2016-06-24 10 views
1

Ich habe 1000 PDFs mit mehreren Seiten und jedes PDF hat unterschiedliche Auflösung (basierend auf Scannern zum Scannen). Ich möchte jede Seite von PDF nach PNG konvertieren, um sie an Tesseract für OCR weiterzuleiten. Ich habe Imagemagick verwendet, um in PNG zu konvertieren, muss aber eine feste DPI für alle Bilder übergeben, um eine gut lesbare Ausgabe zu erhalten. Gibt es eine Möglichkeit, jede PDF-Datei zu konvertieren, indem Sie auch die Auflösung dieser PDF-Datei beibehalten?Konvertieren von PDF in PNG mit gleicher Auflösung - Imagemagick

Zum Beispiel, wenn 1.PDF Auflösung 622 × 788 und 2.pdf Auflösung 792 × 612 hat, möchte ich die genaue Konvertierung mit der gleichen Auflösung nur ein anderes Format (PNG).

Der Befehl, den ich im Augenblick verwende ist:

convert -monochrome -density 1200 input.pdf -resize 25% -monochrome -white-threshold 50% -black-threshold -50% output.png 

Danke, pashah

+1

fügen Sie bitte den Befehl hinzu, den Sie ebenfalls konvertieren. nur so ist es möglich, eine Antwort zu erhalten, die tatsächlich etwas erklärt – rll

+0

sorry..have aktualisiert den Beitrag mit dem Befehl – pashah

Antwort

0

Vielleicht die Geometrie der ersten Seite lesen, dann alle Seiten der Größe zu passen?

SIZE=$(identify -format '%g' input.pdf) 
convert -monochrome \ 
     -density 1200 \ 
     -resize $SIZE \ 
     -white-threshold 50% \ 
     -black-threshold -50% \ 
     -append \ 
     output.png 
+0

Dank @emcconville. Dies behält jedoch die Auflösung nicht bei. Das ausgegebene PNG-Bild ist verschlechtert. – pashah