Ich verwende den ImageMagick-Dienst, um das Quittungsbild vorzuverarbeiten, bevor ich die Tesseract-OCR-Engine zum Extrahieren von Texten verwende. Ich muss den Hintergrund der Quittungen entfernen. Ich habe durch Maskierung gegangen, um den Rand zu entfernen here. Aber ich kann die Maske für die Quittungen nicht erstellen.Entfernen der Quittungsbildgrenze mit ImageMagick
Allerdings habe ich versucht, Schatten aus den Quittungsbildern zu entfernen.
Anfangsbild (Beispiel Quittung)
convert input.png -colorspace gray \
\(+clone -blur 0x2 \) +swap -compose divide -composite \
-linear-stretch 5%x0% photocopy.png
Nachdem der Code angewendet wird:
Ich habe den Code unten versucht, alle Farben, außer weiß zu machen zu schwarz, aber das scheint den Hintergrund von photocopy.png nicht komplett zu verdunkeln.
convert receipt.jpg -fill black -fuzz 20% +opaque "#ffffff" black_border.jpg
Gibt es eine Möglichkeit, die Grenze des Eingangs Bild zu entfernen? Oder irgendwelche Masken aus dem Bild erstellen? Hinweis: Ich muss Rauschen und Rahmen für mehrere Bilder mit unterschiedlichen Hintergründen entfernen.
Code mit anderen Bildern ausprobiert, aber -trim scheint nicht für Bilder mit dunkleren Hintergründen zu arbeiten. Ich habe versucht, Schwellenwerte zu ändern, aber unterschiedliche Bilder erfordern unterschiedliche Schwellenwerte. Können Sie bitte andere Möglichkeiten zum Entfernen der Grenze vorschlagen? In letzter Zeit habe ich SWT 'Stroke Width Transform' gefunden, um Texte in natürlichen Bildern zu identifizieren. Kann dies über imagemagic geschehen, um den Textbereich irgendwie zu finden und andere Teile zu entfernen? Danke im Voraus. –