2014-09-05 8 views
7

Ich arbeite daran, Personalausweisinformationen mithilfe der Tesseract-Bibliothek zu lesen. Ich habe versucht, mit einigen Google images und bekam gute Ergebnisse, aber wenn ich zu Echtzeit-Bildern ging, das ist, wenn Bilder von einer iPhone-Kamera erfasst werden, bekam ich keine guten Ergebnisse.Verbessern Sie die Vorverarbeitungsschritte in Tesseract OCR für die Echtzeitaufnahme

Ich habe einige Vorverarbeitungsschritte von Tesseract vorgeschlagen.

1. Fix DPI (wenn nötig) 300 DPI ist Minimum.

Wie kann ich die DPI des Bildes bei der Aufnahme von Bildern von iPhone-Kamera in Echtzeit einstellen?

2. Fix Textgröße (z. B. 12 pt sollte in Ordnung sein).

Wie behebe ich die Textgröße für das große Bild von der iPhone-Kamera erstellt?

3. Versuchen Sie, Textzeilen zu korrigieren (Text entzerren und entwarfen).

Ich lese, dass der Tesseract dewarp Text unter Verwendung Leptonica library.Is Dewarp oder Deskew benötigt für Text in diesem Pre-Processing-Phase.?

4. Versuchen Sie, die Beleuchtung des Bildes zu fixieren (z. B. kein dunkler Teil des Bildes).

Kann ich das Bild mit OpenCV beleuchten?

5. Binarize- und De-Noise-Bild.

Ich bekomme schlechte binarisierte Bilder, wenn ich einen Schwellenwert oder einen adaptiven Schwellenwert für das Echtzeitbild anwende.

Wie kann ich diese Echtzeitbilder binarisieren?

Antwort

1
    1. und 2 .: Wenn ein Text eine Punktgröße von 12 hat, bedeutet dies, dass es bei 72 DPI bis 12 Pixel Höhe nimmt. Bei 300 DPI sind das ungefähr 50 Pixel. Was Sie also von 1. und 2. nehmen sollten, ist, dass Sie versuchen sollten, die Auflösung des aufgenommenen Bildes so zu gestalten, dass die Textzeilen etwa 50 Pixel hoch sind. Wie Sie dies tun würden, hängt davon ab, wie Sie das Bild erfassen.
    1. Es ist einfacher, den Benutzer zu fragen, die Kamera gerade :-)
  • zu halten
    1. und 5. Sie könnten versuchen, eine Filterung anzuwenden. Auch hier könnte es leichter sein, die Verwendung zu fragen, um sicherzustellen, dass die richtige Beleuchtung angewendet wird.