Ich arbeite daran, Personalausweisinformationen mithilfe der Tesseract-Bibliothek zu lesen. Ich habe versucht, mit einigen Google images und bekam gute Ergebnisse, aber wenn ich zu Echtzeit-Bildern ging, das ist, wenn Bilder von einer iPhone-Kamera erfasst werden, bekam ich keine guten Ergebnisse.Verbessern Sie die Vorverarbeitungsschritte in Tesseract OCR für die Echtzeitaufnahme
Ich habe einige Vorverarbeitungsschritte von Tesseract vorgeschlagen.
1. Fix DPI (wenn nötig) 300 DPI ist Minimum.
Wie kann ich die DPI des Bildes bei der Aufnahme von Bildern von iPhone-Kamera in Echtzeit einstellen?
2. Fix Textgröße (z. B. 12 pt sollte in Ordnung sein).
Wie behebe ich die Textgröße für das große Bild von der iPhone-Kamera erstellt?
3. Versuchen Sie, Textzeilen zu korrigieren (Text entzerren und entwarfen).
Ich lese, dass der Tesseract dewarp Text unter Verwendung Leptonica library.Is Dewarp oder Deskew benötigt für Text in diesem Pre-Processing-Phase.?
4. Versuchen Sie, die Beleuchtung des Bildes zu fixieren (z. B. kein dunkler Teil des Bildes).
Kann ich das Bild mit OpenCV beleuchten?
5. Binarize- und De-Noise-Bild.
Ich bekomme schlechte binarisierte Bilder, wenn ich einen Schwellenwert oder einen adaptiven Schwellenwert für das Echtzeitbild anwende.
Wie kann ich diese Echtzeitbilder binarisieren?