Ich verwende Tesseract OCR (über pytesser) und PIL (Python Image Library) für den automatisierten Test einer Anwendung.Wie können Sie einer OCR-Software die beste Erfolgschance geben?
Ich überprüfe, ob der angezeigte Text in Ordnung ist, indem ich einen Screenshot mache und den Text dank tesseract erhalte.
Ich hatte am Anfang einige Probleme und es scheint besser zu funktionieren, da ich die Größe des Screenshots dank der bikubischen Interpolation von PIL erhöht habe.
Leider habe ich immer noch einige Fehler wie die Verwechslung zwischen '0' und 'O'. Ich kann mir vorstellen, dass ich in Zukunft ähnliche Probleme haben werde.
Ich würde gerne wissen, ob es einige Techniken gibt, um ein Bild vorzubereiten, um die OCR zu helfen. Jede Idee ist willkommen.
Vielen Dank im Voraus
Wenn diese Frage noch relevant ist: Enthält diese Tesseract sein? Es gibt OCR-Engines (z. B. ABBYY), die sich hervorragend für Eingabebilder mit niedriger Qualität eignen und die Bildvorverarbeitung automatisch für Sie übernehmen. Es gibt eine REST-API für OCR, die die ABBYY-Engine unter http://www.wisetrend.com/wisetrend_ocr_cloud.shtml verwendet - es gibt eine kostenlose Testversion, damit Sie ein paar Bilder für sich selbst ausprobieren können. –