Ich versuche, ein paar Großbuchstaben aus einem Screenshot zu erkennen. Ich wandeln es in schwarz und weiß mit PIL und dann das Codebeispiel aus der PyTesser Seite mit, ich laufe tesser.exe auf dem Bild:Niedrige Erfolgsrate mit Pytesser? Ist das ein Problem des Lärms oder gibt es noch etwas anderes zu tun?
from pytesser import *
image = Image.open('fnord.tif')
print image_to_string(image)
Ich verwende dieses Bild:
Aber es erkennt es nicht als ein E, oder wirklich irgendetwas in dieser Angelegenheit. I denke,, dass es eine saubere genug Capture ist? Der Lärm an der Spitze wirft es nicht ab, oder?
Gibt es etwas, das mir fehlt?
Ich habe die Befehlszeile util ausgeführt, die 'Tesseract Open Source OCR Engine v3.02 mit Leptonica' zeigt - ohne eine' psm' Option - ich bekomme eine leere Datei. Mit '-psm 10', das angeblich "das Bild als ein einzelnes Zeichen behandelt" - bekomme ich '%' gefolgt von zwei Zeilenumbrüchen ... –
[Begrenzen der Zeichen, nach denen tesseract sucht] (http://stackoverflow.com/questions/2363490/limit-character-tesseract-is-looking-for) hat mir in der Vergangenheit geholfen. – user500198
Wenn die Großbuchstaben, die Sie zu erkennen versuchen, eine eindeutige Schriftart haben, die wie in der Frage gezeigt klar ist, dann gibt es keinen Grund, sich auf tesseract zu verlassen. Einige einfache topologische Merkmale zusammen mit Skelett-Informationen können das direkt lösen. – mmgp