2014-06-24 9 views
5

Ich habe ein Bild analysiert, das sowohl englische als auch japanische Texte enthält. Wenn ich tesseract standardmäßig starte (eng), verloren einige japanische Zeichen. Ansonsten, wenn ich tesseract mit japanisch (-l jpn) laufe, verloren einige englische Zeichen (e.p. Email). Wie kann ich einen Prozess ausführen, der sowohl englische als auch japanische Zeichen erkennt. Danke.Tesseract: Wie tesseract mit mehreren Sprachen einmal ausgeführt wird

+1

Hoffnung, das wird helfen: https://github.com/rmtheis/tess-two/issues/28 –

+0

Siehe https://stackoverflow.com/questions/16508796/how-can-i-use-Mehrsprachigkeit-Support-on-Android-with-Tesseract – sashoalm

Antwort

17

Seit tesseract 3.02 können mehrere Sprachen für den Parameter -l angegeben werden.

-l lang Die zu verwendende Sprache. Wenn keine angegeben ist, wird Englisch angenommen. Mehrere Sprachen können getrennt durch Pluszeichen angegeben werden. Tesseract verwendet 3-stellige ISO 639-2-Sprachencodes.

Ein Beispiel:

tesseract myscan.png out -l deu+eng