Ich habe ein Bild analysiert, das sowohl englische als auch japanische Texte enthält. Wenn ich tesseract standardmäßig starte (eng), verloren einige japanische Zeichen. Ansonsten, wenn ich tesseract mit japanisch (-l jpn) laufe, verloren einige englische Zeichen (e.p. Email). Wie kann ich einen Prozess ausführen, der sowohl englische als auch japanische Zeichen erkennt. Danke.Tesseract: Wie tesseract mit mehreren Sprachen einmal ausgeführt wird
5
A
Antwort
17
Seit tesseract 3.02 können mehrere Sprachen für den Parameter -l angegeben werden.
-l lang Die zu verwendende Sprache. Wenn keine angegeben ist, wird Englisch angenommen. Mehrere Sprachen können getrennt durch Pluszeichen angegeben werden. Tesseract verwendet 3-stellige ISO 639-2-Sprachencodes.
Ein Beispiel:
tesseract myscan.png out -l deu+eng
Hoffnung, das wird helfen: https://github.com/rmtheis/tess-two/issues/28 –
Siehe https://stackoverflow.com/questions/16508796/how-can-i-use-Mehrsprachigkeit-Support-on-Android-with-Tesseract – sashoalm