Tesseract: Wie tesseract mit mehreren Sprachen einmal ausgeführt wird

Ich habe ein Bild analysiert, das sowohl englische als auch japanische Texte enthält. Wenn ich tesseract standardmäßig starte (eng), verloren einige japanische Zeichen. Ansonsten, wenn ich tesseract mit japanisch (-l jpn) laufe, verloren einige englische Zeichen (e.p. Email). Wie kann ich einen Prozess ausführen, der sowohl englische als auch japanische Zeichen erkennt. Danke.Tesseract: Wie tesseract mit mehreren Sprachen einmal ausgeführt wird

Quelle

2014-06-24 pars

Hoffnung, das wird helfen: https://github.com/rmtheis/tess-two/issues/28 –

Siehe https://stackoverflow.com/questions/16508796/how-can-i-use-Mehrsprachigkeit-Support-on-Android-with-Tesseract – sashoalm

Seit tesseract 3.02 können mehrere Sprachen für den Parameter -l angegeben werden.

-l lang Die zu verwendende Sprache. Wenn keine angegeben ist, wird Englisch angenommen. Mehrere Sprachen können getrennt durch Pluszeichen angegeben werden. Tesseract verwendet 3-stellige ISO 639-2-Sprachencodes.

Ein Beispiel:

tesseract myscan.png out -l deu+eng

Quelle

2014-12-22 12:36:53 tobltobs

Tesseract: Wie tesseract mit mehreren Sprachen einmal ausgeführt wird

Antwort

Verwandte Themen