Dies kann keine optimale Lösung sein, aber hier geht:
Ich bin nicht sicher, ob das Kommandozeilen-Tool Optionen Text-Regionen angeben hat.
Was Sie tun können, ist eine Tesseract-Wrapper auf einer anderen Plattform (EmguCV hat Tesseract eingebaut). Sie erhalten also das gescannte Bild, schneiden die Textbereiche aus und geben sie Tesseract nacheinander. Auf diese Weise vermeiden Sie auch Ungenauigkeiten in der Seitenlayoutanalyse von Tesseract.
z.
Image<Gray,Byte> scannedImage = new Image<Gray,Byte>(path_to_scanned_image);
//assuming you know a text region
Image<Gray,Byte> textRegion = new Image(100,20);
scannedImage.ROI = new Rectangle(0,0,100,20);
scannedImage.copyTo(textRegion);
ocr.recognize(textRegion);
Hehe, dass mein Ausweich Plan war, wenn Tesserakts Regionen nicht akzeptieren :) – sashoalm