Ich konnte keine detaillierte Dokumentation finden und habe keine Lust den Quellcode zu durchsuchen. Ich möchte beispielsweise die Erkennung von schiefem Rand nicht wiederholen, wenn es bereits von der Tesseract-Engine durchgeführt wurde.Welche Vorverarbeitungsoperationen werden von Tesseract OCR ausgeführt?
5
A
Antwort
6
Dieses Dokument gibt einen Überblick über den Motor: https://github.com/tesseract-ocr/docs/blob/master/tesseracticdar2007.pdf
So sieht es aus wie Sie nicht Canny-Algorithmus implementieren müssen.
Tesseract verwendet Otsu Schwellwertbildung das Bild zu digitalisieren, bevor es die Verarbeitung https://github.com/tesseract-ocr/tesseract/blob/master/ccstruct/otsuthr.h
Edit: Wenn Sie das binarisierte Bild sehen wollen, nur eine neue Konfigurationsdatei erstellen in „\ tessdata \ configs \“, fügen Sie diese Zeile: tessedit_write_images True
und bearbeiten Sie Ihr Bild: tesseract your_image out your_config_file
. Tesseract speichert das binärisierte Bild als tessinput.tif
.
Wo speichert es die Datei tessinput.tif? – kiwicomb123
@neoneye @ cortex42 In meinem '\ tessdata \ configs \' Verzeichnis habe ich eine Reihe von Dateien, wie zum Beispiel 'api_config', also wenn du sagst, eine neue Konfigurationsdatei erstellen, meinst du nur eine existierende Konfiguration duplizieren? Wie öffne ich diese Dateien, um die von Ihnen vorgeschlagene Zeile hinzuzufügen? Wo kann ich dann die '.tif' Datei sehen? – Joshua