2014-02-11 8 views
7

Kurz, ich möchte die Vorverarbeitungsverfahren vor der OCR mit dem Vorschlag kommt aus ABBYY 's technology. Es gibt zwei Teile in dem Artikel:Binarisierung und Hintergrundfilterung in opencv

  • Hintergrund Filtering: separate Textzeichenfolgen aus Hintergrund.
  • Adaptive Binarisierung: Damit Zeilen und Wörter korrekt erkannt werden und eine höhere Erkennungsgenauigkeit erreicht wird. Und sie versuchen, auf Charaktere einzuwirken. enter image description here enter image description here

Ich frage mich, gibt es irgendwelche Möglichkeiten, sie opencv durch Verwendung zu erreichen? Irgendwelche Vorschläge oder Beispielcodes würden geschätzt werden.

+0

sieht aus wie eine Art adaptiver Schwellenwertbildung: versuchen http://docs.opencv.org/modules/imgproc/doc/miscellent_transformations.html#adaptienthreshold – Micka

+0

@Micka Ich denke, adaptive Schwellenwertbildung ist nicht gut genug für die meisten Fälle, ich probierte es aus und bekam die schlechten Ergebnisse, es machte den Punktbereich in Bildern und bedeckte die Charaktere. – R4j

Antwort

3

Ich möchte Sie ermutigen Um diesen Code zu verwenden: http://liris.cnrs.fr/christian.wolf/software/binarize/ Insbesondere binär binarization, es funktioniert wirklich gut in der Praxis und es braucht sehr wenig Änderung an C++ - Code, wenn Sie es mit opencv verwenden möchten. Grundsätzlich müssen Sie den Zeiger zu Ihren Bilddaten an diese Funktion übergeben.

2

Hier ein paar Papiere ist, hoffen, dass es nützlich sein werden:

Papier von XEROX: http://www.xrce.xerox.com/content/download/6708/51560/file/Binarising-camera-images-for-OCR.pdf

Vorverarbeitung

Und ein weiteres gutes Papier über Bild für ocr: http://wbieniec.kis.p.lodz.pl/research/files/07_memstech_ocr.pdf

+0

Danke, eigentlich habe ich viele Bücher gelesen und habe einen Ratschlag bekommen, dann versuche ich viele Verarbeitungsmethoden für meine App anzuwenden, aber sie sind in den meisten Fällen nicht deckungsgleich, da meine App automatisch Vorverarbeitungsverfahren für alle Bilder verwendet – R4j