2008-08-05 17 views
25

Ich arbeite gerade an einem Projekt und mein Ziel ist es, Text in einem Bild zu lokalisieren. OCR'ing der Text ist noch nicht meine Absicht. Ich möchte grundsätzlich die Grenzen von Text innerhalb eines Bildes erhalten. Ich verwende die AForge.Net-Bildgebungskomponente zur Manipulation. Irgendwelche Hilfe in irgendeiner Weise?Lokalisieren von Text in Bild

Update 2/5/09: Ich bin seit einer anderen Route in meinem Projekt gegangen. Ich habe jedoch versucht, Text mit MODI (Microsoft Office Document Imaging) zu erhalten. Es ermöglicht Ihnen, ein Bild zu OCR zu erfassen und Text mit einiger Leichtigkeit daraus zu ziehen.

Antwort

12

Dies ist ein aktives Forschungsgebiet. Es gibt buchstäblich Unmengen von wissenschaftlichen Arbeiten zu diesem Thema. Es wird schwierig sein, Ihnen Hilfe zu geben, vor allem ohne weitere Details. Suchen Sie nach bestimmten Arten von Text? Schriftarten? Nur Englisch? Kennen Sie die wissenschaftliche Literatur?

"Texterkennung" ist ein Standardproblem in jedem OCR (Optical Character Recognition) -System und folglich gibt es viele Bits von Code auf den Interwebs, die damit umgehen.

Ich könnte beginnen, Stapel von Links von Google aufzulisten, aber ich schlage vor, Sie nur eine Suche nach "Text Erkennung" und beginnen zu lesen :). Es gibt auch reichlich Beispielcode.

3

Das Erkennen von Text in einem Bild ist in der Tat ein heißes Thema für Forscher in diesem Bereich, aber begann nur außer Kontrolle zu geraten, wenn captcha's die "Norm" in Bezug auf die Verteidigung gegen Spam-Bots wurde. Warum Captchas als Schutz verwenden? gut, weil es sehr schwer ist, Text in einem Bild zu finden (und zu lesen)!

Der Grund, warum ich Captchas erwähne, ist, weil die meisten Fortschritte * in diesem winzigen Bereich gemacht werden, und ich denke, dass Ihre Lösung dort am besten gefunden werden könnte. vor allem, weil Captcha's in der Tat über Text (oder etwas, das Text ähnelt) in einem überfüllten Bild suchen und anschließend versuchen, die Buchstaben richtig zu lesen.

so können wenn Sie sich a good open source captcha breaking tool Sie wahrscheinlich alles, was Sie benötigen, um Ihre Suche fortsetzen ...
Sie könnten wahrscheinlich sogar die meisten dificult Code wegzuwerfen, die die Zeichenerkennung selbst behandelt, weil die OCR die verwendet werden, lesen verzerrter Text, etwas, das du nicht tun musst.

*: Fortschritt in Bezug auf sichtbare, verwendbar, und praktische Informationen für einen „Nicht-Forscher“

+0

Der andere Grund, Captcha's zu erwähnen, ist wahrscheinlich, was sein "Projekt" ist. :-) –