2010-12-21 11 views
2

Wo finde ich Algorithmusdetails für holistische Worterkennung? Ich muss ein einfaches OCR-System in Hardware (FPGAs tatsächlich) bauen, und die wissenschaftlichen Zeitschriften scheinen so abstrakt zu sein?Holistischer Worterkennungsalgorithmus im Detail

Gibt es Open-Source-Codes (Open Core) für die holistische Worterkennung?

Dank

+0

@Joe Blow: FPGAs sind feldprogrammierbare Gate-Arrays. Und sie sind einfach integrierte Schaltungen, die vom Benutzer konfiguriert werden können. – Lukasz

+0

@Joe: Ein feldprogrammierbares Gate-Array ist "programmierbare Hardware" - es ist ein Gerät mit einer Reihe von Logikgattern (UND, ODER, usw.), die Sie programmatisch "verdrahten" können, wie Sie wollen (ein bisschen wie das Hochladen von Firmware)), verwenden Sie und "rewire" dann für etwas anderes. –

+1

@Joe nimmst du das sprichwörtliche? – William

Antwort

4

Für einen Algorithmus, der für die FPGA-Implementierung (embarrassingly parallel) Sie können sehen gut geeignet ist:

http://en.wikipedia.org/wiki/Cross-correlation

Es ist schnell und einfach zu realisieren.

Das einzige Ding ist: es erkennt eine Form (in Ihrem Fall irgendein Text) UNABHÄNGIG von der Rotation und von der Größe/von Ausdehnung/von Schräglage etc. Aber wenn das nicht ein Problem ist, kann es sehr schnell sein und ist ziemlich robust . Sie sollten nur auf Interpretationsprobleme mit ähnlichen Zeichen achten (wie o und c).

Ich habe es verwendet, um Standardtexte auf gescannten Formularen zu finden, wo Regionen von Interesse und Suche in diesen Bildern (6M Pixel) dauerte nur etwa 15 ms mit unserer Implementierung auf einem Core2 CPU in einem einzigen Thread.

+1

Wir haben die Formel von http://scribblethink.org/Work/nvisionInterface/nip.html implementiert und ein Mipmap/Bild-Pyramiden ähnliches Schema verwendet, um sicherzustellen, dass die Anzahl der FLOPs niedrig gehalten wurde –