2014-02-19 9 views
5

Ich habe ein Projekt, das bestimmte Bilder mit OCR scannen muss. Ich kenne die Software abbyy finereader ziemlich gut (versuchte auch eine Testversion, die fast perfekt für mich funktioniert) und jetzt frage ich mich, wie man diese Software in Python oder eine andere Skriptsprache einbetten, so dass ich später einfach eine Befehlszeile ausführen kann Skript, z python the_script.py image.jpg um ein Bild als Parameter zu nehmen, führe abbyy finereader damit aus und gebe den erkannten Text zurück ...Abbyy Finereader Befehlszeilennutzung/Python-Nutzung?

Ich konnte keinen Weg auf Google finden, gibt es keinen !? Ich fand nur etwas wie folgt aus: https://github.com/mikesname/python-ocrlab/blob/master/ocrsite/ocrlab/nodes/abbyy.py konnte aber nicht herausfinden, was es wirklich tut ...

Oder das Stück abbyy Software brauche ich, um dies zu tun !? Der Erkennungsserver oder die OCR-Engine oder vielleicht noch etwas?

Vielen Dank im Voraus

+0

Ich würde denken, dass Sie die Testlizenz von abbyy bekommen sollte und einfach fragen sie. Wenn Ich bin nicht falsch, Sie sind berechtigt, während der Testphase zu unterstützen. Ich habe ihre Wolke SDK versucht und es gibt eine genaue Befehlszeile Beispiel, die Sie in Python beschrieben.Ich nehme an, es wäre das gleiche für alle ihre SDK Produkte. –

+0

Könnte mich interessieren In diesen Linux [Shell-Skripten] (https://github.com/cove/scanbd) wie von xorgar831 [hier] (https://news.ycombinator.com/item?id=12416607) – zelusp

Antwort

8

Ich habe seit über 15 Jahren mit ABBYY-Technologie gearbeitet. Ich arbeitete für ABBYY, und jetzt arbeite ich für WiseTREND - einer der großen ABBYY Technologie VARs und Integrator in den USA.

FineReader, das Produkt im Einzelhandel, ist für die eigenständige interaktive Nutzung durch einen Bediener konzipiert. Befehlszeilen- und API-Automatisierung ist in diesem Paket nicht verfügbar. Wenn Sie nur kleine Volumes verwenden, können Sie FineReader Corporate Edition als einfache Blackbox verwenden, als Hot Folder einrichten und Ihr Skript Bilder in diesen Input-Ordner legen, auf die Verarbeitung warten und im Output-Ordner abholen.

Für eine bessere Automatisierung und Integration muss ein anderes Produkt als FineReader verwendet werden.

Entscheiden Sie zuerst, ob Sie lokale Software oder eine Cloud-basierte OCR haben möchten.

Cloud - ABBYY, OCR-IT und einige andere Anbieter bieten OCR über eine Webanfrage an. Normalerweise zahlen Sie pro Seite, und kein Software-Kauf erforderlich.

Lokal - einige Software läuft auf Ihrem Server und bietet Ihre Skripte mit OCR-Funktionalität, wie Black-Box oder über direkte API. Recognition Server ist das nächste Produkt, das berücksichtigt werden muss. Wenn Sie eine große Anwendung mit der Notwendigkeit entwickeln, sie an zahlreiche Benutzer zu verteilen oder eine gründliche OCR-Steuerung benötigen, ist das Engine SDK das zu berücksichtigende Produkt.

Wenn Sie mehr darüber erfahren möchten, wie OCR integriert werden soll und welche Volumen und Funktionen Sie benötigen, können wir versuchen, noch mehr einzugrenzen.

+0

bereitgestellt, werde ich Sie kontaktieren per Mail bezüglich eingeschränkter Produktberatung - die Frage (Kommandozeilennutzung von Finereader) wird beantwortet, danke dafür! – tim

4

Ich sah diese Nachricht sehr spät, aber ich verwende ABBYY-Befehlszeile seit 10 Jahren.

Ich bevorzuge ABBYY 8, weil es den gleichen guten Job schneller macht und keine GUI öffnet. Es kommt mit FineOCR.exe:

"C: ... \ ABBYY Finereader 8 \ FineOCR.exe" % 1/lang griechisch Englisch/senden MsWord

Es tut OCR und öffnet MS Word. Die FineOCR.txt ist eine einfache Hilfedatei.

In Bezug auf ABBYY 11, 12 (alle Versionen) gibt es eine FineCmd.exe. Mit etwas wie:

"c: ... \ FineReader \ FineCMD.exe“% 1/lang griechisch Englisch/senden MsWord

Es tut, was FineOCR tat vor (aber keine .txt-Hilfedatei).