Wie Tesseract zu dem Ausführen mit Projekt in Visual Studio 2010 implementiert wird

Ich habe ein C++ - Projekt in Visual Studio 2010 und möchte OCR verwenden. Ich stieß auf viele "Tutorials" für Tesseract, aber leider hatte ich nur Kopfschmerzen und verschwendete Zeit. In meinem Projekt habe ich ein Bild gespeichert als Mat. Eine Lösung für mein Problem ist, diese Matte als Bild (image.jpg zum Beispiel) zu speichern und dann rufen Tesseract ausführbare Datei wie folgt aus:Wie Tesseract zu dem Ausführen mit Projekt in Visual Studio 2010 implementiert wird

system("tesseract.exe image.jpg out");

Welche wird mir eine Ausgabe out.txt und dann rufe ich

infile.open ("out.txt");

, um die Ausgabe von Tesseract zu lesen.

Es ist alles gut und funktioniert wie ein Stuhl, aber es ist keine optimale Lösung. In meinem Projekt verarbeite ich ein Video so speichern/Anruf .exe/schreiben/lesen bei 10 + FPS ist nicht das, was ich wirklich suche. Ich möchte Tesseract in bestehenden Code implementieren, um eine Mat als Argument übergeben zu können und sofort ein Ergebnis als String zu erhalten.

Kennen Sie ein gutes Tutorial (z. B. Schritt-für-Schritt), um Tesseract OCR mit Visual Studio 2010 zu implementieren? Oder deine eigene Lösung?

Quelle

2013-08-12 OpenMinded

OK, ich es herausgefunden, aber es funktioniert für Veröffentlichung und Win32 nur Konfiguration (keine Debug oder x64). Es gibt viele Verbindungsfehler unter Debug-Konfiguration.

1. Zu allererst Download bereit Bibliotheksordner (Tesseract + Leptonica) hier:

Mirror 1(Google Drive)

Mirror 2(MediaFire)

2. Extract tesseract.zip zu C:\

in Visual Studio gehen unter C/C++ > General > Additional Include Directories

Insert C:\tesseract\include

4. Unter Linker > General > Additional Library Directories

Insert C:\tesseract\lib

5. unter 012.

Anzahl:

liblept168.lib 
libtesseract302.lib

Beispielcode sollte wie folgt aussehen:

#include <tesseract\baseapi.h> 
#include <leptonica\allheaders.h> 
#include <iostream> 

using namespace std; 

int main(void){ 

    tesseract::TessBaseAPI api; 
    api.Init("", "eng", tesseract::OEM_DEFAULT); 
    api.SetPageSegMode(static_cast<tesseract::PageSegMode>(7)); 
    api.SetOutputName("out"); 

    cout<<"File name:"; 
    char image[256]; 
    cin>>image; 
    PIX *pixs = pixRead(image); 

    STRING text_out; 
    api.ProcessPages(image, NULL, 0, &text_out); 

    cout<<text_out.string(); 

    system("pause"); 
}

Für die Interaktion mit OpenCV und Mat Typ Bilder sehen HERE

Quelle

2013-11-22 09:48:50 OpenMinded

Ich sagte Sprachdatenpfad so, dass es funktionierte. api.Init ("C: \\ tessdata", "eng", tesseract :: OEM_DEFAULT); –

Ich kann Ordner finden, die "Tessdata" ??Sollte ich es erstellen oder muss es in Ordner @ İsmailKocacan –

Ich lade Ordner Ihren Link, aber es hat keine Daten? @OpenMinded –

Sie müssen die Bibliothek über die API verwenden.

Wahrscheinlich:

Start durch die Libs downlaoding (https://code.google.com/p/tesseract-ocr/downloads/detail?name=tesseract-3.02.02-win32-lib-include-dirs.zip&can=2&q=). Sie sind mit Visual 2008 zusammengestellt, aber es sollte
Verwenden Sie die API direkt (zB Blick auf einem Open-Source-Projekt mit ihm: https://code.google.com/p/qtesseract/source/browse/#svn%2Ftrunk%2Ftessdata) genug sein, und lesen Sie die Links von dieser Antwort: How can i use tesseract ocr(or any other free ocr) in small c++ project?

Quelle

2013-08-12 06:45:23 Bruce

die Libs heruntergeladen. In _C/C++> Allgemein> Zusätzliche Include-Verzeichnisse: _ Hinzugefügt _ \ include_-Ordner. In _Linker> Allgemein> Zusätzliche Bibliotheksverzeichnisse: _ Ordner _ \ lib_ hinzugefügt. In _Linker> Eingabe> Zusätzliche Abhängigkeiten: _ Hinzugefügt _libtesseract302.lib_ und _libtesseract302d.lib_. Hat ein einfaches Programm geschrieben und kann aufgrund von Verknüpfungsfehlern für jede aufgerufene Methode kein Objekt erstellen. Zum Beispiel: Fehler Fehler LNK2019: nicht aufgelöstes externes Symbol "public: Zeichen * __cdecl tesseract :: TessBaseAPI :: GetUTF8Text (void)" (? GetUTF8Text @ TessBaseAPI @ tesseract @@ QEAAPEADXZ) verwiesen in Funktion main'. Was vermisse ich? – OpenMinded

Gute Nachrichten: Kompilierungsschritt funktioniert. Schlechte Nachrichten, der Verbindungsschritt schlägt fehl. Es sieht so aus, als würde es nicht die richtige Bibliothek zum Verknüpfen finden. Ich würde empfehlen, libtesseract302.lib in release und libtesseract302d.lib in debug zu verwenden. Sie können in Ihrem visuellen Projekt zur ConfigurationProperts/Linked/Befehlszeile gehen, um sicherzustellen, dass die Befehlszeile auf den richtigen Speicherort zeigt. – Bruce

Ich habe die x64-Konfiguration wegen OpenCV verwendet ... also bin ich zu x86 gewechselt. Keine Tesseract-Verknüpfungsfehler mehr. Jetzt habe ich ähnliche Verknüpfungsfehler aber mit OpenCV-Funktionen. Also habe ich OpenCV weggeworfen und versucht Tesseract zu bauen, nur um zu sehen, ob es funktioniert. Switched imread (OpenCV) für pixRead (Leptonica?). Anscheinend erkennt es diese Funktion pixRead nicht. Ich denke, ich brauche Leptonica-Header? allheaders.h oder was? Ich gebe langsam auf alles auf: -/ – OpenMinded

Es ist viel seit der letzten Antwort, aber es kann anderen helfen;

Ich glaube, Sie müssen auch an das Ziel Ihrer exe "liblept168.lib" und "liblept168d.lib" auf zusätzliche Abhängigkeiten
Add "liblept168.dll" und "liblept168d.dll" hinzufügen.
Fügen Sie Ihrem Code #include hinzu.

(Diese Antwort muss ein Kommentar zu Bruce Antwort. Sorry für Verwirrung.)

Quelle

2013-11-06 11:39:42

Wenn Sie sagen "add #include zu Ihrem Code", was genau muss enthalten sein? – MPorto

sollten Sie hinzufügen: #include #include – pourjour

Wie Tesseract zu dem Ausführen mit Projekt in Visual Studio 2010 implementiert wird

Antwort

Verwandte Themen