2015-12-21 8 views
5

ich erfolgreich die traineddata Datei für eine neue Tesserakts Sprache geschrieben, aber als ich fertig war, habe ich auch weiterhin die folgenden Fehler erhalten:Tesseract Index> = 0 && Index <size_used_: Fehler: Assert fehlgeschlagen Fehler

index >= 0 && index < size_used_:Error:Assert failed:in file ../ccutil/genericvector.h, line 657

Dies passiert jedoch sogar, wenn ich Tesseract auf einem Bild, mit dem ich trainiert habe, laufen lasse! Ich bin verwirrt, was passiert, wie ich erwarten würde, dass der Fehler nicht auftreten sollte, wenn ich Tesseract auf dem Trainingssatz laufen lasse.

Antwort

0

Dieser Fehler zeigt an, dass Ihr Training fehlgeschlagen ist => Sie haben während des Trainings eine Fehlermeldung übersehen.

+0

Würde eine falsche Datei font_properties diesen Fehler verursachen? Ich habe keine Fehlermeldungen erhalten, und soweit ich weiß, wurden keine Fehlermeldungen gedruckt. – vigneshv

+0

Sehen Sie hier: https://code.google.com/p/tesseract-ocr/issues/detail?id=821 – user898678

4

Dieser Fehler wird durch das Fehlen einer lang.shapetable Datei in Ihrer lang.traineddata Datei verursacht.


Stellen Sie sicher, dass Sie die shapetable erzeugen:

shapeclustering -F font_properties -U unicharset lang.font.exp0.box.tr 

Diese eine Datei namens shapetable schaffen. Sie müssen dies in lang.shapetable umbenennen, bevor Sie alles kombinieren können:

combine_tessdata lang.