Ich bin auf der Suche nach einer OCR-Lib, die mit einer Schriftart, parametrisiert werden kann, weil ich es immer weiß und ich glaube, die Erkennungsergebnisse werden viel besser auf diese Weise.OCR für bekannte Schriftart
Weiß jemand?
Ich bin auf der Suche nach einer OCR-Lib, die mit einer Schriftart, parametrisiert werden kann, weil ich es immer weiß und ich glaube, die Erkennungsergebnisse werden viel besser auf diese Weise.OCR für bekannte Schriftart
Weiß jemand?
Auschecken OCRopus. Es ist Open-Source-und gesponsert von Google :) Ich bin mir nicht sicher, ob es ermöglicht, eine bestimmte Schriftart auszuwählen, aber es scheint, um gute Ergebnisse zu erzielen.
Die meisten OCR-Engines werden diese Situation gut bewältigen. In der Tat werden OCR-Engines nicht so verwirrt, wenn nur eine Schriftart auf einer Seite zu erkennen ist. Seltsam, aber wahr in meiner Erfahrung.
Wenn eine OCR-Engine Ihre Schriftart an erster Stelle lesen kann, würde ich sie einfach verwenden und mir keine Sorgen machen. Es gibt bessere Möglichkeiten, um die Erkennung zu verbessern.
Viele OCR-Engines ermöglichen es Ihnen, einige Erkennungsparameter festzulegen, um die Erkennung zu verbessern, z. B. feste Breite oder Proportional-, Serifen- oder Nicht-Serifen-, Maschinen- oder Handdruck. Sie können auch eine Teilmenge von Zeichen auswählen, z. B. Großbuchstaben oder Zahlen, um die Ergebnisse erheblich zu verbessern. I.e. Wenn Sie nur numerische Zeichen haben, kann das Zeichen 0 (Null) niemals mit einem 'O' oder 'O' oder 'Ø' verwechselt werden. Sie werden feststellen, dass diese Hinweise effektiver sind als die Möglichkeit, den genauen Fonttyp für OCR zu wählen.
Mit anderen Engines können Sie Ihre OCR-Engine trainieren, um mit neuen Schriftarten umzugehen, und dies wird erheblich hilfreich sein, wenn Sie eine seltsame Schriftart haben.
Wenn Ihre Bildqualität gut ist und Ihre Schriftarten sauber und von anständiger Größe sind, würde ich Tesseract OCR von Google und OCROpus als suggested by Michael Mior empfehlen. Es ist kostenlos und funktioniert gut auf sauberen und klaren Text. Wenn der Text ein wenig schwierig ist, dann gibt es definitiv bessere OCR-Motoren wie ABBYY, Prime Recognition, Omnipage und viele andere, obwohl sie Geld kosten werden.
Es ist anscheinend nur Windows, und nicht in erster Linie auf OCR konzentriert, aber Simba OCR hat Methoden, die Kenntnisse der verwendeten Schriftart erfordern.
Sind Sie fragen, welche Schrift für OCR oder einer OCR-Bibliothek verwenden, um eine bekannte Schrift zu erkennen? – t0mm13b
@ tommieb75: Ich denke, er sagt eindeutig, er sucht nach einer Bibliothek ... –
@Matti: ok ... es ist der Wortlaut der Frage wrt "mit einer Schriftart parameterized", die ich nicht verstanden habe ... – t0mm13b