OCR-Programme erkennen häufig den Großbuchstaben O fälschlicherweise als Null oder umgekehrt. Zum Beispiel könnten sie Over als 0 oder als we11 erkennen.Wie ändere ich eine Hunspell-Affix-Datei, um Zahlen in Wörtern zuzulassen?
Ich versuchte
REP 0 O
REP 1 l
zur Affix-Datei hinzufügen, aber es hat nicht funktioniert, weil Zahlen scheinbar Wortgrenzen berücksichtigt werden.
(ich hatte einen Blick auf den hunspell man page, aber ich kann, welcher der zahlreichen Einstellungen nicht herausfinden muss geändert werden, damit Zahlen in Worten.)
Danke für Ihre Antwort. Ich habe den Header mit der Anzahl der folgenden Einträge hinzugefügt und alle anderen REP-Anweisungen funktionieren. Was nicht funktioniert ist: 'REP 0 O' –
Denkst du, dass es möglich ist, dass HUNSPELL REP gefolgt von einer ganzen Zahl sieht, und interpretiert es als eine Überschrift, anstatt eine Ersetzung? In diesem Fall könnte die Nullsetzung am Ende funktionieren, wenn ich nicht befürchte, dass dies ein Versehen der Hunspell-Implementierung ist. –
Sie haben wahrscheinlich Recht. Der Hunspell-Parser wird wahrscheinlich durch Zahlen in REP-Anweisungen verwirrt. –