Ich benutze langdetect
, um die Sprache einer Reihe von Strings zu bestimmen, von denen ich weiß, dass sie entweder in Englisch oder Französisch sind.Python langdetect: wähle zwischen der einen oder der anderen Sprache nur
Manchmal, langdetect
sagt mir die Sprache ist Rumänisch für eine Zeichenfolge, die ich weiß, ist in Französisch. Wie kann ich langdetect
wählen zwischen nur Englisch oder Französisch, und nicht alle anderen Sprachen?
Danke!
lang erkennen, irgendwie .. saugt. "38 HewcnonHe,! Me PlrIM HellaA.ne * aulee kicnon} le, wle npeAy (MOTpHHbIX AorOBOpOM" wird erkannt als en – thang
@thang Und welche Ausgabe würden Sie von einem perfekten Werkzeug erwarten? Langdetect versucht, jeden String in eine bestimmte Sprache zu bringen wenn Sie es verwenden, um bedeutungslose Zeichenfolgen zu erkennen, bricht es natürlich – Jeyekomon
Ich denke, das wurde von einem russischen pdf Dokument kopiert. – thang