Ich suche gerade wie man Tweets Sprachen erkennt. Ich fand die Apache-Bibliothek Tika, aber es funktioniert nicht gut ... Jetzt habe ich langedetect gefunden und ich versuche es zu verwenden. Derzeit habe ich eine Probe von Code gefunden, aber ich verstehe nicht, was die Datei „Profile“ ist ... Ich weiß nicht, was ich nach innen setzen muß ...LangDetect was ist Profil?
String path = "my path to the file profiles";
DetectorFactory.loadProfile(path);
detector = DetectorFactory.create();
detector.append(tweet);
langDetected = detector.detect();
Vielen Dank! Es klappt. Ich musste nur Profile aus den JAR-Dateien extrahieren. – Arya