2016-05-30 7 views
-2

der Annahme, dass ich die folgenden Zeichenfolgen haben:Wie erkennt man Wörter in einem Satz ohne Leerzeichen in Java?

  • "myteststringwithoutanyspace"
  • "myOtherSTRINGwithoutanyspace"

Wie würden Sie die Wörter nach innen es in Java trennen?

Meine aktuelle Strategie konzentriert sich auf SimpleNLG. Aber tatsächlich habe ich keine Dokumente gefunden, die SimpleNLG verwenden, um Strings in Wörter zu trennen.

+0

überprüfen Sie diese [Frage] (http://stackoverflow.com/questions/8870261/how-to-split-text-without-spaces-into-list-of-words) –

+0

[dieser] (http://stackoverflow.com/questions/9665501/word-splitting-statistical-approach/9688034#9688034) könnte ebenfalls relevant sein – AaronD

Antwort

0

Nun, Ihre Lösung wird fast nie perfekt sein.

Ich würde es angehen, indem ich eine englische Wörterbuchdatei sortiere, nach Länge sortiere, dann nach Nutzungshäufigkeit sortiere und sie dann in der Zeichenkette anpasse, wie ich es sehe, das wäre die einzige Option.