Ich möchte einige häufig vorkommende Phrasen mit Lucene bekommen. Ich erhalte einige Informationen aus TXT-Dateien, und ich verliere viel Kontext, weil ich keine Informationen für Phrasen z. "Informat
Ich habe eine große Sammlung von menschlichen generierten Inhalten. Ich möchte die Wörter oder Sätze finden, die am häufigsten vorkommen. Was ist ein effizienter Weg dies zu tun?