Von Google Analytics Ich habe eine (lange) Liste von Schlüsselwörtern, die in Suchmaschinen Leute meine Website zu finden. Ich will den Kern Keywords, hypothetisches Beispiel finden:Wie Cluster Suchmaschinen Keywords?
java online training
learning java
scala training
training for java
online training java
learn scala programming
Das ideale Ergebnis sei: 'Java', 'Online-Training', 'Ausbildung', 'scala' und 'lernen'.
Die Schwierigkeit scheint vollständige Sätze zu erfassen, gemeinsame Wörter ignorieren (für) und Handhabung Variationen (Lern-Lernen).
Gibt es eine Bibliothek, die das (vorzugsweise für JVM) tun? Oder gibt es einen geeigneten Algorithmus, den ich selbst implementieren kann?
Ich glaube, Sie brauchen, um mehr Zeit unter Angabe Ihrer Anforderungen zu verbringen. Selbst in Ihrem begrenzten Beispiel weiß ich nicht, warum Sie "Programmieren" nicht als "Kern" betrachten. –
Was wäre, wenn Sie googles Anzahl der Ergebnisse für die Suche nach guten Keywords verwenden würden? Scala hätte weniger Ergebnisse als für -> besseres Wort. Sie können nach allen möglichen Phrasen suchen und die Anzahl der Ergebnisse für jede Phrase aufzeichnen und dann einen Bereich finden, in dem gute Phrasen existieren. (Das war nur ein kurzer Gedanke, also stelle ich es nicht als Antwort dar) –