Ich kenne die folgenden Open-Source-Tools, aber ich habe keine Vergleiche gefunden, wie gut sie jeweils sind. Werkzeuge mit fertigen Ausdruck Extraktion verwenden:Welches Phrasenextrahierungswerkzeug ist jetzt der Stand der Technik?
- KEA
- MAUI (http://code.google.com/p/maui-indexer/)
- Dragon Xtract (http: // Drachen .ischool.drexel.edu/xtract.asp)
- LingPipe (http://alias-i.com/lingpipe/demos/tutorial/interestingPhrases/read-me.html)
- Mahout (https: // cwiki .apache.org/MAHOUT/collocations.html)
- Alles andere
Hat jemand jemals einen solchen Vergleich gesehen?
mit "Phrase Extraktion", tun Sie "Satz-Splitting" oder "Satz tokenization" bedeuten? – Renaud