2009-08-09 6 views
1

Ich fing an, an einem Projekt zu arbeiten, in dem ich Dokumente mit Schlüsselwörtern kennzeichnen muss, und es ist wirklich hart und zeitaufwendig, wenn Sie es manuell tun (besonders wenn Sie Tausende von Dokumenten haben). Daher plane ich, den Prozess zu automatisieren (in dem Wissen, dass das Ergebnis nicht perfekt wäre, aber zumindest gibt es einige vorgeschlagene Tags). In der neuesten Firefox-Version haben sie ein System wie dieses implementiert (wenn Sie eine Seite mit einem Lesezeichen versehen, schlägt es Ihnen einige Tags vor).automatische Dokumente Tagging bezogen

yahoo term extraction Service ist auch ein gutes Beispiel

Also, wenn jede Einrichtung kann mir dieses Problem umgehen helfen würde, ich schätze die Hilfe. Oder wenn jemand über das firefox Tagging-System weiß, wäre ein bisschen Hilfe toll.

Antwort

1

Würde ein statistischer Algorithmus funktionieren? Etwas Bayesianer vielleicht? Ich weiß, dass sie bei der Spam-Filterung verwendet werden. Vielleicht können Sie einen Bayes-Filter an Ihre Bedürfnisse anpassen.

Zumindest könnten Sie Wörter vorschlagen, die häufig verwendet werden, aber keine gebräuchlichen Wörter in Englisch sind (er, sie, ich, und dann, oder, usw.)