Was sind einige gute Algorithmen für die automatische Beschriftung von Text mit der Stadt/Region oder Herkunft? Das heißt, wenn ein Blog über New York ist, wie kann ich das programmatisch sagen? Gibt es Pakete/Papiere, die dies mit einiger Sicherheit behaupten?Methoden für Geotagging oder Geolabelling Text Inhalt
Ich habe einige Tfidf-basierte Ansätze, Eigennamen Kreuzungen, aber bis jetzt, keine spektakulären Erfolge, und ich würde Ideen schätzen!
Die allgemeinere Frage bezieht sich auf die Zuordnung von Texten zu Themen, mit einer Liste von Themen.
Einfache/naive Ansätze bevorzugt auf Bayesian Ansätze, aber ich bin offen.
Danke für den Rat. Dies ist ein hartes, schweres Problem, und Ihre Antwort, die ich als "Look up NER" zusammenfasse, handelt von den besten, die es gibt, wahrscheinlich :) –
Haben Sie eine einfache Lösung für diese Frage gefunden? Da bin ich auch auf der Suche nach der gleichen Art von Anwendung .. Ich habe meine eigene Trie Datenstruktur implementiert und ich kann auch leicht nachschlagen, aber das Problem ist das Sammeln von Datensätzen .. Ich muss alle Daten im Wörterbuch zu bekommen ... Bitte teilen Ihre Gedanken.. –