Ich suche Namen und Orte von sehr kurzen Ausbrüchen von Text BeispielSoll ich LingPipe oder NLTK zum Extrahieren von Namen und Orten verwenden?
"cardinals vs jays in toronto" " Daniel Nestor and Nenad Zimonjic play Jonas Bjorkman w/ Kevin Ullyett, paris time to be announced" "jenson button - pole position, brawn-mercedes - monaco".
Diese Daten sind zur Zeit in einer MySQL-Datenbank zu extrahieren, und ich (ziemlich) hat einen separaten Eintrag für jeden Sportler, obwohl Namen werden manchmal falsch geschrieben, etc.
Ich möchte die Athleten und Standorte extrahieren. Ich arbeite normalerweise in PHP, konnte aber keine Bibliothek für Entity-Extraktion finden (und ich möchte in Zukunft vielleicht näher auf einige NLP und ML zugreifen).
Von dem, was ich gefunden habe, scheinen LingPipe und NLTK am meisten zu empfehlen, aber ich kann nicht herausfinden, ob entweder wirklich mein Zweck erfüllt, oder ob etwas anderes besser wäre.
Ich habe weder in Java noch in Python programmiert, also hoffe ich, bevor ich anfange, neue Sprachen zu lernen, einen Ratschlag darüber zu bekommen, welche Route ich befolgen sollte, oder andere Empfehlungen.
"... ein separater Tisch für jeden Athleten ..." vielleicht meinen Sie einen _record_ für jeden Athleten? (das wäre sonst eine Menge Tische ...) – mjv
yeah! Sprachen/Module wäre das kleinste meiner Probleme, wenn ich einen separaten Tisch für jeden Athleten hätte! Danke, dass du darauf hingewiesen hast. – pedalpete