Hat jemand eine einfache, aber effektive Möglichkeit gefunden, Datumsreferenzen aus dem Text zu extrahieren? Ich habe ziemlich lange nach temporalen Extraktionswerkzeugen gesucht, aber da draußen gibt es nicht viel. Es gibt ein paar White Papers, aber es scheint in eine Teilmenge des gesamten semantischen Web-Dings zu fallen, wird aber nicht sehr beachtet.Temporale Extraktion (d. H. Extrahieren von Datum/Uhrzeit-Entitäten aus freiem Text) - Wie?
Ich bin nur auf der Suche nach etwas, das 80% effektiv ist. Es gibt keine Notwendigkeit, Dinge wie "der Monat nach Jan 2009" zu erfassen, aber grundlegende gemeinsame Daten Entitäten wäre nett.
Ich bin offen für alle Vorschläge, auch ausgefallene Regex-Ausdrücke.
Feuer weg!
(und Dank - Henry)
ich zur Zeit eine einfache regex =>/\ b ((19 | 20) \ d \ d) extrahieren Jahr treffen \ b/(wollte nur auf die Jahre fokussieren, die mit 19 und 20 beginnen, um falsche Positive einzuschränken); Der nächste Schritt besteht darin, nach Monaten zu suchen, aber noch keine Möglichkeit gefunden zu haben, mit mehreren Daten im selben Satz umzugehen. – henry74