Wie kann ich PerceptronTagger
in nltk
Modul ändern (oder vielleicht einige temporäre Funktionalität hinzufügen), so dass es erkennt und/oder als CC-Tag?Python: modifizieren PerceptronTagger in nltk zu erkennen 'und/oder'
0
A
Antwort
0
Wenn dies das einzige, was Sie ändern möchten, ist die einfachste Lösung, um einfach nachbearbeiten markierten Text:
for sentence in tagged_sentences:
for n, (word,tag) in enumerate(sentence):
if word == 'and/or':
sentence[n] = (word, "CC")
Aber wenn Ihre Frage ist der erste Schritt der NLTK des Tagger zu „verbessern“ sollten Sie die lange Sicht betrachten und darüber nachdenken, wie Sie einen besseren Tagger erstellen oder installieren können. Werfen Sie einen Blick auf die vielen Links, die in this answer enthalten sind.