2016-06-03 15 views

Antwort

0

Wenn dies das einzige, was Sie ändern möchten, ist die einfachste Lösung, um einfach nachbearbeiten markierten Text:

for sentence in tagged_sentences: 
    for n, (word,tag) in enumerate(sentence): 
     if word == 'and/or': 
      sentence[n] = (word, "CC") 

Aber wenn Ihre Frage ist der erste Schritt der NLTK des Tagger zu „verbessern“ sollten Sie die lange Sicht betrachten und darüber nachdenken, wie Sie einen besseren Tagger erstellen oder installieren können. Werfen Sie einen Blick auf die vielen Links, die in this answer enthalten sind.