Ich habe ein Problem, das eigentlich sehr einfach mit NLTK lösen sollte. Ich fand eine Lösung für mein Problem, aber es verwenden sie nicht NLTK:Suche nach bestimmten Bigram mit NLTK Python 3
how can I count the specific bigram words?
Ist es möglich, mit einer NLTK Funktion zu tun?
Hier ist mein Code:
food = open("food_low.txt")
lines = food.read().split(',')[:-1]
raw = wordlists.words("cleaned2.txt")
fdist = nltk.FreqDist(w.lower() for w in raw)
with io.open('nltk1.txt', 'w', encoding="utf-8") as h:
for m in lines:
if fdist[m] > 0:
print(m + ':', fdist[m], end=' ', file = h)
ich zu zählen, wie oft ich die Worte aus dem food_low.txt
im cleaned2.txt
erscheinen. Mein Problem ist, dass ich einige Bigram-Wörter in food_low.txt
habe und sie nicht gezählt werden. Wie kann ich erreichen, dass es auch die Bigramme zählt?