Ich habe eine Reihe von Textdatei. Ich möchte NLTK zum Vorverarbeiten und Ausdrucken des Vokabulars in einem Textformat im Textformat verwenden, damit ich diese Datei für die Benutzer verteilen kann. Ich habe folgenden it.I begann zu tun mit einzelner Datei unter:Erstellen von Vokabeln in Python
file1 = open("path/to/text/file","rU")
raw = file1.read()
tokens = nltk.wordpunct_tokenize(raw)
words = [w.lower for w in tokens]
vocab = sorted(set(tokens))
Jetzt würde ich die Elemente in vocab zur Liste wie in einen Klartext .txt
menschliche lesbare Datei. Wie würde ich es tun?
Ein Fehler, der es in Ihrer Frage ist, dass die Worte nach dem unteren Untertitelung, verwenden Sie sie nicht Ihre vocab zu bauen. – chandresh