Erstellen von Vokabeln in Python

Ich habe eine Reihe von Textdatei. Ich möchte NLTK zum Vorverarbeiten und Ausdrucken des Vokabulars in einem Textformat im Textformat verwenden, damit ich diese Datei für die Benutzer verteilen kann. Ich habe folgenden it.I begann zu tun mit einzelner Datei unter:Erstellen von Vokabeln in Python

file1 = open("path/to/text/file","rU") 
raw = file1.read() 
tokens = nltk.wordpunct_tokenize(raw) 
words = [w.lower for w in tokens] 
vocab = sorted(set(tokens))

Jetzt würde ich die Elemente in vocab zur Liste wie in einen Klartext .txt menschliche lesbare Datei. Wie würde ich es tun?

Quelle

2012-03-28 thetna

Ein Fehler, der es in Ihrer Frage ist, dass die Worte nach dem unteren Untertitelung, verwenden Sie sie nicht Ihre vocab zu bauen. – chandresh

schreiben sie manuell aus:

with open("output.txt", "w") as f: 
    for item in vocab: 
     f.write(item + "\n")

Quelle

2012-03-28 14:57:40 brice

Oder nur 'f.writelines (vocab)' :) –

danke you.it funktionierte :) – thetna

@NiklasB. Just so: D – brice

Antwort

Verwandte Themen