Bitte, jemand mit Nltk auf Eclipse IDE auf Mac OS? Ich versuche herauszufinden, wo die Nltk-Daten gespeichert sind. Ich habe etwas gegraben und herausgefunden, dass sie sich auf meinem Rechner in diesem Pfad befinden: /Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/nltk/ init .pyc aber Als ich in das Nltk-Verzeichnis wechselte, fand ich einen Corpus-Ordner, aber darin ist nichts dem Korpus ähnlich. Jeder mit Tipps, was als nächstes zu tun ist?nltk Korpus Standort auf Mac OS
Antwort
Korpora sind nicht als Teil der Basis nltk
Paket verteilt, da nicht alle Benutzer des Moduls sie brauchen, und viele von ihnen sind ziemlich groß - zuletzt überprüft, gab es eine, die als 1,7 GB aufgeführt wurde, nicht ein trivialer Download für fast jeden.
Wenn Sie jedoch die ausgezeichnete NLTK docs lesen, werden Sie sofort angezeigt, wie Corpora wählen zum Download:
>>> import nltk
>>> nltk.download()
Das wird eine schöne Tk-basierte GUI öffnen (in entsprechenden Umgebungen) oder ein textbasiert und ermöglicht es Ihnen, Korpora von Interesse zu suchen, auszuwählen und herunterzuladen, oder sogar alles zu bekommen, was in hochtechnischen Kreisen als "der ganze Shebang" bekannt ist. Sie können sogar das Verzeichnis auswählen, in dem Ihre frisch heruntergeladenen Korpora gespeichert werden sollen. Einfach! Das corpus
Verzeichnis, das Sie irgendwie gefunden haben, enthält den Quellcode für nltk.corpus
, der Tools für den Umgang mit Korpora hat, nicht die eigentlichen Korpora selbst
Haben Sie den Korpus bereits heruntergeladen? Es kommt nicht mit der Basisinstallation. – MattDMo
@MattDMo, tut es nicht? Ich dachte, es käme mit, seit ich den Corpus-Ordner im Verzeichnis nltk gefunden habe. Also, irgendein Tipp, wie man den Korpus herunterlädt? – user200188