OK, es ist ein bisschen ein Hack, aber hier ist, was ich tun musste, um die verschiedenen NLTK-Dateien in Python 3.x auf meinem Mac-Laptop (mit macOS 10.12.2) verwenden zu können.
Erstens, der Zertifikatsfehler tritt nur auf, wenn ich versuche, NLTK-Daten mit Python 3.x auf meinem Mac herunterzuladen (meine Ubuntu-VM in VirtualBox hatte keinen solchen Fehler bei Python 3.x - was ärgerlich ist) . Warum dies einen Fehler auf meinem Mac verursacht, ist mir ein Rätsel, zumal das NLTK-Modul ohne Probleme in Python 3.x mit pip
installiert wird. Es ist die Verbindung zum Download-Server von NLTK, die das SSL-Verifizierungsproblem verursacht.
Mein 'ah ha!' Der Moment kam, als ich erkannte, dass NLTK - wenn es in Python 3.x oder Python 2.x installiert wurde - die gleiche Verzeichnisstruktur unter allen Python-Versionen hat, die auf jedem Computer installiert sind. Also habe ich Python 2.x verwendet, das auf macOS vorinstalliert ist, um NLTK zu installieren, und dann nltk.download()
in Python 2.x verwendet, um den Stoppwordkorpus ohne Probleme zu installieren. Nachdem dies erledigt ist (in Python 2.x), ich ging dann zurück in Python 3.x und dieser Code gearbeitet:
import nltk
from nltk.corpus import stopwords
print(stopwords.words('english'))
Wie gesagt, es ist ein bisschen wie ein Hack, aber diese Technik läßt mich bekommen Die NLTK-Daten werden mit Python 2.x installiert, die ich mit Python 3.x nach Bedarf bearbeiten kann.
Sind Sie sicher, dass Sie die aktuellste Version von nltk verwenden und vielleicht nltk.download versuchen (‚alle‘) – SAMO
nein, es –
arbeiten knapp http://stackoverflow.com/a/37053858/1168680 – RAVI