Ich habe gerade mein erstes NLTK-Projekt gestartet und bin verwirrt über das richtige Setup. Ich brauche mehrere Ressourcen wie den Punkt Tokenizer und den maxent pos Tagger. Ich selbst habe sie über die GUI nltk.download()
heruntergeladen. Für meine Mitarbeiter möchte ich natürlich, dass diese Dinge automatisch heruntergeladen werden. Ich habe dafür keinen idiomatischen Code in der Doku gefunden.Wie kann ich testen, ob eine Nltk-Ressource bereits auf dem Computer installiert ist, auf dem mein Code ausgeführt wird?
Soll ich einfach nltk.data.load('tokenizers/punkt/english.pickle')
und ihre dergleichen in den Code einfügen? Werden die Ressourcen jedes Mal heruntergeladen, wenn das Skript ausgeführt wird? Soll ich dem Nutzer (d. H. Meinen Mitentwicklern) Feedback geben, was heruntergeladen wird und warum dies so lange dauert? Es muss Getriebe dort draußen sein, die die Arbeit macht, richtig? :)
// bearbeiten Meine Frage an explify:
Wie teste ich, ob ein nltk Ressource (wie der Punkt Tokenizer) bereits auf dem Rechner installiert ist mein Code ausgeführt wird, und installieren Sie es, wenn es nicht ist?
Ich habe Probleme festzustellen, was Sie fragen. Ein kurzes, testbares Codebeispiel, das Ihren derzeitigen Ansatz demonstriert, wäre sehr hilfreich. –
Lassen Sie mich die Frage neu anordnen: Wie teste ich, ob eine nltk-Ressource (wie der Punkt Tokenizer) bereits auf dem Computer installiert ist, auf dem mein Code läuft, und installiere es, wenn dies nicht der Fall ist? – Zakum
Bearbeiten Sie Ihre Frage so, dass sie zu Ihrem Kommentar passt. Wenn man die kurze Frage in die Kommentare einfügt, kann es übersehen werden – Spaceghost