Es ist möglich, eigene Stoppwörter in die Standardliste der Stoppwörter hinzuzufügen, die zusammen mit tm kam installieren . Das Paket "tm" wird mit vielen Datendateien einschließlich Stoppwörtern geliefert. Beachten Sie, dass Stoppworddateien für viele Sprachen verfügbar sind. Sie können die Datei Englisch.dat unter Stoppwörterverzeichnis hinzufügen, löschen oder aktualisieren.
Der einfachste Weg, um das Stoppwörterverzeichnis zu finden, ist die Suche nach dem Verzeichnis "stopwords" in Ihrem System über Ihren Dateibrowser. Und Sie sollten Englisch.dat zusammen mit vielen anderen Sprachdateien finden. Öffnen Sie die Datei "german.dat" von RStudio, mit der Sie die Datei bearbeiten können. Sie können Ihre eigenen Wörter hinzufügen oder vorhandene Wörter löschen. Es ist der gleiche Prozess, wenn Sie Stoppwörter in einer anderen Sprache bearbeiten möchten.
Anstatt dies für jede Operation zu tun, gibt es eine Datei oder ein Diktat, wo ich diese zusätzlichen Stoppwörter wie Prozent, Cent, Million usw. hinzufügen kann? – Pradeep