Ich versuche, Sentiment-Analyse von Tweets zu tun. Während die Vorverarbeitung von Wörtern zu tun und eine Matrix zu schaffen, ich folgende Fehlermeldung bekam:Stemming Wörter in r: Fehlender Wert
Error in if (any(lens > lim)) stop("There is a limit of ", lim, "characters on the number of characters in a word being stemmed") :
missing value where TRUE/FALSE needed
Von den 14.215 Tweets, gekocht ich es auf den spezifischen tweet nach unten, die den Fehler verursacht hat, haben aber keine Ahnung, wie man verhindern Sie, dass dieser Fehler erneut auftritt. Der Tweet aufgrund welchen Fehler aufgetreten ist (und Code, um den Fehler zu reproduzieren):
library(RTextTools)
tweet<-"demonio leg edge sexy we get it u vape PLEASE COME TO NA SOON I HAVE A LUCIEL READY FOR U dominos"
all_tweets= create_matrix(tweet, language="english", minWordLength = 3,
removeStopwords=TRUE, removeNumbers=TRUE, # we can also removeSparseTerms
stemWords=TRUE,removePunctuation = TRUE,removeSparseTerms = 0)
Ich würde zuerst den Fehler zu verstehen, wie - warum es aufgetreten und dann wünschen, was ich ist ein Verfahren, das ermöglichen, würde mich Verhindern Sie, dass dieser Fehler auftritt - entweder indem Sie solche Tweets auswählen und entfernen oder indem Sie meine create_matrix-Funktion so bearbeiten?
Hallo, welche Version haben Sie (R/RTextTools Paket). Unter Windows 64, R 3.2.2 und RTextTools 1.4.2 kann ich den Fehler in dem von Ihnen bereitgestellten Text nicht reproduzieren. –
Ich verwendete R Version 3.3.0 und RTextTools 1.4.2 – user3109578
Vielleicht ein Problem von Locale oder Codierung. @ Luke Ein Vorschlag scheint auch eine Möglichkeit. Seltsam, dass dein Code hier wie ein Zauber wirkt. –