Wenn ich importiert die gespeicherten folgende Daten als UTF-8 Encoded TxtImport txt-Datei in R Studio enthält unerwünschte BOM Zeichen „ï» ¿“
1 test1
1 test2
2 test1
2 test3
In R-Studio-Datei hatte ich Probleme mit der BOM Zeichen "ï» ¿"erscheinen in der resultierenden Tabelle. Unten ist der Code, mit dem ich die Daten importiert habe.
library(arules)
library(arulesViz)
txn <- read.transactions("r-test.txt",rm.duplicates= FALSE,format="single",sep="\t",cols = c(1,2))
inspect(txn)
Die resultierende Import sah wie folgt aus:
items transactionID
1 {test2} 1
2 {test1,test3} 2
3 {test1} 1
Hallo Michael, habe ich tatsächlich versucht, die Codierung mit UTF8 sowie UTF8 mit BOM. Beide haben das Problem jedoch nicht behoben. Vielen Dank für die Antwort und lassen Sie mich wissen, ob die Codierung für Sie funktioniert. – TsTeaTime
Sieht so aus, als müsste ich die Codierung hinzufügen, um in read.transactions zu scannen. Ich werde das in der Entwicklerversion von arules auf github versuchen. Nicht ganz sicher, ob das das Problem löst. –
Danke, das sollte perfekt funktionieren. Ich werde es versuchen, sobald es hinzugefügt wurde. – TsTeaTime