Ich habe eine .RData-Datei auf meinem Linux (UTF-8) -Maschine zu lesen, aber ich weiß, dass die Datei in Latin1 ist, weil ich sie selbst auf Windows erstellt habe. Leider habe ich keinen Zugriff auf die Originaldateien oder einen Windows-Rechner und muss diese Dateien auf meinem Linux-Rechner lesen.Rdata-Datei mit unterschiedlicher Codierung lesen
Um eine Rdata-Datei zu lesen, wird normalerweise load("file.Rdata")
ausgeführt. Funktionen wie read.csv
haben ein encoding
Argument, das Sie verwenden können, um diese Art von Problemen zu lösen, aber load
hat keine solche Sache. Wenn ich load("file.Rdata", encoding = latin1)
versuchen, bekomme ich nur diese (erwartet) Fehler:
Error in load("file.Rdata", encoding = "latin1") : unused argument (encoding = "latin1")
Was kann ich sonst noch tun? Meine Dateien werden mit Textvariablen geladen, die Akzente enthalten, die beim Öffnen in einer UTF-8-Umgebung beschädigt werden.
RData-Dateien haben keine Codierungen. Sie müssen die serialisierten Rdata laden und die Werte erneut codieren, sobald sie sich im R-Arbeitsbereich befinden. Bleibt dies nach dem Lesen von "? Encoding" unklar, laden Sie die Ausgabe von "dput (head (object))" und stellen Sie sie dort ab. –
@ 42, scheint dies das Problem zu lösen, schade, anscheinend muss ich 'Encoding (x)' auf jeden Vektor in meinem Datenrahmen anwenden. Ich werde es mir genauer ansehen und werde zu dir zurückkommen. –
Sie können die Namen im Arbeitsbereich vor und nach dem Laden aufzeichnen und dann die Unterschiede für die Elemente mit Zeichenwerten bearbeiten. –