Konnte in früheren Fragen und Antworten auf mein Problem keine richtige Antwort finden: 1. Ich habe eine 2,3 GB csv-Datei, die 2,4 Millionen Zeilen hebräischen Text enthält, derzeit codiert in ASCII. Da wir über große Datei sprechen, wäre fread vorzuziehen, aber was ist mit der Codierung? Irgendeine Idee, wie man csv-Datei liest, die in ASCII kodiert wird, um den berühmten "eingebetteten nul in der Schnur" Fehler zu vermeiden?fread (data.table in R) mit Angabe der Kodierung
Danke
https://github.com/Rdatatable/data.table/issues/563 –
Ich habe die Lösung ausprobiert, aber alles, was ich von R bekomme, ist> fread ("C:/Users/WINDOWS 7/IdeaProjects/PHD /classifier/phdcorpus2_processed/phdcorpus2_processed.csv ", encoding = 'UTF8') Fehler in fread (" C:/Benutzer/WINDOWS 7/IdeaProjects/PHD/Klassifikator/phdcorpus2_processed/phdcorpus2_processed.csv ",: Unbenutztes Argument (encoding = "UTF8") –
Es ist keine Lösung, es ist FR auf GitHub, was bedeutet, dass Ihr Problem derzeit nicht mit der aktuellen 'data.table' Version behoben werden kann, aber die Entwickler arbeiten daran. –