2016-03-22 8 views
2

Ich versuche, eine Textdatei in R zu importieren, die mehrere Spalten hat, die durch mehrere Leerzeichen getrennt sind. Es enthält auch Wörter, die ebenfalls durch Leerzeichen getrennt sind. Ich habe viel mit dem read.table() Befehl versucht. Wenn ich sep = "" verwende, erkennt R die Spalten, setzt aber jedes Wort in eine separate Spalte. Ich könnte diese Spalten kombinieren, aber verschiedene Zeilen enthalten unterschiedliche Mengen an Wörtern. Beispiel einer Zeile in der Textdatei:Textdatei mit mehreren Leerzeichen und Wörtern in R lesen

123A456B789C0 RADIO PANEL 95-17 AB123 0 1 0987AB654321C ALTIMETER 12-34 123AB 1 2 1234567890ABC LIGHT SENSOR BACK 78-45 ABC12 0 1

Wie kann ich dieses Problem beheben?

Antwort

1

Die read.fwf Funktion (lesen Sie eine Tabelle von formatierten Daten mit fester Breite in einem data.frame) ist, was Sie suchen. Mit Ihrem Beispiel oben:

read.fwf(file = "test", widths = c(16, 20, 12, 13, 8, 1), strip.white = T) 

      V1    V2 V3 V4 V5 V6 
1 123A456B789C0  RADIO PANEL 95-17 AB123 0 1 
2 0987AB654321C   ALTIMETER 12-34 123AB 1 2 
3 1234567890ABC LIGHT SENSOR BACK 78-45 ABC12 0 1 

file ist die Quelldatei, widths eine ganze Zahl Vektor mit den aufeinanderfolgenden Breiten aller Spalten, und können Sie strip.white = T so dass unnötige Räume sind für jeden Wert getrimmt hinzufügen.

+0

Vielen Dank! Genau das, was ich brauche – Cheryl