2009-08-11 5 views
2

Ich lade eine Tabelle, in der die erste Spalte eine URL ist, und lese sie unter Verwendung von read.table() in R ein.Zeilen, die mit read.table in R fallen gelassen werden?

Es scheint, dass R etwa 1/3 der Spalten fallen lässt und keine Fehler zurückgibt.

Die URLs enthalten keine Zeichen oder Tabs (mein Trennzeichenfeld), von denen ich verstehe, dass sie ein Problem darstellen könnten. Wenn ich zuerst die URLs in Integer-IDs umwandle, geht das Problem verloren.

Gibt es etwas in dem Feld, das R veranlassen könnte, die Zeilen zu löschen?

+0

Könnten Sie uns ein kleines Beispiel der Daten geben (aus einem einfachen Texteditor, nicht nach dem Laden in R)? Verwenden Sie irgendwelche Parameter mit Ihrer read.table() oder nur den Standardeinstellungen? (PS - Danke an wer auch immer meine Antwort Version dieses Kommentars upvoted, so dass ich genügend Rep haben könnte, um zu kommentieren!) –

Antwort

2

Ohne eine Stichprobe der Daten ist es schwer zu sagen. Aber ein kleiner "Gotcha" ist, dass # der Standard comment.char in read.table() ist. Versuchen Sie comment.char = "" einzustellen und sehen Sie, ob das das Problem behebt.

1

Vielen Dank für Ihre Hilfe,

Ja, so zunächst gab es einige Hashes und ich konnte sie comment.char = '' mit behandeln. Das Problem stellte sich heraus, dass einige meiner URLs "und" Zeichen enthielten. Das Seltsamste an der Situation war, dass keine Fehler zurückgegeben wurden. Nachdem ich diese Zeichen mit tr entfernt hatte, hatte ich keine Probleme beim Laden der Daten.

+0

Dies sollte eine Bearbeitung der Frage sein.Ein reproduzierbares Beispiel ist erforderlich. –