2016-05-26 16 views
-1

Obwohl ich von einigen "grundlegenden" r-Befehlen ratlos bin. Dies ist das dritte Mal, dass ich diesen Kurs (Roger Pengs R-Programmierung auf Coursera) mache Ich bin ein Stata-Benutzer, also bin ich sehr versiert in Statistiken.Anzahl der Zeilen in der csv-Datei für 'R-Programmierkurs' auf Coursera von Roger Peng

Hier sind die Probleme, die ich habe: Erstens, wie finde ich die Anzahl der Zeilen in einer CSV-Datei.Ich habe die Antwort gefunden, weil es ist nicht eine sehr große Datenmenge so dass ich nur nach unten gescrollt

Der folgende Code hat mir die ersten beiden Reihen.

read.csv ("hw1_data-3.csv", nrows = 2) 

Aber ich brauche auch die letzten beiden Zeilen und wenn ich versuche,

read.csv ("hw1_data-3.csv", nrows = 152:153) 

Ich erhalte den Fehler

Error: unexpected numeric constant in "read.csv ("hw1_data-3.csv", nrows 152"

Würde etwas Hilfe auf dieser lieben

Antwort

0

die Anzahl der Zeilen zu finden in einer CSV-Datei versuchen Sie dies:

my.data <- read.csv("hw1_data-3.csv") 
nrow(my.data) 

Oder:

dim(my.data)[1] 

Um die letzten beiden Zeilen extrahieren können Sie dies versuchen:

my.data[(nrow(my.data) - 1) : nrow(my.data), ] 

Eine schnelle Suche im Internet eine Blog-Post mit einer Vielzahl von Methoden zur Bestimmung der Anzahl der Zeilen in einer CSV-Datei noch nicht entfernt hier erwähnt. Ich zögere ein wenig, diese Methoden zu kopieren und einzufügen. So, jetzt, ich sende einfach den Link zu diesem Blog:

http://www.r-bloggers.com/easy-way-of-determining-number-of-linesrecords-in-a-given-large-file-using-r/

2

Erste Frage,

how do I find the number of rows in a csv file

Sie nrow Funktion

Zum Beispiel in mtcars Dataset verwenden können, können Sie Verwenden Sie

nrow(mtcars) 

, die die Zeilennummern

#[1] 32 

I also need the last two rows

denn das würde zurückkehren können Sie tail Funktion

tail(mtcars, 2) 

#    mpg cyl disp hp drat wt qsec vs am gear carb 
#Maserati Bora 15.0 8 301 335 3.54 3.57 14.6 0 1 5 8 
#Volvo 142E 21.4 4 121 109 4.11 2.78 18.6 1 1 4 2 

verwenden, wo mtcars Datenrahmen und 2 ist die Anzahl der Zeilen, die Sie anzeigen möchten.

0

Um herauszufinden, wie viele Zeilen in Ihrer Tabelle sind, müssen Sie die gesamte Tabelle in R lesen.

data <- read.csv("hw1_data-3.csv") 

Wenn Sie nur die letzten beiden Zeilen aus dem Datensatz benötigen, verwenden tail().

tail(data, n=2) 

n gibt an, wie viele letzte Zeilen auszuwählen.

1

Wir .N von data.table verwenden, um die Anzahl der Zeilen von fread

d1 <- fread("hw1_data-3.csv") 
d1[, .N] 
nach der Lektüre

bekommen die letzten beiden Zeilen zu bekommen

tail(d1, 2)