R Schleifenoptimierung/Schleife ist viel zu zeitaufwendig

Die folgende Schleife dauert ewig. Gibt es dafür einen effizienteren Weg? Die folgende Tabelle besteht aus 27 Variablen und mehr als 600.000 Beobachtungen.R Schleifenoptimierung/Schleife ist viel zu zeitaufwendig

data <- read.table("file.txt", header = T, sep= "|") 
colnames(data)[c(1)] <- c("X") 
data <- as.data.table(data) 
n=1; 
vector <- vector() 
for(i in 2:nrow(data)) 
{ 
    if(data[["X"]][i] != data[["X"]][i-1]) 
    { 
    n=1; vector[i]=1} 
else { 
    n=n+1; vector[i]=n}}

Grundsätzlich ich brauche jedes Auftreten eines eindeutigen Eintrag in X, das heißt das erste Mal erschien es, das zweite Mal erschien es, usw. und dann zusammenführen, dies zu den vorhandenen Daten als zusätzliche Spalte zu indizieren. Allerdings habe ich beim Übersetzen des Vektors eine Bestandsaufnahme erhalten.

Vielen Dank.

Quelle

2016-08-02 Tsvetan Nikolov

eine zeitaufwendige Art und Weise? – MichaelChirico

Wo wird 'Vektor' initiiert? –

auch wo ist 'n' initiiert ... – MichaelChirico

First off, verwenden fread:

DT <- fread("file.txt", sep = "|")

Als nächstes benutzen setnames:

setnames(DT, 1, "X")

Schließlich verwenden rowid:

DT[ , vector := rowid(X)]

Quelle

2016-08-02 14:08:16 MichaelChirico

Es hat funktioniert ... Danke! –

R Schleifenoptimierung/Schleife ist viel zu zeitaufwendig

Antwort

Verwandte Themen