, wenn ich einen VektorHäufigkeit der Zeichenfolge bestimmen grep
x <- c("ajjss","acdjfkj","auyjyjjksjj")
haben und zu tun:
y <- x[grep("jj",x)]
table(y)
ich:
y
ajjss auyjyjjksjj
1 1
jedoch die zweite Zeichenfolge "auyjyjjksjj" zählen sollte der Teilstring "jj" zweimal. Wie kann ich dies von einer echten/falschen Berechnung ändern, um die Häufigkeit von "jj" tatsächlich zu zählen?
Auch wenn für jeden String die Frequenz des Teilstrings geteilt durch die Länge des Strings berechnet werden könnte, wäre das großartig.
Vielen Dank im Voraus.
das ist ausgezeichnet, danke. Ich merke, dass Sie die Länge der Zeichenfolge berechnen - im data.frame kann ich die Frequenz/Länge aufrufen? das wäre sehr nützlich. Vielen Dank. – brucezepplin
oh tut mir leid - was ich meine ist, kann ich für jede Zeichenfolge die Frequenz der Teilzeichenfolge durch die Zeichenfolgenlänge zurückgegeben? – brucezepplin
sorry - ich; m bekomme Fehler in nchar (df $ x): 'nchar()' benötigt einen Zeichenvektor – brucezepplin