Ich bin der Autor der video tutorial in der Frage erwähnt. Hier ist eine Zusammenfassung der Funktionen relevant zu dieser Diskussion:
data.frame()
ist Funktion R für regelmäßigen Datenrahmen zu schaffen.
data_frame()
ist dplyrs Funktion zum Erstellen von lokalen Datenrahmen.
tbl_df()
und as_data_frame()
sind dplyr Funktionen für eine Umwandlung regelmäßigen Datenrahmen (oder eine Liste) in eine lokalen Datenrahmen.
Also, was ist der Unterschied zwischen regelmäßigen und lokalen Datenrahmen? Sehr wenig. Ein lokaler Datenrahmen ist nur ein regulärer Datenrahmen, der mit der tbl_df
Klasse für netteren Druck eingewickelt worden ist. (Die Daten werden nach wie vor in einem regelmäßigen Datenrahmen „unter der Haube“ gespeichert.)
Insbesondere Drucken ein lokalen Datenrahmen zeigt nur die ersten 10 Zeilen, und so viele Spalten wie auf dem Bildschirm passen .(Sie können ein Beispiel für dieses Verhalten oben in der RMarkdown document von meinem first dplyr video tutorial, die dem oben verlinkten Lernprogramm vorausgeht) sehen.
Alle dplyr Funktionen geben einen lokalen Datenrahmen standardmäßig, obwohl Sie es zurück zu einem regelmäßigen Datenrahmen mit der data.frame()
Funktion umwandeln kann. Ein Grund dafür ist, wenn Sie bevorzugen, wie regulären Datenrahmen drucken, nämlich, dass Sie mehr Zeilen oder mehr Spalten sehen möchten. Allerdings dplyr ermöglicht es Ihnen, dies zu tun, ohne sie zu konvertieren:
library(dplyr)
library(nycflights13)
# print a local data frame (10 rows, variable number of columns)
flights
# print 15 rows
print(flights, n = 15)
# print all rows (don't run this, since it has 336,776 rows)
print(flights, n = Inf)
# print all columns
print(flights, width = Inf)
dplyr eine vignette über Datenrahmen hat, die weitere technische Details zur Verfügung stellt.
Es unterscheidet es nur von einer entfernten Datenquelle wie einer MySQL-Datenbank oder etwas. – joran
Wenn das verknüpfte Video korrekt ist, sind "data_frame" -Objekte lokale Datenrahmen, aber "data.frame" -Objekte nicht. Jetzt bin ich auch verwirrt. – patabongo
Ich glaube nicht, dass @Tyler in der ursprünglichen Annahme falsch ist, und es gibt einige Semantiken bei der Arbeit. Vielleicht könnte man im Einklang mit der Aussage von Docs und Kevin Markham sagen, dass ein "lokaler Datenrahmen" die Daten sind, die von tbl_df umschlossen werden, das aus einem data.frame erstellt wird, der selbst kein "lokaler Datenrahmen" ist. – jaimedash