Ich muss einige Daten über Internet-Sitzungen für eine DSL-Leitung analysieren. Ich wollte sehen, wie die Sitzungsdauern verteilt sind. Ich dachte, ein einfacher Weg, dies zu tun, würde darin bestehen, ein Wahrscheinlichkeitsdichtediagramm der Dauer aller Sitzungen zu erstellen.Getting Probability Dichte von Daten
Ich habe die Daten in R geladen und die density()
Funktion verwendet. Also, es war so etwas
plot(density(data$duration), type = "l", col = "blue", main = "Density Plot of Duration",
xlab = "duration(h)", ylab = "probability density")
Ich bin neu in R und diese Art von Analyse. Das war, was ich von Google erfahren habe. Ich bekam eine Verschwörung, aber mir blieben einige Fragen. Ist das die richtige Funktion, um das zu tun, was ich versuche, oder gibt es etwas anderes?
In der Grafik fand ich, dass die Y-Achsenskala von 0 ... 1,5 war. Ich verstehe nicht, wie es 1.5 sein kann, sollte es nicht von 0 ... 1 sein?
Auch möchte ich eine glattere Kurve bekommen. Da der Datensatz sehr groß ist, sind die Zeilen wirklich gezackt. Es wäre schöner, wenn sie geglättet werden, wenn ich das vorstelle. Wie würde ich das machen?
Sie interpretieren die Dichte falsch. Die Dichte von X kann als ein Wert ** gesehen werden, der proportional zu ** der Wahrscheinlichkeit ist, aus der Population eine Zahl zu ziehen, die in der Nähe von X liegt. Jetzt ist definitionsgemäß das Integral der Dichtefunktion gleich 1.Dies bedeutet nicht, dass der maximale Wert der Dichtefunktion 1 sein sollte, er kann leicht größer sein. Für eine F-Verteilung mit df = (1,1) ist der maximale Wert für die Dichte (bei 0) sogar unendlich. –
@Joris Ja ich merke jetzt, dass ich es nicht richtig interpretiert habe. eher vereinfachend nahm ich an, dass es wegen seiner Wahrscheinlichkeitsverteilung weniger als 1 wäre :). – sfactor