Was ist eine Kerndichteschätzer? Im Wesentlichen passt es eine kleine normale Dichtekurve über jeden Punkt (der Mittelpunkt der normalen Dichte ist dieser Punkt) der Daten und summiert dann alle kleinen normalen Dichten zu einem Kerndichte-Schätzer.
Aus Gründen der Veranschaulichung werde ich ein Bild eines 1 dimensionalen Kerndichte-Schätzers von one of your links hinzufügen.
Bis jetzt haben wir schnell diskutiert, was ein 1D Kernel Density Estimator ist.
Was ist mit zweidimensionalen Kerndichten?
# library(MASS)
b <- log10(rgamma(1000,6,3))
a <- log10((rweibull(1000,8,2)))
# a and b contain 1000 values each.
density <- kde2d(a,b,n=100)
Die Funktion erstellt ein Gitter aus min(a)
zu max(a)
und min(b)
zu max(b)
. Statt eine winzige 1D-Normaldichte über jeden Wert in a
oder b
zu setzen, passt kde2d
jetzt eine winzige 2D-Normaldichte über jeden Punkt im Raster. Genau wie in der 1-dimensionalen Fall-Kerndichte addiert sie dann alle Dichtewerte auf.
Was bedeuten die Farben? Wie @cel in den Kommentaren darauf hingewiesen: Die geschätzte Wahrscheinlichkeit hängt von zwei Variablen ab, also haben wir jetzt drei Achsen (a
, b
und estimated probability
). Eine Möglichkeit, 3 Achsen zu visualisieren, ist die Verwendung von ISO-Wahrscheinlichkeitskonturen. Das klingt schick, aber es ist im Grunde das gleiche wie die Hoch-/Niederdruckbilder, die wir aus der Wettervorhersage kennen.
Sie
verwenden
filled.contour(density,color.palette = colorRampPalette(c('white', 'blue',
'yellow','red',
'darkred')))))
So von niedrig bis hoch, wird das Grundstück white
, blue
, yellow
, red
und schließlich darkred
für die höchsten Werte der geschätzten Wahrscheinlichkeit gefärbt sein. Daraus ergibt sich folgendes Diagramm:
'Schätzen sie die gemeinsame Verteilung Wahrscheinlichkeit Dichtefunktion von zwei Zufallsvariablen?' - ja. Da Sie jetzt drei Achsen haben, 'rv1',' rv2' und 'geschätzte Wahrscheinlichkeit', müssen Sie einen von ihnen farbcodieren, um sie in einem' 2d'-Graphen anzeigen zu können.So können Sie die Wahrscheinlichkeit farbig codieren und/oder Konturlinien gleicher Wahrscheinlichkeit zeichnen. Weitere Informationen zu Konturlinien finden Sie in Wikipedia: https://en.wikipedia.org/wiki/Contour_line – cel
Werfen Sie einen Blick auf den Quellcode von 'kde2d'. Es ist oft leicht, die 2D-Kde zu disambiguieren, sobald man weiß, dass die 2d-normale Kerndichte-Schätzung das Produkt von zwei 1d-Normal-Kdes ist. – shayaa
@cel, danke und vote up, also ** dunkelrot ** Farbe bedeutet höhere Wahrscheinlichkeit für '(x, y)' als ** weiß **, richtig? Bedeutet das auch, dass im Bereich ** dunkelrot ** die Zufallsvariable 'x' und' y' eine höhere Korrelation als ** weiß ** hat? –