Verwirrung über 2-dimensionale Kerndichte-Schätzung in R

Für Kerndichte-Schätzer, wie die unten erwähnte Referenz, werden verwendet, um die Wahrscheinlichkeitsdichtefunktion zu schätzen.Verwirrung über 2-dimensionale Kerndichte-Schätzung in R

Meine Verwirrung ist zu wissen, was genau tut kde2d tun? Schätzen sie die gemeinsame Verteilungswahrscheinlichkeitsdichtefunktion von zwei Zufallsvariablen - f (a, b) im folgenden Beispiel? Und was bedeutet die Farbe?

Hier ist das Codebeispiel, auf das ich mich beziehe.

b<-log10(rgamma(1000,6,3)) 
a<-log10((rweibull(1000,8,2))) 
density<-kde2d(a,b,n=100) 
filled.contour(density,color.palette=colorRampPalette(c('white','blue','yellow','red','darkred')))

Vielen Dank im Voraus, Lin

Quelle

2016-08-04 Lin Ma

'Schätzen sie die gemeinsame Verteilung Wahrscheinlichkeit Dichtefunktion von zwei Zufallsvariablen?' - ja. Da Sie jetzt drei Achsen haben, 'rv1',' rv2' und 'geschätzte Wahrscheinlichkeit', müssen Sie einen von ihnen farbcodieren, um sie in einem' 2d'-Graphen anzeigen zu können.So können Sie die Wahrscheinlichkeit farbig codieren und/oder Konturlinien gleicher Wahrscheinlichkeit zeichnen. Weitere Informationen zu Konturlinien finden Sie in Wikipedia: https://en.wikipedia.org/wiki/Contour_line – cel

Werfen Sie einen Blick auf den Quellcode von 'kde2d'. Es ist oft leicht, die 2D-Kde zu disambiguieren, sobald man weiß, dass die 2d-normale Kerndichte-Schätzung das Produkt von zwei 1d-Normal-Kdes ist. – shayaa

@cel, danke und vote up, also ** dunkelrot ** Farbe bedeutet höhere Wahrscheinlichkeit für '(x, y)' als ** weiß **, richtig? Bedeutet das auch, dass im Bereich ** dunkelrot ** die Zufallsvariable 'x' und' y' eine höhere Korrelation als ** weiß ** hat? –

Was ist eine Kerndichteschätzer? Im Wesentlichen passt es eine kleine normale Dichtekurve über jeden Punkt (der Mittelpunkt der normalen Dichte ist dieser Punkt) der Daten und summiert dann alle kleinen normalen Dichten zu einem Kerndichte-Schätzer.

Aus Gründen der Veranschaulichung werde ich ein Bild eines 1 dimensionalen Kerndichte-Schätzers von one of your links hinzufügen.

Bis jetzt haben wir schnell diskutiert, was ein 1D Kernel Density Estimator ist.

Was ist mit zweidimensionalen Kerndichten?

# library(MASS) 
b <- log10(rgamma(1000,6,3)) 
a <- log10((rweibull(1000,8,2))) 
# a and b contain 1000 values each. 

density <- kde2d(a,b,n=100)

Die Funktion erstellt ein Gitter aus min(a) zu max(a) und min(b) zu max(b). Statt eine winzige 1D-Normaldichte über jeden Wert in a oder b zu setzen, passt kde2d jetzt eine winzige 2D-Normaldichte über jeden Punkt im Raster. Genau wie in der 1-dimensionalen Fall-Kerndichte addiert sie dann alle Dichtewerte auf.

Was bedeuten die Farben? Wie @cel in den Kommentaren darauf hingewiesen: Die geschätzte Wahrscheinlichkeit hängt von zwei Variablen ab, also haben wir jetzt drei Achsen (a, b und estimated probability). Eine Möglichkeit, 3 Achsen zu visualisieren, ist die Verwendung von ISO-Wahrscheinlichkeitskonturen. Das klingt schick, aber es ist im Grunde das gleiche wie die Hoch-/Niederdruckbilder, die wir aus der Wettervorhersage kennen.

Sie

verwenden

filled.contour(density,color.palette = colorRampPalette(c('white', 'blue', 
                  'yellow','red', 
                  'darkred')))))

So von niedrig bis hoch, wird das Grundstück white, blue, yellow, red und schließlich darkred für die höchsten Werte der geschätzten Wahrscheinlichkeit gefärbt sein. Daraus ergibt sich folgendes Diagramm:

Quelle

2016-08-04 13:51:51

Danke Ken, stimme ab. In meinem Codebeispiel bedeutet ** dunkelrot ** also eine höhere Wahrscheinlichkeit für '(x, y)' als ** weiß **, richtig? Bedeutet das auch, dass im Bereich ** dunkelrot ** die Zufallsvariable 'x' und' y' eine höhere Korrelation als ** weiß ** hat? –

@LinMa Ich habe den Beitrag bearbeitet. Die Farben ** ** ** stellen keine Korrelation dar, sie repräsentieren den Wert der geschätzten Fugendichte. Da 'kde2d' keine Kovarianzmatrix enthält, um die Beziehung zwischen' a' und 'b' zu modellieren, bin ich mir sicher, dass es die Unabhängigkeit der Werte in' a' und 'b' annimmt, dh' a' und 'b' sind unkorreliert. –

Danke Ken, wähle für die Antwort. Ich denke für eine tiefere Farbe (dunkelrot in deinem Beispiel) bedeutet das höhere Dichte - was bedeutet, dass "a" und "b" am ehesten in solch dunkelroten Bereichen vorkommen, richtig? Wenn es richtig ist, warum können wir nicht schließen, dass "a" und "b" eine höhere Korrelation im dunkelroten Bereich haben? –

Verwirrung über 2-dimensionale Kerndichte-Schätzung in R

Antwort

Verwandte Themen