2016-07-01 14 views
3

Gegeben Mittelwert und Varianz einer Gaußschen (normalen) Zufallsvariablen, möchte ich seine Wahrscheinlichkeitsdichtefunktion (PDF) berechnen.Warum gibt scipy.norm.pdf manchmal PDF> 1? Wie man es korrigiert?

enter image description here

ich diesen Beitrag genannt: Calculate probability in normal distribution given mean, std in Python,

Auch die scipy docs: scipy.stats.norm

Aber wenn ich eine PDF-Datei einer Kurve zeichnen, ist die Wahrscheinlichkeit größer als 1! Wenden Sie sich an diesem Mindestarbeitsbeispiel:

import numpy as np 
import scipy.stats as stats 

x = np.linspace(0.3, 1.75, 1000) 
plt.plot(x, stats.norm.pdf(x, 1.075, 0.2)) 
plt.show() 

Dies ist, was ich bekommen:

Gaussian PDF Curve

Wie ist es sogar möglich, 200% Wahrscheinlichkeit zu haben, den Mittelwert zu erhalten, 1,075? Unterscheide ich hier etwas falsch? Gibt es eine Möglichkeit, dies zu korrigieren?

+0

Haben Sie versucht, die Dokumentation der von Ihnen verwendeten Funktion zu lesen? Das letzte Argument ist ein Skalierungsfaktor. Sie sagen scipy, die resultierende PDF mit 1/0,2 – talonmies

+0

zu multiplizieren, tat ich tatsächlich @talonmies. Die norm.pdf selbst wird für standardisierte Zufallsvariablen verwendet und berechnet daher exp (-x ** 2/2)/sqrt (2 * pi). Um mu und sigma in die Relation zu bringen, werden "loc" und "scale" eingeführt. Diese zu spezifizieren würde bedeuten, dass x durch (x-loc)/skalieren ersetzt wird und das Endergebnis durch Skalierung dividiert wird, wodurch die oben beschriebene Gaußsche PDF gebildet wird. –

Antwort

10

Es ist kein Fehler. Es ist auch kein falsches Ergebnis. Der Wert der Wahrscheinlichkeitsdichtefunktion an einem bestimmten Punkt gibt Ihnen keine Wahrscheinlichkeit; es ist ein Maß dafür, wie dichten die Verteilung ist um diesen Wert. Für kontinuierliche Zufallsvariablen ist die Wahrscheinlichkeit an einem gegebenen Punkt gleich Null. Anstelle von p(X = x) berechnen wir Wahrscheinlichkeiten zwischen 2 Punkten p(x1 < X < x2) und es ist gleich dem Bereich unterhalb dieser Wahrscheinlichkeitsdichtefunktion. Der Wert der Wahrscheinlichkeitsdichtefunktion kann sehr wohl über 1 liegen. Sie kann sich sogar der Unendlichkeit nähern.

+0

Danke für die Klarstellung. Ich war besorgt, weil das mit meinem Produkt der Wahrscheinlichkeiten zu tun hatte. Antwort angenommen. –

+3

@ ÉbeIsaac, um einen Punkt zur Antwort hinzuzufügen ** INTEGRAL ** von PDF über das Intervall ist gleich 1. Aber PDF selbst kann über 1, unter 1, 0 sein. Natürlich kann nicht negativ sein. –