Wenn die Verteilung kontinuierlich ist, dann ist die Wahrscheinlichkeit eines beliebigen Punktes x
0, fast definitionsgemäß kontinuierliche Verteilung. Wenn die Verteilung diskret ist, und darüber hinaus ist die Unterstützung der Verteilung eine Teilmenge der Menge der ganzen Zahlen, wird für jede ganze Zahl x seine Wahrscheinlichkeit ist
cdf(PD,x) - cdf(PD,x-1)
Allgemeiner gesagt, für jede Zufallsvariable X, welche auf ganze Zahl nimmt Werte sind die Wahrscheinlichkeitsmassenfunktion f(x)
und die kumulativen Verteilungs F(x)
durch
f(x) = F(x) - F(x-1)
die rechte bezogene Seite als diskretes Derivat interpretiert werden kann, so ist dies eine direkte Analogon der Tatsache, dass der PDF im kontinuierlichen Fall ist die Ableitung des cdf.
Ich bin mir nicht sicher, ob Matlab einen direkteren Weg hat, an der Wahrscheinlichkeits-Massenfunktion in Ihrer Situation zu kommen, als das cdf so durchzugehen.
Im kontinuierlichen Fall ist Ihre Frage nicht sehr sinnvoll, da, wie ich oben sagte, die Wahrscheinlichkeit 0 ist. Nicht-Null-Wahrscheinlichkeit in diesem Fall ist etwas, das Intervalle statt einzelne Punkte anhaftet. Sie können immer noch nach der Wahrscheinlichkeit fragen, einen Wert in der Nähe vonx
zu erhalten - aber dann müssen Sie entscheiden, was Sie mit "in der Nähe" meinen. Wenn beispielsweise x
eine Ganzzahl ist, möchten Sie vielleicht die Wahrscheinlichkeit kennen, einen Wert zu erhalten, der auf x gerundet wird. Das wäre:
cdf(PD, x + 0.5) - cdf(PD, x - 0.5)
Vielen Dank, aber was ich ursprünglich wollte, ist P (X = a), das heißt a = b, die F (b) geben - F (a) = F (a) - F (a) = 0 – machinery
@ machinery ja , das ist richtig. Und deshalb fragt niemand nach P (X = a) für die Normalverteilung oder die meisten anderen kontinuierlichen Verteilungen (mit der möglichen Ausnahme während Tests oder Hausaufgabenfragen, um das Verständnis zu testen). P (X = a) = 0 für irgendeine Zufallsvariable X mit einer kontinuierlichen Wahrscheinlichkeitsdichtefunktion. –
Ok, aber in einem (gaussian) naiven Bayes Klassifikator passen Sie eine normale Verteilung für jedes Feature an und dann müssen Sie P (X = a) für einen neuen Datenpunkt berechnen ... Kann ich einfach den PDF Wert in solchen verwenden ein Fall? Natürlich kann pdf größer als eins werden, aber höherer pdf Wert bedeutet höhere Wahrscheinlichkeit (Dichte). – machinery