Der harmonische Mittelwert ist das Äquivalent des arithmetischen Mittelwerts für reziproke Größen, die durch das arithmetische Mittel gemittelt werden sollen. Genauer gesagt, mit dem harmonischen Mittel transformierst du alle deine Zahlen in die "durchschnittliche" Form (indem du das Reziproke nimmst), nimmst ihr arithmetisches Mittel und transformierst das Ergebnis zurück in die ursprüngliche Darstellung (indem du wieder das Reziproke nimmst).
Präzision und der Rückruf sind "natürlich" reziprok, weil ihr Zähler der gleiche ist und ihre Nenner unterschiedlich sind. Brüche sind vernünftiger zu mitteln, wenn sie den gleichen Nenner haben.
Für mehr Intuition, nehmen wir an, dass wir die Anzahl der wahren positiven Elemente konstant halten. Dann nehmen Sie implizit das arithmetische Mittel der Falsch-Positiven und Falsch-Negativen, indem Sie das harmonische Mittel der Präzision und des Abrufs nehmen. Es bedeutet im Grunde, dass falsch positive und falsch negative genauso wichtig für Sie sind, wenn die wahren positiven gleich bleiben. Wenn ein Algorithmus N mehr falsch positive Items hat, aber N weniger falsch negative Items (während er dieselben wahren Positiven hat), bleibt das F-Maß gleich.
In anderen Worten: die F-Maßnahme ist geeignet, wenn:
- Fehler gleich schlecht sind, ob sie falsch-positive oder falsch-negative Ergebnisse
- die Anzahl der Fehler ist, gemessen in Bezug auf die Anzahl der zutreffen Positive
- wahre Negative sind uninteressant
Punkt 1 oder nicht wahr sein können, gibt es Varianten des F-Maß gewichtet, dass, wenn diese Annahme verwendet werden kann, ist nicht wahr. Punkt 2 ist ziemlich natürlich, da wir erwarten können, dass die Ergebnisse skalieren, wenn wir mehr und mehr Punkte klassifizieren. Die relativen Zahlen sollten gleich bleiben.
Punkt 3 ist ziemlich interessant. In vielen Anwendungen sind Negative der natürliche Standard und es kann sogar schwer oder willkürlich sein zu spezifizieren, was wirklich als ein echtes Negativ gilt. Zum Beispiel hat ein Feueralarm jede Sekunde, jede Nanosekunde, jedes Mal, wenn eine Planck-Zeit vergangen ist, ein echtes negatives Ereignis usw. Auch ein Felsbrocken hat immer diese wahrhaft negativen Feuererkennungs-Ereignisse.
Oder in einem Gesichtserkennung Fall die meiste Zeit Sie "korrekt zurückgeben" Milliarden von möglichen Bereichen im Bild, aber das ist nicht interessant. Die interessanten Fälle sind, wenn Sie eine vorgeschlagene Erkennung tun zurückgeben, oder wenn Sie zurückgeben sollten.
Im Gegensatz dazu gilt die Klassifikationsgenauigkeit gleichermaßen für echte positive und echte negative und ist besser geeignet, wenn die Gesamtzahl der Proben (Klassifikationsereignisse) wohldefiniert und eher klein ist.
Die Intuition ist es, Präzision und Erinnerung auszugleichen (normalerweise die beste Messung, aber in einigen Fällen möchten Sie die Präzision oder den Erinnerungswert maximieren, was eine andere Geschichte ist). Sie können keinen hohen f-Wert erhalten, wenn einer der beiden sehr niedrig ist. – greeness
http://www.cse.unsw.edu.au/~teachadmin/info/harmonic3.html Dies ist eine gute Ressource zum Verständnis HM –