i die IRStatisticsImpl
Daten lesen möchten, haben aber einige Probleme zu interpretieren:wie IRStatisticsImpl Daten in Mahout
mein Ergebnis ist:
IRStatisticsImpl[precision:0.04285714285714287,recall:0.04275534441805227,fallOut:0.0018668022652391654,nDCG:0.04447353132522083,reach:0.997624703087886]
ist gemeint, dass ich nur 4% der guten Empfehlungen bekam (Präzision) und ungefähr das gleiche Niveau der schlechten Empfehlung (Rückruf)?
Wie sollten die Zahlen im besten Fall aussehen - Genauigkeit bei 1,0 und Rückruf bei 0,0?
können Sie mir sagen, wie die Zahlen für 'fallOut' und' nDCG' aussehen sollen? sollen sie 1,0 oder 0,0 sein? – ulkas
per definitionem FallOut ist "Der Anteil der nicht relevanten Dokumente, die aus allen nicht relevanten Dokumenten abgerufen werden:" http://en.wikipedia.org/wiki/Information_retrieval#Fall-out Soweit ich weiß, Es sollte so niedrig wie möglich sein, aber es ist auch trivial, 0% zu erhalten, damit Sie Ihre Domain bewerten können. – gpicchiarelli
über nDCG, es ist eine normalisierte Version von DCG, die "Discounted Kumulative Gain" bedeutet. Um genau zu sein, schaue hier http://en.wikipedia.org/wiki/Discounted_cumulative_gain – gpicchiarelli