Ich studierte Viola-Jones-Papier, um deren Objektdetektionsalgorithmus besser zu verstehen und ein anwendbares Programm zu erstellen. Im letzten Absatz des Themas "Features" sprechen die Autoren über die Basisauflösung des Detektors, die 24x24 ist, sie sagen, dass die erschöpfende Menge der Rechteckmerkmale ziemlich groß ist, über 180.000. Beachten Sie, dass im Gegensatz zur Haar-Basis die Menge der Rechteck-Features überkompensiert ist. Bedeutet das, dass jedes einzelne Rechteck-Feature 24 mal 24 ist oder es bedeutet einfach, dass wir ein gegebenes Bild in 24 * 24 Blöcke teilen? 180000 ist das Ergebnis der Suche nach verschiedenen Arten von Haar-ähnlichen Merkmalen für jeden 24 * 24-Block? Und ich konnte auch nicht den letzten Teil verstehen, der besagt, dass die Menge der Rechteck-Features überkompensiert ist. Was bedeutet "überkompensiert", wenn wir über Rechteck-Features sprechen? Vielen Dank.Haarähnliche Merkmale zum Erkennen von Objekten
Antwort
Jedes 24X24 Rechteck-Feature gibt Ihnen nur eine Nummer, wie zuvor im selben Abschnitt "Der Wert eines Zwei-Rechteck-Features ist der Unterschied zwischen der Summe der Pixel innerhalb von zwei rechteckigen Bereichen" und "Ein Drei-Rechteck-Feature berechnet die Summe in zwei äußeren Rechtecken, subtrahiert von der Summe in einem mittleren Rechteck. Schließlich berechnet ein Vier-Rechteck-Merkmal den Unterschied zwischen diagonalen Paaren von Rechtecken. "
Eine Erklärung über die Zahl 180,00 Sie können in: Viola-Jones' face detection claims 180k features
einem über Satz bedeutet, dass Sie einige Funktionen, die eine lineare Kombination von anderen Funktionen sind. Im Fall von 24X24-Rechteck-Features können wir eine lineare Basis für diesen Raum erstellen, indem wir alle Rechtecke mit dem Wert 1 in einem ihrer Quadrate und Null in dem ganzen Rest nehmen. Wenn wir berechnen, wie viele Optionen diese Konfiguration hat, erhalten wir 24 * 24 = 576, was viel weniger als 180.000 ist. Dies bedeutet, dass wir aus ihrer Menge von 180.000 einige Rechtecke haben, die wir als Kombination von anderen Rechtecken aus unserer Menge erhalten können.