Die Größe des Standard-Personen-Detektors ist 64x128, was bedeutet, dass die Personen, die Sie erkennen möchten, mindestens 64x128 sein müssen. Für Ihre Kameraauflösung würde das bedeuten, dass eine Person ziemlich viel Platz einnehmen müsste, bevor sie richtig erkannt wird.
Abhängig von Ihrer spezifischen Situation können Sie versuchen, Ihren eigenen HOG Descriptor mit einer kleineren Größe zu trainieren. Sie können einen Blick auf this answer und die referenced library werfen, wenn Sie Ihren eigenen HOG Descriptor trainieren möchten.
Für die Parameter:
win_stride: Angesichts Ihrer Eingangsbild hat eine Größe von 640 x 480, und die defaultpeopleDetector hat eine Fenstergröße von 64x128, können Sie die HOG Detektionsfenster passen (das 64x128 Fenster) mehrmals im Eingabebild. Der Winstride teilt HOG mit, das Erkennungsfenster jedes Mal um einen bestimmten Betrag zu bewegen. Wie funktioniert das? Hog platziert das Erkennungsfenster oben links in Ihrem Eingabebild. und verschiebt das Erkennungsfenster jedes Mal um win_stride.
wie folgt aus (kleine win_stride):
oder so (große win_stride)
Eine kleinere winstride Genauigkeit verbessern sollte, sondern verringert preformance und andersrum
Auffüllen Auffüllen fügt auf jeder Seite des Eingabebildes eine bestimmte Menge zusätzlicher Pixel hinzu. Auf diese Weise wird das Erkennungsfenster etwas außerhalb des Eingabebildes platziert. Aufgrund dieser Auffüllung kann HOG Personen erkennen, die sich sehr nahe am Rand des Eingabebilds befinden.
group_threshold Der group_threshold bestimmt einen Wert, wenn erkannte Teile in einer Gruppe platziert werden sollen. Niedriger Wert stellt keine Ergebnisgruppierung bereit, ein höherer Wert stellt Ergebnisgruppierung bereit, wenn der Grenzwert innerhalb der Erkennungsfenster gefunden wurde.(in meiner eigenen Erfahrung, ich musste nie den Standardwert ändern)
Ich hoffe, dass dies für Sie ein wenig sinnvoll ist. Ich habe in den letzten Wochen mit HOG gearbeitet und viele Artikel gelesen, aber ich habe einige der Verweise verloren, daher kann ich Ihnen die Seiten, von denen diese Informationen stammen, nicht verlinken, tut mir leid.
Leute im Bild müssen mindestens die Größe des HOG-Deskriptors haben (etwas weniger) und nur größere Personen werden von detectMultiScale zusätzlich gefunden (afaik). Sie können nicht erwarten, dass die Erkennungsrate für solche allgemeinen "Objekte" in der Nähe von 100% liegt, aber in einem Stream sollten Sie jede reale Person mindestens einmal erkennen. Sie können versuchen, diese nachzuverfolgen und Ihre zuvor erkannten Personen zu bestätigen/zu verleugnen. – Micka
Danke für deine Antwort Micka! Sagst du: "mindestens die Größe des HOG-Deskriptors" ... aber ** Was ist diese Größe? ** Kennen Sie andere Möglichkeiten oder existiert nur "getDefaultPeopleDetector" ?? Vielen Dank !! – Ricardo
Diese Website könnte Ihnen helfen: http://www.geocities.ws/talh_davidc/ – SomethingSomething