So gibt es viele Möglichkeiten, wie man HoG-Funktionen extrahieren kann. Verwenden unterschiedlicher Orientierungen, unterschiedliche Anzahl von Pixeln pro Zelle und unterschiedliche Blockgrößen.Ideale Anzahl von HoG-Funktionen
Aber gibt es eine Standard- oder optimale Konfiguration? Ich habe Trainingsbilder der Größe 50x100, und ich wähle für 8 Richtungen der Orientierung. Ich extrahiere die Merkmale aus den Trainingsdaten, um die Fahrzeugklassifizierung durchzuführen. Aber ich weiß wirklich nicht, was "optimal" ist.
Zum Beispiel habe ich hier 2 Konfigurationen, gibt es einen Grund, einen über den anderen zu wählen? Persönlich habe ich das Gefühl, dass der zweite eine bessere Wahl ist, aber warum?
Aber für eine Person, die eine Erfahrung mit HoG-Funktionen hat Stimmst du auch zu, dass das untere Bild, das ich auflege, eine bessere HoG-Skala hat als das obere Bild? – user961627
Aus persönlicher Erfahrung, wenn Bild nicht sehr klein ist, 8x8 Pixel pro Zelle ist oft die gute Konfiguration. Und 9 Orientierung - UoCTTI Variante. P. F. Felzenszwalb, R. B. Grishick, D. McAllester und D. Ramanan. Objekterkennung mit diskriminativ trainierten teilbasierten Modellen. PAMI, 2009. –
was meinst du mit "sehr klein". Ich nehme an, 50x100 Bilder würden sich als nicht sehr klein qualifizieren? – user961627