0

Ich habe die Größe aller positiven Proben so angepasst, dass sie die gleiche Größe haben, also sollen negative Proben die gleiche Größe wie positive haben.Für Autoerkennung, sollen die negativen Proben die gleiche Größe der positiven Proben haben?

+0

Beziehen Sie sich auf die relative Größe der Fahrzeuge in Ihrem Schiebefenster? – autonomy

+0

Nein, die negativen Bilder enthielten keine Fahrzeuge. Meine Frage ist, ob die Bildgröße gleich groß sein soll. – Elhamshary

Antwort

1

Im Allgemeinen gleiten Sie mit der Objekterkennung ein Suchfenster mit einer festen Größe über Ihr Bild, um Featureantworten zu erzeugen. Der Klassifikator vergleicht dann die Antworten mit einem trainierten Modell und meldet die Nähe der beiden. Wir verlassen uns auf die Tatsache, dass die gleiche Art von Objekten ähnliche Merkmalsreaktionen erzeugt. Aus diesem Grund möchten Sie, dass Ihre positiven Daten in jedem gleitenden Fenster die gleiche Größe haben, ansonsten werden die Antworten unterschiedlich sein und Sie werden keine guten Übereinstimmungen erhalten.

Wenn Sie mit den negativen Daten trainieren, geben Sie dem Klassifikator Beispiele für Antworten, die im Allgemeinen nichts gemeinsam haben. Auf diese Weise lernt der Algorithmus, Ihre Daten zu partitionieren. Es spielt keine Rolle, wie groß die Bilder sind, da Sie dasselbe Schiebefenster verwenden. Was zählt, sind die Daten, die von diesem Fenster erfasst werden - es sollte die Daten darstellen, die Sie zur Laufzeit verwenden. Was ich meine ist, dass das Schiebefenster nicht zu viel oder zu wenig Details enthalten sollte. Sie wollen nicht wirklich ein Full-Landscape-Foto machen, es auf 320x240 reduzieren und dann darauf trainieren. Ihr gleitendes Fenster erfasst zu viele Informationen. Das Gleiche gilt für die Aufnahme einer kleineren Teilmenge einer Szene und deren Auflösung auf 1280x960. Jetzt gibt es zu wenig Informationen.

Mit allem, was gesagt wird, jedoch sind die Dinge in der realen Welt gleichzeitig komplizierter und einfacher. Sie werden Objekten unterschiedlicher Größe begegnen; Daher müssen Sie in der Lage sein, sie in verschiedenen Maßstäben zu handhaben. Ihr Klassifikator sollte also über mehrere Maßstäbe hinweg suchen, wodurch Bildgrößen irrelevant werden. Denken Sie daran, es zählt, was innerhalb des gleitenden Fensters zählt. Und: Müll rein = Müll raus. Stellen Sie sicher, dass Ihre Daten gut aussehen.

Edit: http://docs.opencv.org/2.4/doc/user_guide/ug_traincascade.html Aber jedes Bild sollte sein (aber nicht notwendigerweise) größer als ein Trainingsfenstergröße, da diese Bilder verwendet werden negatives Bild auf die Ausbildung Größe unterzuabzutasten.

+0

Was ist mit der angemessenen Menge an Bildern, die ich für das Training verwenden sollte? Ich habe bereits ungefähr 10.000 Negativbilder und ungefähr 7000 positive Bilder der gleichen Größe und des gleichen Formats. Was sind deine Gedanken? – Elhamshary

+0

Die kurze Antwort ist, dass die Menge an Trainingsdaten vernünftig klingt. Die lange Antwort hängt davon ab, welche Genauigkeit Sie erreichen möchten und welche Betriebsbedingungen Sie abdecken möchten. Wenn Sie nur an einer neuen Funktion arbeiten, hilft Ihnen ein kleineres, aber diverses Dataset, schneller zu trainieren. Wenn Sie eine hohe Genauigkeit unter verschiedenen Bedingungen/Beleuchtung/Winkeln wollen, wollen Sie viele und viele verschiedene Daten - es hilft nicht, 7000 Bilder des gleichen Autos zu haben (ich übertreibe), da Sie einfach lernen werden, das zu finden bestimmtes Auto und Ihr Klassifikator werden nicht gut verallgemeinern. – autonomy

+0

Nun, ich ändere meine Meinung in Richtung der Verwendung von Deep Learning für die Erkennung, ist die Größe der Bilder wichtig in Deep Learning? – Elhamshary