2016-07-13 19 views
3

Ist dlib fähig zu großen Datensätzen für Trainingsobjektdetektor. Ich habe> 450K Gesichtsbilder, um einen Gesichtsdetektor zu trainieren. Ist es möglich, Dlib zu verwenden, oder muss ich zu einer anderen Alternative wechseln?Traning Dlib Objektdetektor mit> 450K Instanzen

Antwort

4

Wie viele Daten Sie verwenden können, hängt davon ab, wie viel RAM sich in Ihrem Computer befindet. Vielleicht können Sie auf diese Weise trainieren, je nachdem, wie groß jedes Bild ist und wie viel Arbeitsspeicher Sie haben.

Aber was noch wichtiger ist, fragen Sie wahrscheinlich über den HOG + SVM-Detektor in dlib. Und für das Training eines Gesichtsdetektors sind 450K-Gesichter weit über den Punkt des abnehmenden Ertrags für HOG + SVM hinaus. Zum Beispiel wird der frontale Gesichtsdetektor, der mit dlib geliefert wird, der sehr genau ist, nur auf einem kleinen 62MB Datensatz trainiert (dieser http://dlib.net/files/data/dlib_face_detector_training_data.tar.gz). Das Training dieser Art von Detektor mit mehr als ein paar tausend Bildern wird Ihnen keine zusätzliche Genauigkeit bringen.

Jetzt, wenn Sie eine Menge Pose Variabilität in Ihren Daten haben, wird HOG + SVM nicht in der Lage, das zu erfassen. In diesem Fall ist es am besten, mehrere Detektoren zu trainieren, einen für jede Pose. Mit der Option --cluster des imglab-Tools von dlib können Sie Ihr Dataset automatisch in verschiedene Posen aufteilen.

+0

Ich glaube nicht, dass es so genau ist. zum Beispiel funktioniert nicht für http://ia.media-imdb.com/images/M/MV5BMjM0MTUwMzgwMF5BMl[email protected]_V1_SY1000_CR0,0,665,1000_AL_.jpg – erogol

+1

Ich habe gerade dieses Beispielprogramm (http://dlib.net/face_detection_ex.cpp .html) auf diesem Bild und erkannte alle Gesichter in der Kamera. –

+0

seltsam. Danke für die Korrektur. Ich werde das überprüfen. – erogol