5

Nach mehreren Monaten Arbeit mit konnte ich meine eigenen Modelle erfolgreich trainieren. Zum Beispiel konnte ich ImageNet mit 1000 Klassen weiter als meine eigenen Modelle trainieren.Versuchen, das ImageNet-Modell mit Region CNN (R-CNN) zu trainieren

In meinem Projekt versuche ich jetzt, die Region meiner Interessenklasse zu extrahieren. Danach habe ich die Demo von Fast R-CNN kompiliert und ausgeführt und es funktioniert ok, aber die Beispielmodelle enthalten nur 20 Klassen und ich hätte gerne mehr Klassen, zum Beispiel alle.

Ich habe bereits die bounding boxes von ImageNet heruntergeladen, mit den echten Bildern.

Jetzt bin ich leer, ich kann die nächsten Schritte nicht herausfinden und es gibt keine Dokumentation, wie es geht. Das einzige, was ich gefunden habe, ist, wie man das INRIA-Personenmodell trainiert, und sie liefern Dataset + Annotationen + Python-Skript.

Meine Fragen sind:

  • Gibt es vielleicht eine Anleitung oder Anleitung, die ich verpasst habe?
  • Gibt es bereits ein Modell, das mit 1000 Klassen trainiert wurde, um Bilder zu klassifizieren und die Bounding Boxes zu extrahieren?

Vielen Dank im Voraus.

Grüße.

Rafael.

Antwort

4

Dr Ross Girshik hat eine Menge Arbeit an der Objekterkennung geleistet. Sie können eine Menge von seinem detaillierten Git auf fast RCNN lernen: Sie sollten in der Lage sein, einen Caffe-Zweig dort mit einer Demo zu finden. Ich habe es nicht selbst benutzt, aber es scheint sehr verständlich zu sein.

Eine andere Richtung, die Sie vielleicht interessant finden, ist LSDA: Verwenden der schwachen Überwachung, um Objekterkennung für viele Klassen zu trainieren.

BTW, haben Sie in faster-rcnn gesucht?

+0

Hallo @Shai, danke für die Antwort. Um ehrlich zu sein, ich wusste nichts über LSDA oder schneller-rcnn, ich werde einen kurzen Blick auf beide werfen. LSDA scheint klar zu sein. Der Sinn von Ross Girshik ist, dass ich nicht in der Lage bin zu trainieren, da es kein "Download-Set" wie reguläres Caffe gibt, sondern nur die vortrainierten Models oder Train-Modelle mit 20 Klassen herunterladen kann. Ich werde einen genaueren Blick darauf werfen, wenn die Dinge "klar" sind, wie du es erwähnst, denn vielleicht habe ich einige Details weitergegeben, die ich brauchte ... werde den Rest der Frameworks sehen und die Antwort aktualisieren. Vielen Dank! –

+0

@RafaelRuiz AFAIK fast-rcnn Git hat ein Trainingsskript (in Python) basierend auf VOC-Annotationen, glaube ich (= Ich habe es selbst nicht versucht) es kann geändert werden, um mit anderen kommentierten Sets zu arbeiten. – Shai

+0

Ich werde es versuchen, vielen Dank. Ich habe dieses Skript jetzt gesehen, aber ich war verwirrt mit anderen Dokumentationen wie dem INRIA Personenmodell: \ –