2013-08-26 3 views
5

Es gibt verschiedene Arten von Detektoren und Deskriptoren, wie SIFT, SURF, SCHNELL. Ich frage mich, ob sie alle für Echtzeitanwendungen geeignet sind? Welches ist das Beste oder besser?Merkmal Detektoren und Deskriptoren Vergleich

Und außerdem, ist Harris-Laplacian Detector immer noch nützlich, wenn wir bereits die oben genannten drei haben? Ist es besser als sie?

+0

SIFT und SURF sind relativ langsam, wenn Deskriptoren um binäre Deskriptoren wie zügigen, BRIEF, ORB und UNGEWÖHNLICHER verglichen. Ich bin mir nicht sicher über ihre Geschwindigkeit bei der Erkennung (anstatt Beschreibung), vielleicht kann jemand anderes das beantworten. Außerdem sind SIFT und SURF im Vergleich zu binären Deskriptoren viel besser in ihren Präzisions- und Erinnerungskurven (dh ihrer Leistung). Wenn Sie interessiert sind, kann ich Ihnen einen Link zu einem Beitrag geben, der eine Einführung in binäre Deskriptoren gibt. – GilLevi

+0

@GilLevi, vielen Dank, du bist ein Hauptfach, :-). Eigentlich fällt es mir schwer, zwischen (SIFT, SURF, FAST) oder (Harris-Laplacian) zu wählen. Ich kenne sie nicht ganz, aber einigen Artikeln zufolge scheint Harris-Laplacian in Bezug auf die Feature-Erkennung gut zu sein, aber es könnte langsamer sein als die anderen 3, oder? Könnten Sie mir bitte dabei helfen? – Alcott

+0

Sie interessieren sich für einen Detektor oder einen Deskriptor? Wenn Sie über Geschwindigkeit besorgt sind, warum überprüfen Sie nicht einfach für sich selbst? Ich kann Sie auf einen Code verweisen, den Sie leicht ändern können, um nach Laufzeiten zu suchen. – GilLevi

Antwort

15

Ich kann Ihnen raten, Hessian-Affine und MSER für die Erkennung zu verwenden, wenn Sie Invarianz für verschiedene Faktoren (z. B. Blickwinkeländerung) oder SCHNELL benötigen, wenn Sie Echtzeit benötigen. FAST macht ähnliche Arbeit wie die Harris, aber viel schneller.

Sie können in "Local Invariant Feature Detectors: A Survey" und "A Comparison of Affine Region Detectors" nachsehen, wo viele Detektoren sehr gut getestet und beschrieben sind.

Update: "WxBS: Wide Baseline Stereo Generalizations" ist erweiterte Benchmark der neuen und klassischen Detektoren und Deskriptoren.

Zweitens ist die Beschreibung Teil in der Regel langsamer als die Erkennung, so dass Sie Echtzeit-GPU oder Binär-Deskriptor wie BRIEF oder FREAK verwenden müssen.

Update2: "HPatches (Homography Patches) dataset and benchmark" und entsprechende Workshop bei ECCV 2016. http://www.iis.ee.ic.ac.uk/ComputerVision/DescrWorkshop/index.html.

Update3: "Comparative Evaluation of Hand-Crafted and Learned Local Features" Beschreibung der Deskriptoren (und ein Bitdetektor) auf der großen 3D-Rekonstruktion Aufgabe CVPR 2017.

+0

Danke, aber warum nicht SIFT/SURF? – Alcott

+2

Da SIFT und SURF als Detektoren nur Ähnlichkeitskovariante sind (d. H. "Immun" gegenüber Rotation, Translation und Skalierungsänderungen, aber nicht affin kovariant, verschlechtert sich ihre Leistung schnell bei Änderung des Blickpunkts). Standardpraxis bei der Bildanpassung - MSER und/oder Hessian-Affine als Detektor + SIFT als Deskriptor zu verwenden. Auch SIFT und SURF sind langsam (sowie Hesse-Affine und weniger - MSER) ​​im Vergleich zu den sehr schnellen FAST-Keypoints. –

+0

@ old-ufo Ich bin bei der Untersuchung von Feature-Detektoren-Vergleichen auf Ihre Antwort gestoßen. Ich suche nach einer Erkennung von Gesichtspunkten (Ort der Mundwinkel, Augen, Nase usw.) und evaluiere die verschiedenen Detektoren/Deskriptoren. Es scheint, dass der Grund dafür, SIFT/SURF nicht zu verwenden, nicht gilt, wenn ich ein Training/Testset verwende, bei dem das Bild eine frontale Aufnahme des Motivs ist (d. H. Änderung des Blickwinkels ist nicht wichtig). Haben Sie irgendwelche Vorschläge, was gute Detektoren/Deskriptoren sein könnten und warum? Die meisten Literatur zu diesem Thema ist um ein paar Jahre veraltet ... Danke! –

1

Mein Speed-Test für Punktmelder in OpenCV 3.0 mit AVT Manta G-125C (1292x964)

Einheit ist FPS

  1. Freilauf (keine Bearbeitung): 21,3
  2. FAST (nonmaxima Unterdrückung : true): 16-21
  3. FAST (nonmaxima Unterdrückung: false): 12,8
  4. ORB: 12,8
  5. GoodFeaturesToTr ack: 9
  6. BRISK: 8-9.2