14

Ich werde oft mit der Bedeutung des Begriffs Deskriptor im Zusammenhang mit Bildfunktionen verwechselt. Ist ein Deskriptor die Beschreibung der lokalen Nachbarschaft eines Punkts (z. B. ein Float-Vektor) oder ist ein Deskriptor der Algorithmus, der die Beschreibung ausgibt? Was genau ist dann die Ausgabe eines Feature-Extractors?Was ist ein Feature-Deskriptor in der Bildverarbeitung (Algorithmus oder Beschreibung)?

Ich habe mir diese Frage schon lange gestellt, und die einzige Erklärung, die ich gefunden habe, ist, dass ein Deskriptor sowohl der Algorithmus als auch die Beschreibung ist. Ein Feature-Detektor wird verwendet, um unterscheidbare Punkte zu erkennen. Ein Feature-Extractor scheint dann aber keinen Sinn zu ergeben.

Bitte helfen Sie mir, dieses Missverständnis zu klären. Danke!

+0

Vielleicht kann dies helfen http://stackoverflow.com/questions/6832933/difference-between-feature-detection-and-descriptor-extraction?rq=1 – user1538798

+1

Danke für die schnelle Antwort, leider führte dies zu noch mehr Verwechslung. – Richard

Antwort

39

Ein Merkmal Detektor ist ein Algorithmus, der ein Bild und gibt Orten (d.h. Pixelkoordinaten) der signifikanten Bereiche im Bild erfolgt. Ein Beispiel hierfür ist ein corner detector, der die Positionen der Ecken in Ihrem Bild ausgibt, Ihnen aber keine weiteren Informationen über die erkannten Merkmale liefert.

Ein Merkmal Deskriptor ist ein Algorithmus, der ein Bild und gibt Merkmal Deskriptoren/Merkmalsvektoren nimmt. Feature-Deskriptoren kodieren interessante Informationen in eine Reihe von Zahlen und fungieren als eine Art numerischer "Fingerabdruck", der verwendet werden kann, um ein Merkmal von einem anderen zu unterscheiden. Im Idealfall würde diese Information bei der Bildtransformation invariant sein, so dass wir das Merkmal wiederfinden können, selbst wenn das Bild irgendwie transformiert wird. Ein Beispiel wäre SIFT, das Informationen über die lokalen Nachbarschaftsbildgradienten der Nummern des Merkmalsvektors codiert. Andere Beispiele, über die Sie lesen können, sind HOG und SURF.


EDIT: Wenn es Detektoren, die „location“ könnte auch eine Nummer verfügen über kommt die Größe oder Umfang des Merkmals umfassen beschreibt. Dies liegt daran, dass Dinge, die wie Ecken aussehen, wenn sie "herangezoomt" werden, möglicherweise nicht wie Ecken aussehen, wenn sie "herausgezoomt" werden, und daher ist es wichtig, Skaleninformationen anzugeben. Anstatt also nur ein (x,y) Paar als Speicherort in "image space" zu verwenden, haben Sie möglicherweise eine dreifache (x,y,scale) als Speicherort in "scale space".

+0

Danke für die schnelle Antwort. Ich denke, diese doppelte Bedeutung des Deskriptors ist wirklich verwirrend und wird oft nicht korrekt verwendet. – Richard

+0

Prägnant und auf den Punkt. +1 – rayryeng

+0

Ausgezeichnete Antwort. – Raj