1

Ich habe etwas über Fisher Vector gelesen und bin immer noch im Lernprozess. Es ist eine bessere Darstellung als die klassische BoF-Darstellung, die GMM ausnutzt (oder k-bedeutet, selbst wenn das üblicherweise als VLAD bezeichnet wird).Wie misst man die Entfernung zwischen Fisher Vecotr für Image Retireval?

Allerdings habe ich gesehen, dass sie normalerweise für Klassifizierungsproblem verwendet werden, zum Beispiel mit SVM.

Aber was ist mit Image Retrieval? Ich habe gesehen, dass sie auch für die Bilderfassung verwendet wurden (here), aber ich verstehe keinen Punkt: Wenn zwei FV 2 Bilder repräsentieren, wie berechnen wir ihre Abstände und so "wie ähnlich sind die beiden Bilder?"

Ist es sinnvoll, sie in einem solchen Kontext zu verwenden?

+0

Beachten Sie, dass der Zugriff auf das Dokument registriert werden muss - eine leichte Anforderung, aber immer noch eine Überraschung. – Prune

Antwort

1

Wie in den beiden folgenden Papieren zu sehen, scheint der euklidische Abstand die beliebteste Wahl zu sein. Es gibt auch Verweise auf die Verwendung von Skalarprodukt als Ähnlichkeitsmaß; Kosinusähnlichkeit (eng verwandt) ist eine allgemein verbreitete Metrik für ML-Ähnlichkeit.

http://link.springer.com/article/10.1007/s11263-013-0636-x

http://www.robots.ox.ac.uk/~vgg/publications/2013/Simonyan13/simonyan13.pdf

Ist das genug, um Sie etwas wählen zu lassen, die Ihren Bedürfnissen entspricht?

+0

Vielen Dank, es ist definitiv etwas, das meine Bedürfnisse erfüllt :) Da ich ein allgemeines Framework implementiere, wo ungefähr ähnliche Elemente durch LSH gefunden werden, denkst du, das ist eine akzeptable Lösung, um ähnliche FV zu finden? Normalerweise weiß ich, dass invertierter Index verwendet wird, aber hier verwende ich nicht mehr als 50.000 Bilder, vielleicht 100k, nicht 100M wie in den Zeitungen, wo diese Lösungen beschrieben werden. – justHelloWorld

+0

Insbesondere der Stand der Technik FALCONN, der für Cosinus-Ähnlichkeit und L2-Abstände ausgelegt ist, wäre perfekt nach Ihrer Antwort. – justHelloWorld

+0

Ja. Da LSH spezifisch einen Sinn für Ähnlichkeit bewahrt, sollte jede der einfachen Methoden Ihnen gut dienen. In der Tat, da Sie so wenige Bilder haben (nach meinen Maßstäben :-)), könnten Sie sowohl Cosinus als auch L2 versuchen; Vergleichen Sie die Ergebnisse und sehen Sie, was Ihnen besser dient. – Prune