8

Ich habe folgendes gescanntes Dokument, mit dem Logo darauf, und ich habe ein anderes Schwarz-Weiß-Bild mit dem gleichen Logo und Stil (in schwarz und weiß Farbe unten dargestellt).So suchen Sie nach dem berühmten Logo im gescannten Bild?

Wie stelle ich sicher, dass das Logo auf diesem Bild vorhanden ist oder nicht?

Search for Image within the Image

Normalerweise werde ich viele gescannte Dokumente, OCR wird Pickup MTNL, aber manchmal sind diese Logos nur aus Symbolen aus nicht leicht von OCR erkannt.

Größe und Position der Logos ändern sich, sie sind nicht oft fixiert. Sie können an beliebiger Stelle auf dem Dokument platziert werden.

Ich möchte gescannte Bilder basierend auf den vorhandenen Logos und Symbolen organisieren und katalogisieren. Die meisten Dokumente können englisch sein oder auch nicht, sie können Barcodes enthalten oder nicht, in diesem Fall hilft das Logo-Match.

Ich habe Aforge.NET Bibliothek gesehen, aber ich bin nicht sehr sicher, Suche, welche Methoden zu kombinieren, zu tun. Die Pixelsuche ist sehr langsam und schlägt fehl, wenn das Quellziel eine andere Größe hat.

Ich habe gehört, dass YouTube hat eine Art von Histogramm oder Wärme Signature Spiel, um zu sehen, ob das Video kein urheberrechtlich geschütztes Material enthält. Ich werde hilfreich sein, wenn mich jemand in diesem Fall führen kann.

Meine ideale Wahl wäre C# und Aforge.NET, sonst einige Kommandozeilen-Tool wird geschätzt.

+2

Ich habe opencv verwendet, die einen [NET-Wrapper] hat (http://code.google.com/p/opencvdotnet/) und könnte eine Option sein. [OpenCV Template Matching] (http://docs.opencv.org/2.4.2/doc/tutorials/imgproc/histograms/template_matching/template_matching.html) –

+0

OpenCV ist eine weitere lib hier zu erwähnen – Max

+0

@GeorgeDuckett, wird es funktionieren mit unterschiedliche Größe aber gleiches Seitenverhältnis? –

Antwort

2
+0

Meine Formen sind kompliziert und wie definieren wir Formen zusammen, um das Logo zu bilden? –

+0

Der dritte Link weist Sie an, ExhaustiveTemplateMatching zu verwenden, das die richtige Lösung für Ihr Problem ist. OpenCV/EmguCV hat auch bessere Template-Matching-Algorithmen als Aforge.Net. – rold2007

1

nützliche Features in Ihrem Logo Bild erkennen, und suchen für diese Funktionen in der gescanntes Dokument. SIFT ist ein nützlicher Feature-Deskriptor, der skalier- und rotationsinvariant ist. Andere Deskriptoren umfassen SURF und HOG.

Wenn Sie sich umschauen, gibt es viele Implementierungen sein, # einige von ihnen sogar in C.