Ich habe sehr viele Ordner mit einer großen Anzahl von Bilddateien darin. Gelegentlich landet ein gescanntes Dokumentbild aus Versehen in einem Ordner, und wenn jemand den Ordner visuell scannt, bleiben diese unerkannt, können aber Probleme verursachen, wenn sie an der falschen Stelle veröffentlicht werden.Ermitteln Sie den Inhalt einer Bilddatei: Finden Sie ein gescanntes Dokument zwischen den Bildern
Da sie gescannt werden könnten, da alle Dateitypen und -größen weitgehend im Bereich der echten Bilder liegen, sind sie aus Metadaten nur schwer zu erkennen.
Kennt jemand eine Möglichkeit, ein gescanntes Dokument aus einem echten Bild zu erkennen - entweder ein Werkzeug oder eine programmatische Methode?
Wenn Sie eine Anzahl von Trainingsbeispielen verwenden, sollten Sie in der Lage sein, Ihr Programm (mit Accord oder ähnlichem) zu "lehren", um den Unterschied zu erkennen. –
Ich denke, dies ist wahrscheinlich der beste Weg zu gehen - markieren Sie Bilder für die Überprüfung, die das Muster zu treffen scheinen, und dann erlauben maschinelles Lernen, das Muster auf der Grundlage der menschlichen Überprüfung kontinuierlich zu verfeinern. – BlueChippy