2009-06-04 8 views
4

Welche semantischen Informationen können aus solchen Medien extrahiert werden? Alles wäre in Ordnung, sei es die Unterscheidung zwischen Musik und gesprochenem Text, die Erkennung verschiedener Geräusche (wie Schüsse oder Vögel oder Autos), die Erfassung von Innen- und Außenaufnahmen oder die Intensität der Kamerabewegung.Audio/Video Content-Hinweise

Ich weiß, dass es many, many, many, manymanymany Forschungsthemen in dieser Kategorie, aber ich habe keine Anwendungen von beliebigen von diesen finden. Hat jemand Links zu Anwendungen/Bibliotheken/Prototypen/Neuigkeiten über kommende Produkte zu diesen Themen?

+0

Sie so etwas wie die in JPEGs Informationen EXIF ​​bedeuten? –

+0

Nein, keine technischen Informationen über die Medien, aber etwas wie: "Dieses Bild wurde im Freien aufgenommen" oder "Es gibt Personen in diesem Bild" oder "Diese Audiospur enthält gesprochenen Text" oder "Diese Audiospur enthält Musik" – soulmerge

Antwort

0

Die beste Thema für Anwendungen dieser Erkenntnis ist, dass Sie bei der Forschung Thema „Content Based Video Retrieval und Indizierung“

Anders als das sehen möchten:

  • Sie Lernen verwenden können Techniken, um die Informationen empfangen (Video, einzelne Bilder oder Audio)
  • Sie Clustering-Techniken verwenden können, um zu klassifizieren ähnliche Abschnitte von Audio- oder Video
zu finden 10

Eine Anwendung davon ist kommerzielle Entfernung. Kommerzielle Entferner machen typischerweise einen Clusteransatz, um Teile von Werbungen in Fernsehvideos zu eliminieren.

+0

Do you Haben Sie Links zu Bibliotheken, die diese Techniken anwenden können? – soulmerge

+0

Nein, nur Papiere, die über ihre Herangehensweise sprechen und wie erfolgreich sie waren. – monksy

1

Werfen Sie einen Blick auf MP4REG, die die Registrierungsstelle für Codepunkte in "MP4 Family" -Dateien ist.

Kurzer Grund: Innerhalb der MPEG4 & QuickTime-Welt wird der grundlegende physische Baustein von Medien ein "Atom" genannt. Atome können nicht nur das eigentliche Audio und Video enthalten, sondern auch technische und nicht-technische Metadaten. Die letzten hören sich für Sie interessant an.

ZB:

  • albm: Albumtitel und Tracknummer (User-Daten)
  • jp2i: geistiges Eigentum Informationen

ich nur genau einmal an diesem Zeug habe gesucht, mit Bezug auf Meta-Daten, und mein Eindruck war, dass es eine schnelle und lose Welt ist. Vielleicht möchten Sie sich einige MP4-Parsing-Tools auf niedriger Ebene ansehen, mit denen Sie die einzelnen Atome realer Mediendateien untersuchen können. Ich denke, es gibt sogar inoffizielle (nicht registrierte), benutzerdefinierte Atome zur Verwendung in bestimmten Systemen.

+0

Die Bibliothek selbst sieht sehr interessant aus. Aber wenn ich es richtig verstanden habe, liefert es nur a.) Technische Daten und b.) Daten, die vom Benutzer eingegeben wurden.Ich suche eher nach Informationen, die durch die Analyse der Medien gewonnen werden. – soulmerge

+0

Es kann mehr als nur technische Daten liefern. Aber, ja, es sind nur Daten, die vom Erstellungs-/Verwaltungssystem spezifisch eingegeben werden. –