Welche semantischen Informationen können aus solchen Medien extrahiert werden? Alles wäre in Ordnung, sei es die Unterscheidung zwischen Musik und gesprochenem Text, die Erkennung verschiedener Geräusche (wie Schüsse oder Vögel oder Autos), die Erfassung von Innen- und Außenaufnahmen oder die Intensität der Kamerabewegung.Audio/Video Content-Hinweise
Ich weiß, dass es many, many, many, manymanymany Forschungsthemen in dieser Kategorie, aber ich habe keine Anwendungen von beliebigen von diesen finden. Hat jemand Links zu Anwendungen/Bibliotheken/Prototypen/Neuigkeiten über kommende Produkte zu diesen Themen?
Sie so etwas wie die in JPEGs Informationen EXIF bedeuten? –
Nein, keine technischen Informationen über die Medien, aber etwas wie: "Dieses Bild wurde im Freien aufgenommen" oder "Es gibt Personen in diesem Bild" oder "Diese Audiospur enthält gesprochenen Text" oder "Diese Audiospur enthält Musik" – soulmerge