Ich verwende eine Audio-Fingerprinting-Technik, um Songs in langen Aufnahmen zu markieren. Zum Beispiel in Radio Show Records. Fingerprinting-Mechanismus funktioniert gut, aber ich habe ein Problem mit der Normalisierung (oder Downsampling).Audio Normalisierung/Fixierung?
alt text http://i26.tinypic.com/2v0j1c3.jpg
Hier können Sie zwei gleiche Songs, aber unterschiedliche Wellenformen sehen. Ich weiß, ich sollte eine DC-Offset-Fixierung machen und einige High- und Low-Gain-Filter verwenden. Ich mache sie bereits mit Sox mit Hochpass 1015 und Tiefpass 1015. Und ich benutze Wavegain, um die Lautstärke und DC-Offset zu beheben. Aber in diesem Fall Wellenformen dreht sich um eine wie unten:
alt text http://i27.tinypic.com/dpk9dy.jpg
Aber auch in diesem Fall kann ich nicht den gleichen Fingerabdruck erhalten. (Ich erwarte nicht% 100 gleich, aber mindestens% 50 wäre gut)
So. Was denken Sie? Was kann ich tun, um Datensätze mit gleichen Fingerabdrücken zu reparieren? Vielleicht funktioniert eine Audiofilterung, aber ich weiß nicht, welche zu verwenden ist? Kannst du mir helfen?
Übrigens, hier ist die Erklärung der Fingerabdruck-Technik.
http://wiki.musicbrainz.org/Future_Proof_Fingerprint
http://wiki.musicbrainz.org/Future_Proof_Fingerprint_Function
Ist das wirklich eine Programmierfrage? – Amber
Ja, Audio-Programmierung. Aber muss das "programmieren" sein? –