2009-08-05 6 views
-1

Ich verwende eine Audio-Fingerprinting-Technik, um Songs in langen Aufnahmen zu markieren. Zum Beispiel in Radio Show Records. Fingerprinting-Mechanismus funktioniert gut, aber ich habe ein Problem mit der Normalisierung (oder Downsampling).Audio Normalisierung/Fixierung?

alt text http://i26.tinypic.com/2v0j1c3.jpg

Hier können Sie zwei gleiche Songs, aber unterschiedliche Wellenformen sehen. Ich weiß, ich sollte eine DC-Offset-Fixierung machen und einige High- und Low-Gain-Filter verwenden. Ich mache sie bereits mit Sox mit Hochpass 1015 und Tiefpass 1015. Und ich benutze Wavegain, um die Lautstärke und DC-Offset zu beheben. Aber in diesem Fall Wellenformen dreht sich um eine wie unten:

alt text http://i27.tinypic.com/dpk9dy.jpg

Aber auch in diesem Fall kann ich nicht den gleichen Fingerabdruck erhalten. (Ich erwarte nicht% 100 gleich, aber mindestens% 50 wäre gut)

So. Was denken Sie? Was kann ich tun, um Datensätze mit gleichen Fingerabdrücken zu reparieren? Vielleicht funktioniert eine Audiofilterung, aber ich weiß nicht, welche zu verwenden ist? Kannst du mir helfen?

Übrigens, hier ist die Erklärung der Fingerabdruck-Technik.

http://wiki.musicbrainz.org/Future_Proof_Fingerprint

http://wiki.musicbrainz.org/Future_Proof_Fingerprint_Function

+0

Ist das wirklich eine Programmierfrage? – Amber

+0

Ja, Audio-Programmierung. Aber muss das "programmieren" sein? –

Antwort

2

Ihre Eingangswellenformen erscheinen wird Clipping, so dass keine Menge von Filtern in einem sinnvollen "Fingerabdruck" führen wird. Stellen Sie sicher, dass Sie gültige Eingabemasken mit einem angemessenen dynamischen Bereich sammeln, die jedoch nicht abgeschnitten werden.