2009-10-24 20 views
9

Ich habe bereits FFT und Tonhöhe + absolute Frequenz in Echtzeit aus dem Eingang des Mikrofons berechnet. Jetzt möchte ich das Timbre berechnen.Wie funktionieren Mel-Frequenz-Cepstrum-Koeffizienten?

Ich sah Mel Frequenz Cepstrum Koeffizienten - MFCCs, aber ich habe es nicht sehr gut verstanden. Kann mir jemand ein paar Tipps dazu geben ..

Antwort

7

MFCCs Berücksichtigung von Aspekten des menschlichen Gehörs (logarithmische Frequenzwahrnehmung, die mel scale) kombinieren und Physik der Musikinstrumente (diese Systeme oft haben gut definierte Untertöne, die harmonic sind - die ist der Grund, warum die MFCCs die FFT der FFT verwenden, um eine vereinfachte Darstellung der Klangfarbe eines Instruments zu erhalten (wobei die Grundfrequenz und die Lautstärke ausgeklammert werden).

Man könnte endlose Seiten zu diesem Thema schreiben, und es gibt viele im Internet, so eine spezifischere Frage, die klar erklärt, was Sie wissen möchten, wäre hilfreich. Der Algorithmus zum Berechnen von MFCCs ist oben auf der wikipedia page aufgeführt.

+0

tks für die Antwort. Also, wenn ich das Timbre erhalten möchte, ist der MFCC der richtige Weg? –

+1

Ja, ich denke schon, vor allem als erster Angriff auf das Problem. Es ist einfach zu implementieren, es gibt eine Menge darüber geschrieben, und es ist ein Standard, gegen den andere Ansätze verglichen werden (und es ist in der Regel gut in diesen Vergleichen), also ist es eine gute Wahl. – tom10

+0

Im Wiki ist der Algorithmus: 1. Nehmen Sie die Fourier-Transformation von (ein Fensterausschnitt von) ein Signal. 2. Ordnen Sie die Mächtigkeiten des oben erhaltenen Spektrums mit dreieckigen überlappenden Fenstern der Mel-Skala zu. 3. Nehmen Sie die Protokolle der Kräfte bei jeder der Mel-Frequenzen. 4. Nehmen Sie die diskrete Kosinustransformation aus der Liste der Mel- dungsleistungen, als wäre es ein Signal. 5. Die MFCCs sind die Amplituden des resultierenden Spektrums. Ich verstehe alles außer Schritt 2: mit dreieckigen überlappenden Fenstern Was soll ich tun, Frequenz an Mel Skala übergeben, aber was ist das Dreieck überlappende Fenster? –