2016-07-01 27 views
1

eine Audio-Datei von 22 mins (1320 secs) Gegeben, Librosa extrahiert ein MFCC Merkmale von data = librosa.feature.mfcc(y=None, sr=22050, S=None, n_mfcc=20, **kwargs)Librosa: MFCC Merkmalsberechnung

data.shape (20,56829) Es gibt numpy Array von 20 MFCC Eigenschaften 56829 Rahmen.

Meine Frage ist, wie es 56829. berechnet Gibt es eine Berechnung dieses Rahmens zu erreichen? und Wie groß ist die Fenstergröße für jeden Frame?

Antwort

2

können Sie die Sprunglänge angeben

mfcc = librosa.feature.mfcc(y=y, sr=sr, hop_length=hop_length, n_mfcc=13) 

librosa zentriert Frames verwendet, so dass der k-ten Rahmen

um Probe k * hop_length zentriert ist

Ich denke, dass Standard-Hop-Wert ist 512, mit Ihren Daten (1320 * 22050)/56829 = 512,16