eine Audio-Datei von 22 mins (1320 secs)
Gegeben, Librosa extrahiert ein MFCC Merkmale von data = librosa.feature.mfcc(y=None, sr=22050, S=None, n_mfcc=20, **kwargs)
Librosa: MFCC Merkmalsberechnung
data.shape (20,56829) Es gibt numpy Array von 20 MFCC Eigenschaften 56829 Rahmen.
Meine Frage ist, wie es 56829. berechnet Gibt es eine Berechnung dieses Rahmens zu erreichen? und Wie groß ist die Fenstergröße für jeden Frame?