Ich versuche, Tonhöhenfunktionen aus einer Audiodatei zu extrahieren, die ich für ein Klassifizierungsproblem verwenden würde. Ich benutze Python (scipy/numpy) für die Klassifizierung.Extrahieren von Tonhöhenfunktionen aus Audiodatei
Ich denke, ich kann Frequenzfunktionen mit scipy.fft
bekommen, aber ich weiß nicht, wie man Noten mit Frequenzen anzunähern. Ich habe ein bisschen recherchiert und festgestellt, dass ich Chroma-Features bekommen muss, die Frequenzen auf 12
Bins für Noten einer chromatischen Skala abbilden.
Ich denke, es gibt eine Chroma-Toolbox für Matlab, aber ich denke nicht, dass es etwas Ähnliches für Python gibt.
Wie soll ich damit fortfahren? Könnte jemand auch das Lesen von Material vorschlagen, das ich untersuchen sollte?
Vielen Dank ... Könnten Sie auch das Lesen von Material oder Büchern zur Tonhöhenerkennung oder die Anwendung von dsp auf Musik im Allgemeinen empfehlen? –
Als eine allgemeine Einführung in eine breite Palette von Computer-Musik-Themen C. Roads _The Computer Music Tutorial_ (1994, Cambridge: MIT Press) ist ein sehr zugängliches und umfassendes (> 1000 Seiten) Nachschlagewerk. Für mich war der 1. Teil von M. Müllers _Information Retrieval for Music and Motion_ (2007, Berlin, Heidelberg: Springer) großartig (weniger umfassend, aktueller, technischer). Wenn Sie an einem bestimmten Thema interessiert sind, sind die [procceedings of ISMIR] (http://www.ismir.net/proceedings/) eine reiche Informationsflut. Andere können Ihnen andere (und bessere?) Referenzen geben. Ich wäre auch interessiert. –
Danke .. Ich werde in sie schauen –