Ich habe Probleme bei der Bestimmung von this research paper genau, wie ich den Standardvektor-Quantisierungsalgorithmus reproduzieren kann, um die Sprache einer nicht identifizierten Spracheingabe basierend auf einem Trainingsdatensatz zu bestimmen. Hier einige grundlegende Informationen:Vektorquantisierung in der Sprachverarbeitung Erläuterung
Abstrakt info Spracherkennung (zum Beispiel Japanisch, Englisch, Deutsch, etc.) unter Verwendung von akustischen Merkmalen sind ein wichtiges, aber schwieriges Problem für aktuelle Sprechen Technologie. ... Die in diesem Artikel verwendete Sprachdatenbank enthält 20 Sprachen: 16 Sätze, die zweimal von 4 Männern und 4 Frauen ausgesprochen wurden. Die Dauer jedes Satzes beträgt etwa 8 Sekunden. Der erste Algorithmus basiert auf der Standard-Vektorquantisierungs (VQ) -Technik . Jede Sprache wird durch ein eigenes VQ-Codebuch, , charakterisiert.
Erkennungsalgorithmen Der erste Algorithmus basiert auf der Standard-Vektorquantisierungs (VQ) -Technik. Jede Sprache, k
, ist durch ein eigenes VQ-Codebuch gekennzeichnet, . In der Erkennungsstufe wird die Eingangssprache durch
quantisiert und die akkumulierte Quantisierungsverzerrung d_k wird berechnet. Die Sprache, die als minimale Verzerrung erkannt wird. Bei der Berechnung der VQ-Verzerrung werden mehrere LPC-Spektralverzerrungsmaße angewendet ... in diesem Fall das WLR - gewichtete kleinste Verhältnis - Abstand: http://tinyurl.com/yc52gcl.
Standard-VQ-Algorithmus: Ein Codebuch, alt text http://tinyurl.com/y8csx6e wird für jede Sprache erzeugt Sätze Training mit. Der akkumulierte Distanz für Eingangsvektor in Satz wird , definiert als: alt text http://tinyurl.com/ybynjc2
Der Abstand d
kann jeder Abstand sein, der an den akustischen Merkmalen entspricht, und es muß die gleiche wie die eine für Codebuch-Generation verwendet wird. Jede Sprache ist durch ihr VQ-Codebuch gekennzeichnet.
Meine Frage ist, wie genau mache ich das? Ich habe einen Satz von 50 Sätzen in Englisch. In MATLAB kann ich den WLR für jedes gegebene Signal leicht berechnen. Aber wie formuliere ich ein Codebuch, da ich den WLR für die "Codebuchgenerierung" für Englisch verwenden muss. Ich bin auch neugierig, wie man ein VQ-Codebuch der Größe 16 (welches die beste Größe war) mit einem gegebenen Eingangssignal vergleicht. Wenn mir jemand helfen könnte, dieses Papier für mich zu destillieren, würde ich es sehr begrüßen.
Danke!