2016-04-09 8 views
0

Ich habe einen Phonem-Klassifikator mit einem Autoencoder implementiert (Bei einem Audiodatei-Array gibt es alle erkannten Phoneme zurück). Ich möchte dieses Projekt erweitern, damit Worterkennung möglich ist. Gibt es ein bereits trainiertes HMM-Modell (in Englisch), das ein Wort mit einer Liste von Phonemen erkennt?Bereits trainiertes HMM-Modell für Worterkennung

Danke allen.

Antwort

0

Ich kenne keinen Decoder, der Ihnen helfen könnte. Spracherkennungssoftware funktioniert nicht auf diese Weise.

Normalerweise erfordert solche Sache benutzerdefinierte Implementierung für die dynamische Strahlsuche. Das ist keine große Aufgabe, vielleicht 100 Zeilen Code. Es hängt auch davon ab, was Ihr phonetischer Decoder produziert. Ist es phonetisches Gitter (ideal) oder ist es ein 1-bestes Ergebnis mit Scores oder einfach 1-bestes Ergebnis ohne Scores.

Falls Sie ein richtiges Gitter haben, können Sie openfst toolkit ausprobieren, in dem Sie LM und Dictionary in FST konvertieren, dann mit Gitter FST zusammensetzen und dann fstbestpath verwenden, um den besten Pfad zu finden. Statt all dieser phonetischen Konvertierungen können Sie einfach eine dynamische Suche schreiben.

Baidu konvertiert in ihren Projekten auch Sprache in Buchstaben und verwendet dann ein Sprachmodell, um die Buchstabenfolge zu fixieren. Aber sie sagen, dass es ohne Sprachmodell genauso gut funktioniert.