So erstellen Sie eine Wörterbuchdatei (.dict) für unser spezielles Sprachmodell für die Domäne. Ich verwende das CMU-Toolkit, um das ARPA-Format zu erstellen, aber es gibt keine Option zum Erstellen einer .dict-Datei. Danke im Voraus.Wie man Wörterbuchdatei vom vocab herstellt?
0
A
Antwort
1
Es gibt eine kurze tutorial page, die verschiedene Möglichkeiten erklärt, das Wörterbuch für Sphinx zu generieren.
Im Allgemeinen gibt es für Englisch eine existing dictionary, die ziemlich viele Wörter abdeckt. Wenn es keine Ihrer spezifischen Domänenwörter enthält, sollten die Aussprachen vom Graphem-zu-Phonem (G2P) -System generiert werden, das im ersten Link aufgeführt ist. G2P lernt aus einem vorhandenen Wörterbuch und generiert Aussprachen für die neuen.
Eine Sache zu berücksichtigen ist das akustische Modell. Wenn Sie einige der bereits trainierten Sphinx-Modelle verwenden, sollten Sie sicherstellen, dass die Aussprachen mit dem gleichen Phonemsatz wie das Trainingswörterbuch generiert werden.
Danke @agorin – sumit