2016-06-17 20 views
1

EDIT: da es unklar schien, werde ich die Frage genauer machen.Pocksphinx - Was bedeutet Debug-Ausgabe (cmn_prior, fsg_search) des Erkennungsprozesses?

Was bedeutet diese numerische Ausgabe in pocketsphinx?

< INFO: cmn_prior.c(149): cmn_prior_update: to < 55.55 10.06 -1.22 10.50 -3.09 1.89 -8.37 -9.24 -5.98 -4.85 4.65 -3.25 -3.95 > 
< INFO: fsg_search.c(859): 191 frames, 4969 HMMs (26/fr), 12795 senones (66/fr), 1090 history entries (5/fr) 

Ich vergleiche diffent läuft mit fast identischen WAV-Dateien und etwas andere Zahlen zu erhalten, und ich bin interessiert an, was das Ausgabemittel, und welche Art von Abschluss oder Informationen von ihm erhalten werden.

Ich konnte keine Dokumentation darüber finden. Was mich interessiert, ist Verständnis pocketsphinx Debug-Ausgabe besser. Ich habe Vorstellungen über die Interna der Modelle und die Theorie hinter dem Prozess, aber ich weiß nicht, wie ich diese Ausgabe interpretiere. Vielen Dank!

+0

Es ist nicht ganz klar, was Sie fragen. Zu viele Fragen und zu breit. Sie müssen Ihre Frage besser angeben. –

+0

@NikolayShmyrev dort. Ich habe es spezifischer gemacht und einen bestimmten Punkt angesprochen (Bedeutung der zitierten Ausgabe). Ich weiß nicht, ob Sie downvoted, aber nach http://stackoverflow.com/help/privileges/vote-down downvotes sind für schlampige No-Effort-Fragen, nicht für unklare und ist kein Ersatz für Kommentare und Bearbeitung :) – jotadepicas

+0

Ok, jetzt müssen Sie den Titel aktualisieren, um die Frage zu erfüllen. –

Antwort

1

< INFO: cmn_prior.c (149): cmn_prior_update: bis < 55,55 10,06 -1,22 10,50 -3,09 1,89 -8,37 -9,24 -5,98 -4,85 4,65 -3,25 -3,95>

Diese Linie sagt, dass der Cepstrum-Mittelwert auf diese spezifischen Werte aktualisiert wird. Sie können über Cepstral mittlere Normalisierung here lesen.

< INFO: fsg_search.c (859): 191 Rahmen, 4969 HMMs (26/fr), 12795 Senonen (66/fr), 1090 Einträgen (5/fr)

Diese Informationen beziehen sich auf Viterbi search. Es sagte, dass dein Audio 191 Frames hatte. Während der Suche wurden 4969 HMMs aktiv, 12795 akustische Senonen wurden ausgewertet. Die Viterbi-Suchhistorie enthielt durchschnittlich 5 Einträge pro Frame.

Ich vergleiche diffent läuft mit fast identischen WAV-Dateien und auch etwas andere Zahlen

Wenn Eingänge sind etwas anders es völlig in Ordnung ist zu sehen, leicht unterschiedliche Werte zu erhalten.

und welche Art von Schlussfolgerung oder Information kann daraus erhalten werden.

Sie können aus den von Ihnen bereitgestellten Informationen nichts Spezifisches zeichnen. Wenn Zahlen ungewöhnlich waren, könnten Sie nach dem Grund suchen. Zum Beispiel, wenn CMN (0) -200 außerhalb des üblichen Bereichs von 10-60 war. Oder wenn es 0 Frames gäbe. Die von Ihnen angegebenen Werte werden erwartet.