2016-03-29 14 views
0

Ich möchte Text in Sprache konvertieren und mit den begleitenden Metadaten versehen werden, in welchem ​​Intervall jedes Wort auftritt und in welchem ​​Zeitraum. So "Der Hund aß" könnte seinText-to-Speech und begleitende Metadaten

Die: 0 Start, Ende .3s Hund: Start .5s, Ende .8s Ate: .11s beginnen, .14s Ende

Gibt es Wege convert Text zu sprechen und hat das Erlangen solcher Daten, außer dass die resultierende Audiodatei nach Pausen sucht. Cheers

Antwort

0

iSpeech bieten eine Txt to Speech-Lösung, deren api in der Lage ist, Positionsmarker für Wörter zu liefern, was ausgezeichnet ist. Die Informationen finden Sie in Abschnitt 4 der API, die Sie hier finden können http://www.ispeech.org/api. Möchte jedoch von anderen Lösungen hören. Prost

+0

Nur schaute auf Preisgestaltung. Nicht zu brillant. Theres muss eine Open Source Lösung sein – dmonarch