Ich möchte Text in Sprache konvertieren und mit den begleitenden Metadaten versehen werden, in welchem Intervall jedes Wort auftritt und in welchem Zeitraum. So "Der Hund aß" könnte seinText-to-Speech und begleitende Metadaten
Die: 0 Start, Ende .3s Hund: Start .5s, Ende .8s Ate: .11s beginnen, .14s Ende
Gibt es Wege convert Text zu sprechen und hat das Erlangen solcher Daten, außer dass die resultierende Audiodatei nach Pausen sucht. Cheers
Nur schaute auf Preisgestaltung. Nicht zu brillant. Theres muss eine Open Source Lösung sein – dmonarch