Ich habe eine funktionierende App, die die Bluemix Speech to Text API verwendet, um Untertitel für Http Live Streaming-Quellen bereitzustellen. Es gibt jedoch eine gewisse Verzögerung beim Parsen des Sounds aus den ts-Dateien. Mein Code ist wie folgt:bluemix Echtzeit-Sprache zu Text mit HLS
Gibt es eine schnellere API zu verwenden, die mich näher an Echtzeit bringt?
Dank
Hallo Aaron, Welches Modell verwenden Sie weitere Informationen über diese Modelle und ihre Eigenschaften sehen? Englisches Breitbandmodell? Die Geschwindigkeit hängt stark von der Qualität der Aufnahme ab. Was ist der Echtzeitfaktor, den Sie erhalten (RTF = Dekodierungszeit/Audiozeit)? Welches Audioformat? Bitte versuchen Sie, Ihre Datei über unsere Demo zu füttern. Wenn ich damit rede, werde ich immer schneller als in Echtzeit erkannt. Dani –