Ich habe festgestellt, dass die Wiki-Transkriptionen für some der jüngsten Stack Overflow Podcasts Art von schwach sind. Diese Aufgabe erfordert eindeutig ein Computerprogramm. Transkribiert Audio zu Text (im Idealfall mit Lautsprecher-Etiketten, so dass wir wissen, wer was gesagt hat) etwas, das in der Software realisierbar wäre? Gibt es aktive Open-Source-Softwareprojekte, die versuchen, diese Funktionalität zu implementieren?Automatisierte Transkriptionssoftware
2
A
Antwort
3
Glauben Sie mir, ich habe schon vorher gesucht. Es gibt kaum Text-to-Speech-Anwendungen, die Open-Source- oder frei zu verwenden sind. Von meiner Suche gab es keine freie Rede zu Textsynthesizern. Diese Dinge sind so schwer zu programmieren und teuer, dass sie nicht wirklich mit einem Open-Source-Ansatz erstellt werden können. Wenn Sie das wirklich brauchen, müssten Sie es von einer Firma kaufen. (obwohl ich nichts von meinem Kopf weiß).
2
Ich habe ein wenig nachgeschaut. Ich habe versucht, die Microsoft Speech API, aber sehr schlechte Ergebnisse. Ich wollte look into the CMU Sphinx project, especially the Transcriber demo.