7

Ich baue eine Webanwendung und plane die Verwendung von speechRecognition und navigator.getUserMedia für Audio-Eingang.Spracherkennung und getUserMedia

Ich habe festgestellt, dass mein Desktop-Browser (Chrome auf Mac, v. 31.0.1650.63) zweimal nach der Berechtigung fragt, das Mikrofon zu verwenden. Während dies für den Benutzer ein wenig lästig sein kann, scheinen sowohl die Spracherkennung als auch die Audioeingabe zu funktionieren.

Allerdings, wenn ich die gleiche Seite auf Android (Nexus 7, Android v4.4.2; Chrome v31.0.1650.59) öffne, fragt es zweimal um die Erlaubnis, mein Mikrofon zu verwenden, aber ich kann nur eines der beiden verwenden (je nachdem, was zuerst gestartet wurde). Manchmal bekomme ich auch eine Spracherkennung error: "not-allowed" Fehler, obwohl ich die Erlaubnis gab, auf das Mikrofon zuzugreifen.

Ich habe ein jsFiddle, hier: http://jsfiddle.net/5xBpW/

Meine Frage ist: Gibt es eine Möglichkeit der Spracherkennung auf einem Eingangsstrom durchzuführen? Oder gibt es eine andere Möglichkeit, beide Funktionen in Chrome für Android zu verwenden?

+0

Da "getUserMedia" auf Android immer noch ziemlich experimentell ist und "readRecognition" überall experimentell ist, klingt das nach einem exzellenten Fehlerbericht. [Es scheint noch nicht geloggt zu sein] (https://code.google.com/p/chromium/issues/list?q=getUserMedia+os%3DAndroid). – apsillers

+1

Ich habe einen neuen Fehler dafür eingereicht: https://code.google.com/p/chromium/issues/detail?id=333881 – snorpey

Antwort

1

Haben Sie andere Werkzeuge in Betracht gezogen? Es gibt ein aufregendes neues Tool/Produkt von Nuance (gegründet von Ray K, jetzt Chef von Google Engineering), das Sprachdaten in Aktionen umwandelt, die proprietäre Lernalgorithmen verwenden, z. B. maschinelle Intelligenz.

Dieses Tool versteht Kontext und kann, dass auf spezifische Maßnahmen anwenden, damit der Benutzer keine exakte Phrase verwenden hat:

https://developer.nuance.com/public/index.php?task=mix

Tour: https://developer.nuance.com/views/templates/mix/howDoesMixWork/phone/index.html

Der Nachteil ist, dass Sie Sich auf eine dritte Partei verlassen, aber da die API, die Sie betrachten, auch experimentell ist, könnte dies von Interesse sein.