November 30, 2017

Года три назад я всем начал говорить, что скоро, совсем скоро распознавание речи станет комодити, вопрос только в общедоступности голосовых данных для независимых разработчиков. Около года назад (мы об этом писали) Мозилла начали собирать такой датасет Common Voice с помощью добровольцев. И вот сегодня первый релиз готовой открытой технологии распознавания речи от Мозилла. Причём выложены не только готовые тренированные модели, но и исходные коды и полный датасет. Развивай - не хочу. Пока нормально работает только английский, конечно.

blog.mozilla.org/blog/2017/11/29/announcing-the-initial-release-of-mozillas-open-source-speech-recognition-model-and-voice-dataset/

Announcing the Initial Release of Mozilla’s Open Source Speech Recognition Model and Voice Dataset

With the holiday, gift-giving season upon us, many people are about to experience the ease and power of new speech-enabled devices. Technical advancements have fueled the growth of speech interfaces ...