December 05, 2019

Очень важная история: мозилла продолжают развивать свой движок распознавания речи DeepSpeech, вышла версия 0.6. Важно это потому, что это общедоступный движок с подготовленными датасетами для обучения 40 разным языкам, который может работать не в облаке, а прямо на вашем железе. Производительности текущей версии хватает, чтобы распознавать речь без задержек даже на Raspberry Pi 4!

Развитие технологий очень быстро двигается сразу в двух направлениях: “все будет через стримминг на серверах” и “все будет прямо у вас на устройстве”. Интересно, что гугл и яндекс делают ставку на первое, а эппл и мозилла на второе. hacks.mozilla.org/2019/12/deepspeech-0-6-mozillas-speech-to-text-engine/

DeepSpeech 0.6: Mozilla’s Speech-to-Text Engine Gets Fast, Lean, and Ubiquitous – Mozilla Hacks - the Web developer blog

The Machine Learning team at Mozilla continues work on DeepSpeech, an automatic speech recognition (ASR) engine which aims to make speech recognition technology and trained models openly available to developers. ...