May 21, 2021

Фейсбук 3 часа назад выложил довольно интересную работу и набор кода, которые обещают нам небольшой прорывчик в области распознавания речи - wav2vec-U это система, позволяющая распознавать звуки минуя процесс обучения на размеченных данных. Идея крутая и дает прямо большой рост качества распознавания, особенно для редких языков (там в работе проверяют на киргизском и татарском).

Очень любопытно, есть с чем поковыряться на выходных github.com/pytorch/fairseq/tree/master/examples/wav2vec/unsupervised

pytorch/fairseq

Facebook AI Research Sequence-to-Sequence Toolkit written in Python. - pytorch/fairseq