Фейсбук 3 часа назад выложил довольно интересную работу и набор кода, которые обещают нам небольшой прорывчик в области распознавания речи - wav2vec-U это система, позволяющая распознавать звуки минуя процесс обучения на размеченных данных. Идея крутая и дает прямо большой рост качества распознавания, особенно для редких языков (там в работе проверяют на киргизском и татарском).
Очень любопытно, есть с чем поковыряться на выходных github.com/pytorch/fairseq/tree/
pytorch/fairseq
Facebook AI Research Sequence-to-Sequence Toolkit written in Python. - pytorch/fairseq