Теккранч утверждает, что Мета сегодня выпустит SeamlessM4T — это прорывная нейросеть, способная распознавать речь и переводить её. Заявлены около 100 языков (т.е. самые популярные войдут), и важно, что это единая модель, не отдельно транскрипция и перевод. Обучать модель на тексте и речи, чтобы сделать возможным перевод speech-to-speech, идея не новая, но у Меты может получиться.
К сожалению, на момент публикации этой заметки ссылка на модель в теккранче ведет на 404 🙂 Но я надеюсь, что это преждевременный анонс, и уже сегодня мы сможем с этой моделью поиграться! upd: в комментариях есть правильная ссылка на репозиторий.
Meta releases an AI model that can transcribe and translate close to 100 languages
In its quest to develop AI that can understand a range of different dialects, Meta has created an AI model, SeamlessM4T, that can translate and transcribe close to 100 languages across text and speech.