August 22, 2023

Теккранч утверждает, что Мета сегодня выпустит SeamlessM4T — это прорывная нейросеть, способная распознавать речь и переводить её. Заявлены около 100 языков (т.е. самые популярные войдут), и важно, что это единая модель, не отдельно транскрипция и перевод. Обучать модель на тексте и речи, чтобы сделать возможным перевод speech-to-speech, идея не новая, но у Меты может получиться.

К сожалению, на момент публикации этой заметки ссылка на модель в теккранче ведет на 404 🙂 Но я надеюсь, что это преждевременный анонс, и уже сегодня мы сможем с этой моделью поиграться! upd: в комментариях есть правильная ссылка на репозиторий.

techcrunch.com/2023/08/22/meta-releases-an-ai-model-that-can-transcribe-and-translate-close-to-100-languages/

Meta releases an AI model that can transcribe and translate close to 100 languages

In its quest to develop AI that can understand a range of different dialects, Meta has created an AI model, SeamlessM4T, that can translate and transcribe close to 100 languages across text and speech.