Сходите по ссылке и послушайте примеры текущего переднего края исследований по синтезу речи. Особенно оцените естественность дыхания в процессе речи и мелкие дефекты произношения. Это пока научная работа от Microsoft Research, которую, вероятно, будут внедрять в Microsoft Azure Speech, и качество синтеза там такое, что я не могу отличить его от живого человека.
Теперь надо еще такое же качество распознавания речи и NLP — и мы получим настоящий интерфейс для взаимодействия человек-компьютер, не требующий обучения.