А вот и подробности того, как обучали бота, выигравшего Денди в Dota2 в режиме 1v1. Обязательно прочитайте, там простой английский.
Самое важное вообще - что обучение проходило на игре бота с самим собой, как и в AlphaGo. И результаты за такой короткий период просто невероятные. Я как-то недооценил ребят из OpenAI, а они очень большие молодцы. Жду пока сделают бота, играющего 5v5, который разнесет Team Liquid на кусочки!
blog.openai.com/more-on-dota-2/
More on Dota 2
Our Dota 2 result shows that self-play can catapult the performance of machine learning systems from far below human level to superhuman, given sufficient compute. In the span of a month, our system went from barely matching a high-ranked player to beating the top pros and has continued to improve