Кажется это самая любопытная научная работа в области ИИ и игр за последний год. Разработчики из Беркли попробовали обучить сеть базируясь на любопытстве, т.е. компьютер играет в игру (в данном случае Марио) не просто максимизируя вероятность дохождения до цели (прохождения уровня). Они заставляют ИИ выполнять действия, результат которых наименее предсказуем. По сути примерно так и работает любопытство: а что если я попробую сделать вот так?
Понятно, что как нейронная сеть мало похожа на реальную работу мозга, так и любопытство в данном случае далеко от человеческого. Но идея очень красивая и результаты показывает очень хорошие, по крайней мере на опробованных играх pathak22.github.io/noreward-rl/
Curiosity-driven Exploration by Self-supervised Prediction
Pathak, Agrawal, Efros, Darrell. Curiosity-driven Exploration by Self-supervised Prediction. In ICML, 2017.