У DeepMind вышла в препринте любопытная, но скорее философская чем математическая статья "Reward is Enough", по мотивам которой в VB опубликовали развернутый обзор и пояснение - очень рекомендую почитать. Общая идея статьи отражена в заголовке: DeepMind утверджают что существующей уже технологии обучения с подкреплением достаточно для того, чтобы создать настоящий ИИ.
Я безусловно не такой специалист, как ребята из дипмайнда, но думаю что это довольно наивное предславление о разуме. Даже старик Фрейд, который если упрощать все пытался свести к инстинктам, не согласился бы venturebeat.com/2021/06/09/deepm
DeepMind says reinforcement learning is ‘enough’ to reach general AI
Scientists at U.K.-based AI lab DeepMind argue true artificial intelligence will emerge from sticking to the principle of reward maximization.