July 18, 2017

Yandex выложил в опенсорс свою библиотеку градиент бустинга. Зачем в век диплернинга вообще такие библиотеки? Ну например потому, что в реальном продакшне нейронные сети подходят далеко не для всех типов задач. При этом градиент бустинг (на примере CatBoost) куда производительнее (как на обучении так и в рантайме), устойчивее к переобучению и вообще работает предсказуемые с точки зрения качества конечного результата.

Если вы разработчик, обратите так же внимание на то, что CatBoost внутри яндекса собирается в довольно интересном окружении. Следы от него (и даже части его самого) можно найти на GitHub проекта и в соседних с ним репозиториях. И вообще, попробуйте собрать catboost из исходных текстов - посмотрите какой необычный туллинг есть у разработчиков поиска яндекса.

techcrunch.com/2017/07/18/yandex-open-sources-catboost-a-gradient-boosting-machine-learning-librar/

Yandex open sources CatBoost, a gradient boosting machine learning library

Artificial intelligence is now powering a growing number of computing functions, and today the developer community today is getting another AI boost, courtesy of Yandex . Today, the Russian search giant — which, like its US counterpart Google, has extended into a myriad of other business lines, from mobile to maps and more — announced […]