Разработчики Яндекса объявили о запуске нового алгоритма машинного обучения Categorical Boosting (CatBoost), который со временем полностью вытеснит MatrixNet. Последний был разработан 8 лет назад, а это является довольно длительным промежутком в такой быстро развивающейся сфере. Как и предшественник, CatBoost — градиентный бустинг на решающих деревьях, но отличительной чертой является то, что алгоритм работает не только с числовыми, но и с категориальными значениями. Новый метод превосходит Матрикснет в несколько раз по точности предсказаний.
Технология уже запущена в тестовом режиме на сервисе Дзен для ранжирования персональной ленты публикаций, основанной на ваших интересах, а также в Яндекс.Погоде с технологией Метеум. В обоих случаях результаты CatBoost оказываются лучше, чем при использовании MatrixNet. Дальше планируется внедрение новой системы в поиск и другие сервисы корпорации. Библиотеки машинного обучения для Python и R выложены в открытый доступ, то есть воспользоваться ими может любой желающий.