«Яндекс» представил новый метод машинного обучения CatBoost
Благодаря этому CatBoost показывает не менее высокое качество обучения, чем подобные методы для работы с разнородными данными.
Соответствующую информацию обнародовала компания «Яндекс» в своем блоге. Соответствующая библиотека выложена в открытый доступ — использовать ее могут все желающие.
«Яндекс» представил новый метод машинного обучения — CatBoost, сообщается в блоге компании. Особенность алгоритмов машинного обучения такого типа состоит в том, что они результативнее, чем остальные модели, работают с разнородными данными, которые описывают разные факторы: например, информацию о демографии, предпочтениях пользователя и историю запросов. Как и Матрикснет, CatBoost использует механизм градиентного бустинга (англ. boosting — улучшение): он подходит для работы с разнородными данными.
Основное отличие CatBoost — умение работать с данными из различных источников, переводить категориальные данные в числа, а еще снижать количество ошибок при прогнозировании не в процессе последовательных доработок модели, а сразу. Отличие состоит в том, что CatBoost владеет не менее высоким качеством обучения. — Нужно сказать, что CatBoost — 1-ый русский метод машинного обучения, который стал доступен в open sourсe.
Новый метод уже протестировали на сервисах Яндекса. CatBoost также используют в YDF для сокращения расходов сырья и предсказания дефектов. В дальнейшем CatBoost будет работать и на остальных сервисах. Они утверждают, что уже сейчас систему используют в работе огромного адронного коллайдера.
Благодаря этому CatBoost показывает не менее высокое качество обучения, чем подобные методы для работы с разнородными данными. Сейчас она является единственной системой своего рода, которую можно найти в свободном доступе в глобальной web-сети. Скачать CatBoost и CatBoost Viewer можно на GitHub.
Поделитесь в вашей соцсети👇