"Яндекс" открыл для публики свою систему машинного обучения


Опубликованно 22.07.2017 13:32

МОСКВА, 18 мая – РИА новости. Программисты "Яндекса" разработала и внедрила в свободный доступ в систему обучения CatBoost, который уже используется в работе Большого адронного коллайдера, сообщили в пресс-службе компании.

"Яндекс многих лет занимаются оборудованием, подготовки, и CatBoost создавали лучшие специалисты в этой области. Надо сказать, что CatBoost — первый российский метод обучения, который стал доступен общественности. Я надеюсь, что сообщество будет благодарен и поможет сделать его еще лучше", - сказал Михаил Биленко, руководитель разведывательной машины и системы "Яндекс".

Как отмечают специалисты "Яндекса", эта система обучения является преемником системы Матрикснет, основы практически всех служб российского поискового гиганта. Это не нейронные сети, а использует математические методы, так называемый градиент бустинг, для оценки актуальности информации и анализа данных.

Под это слово программистам понять набор алгоритмов, каждый из которых дает ответ на этот вопрос, не очень отличается от случайных значений, но комбинация, которая позволяет получить достаточно точный ответ на эту задачу классифицировать тот или иной объект.

Основным преимуществом алгоритма CatBoost, по мнению программистов, это то, что он позволяет использовать не только цифровые данные, но и объекты другого типа, например, фотографии облаков или типов зданий. Это упрощает работу для людей, которые используют его для анализа и категоризации информации, и значительно улучшить ее использование.

В рамках эксперимента, он используется, чтобы улучшить результаты поиска, классификация полос, рекомендации Яндекс.Zen, а также для расчета прогнозов погоды в технологии Метеум, и во всех случаях показал себя лучше Матрикснета.

В результате, CatBoost будет работать на другие службы. Он также использует команду Yandex Data Factory — в своих решениях для промышленности и, в частности, оптимизировать расход сырья и прогнозирования неисправностей. Кроме того, CatBoost уже использует ЦЕРН: он используется российский алгоритм, чтобы объединить данные, полученные с различных сторон детектора LHCb.

Как пояснили в пресс-службе "Яндекса", компания намерена использовать ту же версию CatBoost в своей работе, которая была выпущена в свободный доступ, и программисты компании планируют использовать предложения сообщества для улучшения системы обучения.



Категория: Hi-Tech