Задать вопрос

Максим @khrisanfov

Программист

машинное-обучение

Машинное обучение

Как выбрать модель из трех примерно равных по ROC?

Задача классификации. Обучил три модели Random Forest, XGBoost, CatBoost. Все три модели показывают примерно равный ROC и Accuracy, но на выходе мне нужны вероятности, а не предсказанный класс и тут возникают проблемы. Например на одном из семплов модели выдают вероятности xgb: 0.38, fr: 0.22, catboost: 0.31. Как видно разброс приличный. Можно ли усреднять эти вероятности? Какие техники обычно используются? Насколько я понимаю нужно тестировать модель на боевых данных и та что выдает лучший результат по EV, например, ту модель и выбрать в качестве конечной?

Вопрос задан более трёх лет назад
216 просмотров

Комментировать

Подписаться 1 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 2

begemot_sun

Сергей @begemot_sun

Программист в душе.

Вообще сейчас тренд идет на то, чтобы объединять модели.
Коллегия экспертов работает лучше, чем каждый эксперт порознь.
Отталкивайтесь от этой догмы.

Ответ написан более трёх лет назад

2 комментария

2 комментария

xdgadd @xdgadd

ML/Python/Cpp

Погуглите стэккинг и бэггинг.

Ответ написан более трёх лет назад

Комментировать

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

IT-образование

+2 ещё

Средний
LLM для школьных экспериментов. Существует ли что то подходящее?
- 1 подписчик
- 03 авг.
- 290 просмотров
3

ответа
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 56 просмотров
0

ответов
Машинное обучение

+1 ещё

Простой
Reverse engineering black box ML-модели?
- 1 подписчик
- 10 июл.
- 135 просмотров
3

ответа
Python

+3 ещё

Простой
Как повысить точность классификации по табличным документам?
- 2 подписчика
- 19 мая
- 283 просмотра
1

ответ
Машинное обучение

+2 ещё

Средний
Какие виды эмбединга используется в nlp?
- 1 подписчик
- 10 мая
- 93 просмотра
1

ответ
Машинное обучение

Средний
В чем преимущество позиционного кодирования синусами?
- 1 подписчик
- 25 апр.
- 106 просмотров
1

ответ
Машинное обучение

Простой
Как обучается трансформер?
- 1 подписчик
- 25 апр.
- 92 просмотра
1

ответ
Python

+2 ещё

Средний
GeForce GTX 1650 > RTX A2000 — как такое возможно?
- 2 подписчика
- 15 апр.
- 754 просмотра
2

ответа
Машинное обучение

+2 ещё

Средний
Какие архитектуры с механизмом внимания появились после transformer?
- 2 подписчика
- 11 апр.
- 174 просмотра
1

ответ
Python

+4 ещё

Средний
Как реализовать фарм-бота для игры Rush Royale?
- 1 подписчик
- 01 апр.
- 768 просмотров
2

ответа
Показать ещё Загружается…

React-разработчик (frontend) с опытом работы в области ML

DevTeam.Space

от 2 000 до 3 000 $

ML Engineer / Data Scientist (Middle+, 25h/w)

Perare

от 2 100 до 2 600 $

Middle/Senior Data Scientist (команда ИИ и аналитика)

Сбер • Москва

от 200 000 до 350 000 ₽