Задать вопрос

Как выровнять процентное распределение по данным?

Здравствуйте коллеги. У меня такой вопрос. Имеется датасет. В нем есть признаки(столбцы) бинарные. но в этих столбцах соотношение True к False не очень ровное. Например True 90% а False 10%. Как выровнять сразу по всем признакам эти данные? Добавив рандомно новые? В Studio ML есть такой инструмент называется SMOTE, но он работает только с одним признаком. Может быть есть какие то механизмы для pandas или numpy? Спасибо
  • Вопрос задан
  • 188 просмотров
Подписаться 3 Средний 1 комментарий
Пригласить эксперта
Ответы на вопрос 2
longclaps
@longclaps
Идея разбодяжить настоящие данные фейковыми, чтобы получить что-то толковое - это бредовая идея.
Инструменты для реализации бредовых идей можно подобрать, да.
Ответ написан
Arseny_Info
@Arseny_Info
R&D engineer
contrib.scikit-learn.org/imbalanced-learn/stable

Но вообще 90 на 10 - вполне здоровое соотношение для большинства случаев.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы