Задать вопрос

Как выровнять процентное распределение по данным?

Здравствуйте коллеги. У меня такой вопрос. Имеется датасет. В нем есть признаки(столбцы) бинарные. но в этих столбцах соотношение True к False не очень ровное. Например True 90% а False 10%. Как выровнять сразу по всем признакам эти данные? Добавив рандомно новые? В Studio ML есть такой инструмент называется SMOTE, но он работает только с одним признаком. Может быть есть какие то механизмы для pandas или numpy? Спасибо
  • Вопрос задан
  • 196 просмотров
Подписаться 3 Средний 1 комментарий
Помогут разобраться в теме Все курсы
  • Нетология
    Data Scientist с нуля
    10 месяцев
    Далее
  • Академия Эдюсон
    Machine Learning: тариф Базовый
    7 месяцев
    Далее
  • karpov.courses
    Инженер машинного обучения
    7 месяцев
    Далее
Пригласить эксперта
Ответы на вопрос 2
longclaps
@longclaps
Идея разбодяжить настоящие данные фейковыми, чтобы получить что-то толковое - это бредовая идея.
Инструменты для реализации бредовых идей можно подобрать, да.
Ответ написан
Arseny_Info
@Arseny_Info
R&D engineer
contrib.scikit-learn.org/imbalanced-learn/stable

Но вообще 90 на 10 - вполне здоровое соотношение для большинства случаев.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы