Как выровнять процентное распределение по данным?

Question

Антон Тарара @atarara

Как выровнять процентное распределение по данным?

Здравствуйте коллеги. У меня такой вопрос. Имеется датасет. В нем есть признаки(столбцы) бинарные. но в этих столбцах соотношение True к False не очень ровное. Например True 90% а False 10%. Как выровнять сразу по всем признакам эти данные? Добавив рандомно новые? В Studio ML есть такой инструмент называется SMOTE, но он работает только с одним признаком. Может быть есть какие то механизмы для pandas или numpy? Спасибо

Вопрос задан более трёх лет назад
197 просмотров

1 комментарий

Подписаться 3 Средний 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Data Scientist с нуля

10 месяцев

Далее
Академия Эдюсон

Machine Learning: тариф Базовый

7 месяцев

Далее
Бруноям

Data Scientist

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

2 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

MacBook

+2 ещё

Простой
Mac для машинного обучения, стоит ли брать?
- 1 подписчик
- 6 часов назад
- 75 просмотров
1

ответ
Хранение данных

+3 ещё

Средний
Как организовать обучение нейронной сети?
- 1 подписчик
- 07 июл.
- 148 просмотров
2

ответа
Машинное обучение

+1 ещё

Средний
Как устроены Нейрохам и подобные ему боты с точки зрения ML?
- 1 подписчик
- 24 июн.
- 501 просмотр
2

ответа
Машинное обучение

+1 ещё

Простой
Какие темы в статистике нужно изучить прежде всего, чтобы начать решать простые задачи машинного обучения?
- 2 подписчика
- 25 мая
- 225 просмотров
2

ответа
IT-образование

+1 ещё

Простой
Важны ли алгоритмы и структуры данных для ML-инженера?
- 2 подписчика
- 25 мая
- 514 просмотров
2

ответа
Карьера в IT

+1 ещё

Простой
Стоит ли беспокоится, если иду в NLP, но я плох на числовых табличных данных?
- 1 подписчик
- 11 мая
- 469 просмотров
1

ответ
Python

+3 ещё

Средний
Как перенести позу SMPL модели на игровую 3д модель?
- 2 подписчика
- 10 мая
- 371 просмотр
1

ответ
Машинное обучение

Простой
Необходимо разработать модель классификации, поможете с выбором парадигмы решения задачи?
- 2 подписчика
- 22 янв.
- 155 просмотров
0

ответов
Машинное обучение

+1 ещё

Средний
Может, у кого-то есть дампы с реальными наименованиями товаров/услуг и кодами ОКПД2 для обучения NLP-модели?
- 1 подписчик
- 16 янв.
- 140 просмотров
0

ответов
Машинное обучение

Простой
Можно ли получить сразу полный список чего-либо от LLM по определённому критерию?
- 1 подписчик
- 28 дек. 2025
- 136 просмотров
1

ответ
Показать ещё Загружается…

Нифига не понял, но подписался. Интересно узнать что скажут люди.

Answer 1 · 2018-03-30 13:59:12

Идея разбодяжить настоящие данные фейковыми, чтобы получить что-то толковое - это бредовая идея.
Инструменты для реализации бредовых идей можно подобрать, да.

Answer 2 · 2018-03-30 22:05:06

contrib.scikit-learn.org/imbalanced-learn/stable

Но вообще 90 на 10 - вполне здоровое соотношение для большинства случаев.

Как выровнять процентное распределение по данным?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт