Допустимо ли неравномерное распределение данных по классам в обучающей выборке?

Question

ivodopyanov @ivodopyanov

NLP, python, numpy, tensorflow

Допустимо ли неравномерное распределение данных по классам в обучающей выборке?

В случае обучения простой feedforward сети с одним скрытым слоем и в случае предобучения при помощи RBM?

Вопрос задан более трёх лет назад
515 просмотров

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

ИИ в медицине: как использовать в работе каждый день

8 недель

Далее
Академия Эдюсон

Нейросети в строительстве

2 месяца

Далее
Бруноям

ИИ-агенты и n8n

2 месяца

Далее

Решения вопроса 1

7 комментариев

ivodopyanov @ivodopyanov Автор вопроса

Я так понимаю, что при таком перекосе размер mini-batch'а при градиентном спуске придется выбирать очень большим, чтобы в него попал хотя бы один самый редкий класс?

Написано более трёх лет назад
Дмитрий Демидов @ptitca_zu

ivodopyanov: я не специалист, но разве градиентный спуск используется в задачах классификации?

Написано более трёх лет назад
Sergei Sudakov @sstrange

ivodopyanov: в общем случае таких ограничений нет. Даже если в какие-то мини-батчи не будут попадать объекты редкого класса, в другие-то будут, так что общее направление обучение поменяться не должно. Конечно, если редкого класса настолько мало, что он не попадает в большинство, нейронная сеть может его проигнорировать при обучении с любым размером батча.

Написано более трёх лет назад
ivodopyanov @ivodopyanov Автор вопроса

Дмитрий Демидов: классификацию же вполне можно решать нейронными сетями

Написано более трёх лет назад
Дмитрий Демидов @ptitca_zu

ivodopyanov: а разве градиентный спуск используется для обучения сети? :) я просто не в курсе, но по-моему самый популярный метод для сетей - обратное распространение.

Написано более трёх лет назад
ivodopyanov @ivodopyanov Автор вопроса

Дмитрий Демидов: слова "обратное распространение" по сути объясняют нам, как выглядит та функция (и её частные производные), которую мы хотим оптимизировать. В обычной регрессии оптимизируем расстояние от функции до исходных точек. В обратном распространении находим производные несколько другим путем. В сетях Хопфилда, например, третий вариант. А как минимизировать эту функцию, зная производные, - это уже другая задача. Самый простой - это градиентный спуск.

Написано более трёх лет назад
Дмитрий Демидов @ptitca_zu

ivodopyanov: ну ок, я сразу сказал, что совсем не специалист

Написано более трёх лет назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- вчера
- 73 просмотра
1

ответ
MacBook

+2 ещё

Простой
Mac для машинного обучения, стоит ли брать?
- 1 подписчик
- вчера
- 264 просмотра
3

ответа
Нейронные сети

Простой
Как решить проблему с генерацией видео в Kling AI?
- 1 подписчик
- 09 июл.
- 79 просмотров
1

ответ
Хранение данных

+3 ещё

Средний
Как организовать обучение нейронной сети?
- 1 подписчик
- 07 июл.
- 152 просмотра
2

ответа
Машинное обучение

+1 ещё

Средний
Как устроены Нейрохам и подобные ему боты с точки зрения ML?
- 1 подписчик
- 24 июн.
- 511 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 307 просмотров
2

ответа
Нейронные сети

Средний
Как в AI ToolKit для тренировки LorA указать свои модели?
- 1 подписчик
- 09 июн.
- 74 просмотра
1

ответ
Машинное обучение

+1 ещё

Простой
Какие темы в статистике нужно изучить прежде всего, чтобы начать решать простые задачи машинного обучения?
- 2 подписчика
- 25 мая
- 228 просмотров
2

ответа
IT-образование

+1 ещё

Простой
Важны ли алгоритмы и структуры данных для ML-инженера?
- 2 подписчика
- 25 мая
- 516 просмотров
2

ответа
Нейронные сети

Простой
Есть ли нейросети для интерактивной работы с изображениями?
- 2 подписчика
- 13 мая
- 290 просмотров
2

ответа
Показать ещё Загружается…

Answer 1 · 2015-08-18 13:58:35

Есть 2 случая:
1. В реальном мире, как и в выборке есть "перекос" распределения по классам, то есть какие-то объекты встречаются заведомо реже
2. В реальном мире "перекоса" нет.

В первом случае, лучше сохранить "перекос", в втором сгенерировать больше данных

Допустимо ли неравномерное распределение данных по классам в обучающей выборке?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт