Какая разница между валидационным и тестовым наборами данных?

Question

Евгений Лернер @ehevnlem

Программирую с 1975, в интернете с 1993.

Машинное обучение

Какая разница между валидационным и тестовым наборами данных?

Прочитал кучу статей, но ясности нет. В некоторых статьях пишут что валидационный набор иногда не нужен, можно обойтись тестовым. В чем разница между этими наборами данных? В каких случаях можно обойтись без валидационного набора?

Вопрос задан более двух лет назад
3524 просмотра

Комментировать

Подписаться 1 Средний Комментировать

Пригласить эксперта

Ответы на вопрос 2

4 комментария

Евгений Лернер @ehevnlem Автор вопроса

Спасибо. Доходит. Про кросс валидпцию знаю. А скажите, используете ли вы информационные критерии, aic,bic и ТП?

Написано более двух лет назад
Максим Припадчев @Maksim_64

Евгений Лернер, Да, но это частности, например AIC - используется если данные временная последовательность. Но это различные регуляризации добавление (penalty) при увеличении (complexity). Как таковые к resampling methods они отношения не имеют. Это больше вспомогательные метрики, для сравнения моделей.

Написано более двух лет назад
Евгений Лернер @ehevnlem Автор вопроса

Как дополнение вроде хорошо. У меня задача предсказание биржевых цен

Написано более двух лет назад
Максим Припадчев @Maksim_64

Евгений Лернер, Ваш вопрос был общий и я дал на него общий ответ. Если речь идет об временной последовательности, то это частности. И у библиотек на которых все это дело реализуется имеются отдельные сплиттеры для временной последовательности. Вообще в ML работа с временной последовательностью это отдельное направление.

Написано более двух лет назад

6 комментариев

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

IT-образование

+2 ещё

Средний
LLM для школьных экспериментов. Существует ли что то подходящее?
- 1 подписчик
- 03 авг.
- 286 просмотров
3

ответа
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 56 просмотров
0

ответов
Машинное обучение

+1 ещё

Простой
Reverse engineering black box ML-модели?
- 1 подписчик
- 10 июл.
- 135 просмотров
3

ответа
Python

+3 ещё

Простой
Как повысить точность классификации по табличным документам?
- 2 подписчика
- 19 мая
- 281 просмотр
1

ответ
Машинное обучение

+2 ещё

Средний
Какие виды эмбединга используется в nlp?
- 1 подписчик
- 10 мая
- 93 просмотра
1

ответ
Машинное обучение

Средний
В чем преимущество позиционного кодирования синусами?
- 1 подписчик
- 25 апр.
- 106 просмотров
1

ответ
Машинное обучение

Простой
Как обучается трансформер?
- 1 подписчик
- 25 апр.
- 92 просмотра
1

ответ
Python

+2 ещё

Средний
GeForce GTX 1650 > RTX A2000 — как такое возможно?
- 2 подписчика
- 15 апр.
- 754 просмотра
2

ответа
Машинное обучение

+2 ещё

Средний
Какие архитектуры с механизмом внимания появились после transformer?
- 2 подписчика
- 11 апр.
- 174 просмотра
1

ответ
Python

+4 ещё

Средний
Как реализовать фарм-бота для игры Rush Royale?
- 1 подписчик
- 01 апр.
- 767 просмотров
2

ответа
Показать ещё Загружается…

React-разработчик (frontend) с опытом работы в области ML

DevTeam.Space

от 2 000 до 3 000 $

ML Engineer / Data Scientist (Middle+, 25h/w)

Perare

от 2 100 до 2 600 $

Middle/Senior Data Scientist (команда ИИ и аналитика)

Сбер • Москва

от 200 000 до 350 000 ₽

Answer 1 · 2023-07-22 22:56:40

Смотри в теории машинного обучения есть такая важная тема как Resampling Methods. Это методы случайной выборки из данных которые у тебя есть. Есть два основных это Cross Validation и Bootstrap. Обычно во всяких обучающих материалах используется Cross Validation да и на практике он тоже очень популярен. Что он из себя представляет мы берем например делим случайным образом датасет на 5 частей. Сначала треним на 4 потом тестим на одном что остался, потом на других 4 и тестим на одном что остался и т.д. Так вот каждый такой набор (на котором мы тестим) называется валидационным набором. Например наша метрика MSE мы получим 5 MSE по каждому валидационному набору потом обычно берут среднее по ним.

Теперь про тестовый сет. Есть правило алгоритм во время трениовки, никогда не должен видеть тестовый набор. Есть два подхода первый мы имеем отдельно тестовый набор на котором мы тестим после всех дел, когда все закончили включая тюнинг модели и тренировочный разбиваем как в примере выше и у нас по очереди получаются валидацонные наборы. Есть и второй подход, когда обходятся без тестового набора, потому что его нет, данных мало и тогда только поочередные валидационные наборы используются.

Используют и то и то. Это инженерное решение и ты будешь видеть оба подхода. Ну и на каких то обучающих историях, ты можешь увидеть отсутствие кросс-валидации и только разбиение train_test_split.

В идеале все выглядит вот так. Единственное существует огромное количество разных кросс-валидаций.

Это пример где кросс-валидация используется для тюнинга гиперпараметров, но точно также она будет использоваться и для других целей, каждый синий Fold это и есть валидационный набор.

Answer 2 · 2023-07-24 05:23:54

В Матлабе подход такой: при обучении на тренировочных данных кривая ошибок идёт вниз. Кривая ошибок валидационных данных обычно немного выше, но тоже идёт вниз. Потом начинает идти вверх, хотя ошибки на тренировочных данных продолжают уменьшаться. Вот это означает переобучение. Поэтому берут параметры сети, при которых был минимум ошибок валидации.
При этих параметрах смотрят результат на тесте.

Какая разница между валидационным и тестовым наборами данных?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт