Как увеличить точность предсказаний?

Question

WSGlebKavash @WSGlebKavash

Машинное обучение

Как увеличить точность предсказаний?

Датасет представлен в виде CSV-файла. В нём есть поля в качестве входных данных и поле целевой переменной. Данные - обычные числа float. В качестве модели используется регрессия. Цель: предсказание прочности бетона
В настоящий момент точность предсказаний 68%. Как увеличить точность модели?

Вопрос задан более двух лет назад
137 просмотров

2 комментария

Подписаться 1 Простой 2 комментария

Пригласить эксперта

Ответы на вопрос 2

2 комментария

U235U235 @U235U235

И самое главное, не факт, что все это поможет. Возможно, что 70%, это, например, принципиальный потолок точности.

Написано более двух лет назад
Максим Припадчев @Maksim_64

U235U235, Лучше бы автор вопроса да и вы объяснили бы что такое точность 70% в регрессивной задаче.
В нём есть поля в качестве входных данных и поле целевой переменной. Данные - обычные числа float.
То есть у нас и X и y непрерывные и это задача регрессии. 70% процентов может быть у задач классификации. (у задач регрессии другие метрики R2 score, MSE, RSME и.т.д) И пусть алгоритм будет например логистическая регрессия (он решает задачи классификации y ДИСКРЕТНЫЙ. На самом деле в ТЕОРИИ и только в ТЕОРИИ и линейная регрессия может быть использована для задач классификации (на практике этого не делают).

Слово регрессия в названии алгоритма - не одно и тоже, как проблема регресиии.
Автор говорит и X y у меня float нам нет дело до X он может быть любым, а вот y то НЕ дискретный. Значит это проблема регрессии. Откуда тогда 68-70% должно быть R2 score, MAE или RMSE.

Я не стал заострять на этом внимание в ответе, так что бы автор начал что то делать КОНКРЕТНОЕ, и появились КОНКРЕТНЫЕ вопросы.

Что же касается вашего заявления

И самое главное, не факт, что все это поможет.
ну там где есть вариативность 100% гарантии конечно нет, не одни метод статистического анализа или машинного обучения не гарантирует 100% результата. Если же мы опустим сто "процентность" то поможет, и еще как поможет.

Написано более двух лет назад

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 41 просмотр
0

ответов
Машинное обучение

+1 ещё

Простой
Reverse engineering black box ML-модели?
- 1 подписчик
- 10 июл.
- 134 просмотра
3

ответа
Python

+3 ещё

Простой
Как повысить точность классификации по табличным документам?
- 2 подписчика
- 19 мая
- 268 просмотров
1

ответ
Машинное обучение

+2 ещё

Средний
Какие виды эмбединга используется в nlp?
- 1 подписчик
- 10 мая
- 90 просмотров
1

ответ
Машинное обучение

Средний
В чем преимущество позиционного кодирования синусами?
- 1 подписчик
- 25 апр.
- 104 просмотра
1

ответ
Машинное обучение

Простой
Как обучается трансформер?
- 1 подписчик
- 25 апр.
- 91 просмотр
1

ответ
Python

+2 ещё

Средний
GeForce GTX 1650 > RTX A2000 — как такое возможно?
- 2 подписчика
- 15 апр.
- 739 просмотров
2

ответа
Машинное обучение

+2 ещё

Средний
Какие архитектуры с механизмом внимания появились после transformer?
- 2 подписчика
- 11 апр.
- 170 просмотров
1

ответ
Python

+4 ещё

Средний
Как реализовать фарм-бота для игры Rush Royale?
- 1 подписчик
- 01 апр.
- 732 просмотра
2

ответа
Регулярные выражения

+2 ещё

Простой
Поиск оптимальной регулярки для бинарной классификации строк. Как?
- 1 подписчик
- 22 мар.
- 197 просмотров
1

ответ
Показать ещё Загружается…

Аналитик-разработчик

Сбер • Москва

R&D разработчик (Центр компетенций CV и нейросетевой оптимизации)

Navio • Нижний Новгород

Ведущий специалист группы аналитики

Специальный Технологический Центр • Санкт-Петербург

Тэг python тут ни при чем.
Не надо ставить как можно больше тэгов. Лучше оставить один, но конкретный, с которым проблема.
См.п.3.1 Регламента.
Покажи график.
А вообще, https://www.directmedia.ru/book-119123-ekstremalny...

Answer 1 · 2023-04-02 15:19:34

Ну информации вы даете мало, а сделать для увеличения точности можно много всего.
1. Трансформации, кейс ваш простой, все входные данные числовые. (Нормализация, Стандартизация), как делать смотрите https://scikit-learn.org/stable/modules/preprocess... там хорошие примеры как правильно применять StandardScaller min_max_scalar в общем приведение ваших входных данных к единой шкале.

2. Увеличение сложности модели здесь мы говорим о bias vs variance компромисс Мы имеем простую модель или сложную модель. Например поведение простой модели слабая точность на тренировочном сете и еще более слабая точность на тестовом сете, такое поведение называется underfitting или говорят еще high bias. В свою очередь high variance или overfitting это высокие показатели на тренировочном сете и значительно более низкие на тестовом сете. Что делать читаем и изучаем https://scikit-learn.org/stable/modules/generated/... это трансформатор и затем https://scikit-learn.org/stable/auto_examples/mode... это кривая валидации в интернете полно примеров как применять. Через них находится оптимальная сложность модели.

3. Тюнинг гиперпарматров https://scikit-learn.org/stable/modules/grid_searc... это как осуществить правильный подбор параметров эстиматора (когда уже сделаны нужные трансформации и выбрана модель).

Перед этим сделайте ну хоть какое то подобие EDA используйте seaborn и функцию pairplot хоть глянуть может какие то корреляции есть. По гуглите другие методы EDA для задач регрессии это задаст направление для лучшего понимания датасета что у вас есть.

Начните делать появятся более конкретные вопросы и будут более конкретные ответы.

Answer 2 · 2023-04-02 15:39:18

Александр Скуснов @AlexSku

не буду отвечать из-за модератора

Глубокое обучение, то бишь нейросеть.

Ответ написан более двух лет назад

1 комментарий

Как увеличить точность предсказаний?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт