Можно ли прогнозировать только по категориальным признакам в ML коих больше 100?

Question

picopicopico @picopicopico

Машинное обучение

Можно ли прогнозировать только по категориальным признакам в ML коих больше 100?

Допустим прогнозирование стоимости дома по 200 признакам, где каждый отдельный дом будет иметь только около 10 признаков (10 не нулевых значений в векторе). Практичны ли такие прогнозы?

Вопрос задан более трёх лет назад
62 просмотра

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Нетология

Инженер машинного обучения с нуля

14 месяцев

Далее
Яндекс Практикум

ML-инженер для начинающих

12 месяцев

Далее
Skillbox

Профессия Machine Learning Engineer

12 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Машинное обучение

Простой
Необходимо разработать модель классификации, поможете с выбором парадигмы решения задачи?
- 2 подписчика
- 22 янв.
- 135 просмотров
0

ответов
Машинное обучение

+1 ещё

Средний
Может, у кого-то есть дампы с реальными наименованиями товаров/услуг и кодами ОКПД2 для обучения NLP-модели?
- 1 подписчик
- 16 янв.
- 118 просмотров
0

ответов
Машинное обучение

Простой
Можно ли получить сразу полный список чего-либо от LLM по определённому критерию?
- 1 подписчик
- 28 дек. 2025
- 119 просмотров
1

ответ
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек. 2025
- 311 просмотров
1

ответ
Машинное обучение

+1 ещё

Средний
Есть ли готовая архитектура модели, которая принимает на вход подобный формат данных?
- 3 подписчика
- 27 сент. 2025
- 180 просмотров
0

ответов
Машинное обучение

+1 ещё

Простой
Поиск по образцу. Как сделать быстрый поиск вхождения картинок-символов на большом чертеже?
- 2 подписчика
- 19 сент. 2025
- 201 просмотр
1

ответ
Нейронные сети

+1 ещё

Простой
С помощью чего проанализировать данные и построить свою нейронную сеть для бана пользователей?
- 1 подписчик
- 09 сент. 2025
- 198 просмотров
2

ответа
Нейронные сети

+1 ещё

Средний
Как повысить macro f1 в задаче классификации изображения?
- 1 подписчик
- 03 сент. 2025
- 65 просмотров
0

ответов
Веб-разработка

+1 ещё

Простой
Какие есть ML-инструменты, которые по структуре или изображению лендинга предсказывают зоны внимания пользователей?
- 1 подписчик
- 28 авг. 2025
- 403 просмотра
3

ответа
Видеокарты

+1 ещё

Средний
Целесообразно ли использование двух RTX 5080 для обучения нейросетей?
- 1 подписчик
- 24 авг. 2025
- 536 просмотров
1

ответ
Показать ещё Загружается…

Middle DevOps Engineer/DevOps-инженер

ZennoLab • Нижний Новгород

от 150 000 ₽

Chief Executive Officer (CEO)

UANT Limited

от 500 000 до 700 000 ₽

QA Engineer (Manual → AQA)

Adfinity

от 150 000 ₽

Answer 1 · 2020-09-16 21:10:50

Любой метод - не панацея. Ответ на ваш вопрос - прогнозировать-то можно. Но вот есть-ли зависимость вашего целевого признака от ваших (пусть даже 100) независимых признаков - это совершенно другой вопрос.
Неудача в прогнозировании может быть вызвана как неправильно выбранным методом, так и отсутствии корреляций между входными и выходными признаками.
И, кстати, подбор наиболее адекватных признаков - это одна из самых важных задач в ML.

Answer 2 · 2020-09-16 17:06:17

Вы имеете ввиду, что у одного конкретного дома может иметься 200 признаков, но в основном имеются только 10 признаков, а остальные 190 признаков пустые?
Тогда возникает вопрос, а от дома к дому имеется ли какая-то системность в том, какие признаки являются пустыми, а какие нет? Или же у одного дома не пустыми признаками будут признаки условно x1 - x10, а у другого x150-160?
Сама суть прогнозирования стоимости заключается в том, что выбираются какие-то опорные признаки, которые оказывают влияние на стоимость. Должен быть какой-то признак x5 (а лучше несколько таких признаков), который будет у всех или почти у всех домов, чтобы изменчивость этого признака можно было связывать с изменчивостью цены.
В любом случае, на первый взгляд данные выглядят очень сильно разреженными, что явно не позитивно сказывается на построении каких-то зависимостей.
Так же неплохо было бы знать о количестве записей.
Попробуйте сделать пару базовых моделей, вдруг что-то из этого получится.

Можно ли прогнозировать только по категориальным признакам в ML коих больше 100?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт