Задать вопрос
@ModestesGonze

Как правильно подготовить данные для обучения сети?

Привет.

Есть исходные данные в таком виде. (одна строка из набора)
Ford, Mustang, 25000, 0, 0, 6, Автоматическая, 2013, Задний, Бензин, 3.7 л, 10, 4, Спорткары, Купе, 87, 568

Последний столбец [568] это метка(объект), сама цифра это кол-во просмотров в сутки, все остальные столбцы это признаки.
После обучения сети, для прогноза, на вход будут подоваться все данные кроме последнего столбца. В итоге сеть должна предсказать число из последнего столбца. Далее уже по результатам будет происходить ранжирование выдачи.

Вопросы:
1. Как правильно подготовить данные перед подачей в сеть? Текстовые (я так понял это категориальные) данные нужно конвертировать в числа, но какие методы для этого использовать?

2. Какая модель подойдет для это задачи? Я так полагаю что линейная регрессия, но не уверен.

3. Как на выходе получать не 0 - 1 а число в том же виде что и в исходных данных? Тут я так понимаю можно как то обратно конвертировать метку(результат).

4. Какую библиотеку посоветуете для этой задачи? Сеть простая, думал использовать Tensorflow, пока вникал в тему понял что есть много других библиотек, например Keras и Scikit-learn.

В питоне разбираюсь плохо, не говоря уже об ML, но тема жутко интересна, ковыряю потихоньку. В голове много пробелов которые не понятно как заполнить. Демки делаю, но нет уверености, что делаю правильно.

UPD:
И еще. В данных с 3 по 5 колонки это тарифы [25000, 0, 0], в приведеном примере последние два тарифа не указаны, поэтому в них прописан 0. У других автомобилей есть все три тарифа или только два.
Для сети лучше оставить как есть, по нулям, или лучше там где один например дублировать его, а там где два, дублировать максимальный?
  • Вопрос задан
  • 80 просмотров
Подписаться 1 Средний Комментировать
Помогут разобраться в теме Все курсы
  • Нетология
    Python-разработчик: расширенный курс + нейросети
    12 месяцев
    Далее
  • Яндекс Практикум
    Python-разработчик
    10 месяцев
    Далее
  • Skillbox
    Профессия Python-разработчик + ИИ
    10 месяцев
    Далее
Пригласить эксперта
Ответы на вопрос 1
DanilBaibak
@DanilBaibak
Machine Learning engineer
Для подготовки данных, sklearn - отличный выбор. В библиотеке имеется ряд инструментов для препроцессинга. Еще немного примеров можно посмотреть здесь.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
ITK academy Краснодар
от 220 000 до 300 000 ₽
ITK academy Краснодар
от 75 000 ₽
DimaTech Ltd Краснодар
от 140 000 до 140 000 ₽