Задать вопрос
@evomed

Какой датасет лучше для обучения?

Если я хочу чтобы нейросеть детектировала в тексте "продам единорога", мне нужно скармливать ей длинные тексты с шумом (500-700 символов) где в конце будет о продаже единорога или много коротких разных вариантов о продаже?
  • Вопрос задан
  • 188 просмотров
Подписаться 2 Простой Комментировать
Помогут разобраться в теме Все курсы
  • Нетология
    Инженер машинного обучения с нуля
    14 месяцев
    Далее
  • Яндекс Практикум
    ML-инженер для начинающих
    12 месяцев
    Далее
  • Skillbox
    Профессия Machine Learning Engineer
    12 месяцев
    Далее
Решения вопроса 1
@rPman
Данные должны быть максимально приближенные к рабочим, в идеале собрать сами рабочие данные.

Синтетика может дать неожиданные, часто плохие, результаты. Нейронки могут настраиваться не на те признаки, которые привык видеть человек.
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы