Задать вопрос
@evomed

Какой датасет лучше для обучения?

Если я хочу чтобы нейросеть детектировала в тексте "продам единорога", мне нужно скармливать ей длинные тексты с шумом (500-700 символов) где в конце будет о продаже единорога или много коротких разных вариантов о продаже?
  • Вопрос задан
  • 187 просмотров
Подписаться 2 Простой Комментировать
Помогут разобраться в теме Все курсы
  • Яндекс Практикум
    Инженер машинного обучения
    4 месяца
    Далее
  • Skillbox
    Профессия Machine Learning Engineer
    12 месяцев
    Далее
  • Stepik
    Машинное обучение: Кросс-валидация и оптимизация гиперпараметров
    2 недели
    Далее
Решения вопроса 1
@rPman
Данные должны быть максимально приближенные к рабочим, в идеале собрать сами рабочие данные.

Синтетика может дать неожиданные, часто плохие, результаты. Нейронки могут настраиваться не на те признаки, которые привык видеть человек.
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы