Задать вопрос
@evomed

Какой датасет лучше для обучения?

Если я хочу чтобы нейросеть детектировала в тексте "продам единорога", мне нужно скармливать ей длинные тексты с шумом (500-700 символов) где в конце будет о продаже единорога или много коротких разных вариантов о продаже?
  • Вопрос задан
  • 50 просмотров
Подписаться 2 Простой Комментировать
Решения вопроса 1
@rPman
Данные должны быть максимально приближенные к рабочим, в идеале собрать сами рабочие данные.

Синтетика может дать неожиданные, часто плохие, результаты. Нейронки могут настраиваться не на те признаки, которые привык видеть человек.
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы