Yourmind
@Yourmind
пишу говнокод в перерывах между едой и сериалами

Как правильно обучить классификатор?

Доброго времени суток. В данный момент мне нужно создать классификатор изображений, который будет выявлять суецидальные картинки (порезанные вены, виселицы, синии киты и т д).
Изучив несколько статеек, например https://habr.com/ru/post/321834/ , возник вопрос. Как я понимаю,классификатор относит картинку к одному из классов (в данной статье к котам или собакам). И собственно понятно, если это тестить на таких картинках. А если дать классификатору какую нибудь картинку, типо человек/ дерево/ мебель, то что будет? и как тогда обучать классификатор, где по сути должно быть два класса: суецид и все остальное?
  • Вопрос задан
  • 89 просмотров
Пригласить эксперта
Ответы на вопрос 2
@dmshar
Да уж, изучать ML по "статейкам" это жесть.

"если дать классификатору какую нибудь картинку, типо человек/ дерево/ мебель" - не дать, а сначала обучить на этих картинках, то потом он и будет классифицировать ее на "типо человек/ дерево/ мебель". А если дать эту картинку классификатору, обученному на "котиках-собачках", тогда не удивляйтесь, если он ваш табурет примет за собаку, а дерево за кота. Или наоборот.

как тогда обучать классификатор, где по сути должно быть два класса: суецид и все остальное - абсолютно так-же, как и котиков-собачек где их тоже два класса, про которые пишут ваши "статейки". Дать обучиться на пару десятках тысяч размеченных картинках, на которых эти ваши "вены, виселицы, синии киты" и столько-же картинок где их нет. Вот и будет потом ваш обученных классификатор делить картинки на "суецид и все остальное".
Ответ написан
solotony
@solotony
code for food, caviar preferably
любая задача построения классификатора начинается с построения корпуса - исходного набора данных для анализа - в вашем случае картинок.

то есть если вы хотите научить распознавать порезанные вены на руках - вам надо иметь 10000 картинок порезанных вен и 10000 - целых рук

я думаю в конкретной задаче очень большой разброс потенциальных изображений очень слабые признаки которые надо выявлять и поэтому ничего не получится.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы