Всем привет!
В процессе изучения нейронных сетей накопилась масса вопросов, ответы на которые наверное требуют больше практических знаний чем теоретических.
В большинстве статей описывается стандартные примеры (например классификация котика или собачки) либо матчасть по работе нейронов, но при этом практически нет реальных примеров прикладных задач используемых на пользовательских данных а не готовых датасетах.
Отсюда возникает проблема, что прочитав статью появляется больше вопросов чем ответов, поэтому, если у кого-то есть практический опыт которым он готов поделиться, буду очень рад информации по следующим вопросам.
- Какой объём данных для обучения считается нормальным или как понять что проблема в нехватке данных а не в ошибочном построении сети?
- По какой логике принято определять что именно должно быть на изображениях, к примеру если мы хотим определить есть ли очки у человека на картинке. Это должен быть набор фото с людьми в очках (портретное фото), лица в очках или же просто область изображения на которой есть очки?
- Из предыдущего пункта вытекает вопрос, как правильно анализировать к какому признаку из датасета привязывается сеть, ведь возможен вариант например что там окажется много людей со схожей формой носа и сеть будет выявлять "правильные носы" а не очки?
- На сколько сильно влияет различие количества данных в разных классах при классификации? если мы например "скормим" сети 5000 изображений котиков и 3000 изображений собачек и хотим определить кто на изображении кот или собака?
Понятно что всё это можно протестировать самому, но подозреваю что можно не изобретать велосипед :)