Как сделать распознавание символов при помощи нейронных сетей со своим набором картинок?
Здраствуйте,
Прочитал уже кучу статей по машинному обучению, по разным фреймворкам для ним, но так ничего и не понял :)
А точнее везде дается пример распознавания символов из базы MNIST, а как сделать этот пример руками - непонятно.
Может кто-то подсказать простой пример. Вот мы загружаем кучу своих картинок для тренировки, тестируем, проверяем.
Язык и фреймворк неважен, мне главное суть уловить.
И еще одновременно тут же маленький глупый вопрос.
Допустим, у меня есть набор картинок с автомобилями. Мне нужно узнать разбита она или нет. Нужно ли мне для этой задачи как-то обрабатывать картинку чтобы нейронная сеть могла отличать два этих образа? Или она сама выведет закономерность за счет каких-то общих повторяющихся шаблонов?
Нейросеть не умеет "видеть" как делает это человек. Ей нужно "подсказать" что есть хорошо, а что плохо.
Поразмыслив: когда машина цела, то у неё форма кузова ровная, линии сплошные, единым фрагментом.
Так что необходимо формализовать эти признаки в виде чисел, закодировать входные данные, а нейросеть уже будет классифицировать по этим признакам.
Распознавание MNIST можно на разных архитектурах сделать. Но для распознавания сложных изображений сейчас применяют сверточные нейронные сети. При должном обучении они могут детектировать различные паттерны в изображении (типа покореженного кузова, разбитого стекла) и делать вывод о состоянии машины.