Чем отличаются нейронные сети?

Question

Kojanseed @Kojanseed

Чем отличаются нейронные сети?

Здравствуйте.
Решил я начать изучение нейронных сетей.
Создал свой первый персептрон.
В моем понимании - персептрон нужен для легких задач по типу распознать букву.

Решил посмотреть дальше про свёрточные сети и глубокое обучение, но не совсем понимаю о них.

Можете мне объяснить (желательно примером), чем отличается свёрточная сеть от глубокого обучения?

Как я понял, свёрточная сеть позволяет оптимизировать нейронную сеть, т.е. сначала, к примеру, классифицирует объект (квадрат), затем детализирует объект (дорожный знак), и в конце конкретизирует объект (знак "Въезд запрещен").
А глубокое обучение само определяет, сколько слоев делать, какие будут идентификаторы. Т.е. само определяет, как находить дорожный знак и конкретизировать его.
Укажите мои ошибки. И подскажите статьи/литературу об этом. Если со сверточной сетью (в моем понимании, которое описано выше) более менее понятно как реализовывать, то с глубинным обучением (в моем понимании, которое описано выше) совершенно не понятно, как возможно реализовать.
C++: Какие библиотеки посоветуете использовать для анализа изображений и какие методы (использование контуров или градиентов) подходят для обучения нейронных сетей?

Вопрос задан более трёх лет назад
4616 просмотров

Комментировать

Подписаться 26 Оценить Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Разработчик C++

9 месяцев

Далее
Нетология

Специалист по информационной безопасности + нейросети

12 месяцев

Далее
Компьютерная академия «TOP»

Учебная программа “Разработка программного обеспечения”

30 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 3

5 комментариев

Kojanseed @Kojanseed Автор вопроса

Можете подсказать, как найти ядра свёртки?
Правильно ли я понял, что ядро есть парацептрон?
Как я понял, одно из ядер можно найти одним из следующих способов:
1. задается ядро (16x16), заполняется нулями, дальше идет подсчет каждого пикселя¹, если он больше определенного значения, то прибавляется ноль, если меньше, то прибавляется 1. И так прогоняется по правильным изоображениям и ложным, если правда оказалась ложью, то прибавляем матрицу от правдивой картинки к ядру, если ложь оказалась правдой, то из ядра вычитаем матрицу ложной картинки.
2. Задается ядро (16x16), заполняется нулями, дальше идёт подсчет каждого пикселя¹, 255 целочисленного делится на любое число (допустим 5), итого максимум оказалось 51, и так с каждым пикселем, делим его целочисленного на ранее заданное число (5), потом подбираем среднее значение и вписываем (получается, нам необходимо создать ещё одну матрицу, которая будет хранить все элементы).
Возможно, все, что я описал выше глупости. И пока писал свои мысли, я забыл как он определяет, что на изображении есть нужный элемент.

Написано более трёх лет назад
Kojanseed @Kojanseed Автор вопроса

Kojanseed: возможно я вспомнил, определением максимумов или среднего среди нейронов?

Написано более трёх лет назад
Александр Кислинский @Luonic

Kojanseed: чтобы понять, как обучаются НС, надо читать о алгоритме обратного распространения ошибки (backpropagonation). Глубокие нейронные сети, чтобы избежать затухания градиента, обучают на неразмеченной выборке с помощью разбиения слоев НС на ограниченные больцмановские машины (RBM)
В этой серии роликов хорошо описаны проблемы и их решения: https://www.youtube.com/watch?v=b99UVkWzYTQ

Написано более трёх лет назад
vik523 @vik523

А есть грань перехода между сверточной нейронной сетью и глубокой, т.е. кажем 5 слоев, это еще сверточная а вот 6 это уже глубокая?)

Написано более трёх лет назад
Александр Кислинский @Luonic

vik523: когда при обратном распространении ошибки градиент затухает и сеть не может обучиться, считай, что глубокая

Написано более трёх лет назад

6 комментариев

Kojanseed @Kojanseed Автор вопроса

Хорошо написал, жаль, что не ответил на мои вопросы).

Написано более трёх лет назад
Deerenaros @Deerenaros

Kojanseed: Так в том то и проблема, что ответа нет. Тем более менее годно написал Александр Кислинский. Я лишь дополнил.

Написано более трёх лет назад
Deerenaros @Deerenaros

Kojanseed: Свёрточные сети и глубинное обучение - одна суть в том плане, что свёрточные сети есть подмножество глубинного обучения. По крайне менее, как мне известно. Про плюсы могу сказать о гугловской TensorFlow, ну а вообще, лучше использовать python/matlab, там уже что угодно подойдёт, смотрим перфоманс, пробуем удобство и выбираем подходящий вариант.

Написано более трёх лет назад
Kojanseed @Kojanseed Автор вопроса

Deerenaros: у меня был вопрос только про то, чем отличаются Сверточные сети от глубокого обучения.

Написано более трёх лет назад
Kojanseed @Kojanseed Автор вопроса

Я не говорю, что ты плохо написал. Ты дал обобщенный ответ по НС, но я спрашивал только об отличиях.

Написано более трёх лет назад
Deerenaros @Deerenaros

Kojanseed: Я просто попытался оправдать некорректный вопрос.

Написано более трёх лет назад

4 комментария

Kojanseed @Kojanseed Автор вопроса

Спасибо за ответ. Не могли бы вы рассказать, как это работает на примере (к примеру, на распознавании дорожного знака)

Написано более трёх лет назад
xmoonlight @xmoonlight

Kojanseed: почитайте по ссылке - там всё есть и даже в картинках. (1-ая ссылка из списка)

Написано более трёх лет назад
Kojanseed @Kojanseed Автор вопроса

xmoonlight: насколько верны мои предположения из первого поста? У меня первая ссылка на классификацию на основе сверточной сети, значит ли это, что глубокое обучение является просто обучением сверточной сети?

Написано более трёх лет назад
xmoonlight @xmoonlight

Kojanseed: про первую ссылку - это про то, как это работает для распознавания изображений.
про глубокое обучение - нет, не значит.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

C++

+1 ещё

Средний
Имя массива это адрес первого элемента или указатель на его первый элемент в Си?
- 2 подписчика
- 12 нояб.
- 347 просмотров
5

ответов
C++

+1 ещё

Простой
Почему Project Dependencies не работает?
- 1 подписчик
- 10 нояб.
- 69 просмотров
1

ответ
Системное администрирование

+2 ещё

Средний
Сервер с GPU предназначен ли для запуска фронтенда/бэкенда или он для вычислений?
- 1 подписчик
- 08 нояб.
- 265 просмотров
1

ответ
C++

Простой
Влияет ли, передаёшь ты в функцию аргументы по ссылке или по значению, на производительность и память?
- 2 подписчика
- 07 нояб.
- 297 просмотров
2

ответа
C++

Простой
А нужно ли заменять dynamic_cast?
- 1 подписчик
- 07 нояб.
- 88 просмотров
1

ответ
C++

Простой
Как понять что переполняет память в C++?
- 1 подписчик
- 01 нояб.
- 247 просмотров
1

ответ
C++

Средний
Как исправить некорректное отображение кириллицы?
- 1 подписчик
- 30 окт.
- 220 просмотров
3

ответа
Компьютерные сети

+1 ещё

Средний
Как обнаружить сканирование портов по логу сетевого трафика?
- 8 подписчиков
- 29 окт.
- 3231 просмотр
2

ответа
C++

Простой
Какой подход выбрать для представления Chunk?
- 1 подписчик
- 28 окт.
- 174 просмотра
1

ответ
Нейронные сети

Простой
Как работать с планами в CursorAi?
- 2 подписчика
- 26 окт.
- 123 просмотра
1

ответ
Показать ещё Загружается…

Frontend Developer - React

rgbcode

от 180 000 до 220 000 ₽

Программист-консультант 1С ЗУП

Grand-hr • Москва

от 120 000 до 200 000 ₽

Программист 1С

Grand-hr • Ростов-на-Дону

от 250 000 до 300 000 ₽

Answer 1 · 2016-08-13 10:57:09

Перцептрон позволяет подобрать примерно такую функцию, которая позволит классифицировать данные или предсказывать то, какими будут неизвестные признаки у данных, обучившись на данных, для которых искомые признаки уже известны.

Сверточный слой в нейронной сети - просто слой, который позволяет уменьшить размерность карты признаков (признаки называтся features в англоязычной литературе и лекциях). Свертки не являются противоположностью глубоких нейронных сетей, глубокие нейронные сети - это просто нейронные сети с большим, по сравнению с перцептроном, количеством слоев, только и всего. Для классификации изображений используют в основном несколько основных типов слоев: сверточный (convolutional), max pooling, ReLU (Linear Rectifier Unit), и в качестве нескольких последних слоев, для проведения самой классификации, используют полносвязные слои, как в перцептроне, а количество выходов = количеству классов для классификации.

А глубокое обучение само определяет, сколько слоев делать, какие будут идентификаторы. Т.е. само определяет, как находить дорожный знак и конкретизировать его.

Нет, количество слоев, их размер, размер входа НС нельзя определить автоматически. Эти параметры называются гиперпараметрами. Существуют методики их подбора, но в основном полагаются на опыт и интуицию.

Для работы с сетями существует несколько основных фреймворков, а это Caffe (пожалуй, самый распространенный), Torch, Theano, TensorFlow. И еще есть CNTK, он подкупает тем, что может работать на 4 gpu одновременно на одной машине. Но большинство из них работают с питоном, среди data scientist'ов для управления нейросетями больше распространены скриптовые языки, или матлаб.

В качестве совета, как изучать эту непростую тему скажу следующее: не нужно тянуться к коду и практике, пока не будет достаточно четкого понимания в теории, как все работает. Каждое видео, каждую статью нужно разбирать до слова, чтобы разжевать все, что не понятно. Что-то не ясно, гуглим, читаем, осознаем, возвращаемся к статье. Рекомендую начать с видео лекций на ютубе, там проще понять принципы работы слоев, не загружая себя математикой, так как от математики толку не будет, пока не понятны основы.

Вот несколько ссылок:
scs.ryerson.ca/~aharley/vis/conv - отличная интерактивная демонстрация работы сверточной сети для распознавания цифр, обученная на наборе MNIST
https://www.youtube.com/watch?v=2aF_yhVtlH0 - вот это отличный ролик для начала
https://www.youtube.com/watch?v=VhmE_UXDOGs
https://youtu.be/CLSy5WlaWKc - немного скучно, но позновательно
https://www.youtube.com/watch?v=ByjaPdWXKJ4&index=... - суперинтересно и познавательно, но после осознания основ

Answer 2 · 2016-08-13 18:08:19

Нейронные сети это довольно старое направление, сугубо математическое, которое получило в последнее время очень мощный пинок под зад благодаря сильно возросшей производительности. Однако, материал по ней очень разношёрстный, очень много дезинформации. И разобраться в этом довольно сложно, особенно учитывая, что она слабо систематизирована и отрасль очень быстро развивается.

Если кратко, то всё строиться на простой идее поиска оптимума, с точки зрения математики практически любая проблема решается именно таким способом. В основе классификации лежит такая простая вещь, как ошибка, которую можно поправить. Кумулятивно поправив сотню тысяч раз на различных примерах обучающей выборке можно получить нечто рабочее. Всё остальное - это лишь сугубо технические вопросы, которые возникают когда встаёт вопрос о реализации всего этого.

И так, что мы имеем? Математический аппарат. Цель. И средства. Ну вот, это уже похоже на прогресс. Но чего нет? Адекватной классификации, большого количества хорошего материала, долгой и стабильной учебной практики. Зато вроде есть красивые материалы.

Ну а вообще, есть отличный сборник вопросов на которые можно попробовать по отвечать. А правильно заданный вопрос - половина ответа.

Answer 3 · 2016-08-13 02:09:22

Вот хорошая подборка по нейросетям (текст, формулы, принципы): тут
Видео-лекции: тут
Если кратко: глубинное обучение - многоуровневый (включая рекурсивный) перцептрон с пороговыми обратными связями, которые могут работать в различных режимах: как обычные связи (сети с обратным распространением) или как управляющие пороговые блокираторы (при заданном весе нейрона - блокируется обратное распространение).
Фактически, это аналог электро-схемы с каскадами транзисторов и тиристорами.

Чем отличаются нейронные сети?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт