В чем заключается идея оптимизации метода оптимизации сети?

Question

salmon4788348 @salmon4788348

В чем заключается идея оптимизации метода оптимизации сети?

Я начинающий в изучении нейронных сетей, сейчас знакомлюсь с теоретическим минимумом, таким, как backpropagation. Мне нужно разобраться с некой задачей. Помогите пожалуйста понять, что от меня требуется, и в какую сторону копать.

Задача: Оптимизация в большинстве случаев выполняется с помощью итераций преобразования F(X)=y, которое берет приближение решения x и возвращает лучшее приближение y (например, ищет минимум энергии E).
Предположим, что функция F параметризирована параметром w, например, это нейронная сеть с весами w. Подберём параметры w таким образом, чтобы скорость сходимости была максимальной. Т.е. мы оптимизируем метод оптимизации сети с помощью машинного обучения: сеть учит сеть.
Чтобы это делать нужно уметь считать производные высокого порядка от E, но на наше счастье проблема достаточна проста, чтобы это сделать.

Вопрос задан более трёх лет назад
88 просмотров

1 комментарий

Подписаться 1 Простой 1 комментарий

Помогут разобраться в теме Все курсы

Яндекс Практикум

Математика для анализа данных

6 месяцев

Далее
Нетология

Data Scientist: расширенный курс

13 месяцев

Далее
Skillfactory

Профессия Data Scientist

24 месяца

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Математика

Простой
Правильное ли док-во существования функции?
- 1 подписчик
- 10 нояб.
- 135 просмотров
1

ответ
Системное администрирование

+2 ещё

Средний
Сервер с GPU предназначен ли для запуска фронтенда/бэкенда или он для вычислений?
- 1 подписчик
- 08 нояб.
- 275 просмотров
1

ответ
Математика

Простой
Почему не используется простая таблица истинности?
- 1 подписчик
- 07 нояб.
- 116 просмотров
1

ответ
Математика

Простой
Как решается такое задание?
- 1 подписчик
- 02 нояб.
- 183 просмотра
2

ответа
Нейронные сети

Простой
Как работать с планами в CursorAi?
- 2 подписчика
- 26 окт.
- 124 просмотра
1

ответ
Нейронные сети

Простой
Как надиктовывать текст голосом в Cursor?
- 1 подписчик
- 24 окт.
- 100 просмотров
1

ответ
Нейронные сети

Средний
Имеют ли нейросети или надстройки над ними возможность анализа «полноты» вопроса?
- 1 подписчик
- 23 окт.
- 87 просмотров
2

ответа
Нейронные сети

Сложный
Как организовать разбивку по таймкодам текста из 30000 слов?
- 1 подписчик
- 18 окт.
- 73 просмотра
0

ответов
Математика

Простой
Нужно ли это доказывать в обратную сторону?
- 1 подписчик
- 17 окт.
- 168 просмотров
1

ответ
Математика

+1 ещё

Простой
Хороший учебник/статья/книга по производным и началам матанализа?
- 2 подписчика
- 08 окт.
- 266 просмотров
2

ответа
Показать ещё Загружается…

Стажер Аналитик

ПСБ цифровая лаборатория • Москва

от 30 000 до 60 000 ₽

Deep Learning Engineer (GigaChat Prod)

Сбер • Москва

от 350 000 ₽

Аналитик-разработчик (команда Intelligent Search)

Сбер • Москва

от 250 000 до 400 000 ₽

Подберём параметры w таким образом, чтобы скорость сходимости была максимальной

Это ложный посыл. С таким же успехом можно сказать "Подберём параметры w таким образом, чтобы сеть уже была настроена".

Answer 1 · 2020-03-13 18:59:51

Что-то вы сбились с пути. Начали правильно, потом вас занесло.
На этапе обучения нейросети мы действительно минимизируем некоторую функцию F(x). Эта минимизация заключается в подборе параметров этой функции - w.

Для того, что-бы подобрать эти параметры можно пойти разными путями: от простого "лобового" перебора всех возможных их значений (естественно - абсолютно неэффективный путь) до методов основанных на идеи градиентного спуска. Этот класс методов - очень грубо - заключается в следующем. Находясь в некоторой точке пытается путем просчета значений функции при маленьких изменениях указанного параметра понять, в каком направлении надо действительно изменить параметры, что бы продвинуться к точке оптимума. Обратите внимание, в данном - минимизируем по w, а не по х. И ни о каком "сеть учит сеть речи не идет".

Если этот поиск (градиентный спуск) делать в точности так, как я описал, решение может искаться долго, может случатся "перескок" через точку оптимума и другие ситуации, которые как минимум ухудшают время поиска оптимума, а иногда и вовсе делают его невозможный. Разные более продвинутые методы пытаются обойти эти ситуации.
backpropagation же это просто способ "обратного переноса" ошибки - от ошибки, зафиксированной на выходе обучаемой нейросети к подбираемым значениям w.
Опять таки, о " оптимизации метода оптимизации сети" речи не идет.

То что вы задали такой вопрос - это очень хорошо. Плохо то, что такое искаженное представление возникает доcтаточно часто. Как правило - у тех, кто пытается сразу "надкусить" нейронную сеть, вместо того, что-бы пойти нормальным путем - разобраться с тем что такое оптимизация, как она реализуется численно, как применяется и наконец, после всего этого - как используется именно в нейронных сетях. Увы, издержки попыток обмануть нормальный путь (само)образования в области Machine Learning.

Answer 2 · 2020-03-13 23:26:55

Для просто представим задачу в матричной форме.
Даны матрицы X,Y.
Существует некоторая функция F с матрицей параметров W, которая преобразует X->Y.
В простейшем случае функция F(X,W)=X*W=Y.
Было бы круто из матрицы весов W получить вектор весов w, что бы иметь возможность преобразовать произвольный вектор x->y для одного датасета.
Остаётся вопрос преобразования W->w. Этим как раз и занимается функция обучения H(W)=w.
Обычно она индуктивна: на нулевом шаге выбирается исходный вектор весов w, затем каждую итерацию к нему прибавляется -k*L(w*x;y), где k - коэффициент скорости обучения, L(a,b) - функция потерь между a и b.
Получаем H(W)={H[0]=w[0];H[i]=w[i-1]-k*L(w[i-1]*x[i];y[i])}.
Ваша задача преобразовать функцию H(W), чтобы сходимость была максимальной (чтобы это не значило). Думаю, речь идёт о скорости сходимости, количестве итераций (шагов) обучения или алгоритмической операционной сложности.

В чем заключается идея оптимизации метода оптимизации сети?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт