Является ли использование разных функций активации на выходном слое нейросети плохой идеей?

Question

pavlik 322 @pavlik321

Генератор случайных Q&A важных людям

Нейронные сети

Является ли использование разных функций активации на выходном слое нейросети плохой идеей?

Является ли использование разных функций активации на выходном слое нейросети плохой идеей? В интернете уже многие сказали, что комбинировать не надо в скрытом и входном, но если мне требуется их скомбинировать в выходном, то и от этого следует отказаться? Например, первый выход говорит о правде или лжи(сигмоида), второй управляет передвижением(tahn), третий - информация для следующего input(вообще линейна)

Вопрос задан 26 нояб. 2024
78 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Решения вопроса 1

4 комментария

pavlik 322 @pavlik321 Автор вопроса

Но, если использовать какой-нибудь NEAT, генетический(то есть любой без учителя) то это роли играть не должно даже для скрытых и входных слоёв?

Написано 26 нояб. 2024
pavlik 322 @pavlik321 Автор вопроса

Ну, например, у меня роботом управляет нейросеть: четыре выхода на передвижение(сигмоида, например), потом 3 на руку(ReLU, так как я могу её повернуть на определенное >= 0 кол-во градусов), но даже в этом случае не надо?

Написано 02 дек. 2024
pavlik 322 @pavlik321 Автор вопроса

Так что? Можно или не следует?

Написано 07 дек. 2024
Максим Припадчев @Maksim_64

pavlik 322, Зависит на сколько все взаимодействует. Если рука независима от передвижения то разделяй. В целом говоря о роботе, думаю здесь разделять не нужно. По сколько все компоненты зависимы между собой. И надо идти очень сложным путем, имея дело с разным типами и функциями активацими на выходе, устанавливать веса для этих функций и т.д.

Написано 07 дек. 2024

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

+1 ещё

Средний
Можно ли расширить словарь VOSK простой правкой каких-то текстовых файлов?
- 1 подписчик
- 30 сент.
- 88 просмотров
1

ответ
Нейронные сети

Средний
Каков объём данных, передаваемых между узлами ComfyUI и где они хранятся (RAM/VRAM/...)?
- 1 подписчик
- 28 сент.
- 66 просмотров
1

ответ
Программирование

+1 ещё

Простой
Апгрейда разраба с помощью нейросетки, с чего начать в 2025 году?
- 6 подписчиков
- 22 сент.
- 1230 просмотров
6

ответов
Нейронные сети

Простой
Отечественные нейронки для кодинга и не только сентябрь 2025?
- 1 подписчик
- 22 сент.
- 224 просмотра
3

ответа
Нейронные сети

Простой
Какая AI модель дешевле в пересчете на решение задачи в программировании?
- 1 подписчик
- 21 сент.
- 265 просмотров
3

ответа
Нейронные сети

Простой
Как настроить оркестрацию вайбкодинга?
- 2 подписчика
- 21 сент.
- 421 просмотр
3

ответа
3D

+2 ещё

Средний
Cуществует ли софт для генерации трёхмерного (если нет — двухмерного) видео говорящего какой-либо заданный текст человека?
- 1 подписчик
- 20 сент.
- 112 просмотров
1

ответ
Python

+1 ещё

Простой
Почему модель обнаружения объектов YOLO работает медленно?
- 1 подписчик
- 14 сент.
- 229 просмотров
2

ответа
Видеокарты

+1 ещё

Средний
Можно ли как-то узнать, какими нодами / сущностями и в каком процентном соотношении занята VRAM в ComfyUI?
- 1 подписчик
- 12 сент.
- 111 просмотров
1

ответ
Нейронные сети

+1 ещё

Простой
С помощью чего проанализировать данные и построить свою нейронную сеть для бана пользователей?
- 1 подписчик
- 09 сент.
- 176 просмотров
2

ответа
Показать ещё Загружается…

ML-разработчик (Machine Learning)

DevTeam.Space

от 2 000 до 4 000 $

DevOps-инженер

DevTeam.Space

от 1 000 до 2 500 $

Менеджер продукта, внутренняя ERP-системы

Mосфлай

от 160 000 до 400 000 ₽

Answer 1 · 2024-11-26 19:48:12

является ли использование разных функций активации на выходном слое нейросети плохой идеей?

Не часто используется, по сути на выходном слое у тебя будет более одного вектора, обычно они разных типов получаются, соответсвенно для каждой тебе нужно будет, своя функция потери. И общая оценка будет подразумевать оценку каждой функции потери. И ее влияния на общую систему, возможно придется вводить дополнительные веса для функций потерь. В общем рекомендую разделить архитектуру.

ДОПОЛНЕНИЕ к ответу
У нас по всей видимости недопонимание наблюдается.
1. Разные функции активации у скрытых слоев и выходного слоя дело обычное. Функция активации для выходного слоя определятся задачей которую ты решаешь, например хочу интерпретировать выходной вектор как вероятности ну и там сигмоид или софт max, или еще что то. В то время как например RELU была в скрытых. Это очень обычно и очень нормально. Когда ты говоришь о выходном слое ты спрашиваешь себя что и в каком виде мне будет выдавать.

2. Ты упомянул, разные функции активации внутри выходного слоя, обычная архитектура это одна функция активации для выходного слоя. Потому что нейронка решает или задачу классификации или регрессии или еще что то. Но существуют редко архитектуры с более чем одной функции активации то есть твоя нейронка будет решать более одного типа задачи. Это редкая практика и она ведет к серьезным усложнениям, во время тренировки тебя появляется несколько функций потерь при это а как оптимизировать? А как иметь дело с оверфитиингом. и т.д.

NEAT тут не причем. Ты делаешь нейронку которая решает несколько разных задач, этим обусловлено несколько функций активации на выходном слое. Например я хочу в ответе увидеть матрицу, первая колонка вероятности роста падения, вторая колонка цена акции. И у меня на выходном слое будет более одной фенкции активации. Так делать плохо, надо две отдельные нейронки и все.

Является ли использование разных функций активации на выходном слое нейросети плохой идеей?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт