Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
BitNeBolt
@BitNeBolt
Математика
Нейронные сети
Как изменять веса при обучении с подкреплением?
Как правильно изменять веса при обучении с подкреплением, какие есть популярные алгоритмы, где можно их найти?
Вопрос задан
более трёх лет назад
154 просмотра
Комментировать
Подписаться
3
Простой
Комментировать
Facebook
Вконтакте
Twitter
Решения вопроса
0
Пригласить эксперта
Ответы на вопрос
1
terentjew-alexey
@terentjew-alexey
Большинство материала по теме вы найдете в англоязычном сегменте интернета. Хотя и на русском статей сейчас полно.
Вот перечислены алгоритмы для обучения:
https://en.m.wikipedia.org/wiki/Reinforcement_lear...
Некоторые реализованы тут:
https://github.com/keras-rl/keras-rl
Ответ написан
более трёх лет назад
Комментировать
Нравится
1
Комментировать
Facebook
Вконтакте
Twitter
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
Математика
+1 ещё
Средний
Как корректно проверить математическую формулу?
1 подписчик
вчера
79 просмотров
2
ответа
Математика
+1 ещё
Средний
Почему можно складывать точки на элиптических кривых?
2 подписчика
16 февр.
420 просмотров
2
ответа
Нейронные сети
Простой
Какие модели могут оценить картинку по URL?
1 подписчик
12 февр.
54 просмотра
0
ответов
Нейронные сети
+1 ещё
Простой
Хорошо ли распознают современные версии FineReader по сравнению со старыми?
1 подписчик
04 февр.
95 просмотров
1
ответ
Математика
+2 ещё
Средний
Возможна ли апроксимация физических систем в HDL?
1 подписчик
31 янв.
111 просмотров
1
ответ
Нейронные сети
+1 ещё
Простой
Какие есть способы сделать динамическое квантование LLM в GGUF?
1 подписчик
29 янв.
86 просмотров
0
ответов
Нейронные сети
+1 ещё
Средний
Есть ли системы озвучки текста учитывающие интонации и эмоции конкретного человека?
1 подписчик
27 янв.
108 просмотров
2
ответа
Нейронные сети
+1 ещё
Простой
Чем автоматизировать некоторые задачи обработки фото с распознаванием местоположение лица?
1 подписчик
26 янв.
89 просмотров
2
ответа
Нейронные сети
Средний
LLM. Qwen2.5-Coder-32b-IQ2_XS vs Qwen2.5-Coder-14b-Q4_K_M. Что лучше?
3 подписчика
24 янв.
131 просмотр
1
ответ
Математика
+2 ещё
Сложный
Применение тензоров 4-го ранга в лингвистике и биоинформатике: возможности и ограничения?
1 подписчик
16 янв.
124 просмотра
0
ответов
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Технический директор (CTO)
Intelinvest
•
Москва
от 200 000 ₽
C++ разработчик
Морская геодезия
•
Санкт-Петербург
от 160 000 ₽
Системный аналитик
Data World
•
Москва
от 150 000 до 190 000 ₽
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама