Всем привет, я знаю много теории про ИИ, но к сожалению я таки не могу понять как начать делать его, как создать ИИ, к примеру способ RL, чтобы давать ИИ балы или отнимать в зависимости от действия, можете посоветовать статьи, книги и подобное где это показывается и объясняется понятным языком, буду благодарен.
Представь себе собаку, которую ты учишь новым трюкам. Ты даешь ей лакомство, когда она делает что-то правильно, и ничего не даешь, когда она ошибается. Собака учится, наблюдая за твоей реакцией и пытаясь получить больше лакомства.
Усиленное обучение - это как обучение собаки, но для компьютеров. Мы создаем алгоритм, который "изучает" мир, пробуя разные действия и получая "награду" за правильные решения. Чем больше "награды" алгоритм получает, тем лучше он учится выполнять задачу.
Например:
Игровая AI: Алгоритм учится играть в шахматы, получая "награду" за победу и "штраф" за проигрыш.
Роботы: Робот учится ходить, получая "награду" за то, что он не падает, и "штраф" за падение.
Рекомендательные системы: Алгоритм учится предлагать тебе товары, которые ты, скорее всего, купишь, получая "награду" за твои покупки.
Ключевые моменты:
Пробное обучение: Алгоритм учится, пробуя разные действия и получая обратную связь.
Награда: Алгоритм получает "награду" за правильные решения и "штраф" за ошибки.
Повторение: Алгоритм повторяет процесс обучения много раз, чтобы улучшить свои навыки.
В итоге, усиленное обучение - это способ обучения компьютеров, который имитирует процесс обучения живых существ.
1. Сильные математические знания, которые позволят читать научные стать или хотя бы подходящую литературу, по RL например Reinforcement Learning, second edition An Introduction by Richard S. Sutton and Andrew G. Barto. Это главная базовая литература.
2. Сильные скилы в программировании определенные алгоритмы очень сложны.
3. Очень много времени.
4. Вычислительные мощности.
В легких для чтения статьях рассматриваются, отдельные компоненты, и их применения, а не ИИ с нуля.
Tokishu, торч это интерфейс, ты можешь использовать торч в контесксте RL это будет torchRL, можешь тенсор флоу, можешь какие то специльные библиотеки, для RL. Тебе предоставлен определенный функционал, и способ взаимодействия с ним.
Максим Припадчев, мозг кипит когда пытаюсь обдумать как это вообще устроено с техническтй точки зрения, много вопросов а ответов мало, ладно, спасибо, попытаюсь что-то сделать чтобы понять.