AlphaGo, разработанная компанией Google, обыграла чемпиона по Го. В чём была сложность построения игрового алгоритма?

Question

khipster @khipster

AlphaGo, разработанная компанией Google, обыграла чемпиона по Го. В чём была сложность построения игрового алгоритма?

Каспарова в шахматы уже давно обыграл компьютер, а по поводу Го раздували шумиху, мол никогда компьютер не выиграет.

Вики:
Программа AlphaGo комбинирует метод Монте-Карло для поиска в дереве[en] (MCST) вместе с использованием свёрточных нейронных сетей для глубинного обучения оценки позиции и наиболее выгодных ходов. Суть этого метода (названого по аналогии с методом Монте-Карло в вычислительной математике) состоит в том, что сначала на текущей доске выбираются позиции, на которые можно пойти, а затем начиная последовательно с каждой из них разыгрывается большое количество случайных партий. Позиция, которая даёт наибольшее соотношение побед к поражениям, выбирается для следующего хода. (См. раздел Методы Монте-Карло в статье Компьютерное го). До AlphaGo наиболее успешные программы для игры в го использовали метод Монте-Карло[1].

Короче, простой перебор вариантов (умный, оптимизированный) но всё такой же перебор, т.е. сложность была просто в вычислительной мощности?

Вопрос задан более трёх лет назад
802 просмотра

3 комментария

Подписаться 5 Оценить 3 комментария

doktr @doktr

В шахматах 10^120 вариантов партий, а в Go - в 10^100 раз больше вариантов, чем в шахматах. Даже если все варианты просчитать, то их просто негде будет хранить, так как во Вселенной всего около 10^80 атомов.
Поэтому систему обучают с помощью нейронных сетей, чтобы она сама находила закономерности и в процессе игры предсказывала, какой ход лучше.

Написано более трёх лет назад
uvelichitel @uvelichitel

В релизе указывалось, что играл обиходный кластер стоковых машин. Не grid CERNа и не облака.

Написано более трёх лет назад
Алексей Николаев @Heian

В Го физически невозможно просчитать ходы, их слишком много \ плюс масса верных вариантов делается чемпионами за счет интуиции профессионала, а не за счет просчета. Показательно, что в одной из партий машина ошиблась, и поняла это лишь через несколько ходов. Эта победа стала возможной исключительно за счет нейронных сетей, ИИ и машинного обучения. Скоро тест Тьюринга пройдут

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

1C-программист: расширенный курс

18 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 4

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Программирование

+4 ещё

Простой
На сколько плох мой GitHub?
- 1 подписчик
- 03 июл.
- 488 просмотров
2

ответа
Программирование

+2 ещё

Средний
Поможете собрать компьютер для запуска виртуальных машин и коддинга?
- 1 подписчик
- 02 июл.
- 464 просмотра
5

ответов
Программирование

+4 ещё

Сложный
Что делать, на QEMU всё летает, а реальный Celeron D умирает?
- 2 подписчика
- 01 июл.
- 493 просмотра
1

ответ
Боты

+1 ещё

Простой
Как создать бота ВК на иностранных мозгах?
- 1 подписчик
- 30 июн.
- 203 просмотра
2

ответа
Обработка изображений

+1 ещё

Простой
Через какой ИИ можно массово редактировать изображения?
- 2 подписчика
- 30 июн.
- 300 просмотров
3

ответа
Машинное обучение

+1 ещё

Средний
Как устроены Нейрохам и подобные ему боты с точки зрения ML?
- 1 подписчик
- 24 июн.
- 363 просмотра
2

ответа
Программирование

+4 ещё

Простой
Выбор между изучением c++ и Golang, что изучать?
- 3 подписчика
- 09 июн.
- 1283 просмотра
10

ответов
Программирование

Простой
Как создать и использовать свою кодировку знаков?
- 1 подписчик
- 02 июн.
- 724 просмотра
4

ответа
Веб-разработка

+2 ещё

Средний
Как избежать вездесущего agentic coding и остаться в IT?
- 7 подписчиков
- 01 июн.
- 3673 просмотра
12

ответов
Программирование

+1 ещё

Простой
Проект для программирования?
- 2 подписчика
- 27 апр.
- 873 просмотра
9

ответов
Показать ещё Загружается…

В шахматах 10^120 вариантов партий, а в Go - в 10^100 раз больше вариантов, чем в шахматах. Даже если все варианты просчитать, то их просто негде будет хранить, так как во Вселенной всего около 10^80 атомов.
Поэтому систему обучают с помощью нейронных сетей, чтобы она сама находила закономерности и в процессе игры предсказывала, какой ход лучше.
В релизе указывалось, что играл обиходный кластер стоковых машин. Не grid CERNа и не облака.
В Го физически невозможно просчитать ходы, их слишком много \ плюс масса верных вариантов делается чемпионами за счет интуиции профессионала, а не за счет просчета. Показательно, что в одной из партий машина ошиблась, и поняла это лишь через несколько ходов. Эта победа стала возможной исключительно за счет нейронных сетей, ИИ и машинного обучения. Скоро тест Тьюринга пройдут

Answer 1 · 2016-03-25 11:22:07

Современное состояние дел в ИИ таково, что большинство проблем является не научными, а инженерно-организационными. Выделить ресурсы на людей/технику, организовать процесс, подобрать архитектуру/методы/эвристики, реализовать программно. В таких условиях всегда возникает вопрос экономической целесообразности проектов. Для гугла такая целесообразность имела место быть. Они от рекламы скорее всего получили больше чем потратили. На корпоративный менеджемент яркие события действуют благотворно при принятии решений о заключении контрактов.

Answer 2 · 2016-03-25 17:44:00

Основная сложность - гораздо большая вариативность ходов (намного больше шахмат). Просто поиграйте в го.

Answer 3 · 2016-03-31 11:59:34

По сути, основная идея Deep Mind, при помощи которой они обучили комп играм Atari и го, - это то, что большую таблицу можно неплохо аппроксимировать нейронной сетью.
Например, компьютер видит две разные позиции, но за счет обработки нейронной сетью "понимает", что они очень-очень похожи. Например, получены банальным сдвигом по одной из осей. А значит, и правильные решения будут почти одни и те же.

Answer 4 · 2016-10-08 13:06:38

Простой перебор прекрасно работает в шахматах, но не работает в Го. В этом была и сложность.

AlphaGo, разработанная компанией Google, обыграла чемпиона по Го. В чём была сложность построения игрового алгоритма?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт