Что такое «распределение Нэша» (Nash distribution)?

В недавней статье DeepMind про их систему ИИ для StarCraft'а (перевод на Хабре), было упомянуто так называемое «распределение Нэша» (Nash distribution), которое использовалось для отбора агентов по результатам матчей.

Пример контекста из оригинала статьи:
The final agent is sampled (without replacement) from the Nash distribution of the league

Я не математик, знаю в общих чертах только равновесие Нэша (Nash equilibrium). Подскажите, пожалуйста, имеет ли оно отношение к «распределению» и что могли иметь в виду авторы оригинальной статьи?

Есть ссылка на white paper внутри самой статьи, но моего уровня знаний математики недостаточно, чтобы полноценно вникнуть в суть. Возможно кто-то сможет более простым языком донести смысл?
  • Вопрос задан
  • 389 просмотров
Решения вопроса 1
@Mercury13
Программист на «си с крестами» и не только
Известная теорема теории игр (теорема Нэша).
Любая матричная игра имеет равновесие Нэша в смешанных стратегиях.
А смешанная стратегия — это распределение, с какой вероятностью брать ту или эту стратегию.

Таким образом, распределение Нэша — это та «случайная смесь» стратегий, которая уныла и надёжна, как и полагается равновесию Нэша. Например, для игры «камень-ножницы-бумага» распределение Нэша — все три фигуры по ⅓.
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы