Решение матричной игры в чистых стратегиях

Педагогика и воспитание » Теория игр » Решение матричной игры в чистых стратегиях

Страница 1

Рассмотрим простейшую математическую модель конечной конфликтной ситуации, в которой имеется два участника и выигрыш одного равен проигрышу другого. Такая модель называется антагонистической игрой двух лиц с нулевой суммой. Игра состоит из двух ходов: игрок А выбирает одну из возможных стратегий Аi, , а игрок В выбирает одну из возможных стратегий Вj, . Каждый выбор производится при полном незнании выбора соперника. В результате выигрыш игроков составит соответственно aij и - aij. Цель игрока А - максимизировать величину aij, а игрока В - минимизировать эту величину.

Определение 1. Матрица, составленная из величин aij, ,,

называется платежной матрицей, или матрицей игры. Каждый элемент платежной матрицы aij, ,равен выигрышу А (проигрышу В), если он выбрал стратегию Аi, , а игрок В выбирал стратегию Вj, .

Пример. В игре участвуют первый и второй игроки, каждый из них может записать независимо от другого цифры 1, 2 и 3. Если разность между цифрами, записанная игроками, положительна, то первый игрок выигрывает количество очков, равное разности между цифрами, и, наоборот, если разность отрицательна, то выигрывает второй игрок. Если разность равна нулю, то игра заканчивается вничью.

У первого игрока три стратегии (варианта действия): А1 (записать 1), А2 (записать 2), А3 (записать 3); у второго игрока также три стратегии: В1, В2, В3 (табл.1).

Таблица 1

В1 = 1

В2 = 2

В3 = 3

А1 = 1

0

-1

-2

А2 = 2

1

0

-1

А3 = 3

2

1

0

Задача первого игрока - максимизировать свой выигрыш. Задача второго игрока - минимизировать свой проигрыш или минимизировать выигрыш первого игрока. Платежная матрица имеет вид

.

Задача каждого из игроков - найти наилучшую стратегию игры, при этом предполагается, что противники одинаково разумны и каждый из них делает все, чтобы получить наибольший доход.

Найдем наилучшую стратегию первого игрока. Если игрок А выбрал стратегию Аi, , то в худшем случае (например, если его ход известен В) он получит выигрыш . Предвидя такую возможность, игрок А должен выбрать такую стратегию, чтобы максимизировать свой минимальный выигрыш.

.

Определение 2. Величина a - гарантированный выигрыш игрока А называется нижней ценой игры. Стратегия Aiопт, обеспечивающая получение выигрыша a, называется максиминной.

Если первый игрок будет придерживаться своей максиминной стратегии, то у него есть гарантия, что он в любом случае выиграет не меньше a.

Страницы: 1 2

Похожие статьи:

Методические рекомендации по формированию просодической стороны речи у детей с двигательной патологией
Методические рекомендации разработаны с учетом особенностей работы логопеда в МДОУ №12 компенсирующего вида для детей с нарушением опорно-двигательного аппарата. Следует отметить, что в детском саду №12 «Ромашка» компенсирующего вида для детей с нарушением опорно-двигательного аппарата сложилась св ...

Десятибалльная система оценивания учебной деятельности
В Республике Беларусь принята 10-балльная система оценивания учебных достижений (на основании приказа Министерства образования Республики Беларусь от 29.05.2009 N 674 «Об утверждении норм оценки результатов учебной деятельности и критериев оценки поведения учащихся общеобразовательных учреждений»). ...

Обучение грамоте в подготовительной группе и устранение предпосылок дисграфии у детей с ОНР III уровня
Самой первой задачей обучения грамоте является развитие у детей фонематического слуха, то есть умения различать не только звуки нашей речи, но и качество звуков (твердые и мягкие, звонкие и глухие, слитные и простые согласные, основные и йотированные гласные). Логопеду надо выработать у детей умени ...

Главное меню

Copyright © 2024 - All Rights Reserved - www.bravoschool.ru