Сведение матричной игры к задаче линейного программирования

Педагогика и воспитание » Теория игр » Сведение матричной игры к задаче линейного программирования

Страница 1

Теория игр находится в тесной связи с линейным программированием, так как каждая конечная игра двух лиц с нулевой суммой может быть представлена как задача линейного программирования и решена симплексным методом и, наоборот, каждая задача линейного программирования может быть представлена как конечная игра двух лиц с нулевой суммой. Рассмотрим игру двух лиц с нулевой суммой, заданную платежной матрицей

.

Если платежная матрица не имеет седловой точки, т.е. a <b и , то решение игры представлено в смешанных стратегиях (x1, x2, ., xm) и (y1, y2, ., yn). Применение первым игроком оптимальной стратегии опт должно обеспечить ему при любых действиях второго игрока выигрыш не меньше цены игры.

, .

Рассмотрим задачу отыскания оптимальной стратегии игрока А, для которой имеют место ограничения

Величина v неизвестна, однако можно считать, что цена игры v > 0. Последнее условие выполняется всегда, если все элементы платежной матрицы неотрицательны, а этого можно достигнуть, прибавив ко всем элементам матрицы некоторое положительное число.

Преобразуем систему ограничений, разделив все члены неравенств на v.

(1)

где

, . (2)

По условию x1 + x2 + … +xm = 1.

Разделим обе части этого равенства на v.

.

Оптимальная стратегия (x1, x2, ., xm) игрока А должна максимизировать величину v, следовательно, функция

(3)

должна принимать минимальное значение.

Таким образом, получена задача линейного программирования: найти минимум целевой функции (3) при ограничениях (1), причем на переменные наложено условие неотрицательности (2). Решая ее, находим значения , и величину 1/v, затем отыскиваются значения xi = vti.

Аналогично для второго игрока оптимальная стратегия опт должна обеспечить при любых стратегиях первого игрока проигрыш, не превышающий цену игры.

, .

Рассмотрим задачу отыскания оптимальной стратегии игрока B, для которой имеют место ограничения

Преобразуем систему ограничений, разделив все члены неравенств на v.

Страницы: 1 2

Похожие статьи:

Поощрение
В школе используются разнообразные виды поощрений. Наиболее распространенными являются похвала, благодарность, различные виды наград (похвальная грамота, награждение медалью по окончании школы). В практике работы используются и такие поощрения, как почетное право открыть соревнование, вести програм ...

Условия и методические приемы развития воображения на занятиях конструированием
Конструктивная деятельность — это практическая деятельность, направленная на получение определенного, заранее задуманного реального продукта, соответствующего его функциональному назначению. Конструирование обладает чрезвычайно широкими возможностями для умственного, нравственного, эстетического, т ...

Графика в изобразительной деятельности младших школьников
В программе Шпикаловой Т.Я., которая будет рассмотрена, главная особенность – интегрированный курс изобразительного искусства и технологии. Для этих предметов создана единая программа и параллельное планирование. Тема «Графика» изучается в 4 классе. Задачи программы по овладению графическими техник ...

Главное меню

Copyright © 2024 - All Rights Reserved - www.bravoschool.ru