06. Принцип максиміну в антагоністичних іграх. Сідлова точка
Як зазначалося, найважливішим питанням теорії ігор (зокрема і матричних) є питання про вибір оптимальних стратегій кожного з гравців.
Оптимальною стратегієюгравця в матричній грі називається така, що забезпечує йому максимальний виграш. Якщо гра повторюється неодноразово, оптимальна стратегія повинна забезпечувати максимальний середній виграш.
При виборі цієї стратегії основою міркувань є припущення, щоПротивник є щонайменше так само розумний, як і ми самі,і робить все, щоб досягти такої ж мети.
Розрахунок на розумного супротивника - лише одна з можливих позицій у конфлікті, але в теорії ігор саме вона кладеться в основу.
При цьому для вибору оптимальної стратегії використовуютьПринцип максиміна:Вибирай ту стратегію, щоб при найгіршій для нас поведінці противника отримати максимальний виграш.Іншими словами, принцип максиміна передбачає вибір тієї стратегії, коли він наш мінімальний виграш для різних стратегій максимальний. Звідси і назва «принцип максиміну».
Як видно, принцип максиміну - це принцип вкрай обережного гравця, але він є основним принципом теорії матричних ігор.
Для пояснення принципу максиміну розглянемо приклад 1 матричної гри G (4х5) із платіжною матрицею, наведеною на рис. 2.2.

Якою стратегією гравцюАскористатися? Є спокусливий виграш 12 при застосуванні стратегіїА3. Але при цьому противник може вибрати стратегіюВ3, і гравець А отримає виграш, що дорівнює трьом.
Для визначення оптимальної стратегії відповідно до принципу максиміну, запишемо у правому додатковому стовпці платіжної матриці мінімальне значенняAIу кожному рядку (мінімум рядка). З усіх значеньAI(правий стовпець) виділимо найбільше. Йому відповідає стратегіяА4. Вибравши цю стратегію, ми у всякому разі можемо бути впевнені, що за будь-якої поведінки противника виграш буде не менше п'яти.
Ця величина – наш гарантований виграш. Він називаєтьсянижньою ціною гри(або «максиміном» - максимальний з мінімальних виграшів). Будемо позначати йогоA. У прикладі a = Aij =5.
Тепер станемо на думку гравця В і поміркуємо за нього. Вибираючи стратегію, він хотів би віддати якомога менше, але повинен розраховувати на найгіршу для нього поведінку гравця А.
Припишемо до платіжної матриці (рис.2.2) нижній рядок і в ньому запишемо найгірше для гравця У можливі результати (максимуми стовпцівBJ).
Очевидно, обережний супротивник повинен вибрати стратегію, при якій величина B J мінімальна. Ця величина називаєтьсяверхньою ціною гри(або "мінімаксом" - мінімальний з максимальних програшів). Позначатимемо їїB. У прикладі b = Aij = 7.
Отже, з принципу обережності, гравець А повинен вибрати стратегіюА4, яке противник -В3. Такі стратегії називаються максимінними або мінімаксними стратегіями (що випливають із принципу максиміну).
Доки обидві сторони в нашому прикладі дотримуватимуться своїх максимічних стратегій, виграш гравцяАі програш гравцяВдорівнюватимеА43=5.
Легко показати, що нижня ціна гри ніколи не перевищує верхню ціну гри.
Лемма 1. Нехай задана матриця виграшів
А = êêaijêêі визначені b = та a = .
Тоді.
Доказ.За визначенням максимуму та мінімуму длябудь-яких фіксованих значеньIтаJмаємо
(2.1)
Оскільки ліва частина нерівності (2.1) не залежить відI, то можемо записати
(2.2)
Оскільки права частина нерівності (2.1) залежить відJ, то
(2.3)
Об'єднуючи нерівності (2.2) і (2.3), отримуємо нерівність (2.1), що потрібно було довести. Отже, завждиB³A.
ВипадокB=Aвідповідає наявності у платіжної матриці так званоїСідлової точки.
Визначення. Точка (I*,J*) називається сідловою точкою платіжної матриціAIj, якщо для решти i і j цієї матриці виконується умова
Т. е.Аijє одночасно мінімумом свого рядка і максимумом свого стовпця.
Наведемо без підтвердження наступну теорему.
Теорема 1. Для того щоб
Необхідно і достатньо, щоб матрицяAIj мала сідлову точку. Крім того, якщо (I*,J*) - сідлова точка матриціAIj, то
(2.4)
Кажуть, що матрична гра має сідлову точку, якщо відповідна їй матриця виграшів (платіжна матриця) має сідлову точку.
Приклад 2.Знайти рішення гри G (3х3), платіжна матриця якої має такий вигляд: