Мінімаксна стратегія - Велика Енциклопедія Нафти та Газа, стаття, сторінка 2

Мінімаксна стратегія

Очевидно, що мінімаксні стратегії, так само як і байєсовські, можуть взагалі не існувати. І тут аналогічно ( 3) можна запровадити поняття г-минимаксной стратегії. У наступних розглядах ми будемо виходити з того, що sup і inf ( 4), ( 5) досягаються. [16]

Цей випадок відповідає застосуванню мінімаксної стратегії. [17]

Седловій точці відповідає пара мінімаксних стратегій (в даному випадку /42 і В2), які називаються оптимальними, а їх сукупність є рішенням гри. [18]

Стратегія, що відповідає мінімаксу називається мінімаксною стратегією. [19]

Тоді л-л є мінімаксною стратегією. [20]

Завдання, що розглядається, є завданням на пошук мінімаксної стратегії за наявності обмежень. [21]

У припущенні, що гравці використовують мінімаксну стратегію, цей алгоритм наказує присвоїти кожній нетермінальній вершині дерева оцінку, рівну такому виграшу, на який можна очікувати, якщо продовжити гру з цього місця і до кінця. [22]

Для визначення алгоритму прийняття рішення, що відповідає мінімаксній стратегії, продиференціюємо (4.36) P (Oj) і прирівняємо похідну нулю. [23]

Елемент матриці а32, що лежить на перетині мінімаксних стратегій Л3 і В2 і дорівнює чистій ціні гри, мінімальний у своєму рядку і максимальний у своєму стовпці. Цей елемент аналогії з точкою на поверхні, що є мінімумом по одній координаті і максимумом по іншій, називається сідловою точкою. В даному випадку про гру говорять, що це гра з сідловою точкою або детермінована гра. Сідловій точці завжди відповідає пара мінімаксних стратегій, які є оптимальними, а їхня сукупністьвизначає розв'язання гри. [24]

В умовах неповної інформації необхідно прийняти певну форму мінімаксної стратегії. Отже, всі статистичні рішення є мінімаксними процедурами. Там, де допускаються лише дві гіпотези (Л0 та AJ), ми маємо справу зі спеціальним випадком, у якому hl виражає всі несприятливі результати. За умови неповної інформації індивід мінімізує свою позицію довгострокового доходу; фірма мінімізує свою позицію довгострокових надходжень. [25]

Мінімаксну та максимінну стратегії часто називають одним терміном – мінімаксні стратегії. [26]

Якщо ж гра повторюється неодноразово, постійне застосування мінімаксних стратегій стає нерозумним. Наприклад, якщо гравець В буде впевнений у тому, що на наступному ході А застосує колишню стратегію, то він вибере стратегію, що відповідає найменшому елементу в цьому рядку, а не колишню. [27]

Це, у свою чергу, дозволяє розглядати питання існування чистих мінімаксних стратегій, змішаних мінімаксних стратегій та байєсових стратегій. Виходячи з цього, надалі дотримуватимемося саме байєсового підходу до вирішення завдання. [28]

Стратегія гравця II, що забезпечує виграш р є його мінімаксною стратегією. [29]

Мінімаксні стратегії нестійкі: якщо один із гравців, застосовуючи свою мінімаксну стратегію, будь-яким чином дізнається про спосіб дій противника, то, відступивши від неї, він може збільшити свій виграш. [30]