Мінімаксна стратегія - Велика Енциклопедія Нафти та Газа, стаття, сторінка 2
Мінімаксна стратегія
Очевидно, що мінімаксні стратегії, так само як і байєсовські, можуть взагалі не існувати. І тут аналогічно ( 3) можна запровадити поняття г-минимаксной стратегії. У наступних розглядах ми будемо виходити з того, що sup і inf ( 4), ( 5) досягаються. [16]
Цей випадок відповідає застосуванню мінімаксної стратегії. [17]
Седловій точці відповідає пара мінімаксних стратегій (в даному випадку /42 і В2), які називаються оптимальними, а їх сукупність є рішенням гри. [18]
Стратегія, що відповідає мінімаксу називається мінімаксною стратегією. [19]
Тоді л-л є мінімаксною стратегією. [20]
Завдання, що розглядається, є завданням на пошук мінімаксної стратегії за наявності обмежень. [21]
У припущенні, що гравці використовують мінімаксну стратегію, цей алгоритм наказує присвоїти кожній нетермінальній вершині дерева оцінку, рівну такому виграшу, на який можна очікувати, якщо продовжити гру з цього місця і до кінця. [22]
Для визначення алгоритму прийняття рішення, що відповідає мінімаксній стратегії, продиференціюємо (4.36) P (Oj) і прирівняємо похідну нулю. [23]
Елемент матриці а32, що лежить на перетині мінімаксних стратегій Л3 і В2 і дорівнює чистій ціні гри, мінімальний у своєму рядку і максимальний у своєму стовпці. Цей елемент аналогії з точкою на поверхні, що є мінімумом по одній координаті і максимумом по іншій, називається сідловою точкою. В даному випадку про гру говорять, що це гра з сідловою точкою або детермінована гра. Сідловій точці завжди відповідає пара мінімаксних стратегій, які є оптимальними, а їхня сукупністьвизначає розв'язання гри. [24]
В умовах неповної інформації необхідно прийняти певну форму мінімаксної стратегії. Отже, всі статистичні рішення є мінімаксними процедурами. Там, де допускаються лише дві гіпотези (Л0 та AJ), ми маємо справу зі спеціальним випадком, у якому hl виражає всі несприятливі результати. За умови неповної інформації індивід мінімізує свою позицію довгострокового доходу; фірма мінімізує свою позицію довгострокових надходжень. [25]
Мінімаксну та максимінну стратегії часто називають одним терміном – мінімаксні стратегії. [26]
Якщо ж гра повторюється неодноразово, постійне застосування мінімаксних стратегій стає нерозумним. Наприклад, якщо гравець В буде впевнений у тому, що на наступному ході А застосує колишню стратегію, то він вибере стратегію, що відповідає найменшому елементу в цьому рядку, а не колишню. [27]
Це, у свою чергу, дозволяє розглядати питання існування чистих мінімаксних стратегій, змішаних мінімаксних стратегій та байєсових стратегій. Виходячи з цього, надалі дотримуватимемося саме байєсового підходу до вирішення завдання. [28]
Стратегія гравця II, що забезпечує виграш р є його мінімаксною стратегією. [29]
Мінімаксні стратегії нестійкі: якщо один із гравців, застосовуючи свою мінімаксну стратегію, будь-яким чином дізнається про спосіб дій противника, то, відступивши від неї, він може збільшити свій виграш. [30]