Математичні моделі прийняття рішень в економіці - Розен В

Лекція 8. Прийняття рішень в умовах невизначеності

• Математична модель завдання ухвалення рішення в умовах невизначеності. Приклад: Оренда готелю. • Принцип домінування стратегії. Методи аналізу ЗПР в умовах невизначеності на основі запровадження гіпотези про поведінку середовища. • Критерії Лапласа, Вал'да, Гурвіца та Севіджа. • Завдання 11. Вибір проекту електростанції.

1. Як вказувалося в лекції 1, реалізаційна структура завдання прийняття рішення включає безліч допустимих альтернатив X, безліч станів середовища Y, безліч результатів А і функцію реалізації F : X х Y - & gt; А. Прийняття рішення за умов невизначеності характеризується тим, що з виборі альтернативи приймаючому рішення невідомо готівковий стан середовища проживання і немає інформації про ймовірності їх появи. Зазначимо, що ця невизначеність не є абсолютною, тому що приймає рішення відомі безліч можливих станів середовища (множина У) та функція реалізації F.

Отже, математична модель ЗПР в умовах невизначеності може бути задана у вигляді наступної трійки об'єктів:

де X - безліч допустимих альтернатив, Y - безліч можливих станів середовища, / : ХхУ-8 - цільова функція.

Фактично побудова такої математичної моделі прийняття рішення зводиться до завдання цільової функції, визначеної на множині X х Y і приймає числові значення.

Розглянемо приклад побудови математичної моделі ЗПР за умов невизначеності.

Витрати, які не залежать від вибору проекту готелю:

а) благоустрій території – 10 тис. грошових од.;

в) один нічний черговий - 6 тис. грошових од.;

г) один службовець для прибирання території - 8 тис. грошових од.

Витрати, що залежать від числа кімнатготелю:

а) меблювання однієї кімнати - 2 тис. грошових од.;

б) 1 покоївка на 10 кімнат - 6 тис. грошових од.;

г) страхування на випадок пожежі для однієї кімнати – 25 грошових од.

Витрати, що залежать від числа зайнятих кімнат:

а) прання, прибирання-25 грошових од.;

б) електрика, газ, вода - 25 грошових од.

Дохід підприємця становить 200 грошових од. на день з кожної зайнятої кімнати. Яке рішення має ухвалити підприємець?

Побудуємо математичну модель завдання ухвалення рішення. Альтернативами тут є типи готелів, тому як безліч альтернатив можна взяти X = .

В даному випадку (відповідно до викладеного у п. 3 лекції 1) середовище — це те, що визначає при кожній фіксованій альтернативі появу конкретного результату (результату). У цьому завдання як результат можна розглядати прибуток, яку отримає підприємець протягом року оренди готелю. При фіксованій альтернативі х Є X його прибуток повністю визначається середнім числом у зайнятих кімнат (тобто як єдиний параметр, що характеризує стан середовища, тут виступає середньорічний попит). Тому як безліч станів середовища в даній задачі можна взяти Y - . Цільова функція / має тут наступний змістовний зміст: / (ж, у) - це прибуток, який отримає підприємець за рік у ситуації, коли він орендує готель з х кімнат, а середньорічний попит дорівнює. Знайдемо цільову функцію f(x, у) у явному вигляді.

Витрати, які не залежать від вибору проекту готелю, становлять

10000 + 1500 + 6000 + 8000 = 25500 (грошових од.)

Витрати, що залежать від кількості кімнат готелю, рівні

2 000 x + 600 x + 150 x + 25 x = 2775 x (грошових од.)

Витрати, що залежать від числа узайнятих кімнат, такі:

365 (25 у + 25 у) = 18 250т / (грошових од.)

Дохід підприємця визначається числом у зайнятих кімнат і становить рік

365 • 200 у = 73 000 у (грошових од.)

Звідси прибуток підприємця протягом року у ситуації (х, у) дорівнює

73 000 у - (2775 х + 18 250 у + 25 500) =

= 54 750 у - 2775 х - 25 500 (грошових од.)

Отже, цільова функція для даної задачі прийняття рішення така

Методи аналізу ЗПР за умов невизначеності розглянуто у наступних двох пунктах

2. Основна складність при прийнятті рішення в умовах невизначеності полягає в тому, що, вибираючи одну з допустимих альтернатив, приймає рішення не знає наявного стану середовища, в той же час, вихід залежить від того, в якому стані знаходиться середовище Формально, цільова функція f

моделі
Обмежимося випадком, коли множини X і Y є кінцевими, тоді цільова функція може бути задана табличним способом Так як «природа» альтернатив і станів середовища в математичній моделі ЗПР ніяк не відображається, розрізнятимемо елементи цих множин за номерами, вважаючи X = , У = Далі, покладемо f(i,j) = а і будемо інтерпретувати число а як виграш приймаючого рішення в ситуації (г:у) Тоді цільова функція задається табл 8 1, в якій на перетині г й рядки і стовпця стоїть число aJt - виграш приймаючого рішення в ситуації, коли він вибирає альтернативу г, а середовище приймає стан j Табл 8 1 називається також матрицею виграшів або платіжною матрицею

• Приклад 8.2. Розглянемо ЗПР за умов невизначеності, цільова функція якої задана табл 8 2 Вибір якої альтернативи слід вважати оптимальним?

Щоб відповісти на поставлене запитання, требамати певний спосіб порівняння двох альтернатив Найбільш простий і природний принцип, за яким можна порівняти дві альтернативи, - це принцип домінування, який полягає в наступному кажуть, що альтернатива г і домінує альтернативу г2 (записують г і > г2), якщо за будь-якого стану середовища виграш приймаючого рішення при виборі ним альтернативи і не менше, ніж його виграш при виборі альтернативи г2 (тобто виконується умова а3 > а3г2 при всіх J = hm)

Якщо і > г2, то альтернатива i називається домінуючою, а альтернатива г2 — домінованою Незалежно від стану середовища домінуюча альтернатива є не менш кращою для приймаючого рішення, ніж домінована альтернатива, тому доміновану альтернативу можна виключити з подальшого розгляду. Принцип домінування полягає у відкиданні домінованих альтернатив

У прикладі 8 2 маємо 4 > 5, 3 > 1, та інших пар, що знаходяться у відношенні домінування, немає Тому, виключаючи доміновані альтернативи 1 і 5 (те викреслюючи в табл 8 2 рядки з номерами 1 і 5), отримуємо ЗПР, в якій всі альтернативи не порівняні по відношенню домінування Для того щоб вибрати з альтернатив, що залишилися оптимальну, потрібні якісь додаткові міркування

Зауваження Порівняння альтернатив щодо домінування > аналогічно порівнянню результатів багатокритеріальної ЗПР щодо Парето-домінування (див. лекцію 5) Основна відмінність тут в інтерпретації для ЗПР в умовах невизначеності номера стовпців відповідають станам середовища, а для багатокритеріальної ЗПР вони відповідають критеріям

Основний метод, що дозволяє знайти оптимальну альтернативу в ЗПР в умовах невизначеності, полягає в наступному

формулюється деяка гіпотеза про поведінку середовища,що дозволяє дати кожній альтернативі єдину числову оцінку

Завдання числової оцінки для кожної альтернативи дає критерій для порівняння альтернатив за перевагою з двох альтернатив кращою вважається та, яка має велику числову оцінку (альтернативи, що мають однакові оцінки, вважаються еквівалентними) Тоді оптимальною буде та альтернатива, яка є найбільш кращою, тобто найбільшою. числову оцінку (для випадку функції втрат — найменшу чи_ лову оцінку).

3. Розглянемо найважливіші типи критеріїв, які використовуються завдань прийняття рішень за умов невизначеності.

Критерій Лапласа заснований на гіпотезі рівноможливості (рівноймовірності) і змістовно може бути сформульований у вигляді: «Оскільки ми нічого не знаємо про стани середовища, треба вважати їх рівноймовірними». При прийнятті цієї гіпотези в якості оцінки г-ї альтернативи виступає середньоарифметичне виграшів, що стоять у рядку матриці виграшів. Таким чином, оцінка за критерієм Лапласа має вигляд

При введенні оцінки Лапласа будь-які дві альтернативи будуть порівнянними між собою за перевагою: найкращою вважається та альтернатива, яка має велику оцінку за критерієм Лапласа.

Оптимальною за критерієм Лапласа є альтернатива г*, яка максимізує оцінку (8.2):

р L(2). Однак величина виграшів для альтернативи 1 розподілена вкрай нерівномірно, тому при виборі альтернативи 1 приймає рішення ризикує нічого не отримати; в той же час при виборі альтернативи 2 він має гарантований виграш, що дорівнює 9, 9.

Критерій Вальда заснований на гіпотезі антагонізму, яка може бути сформульована в наступному вигляді: "При виборі рішення треба розраховувати на найгірший можливий варіант" -

Приприйнятті цієї гіпотези оцінкою альтернативи і служить число W[i) = mina^ і порівняння будь-яких двох альтернатив

провадиться за величиною критерію W_. Оптимальною у разі є альтернатива, максимізує функцію W, тобто. альтернатива і*, для якої виконується умова

W(i*) = max.W(i) = maxmina;?. (8-3)

Альтернатива г* називається максимінною, а число шахтіпа^

називається максиміном. Принцип оптимальності, яким оптимальною альтернативою вважається максиминна альтернатива, називається принципом максимина.

Змістовний зміст принципу максиміну складається з наступного. Число W_(i) характеризує гарантований рівень альтернативи і (оскільки при виборі альтернативи г виграш приймаючого рішення — незалежно від стану середовища — не може бути меншим, ніж W_(i)). Таким чином, принцип максиміну заснований на макісимізації мінімального можливого (тобто гарантованого) виграшу; тому іноді цей принцип називають принципом максимального гарантованого результату.

Насправді використання принципу максимина пов'язані з психологічними особливостями приймаючого рішення, точніше, з його ставленням до невизначеності. Розрахунок на найгірший варіант властивий вкрай обережним людям («песимістам»).

Головний недолік принципу максиміну полягає в тому, що при виборі рішення враховується лише найгірший варіант. Наприклад, при порівнянні альтернатив, наведених у табл. 8.4, згідно з принципом максиміну, альтернатива 1 краща, ніж альтернатива 2, хоча, за винятком одного стану середовища, альтернатива 2 домінує альтернативу 1.

Зауваження. Якщо цільова функція є функцією втрат, Tq відповідно до гіпотези антагонізму, оцінкою альтернативи гє-

ється число W(i) = max a3t. Альтернатива, що мінімізує функцію

і ' тобто. альтернатива і0, для якої виконується умова

W(i°) = minW(i) = minmaxa^,

називається мінімаксною, а число min max а - мінімаксом. В цьому

У разі принцип максиміну трансформується в принцип мінімаксу, за яким оптимальною альтернативою буде мінімаксна альтернатива. Змістовно принцип мінімакс є принцип мінімізації максимальних можливих втрат.

Критерій Гурвіда пов'язаний із запровадженням показника Про 4/5 оптимальною є альтернатива А2. Зокрема, при а = 1 оптимальною виходить максиминна альтернатива А2.

математичні
4) Критерій Севіджа. Для застосування критерію Севіджа треба перетворити матрицю виграшів на матрицю ризиків. Для зручності додамо до початкової матриці виграшів (див. табл. 8.5) рядок стовпцевих максимумів (У (табл. 8.9), потім складаємо матрицю ризиків за формулою: = (3J - a?t (табл. 8.10)).

Для того щоб застосувати мінімаксний критерій до матриці ризиків, додамо до неї праворуч стовпець малих максимумів; кожен елемент цього стовпця вказує найбільший ризик (найбільше «жаль») при виборі відповідної альтернативи. З табл. 8.10 видно, що оптимальними за критерієм Севіджа є альтернативи Ai, A3, А4: вони мінімізують максимальне "жаль", пов'язане з незнанням справжнього стану середовища.

Примітка. У цьому задачі альтернатива А4 домінує альтернативу Ai, тому альтернатива А може бути одразу виключена з Подальшого розгляду