< Попер   ЗМІСТ   Наст >

Ігрові моделі

Часто виникають ситуації, в яких різні учасники мають не збіжні між собою інтереси. Математичні моделі та методи для дослідження таких "конфліктних" ситуацій одержали назву теорії ігор.

Наведемо прості поняття і наслідки цієї теорії. Під словом "гра" розуміють сукупність правил, керуючись якими гравці-учасники приймають рішення. Припустимо, що результатом гри є платня, яку, відповідно до правил, учасник, що програв, платить тим, хто виграв. Для простоти обмежимося спочатку так званою "грою двох осіб із нульовою сумою". Для того щоб повністю визначити таку гру, потрібно задати таблицю платежів – платіжну матрицю, наприклад таку матрицю розміром 3x4:

Цей запис означає, що гравець А обирає один із рядків цієї матриці, а гравець В, не знаючи вибору А, обирає один зі стовпців матриці. Число на перетині вибраних рядка і стовпця визначає виграш першого гравця (відповідно програш другого). Наприклад, якщо А вибрав другий рядок, а В – третій стовпець, то А виграв 5 одиниць, а В їх програв. Якщо ж А вибрав третій рядок, а В – другий стовпець, то А програв 2 одиниці, а В їх виграв.

Вважатимемо, що мета кожного із гравців полягає в максимізації найменшого можливого виграшу (відповідно мінімізації найбільшого можливого програшу). Основне питання, що виникає в теорії ігор: чи існує якнайкращий спосіб грн у кожного із гравців, тобто чи є у них оптимальні стратегії.

Перш ніж сформулювати відповідь, повернемося до даної матриці. Відразу бачимо, що гравцю А найвигідніше вибрати перший рядок, оскільки всі її елементи більші за відповідні елементи решти рядків. Так само гравцю В найвигідніше обрати другий стовпець, оскільки всі елементи цього стовпця менші за відповідні елементи решти стовпців. Отже, в даному прикладі оптимальними стратегіями будуть такі: для А – вибір першого рядка, а для В – вибір другого стовпця. Число 4, що стоїть на припиненні першого рядка і другого стовпця, носить назву ціни гри, тобто платні, яку одержує оптимально граючий гравець. Таким чином, в даному прикладі гарантований виграш А- не менше 4 одиниць і гарантований програш В – не більше 4 одиниць (вій дорівнює 4 одиницям, якщо обидва гравці грають оптимально).

Якщо виявляється, що для цієї платіжної матриці мінімум у якому-небудь рядку збігається з максимумом у якому-небудь стовпці, то ці рядок і стовпець називаються оптимальними, а їх перетин – сідловою точкою платіжної матриці. Відповідне число і буде ціною гри.

Проте далеко не кожна матриця має сідлову точку, наприклад, матриця

сідлової точки не має. Говорити тут про максимізацію найменшого можливого виграшу (мінімізації найбільшого можливого програшу) можна лише під час використання так званої змішаної стратегії при багатократній грі з однією і тією самою платіжною матрицею. Суть цієї стратегії полягає у виборі різних стратегій з певними частотами. Отже, нехай А обирає перший рядок із частотою ж, а другий – із частотою (1-х). Аналогічно для У відповідні частоти позначимо через у і (1 – у). Тоді середній виграш А, що позначається через E (х, у), дорівнює

(6.71)

Нас цікавить величина max, Hiiny Е(х,у). Маємо

(6.72)

Звідки при при при . Тоді

Відповідно

(6.73)

й оптимальною змішаною стратегією для А буде вибір першого рядка з частотоюта другого рядка – із частотою. Середній програш B1 позначений F(x,y), дорівнює -E(x,y). Нас цікавить величина, де

(6.74)

Маємо , звідки при при та при . Тоді

(графік нарис. 6.15). Відповідно

(6.75)

й оптимальною стратегією для А буде вибір першого стовпця з частотою, й другого стовпця – із частотою. При оптимальних змішаних стратегіях виграш А і відповідно програш В у п'ять разів менший за максимально можливий під час одиночної гри.

Відзначимо також, що в розглянутому прикладі ми показали існування оптимальних стратегій і встановили рівність

(6.76)

при цьому величину Е(х,у) можна трактувати як математичне сподівання виграшу, а величинувизначити як ціну гри.

Графік функції

Рисунок 6.16 – Графік функції

Розглянемо тепер загальний випадок прямокутної матриці

При будь-якій допустимій стратегії іранця та будь-якій допустимій стратегії гравця математичне сподівання втрату дорівнює

Графік функції

Рисунок 6.15 – Графік функції

(6.77)

Безліч допустимих стратегійгравця А позначимо через X, а безліч допустимих стратегійгравця Я позначимо через K

Розглянуті вище приклали е окремими випадками запільних теорем для ігор із прямокутними матрицями (прямокутними іграми); з них, зокрема випливає:

1. Величинитаіснують і рівні між собою; при цьому величина

(6.78)

є ціною грн.

  • 2. Будь-яка прямокутна гра маг ціну; кожен гравець у прямокутній грі завжди має оптимальну стратегію.
  • 3. Нехай E – математичне сподівання виграш)' в прямокутній грі з матрицею С, що має ціну v. Тоді для того, щоб елементбув оптимальною стратегією для гравця А, необхідно і достатньо, щоб для всякого базисного вектораспостерігалася нерівність

(6.79)

Аналогічно для того, щоб елементбув оптимальною стратегією для гравця В, необхідно і достатньо, щоб для будь-якого елемента базисного вектораспостерігалася нерівність

(6.80)

Покажемо тепер на двох прикладах, як можна застосувати ці твердження для обчислення цін і визначення оптимальних стратегій для прямокутних ігор. Як такі приклади розглянемо стратегії ловлення на вудку і живлення риби.

Уявимо собі, що існування такого виду риб, що живляться біля поверхні води, залежить від наявності трьох видів комах, що літають, яких позначимо через відповідно; комахи з'являються в зоні захоплення із частотами !Sn, Sn і п (тобто комах у 5 разів більше, ніж , а комах у 3 рази більше, ніж m2).

Припустимо, що рибалка В ловить рибу А на комах одного із цих видів, насаджуючи їх на гачок. Тоді матриця стратегій C ловлення на вудку і живлення риб має такий вигляд (табл. 6.1).

Таблиця 6.1 – Матриця стратегій

Стратегії

Рибалка використовує як наживку

m1

m2

m3

Риба

живиться

m1

-2

0

0

m2

0

-6

0

m3

0

0

-30

На підставі викладених тверджень досить знайти невід'ємні числа і число, шо задовольняє такі умови:

(6.81)

Замінимо останні шість нерівностей на рівність. Тоді маємо

(6.82)

Підставляючи ці значення в рівність (5.48), одержимо

(6.83)

(6.84)

(6.85)

Таким чином, ціна гри для риби буде від'ємною і дорівнюватиме

Вона показує, що врешті-решт риба буде спіймана При цьому оптимальна стратегія рибалки збігається зі стратегією живлення (також оптимальної) риби і оптимальна стратегія зменшує ймовірність упіймання риби у кожному конкретному випадку.

Дещо ускладнимо завдання. Припустимо, що рибалка іноді використовує приманку m* яка може бути прийнята помилково за одну із трьох комах, але яка вдвічі частіше викликає підозру в риб. Тоді матриця зі стратегій ловлення на вудку і живлення риб набере вигляду табл. 6.2:

Таблиця 6.2 – Матриця стратегій

Стратегії

Рибалка використовує як наживку

m1

m2

m3

m4

Риба

живиться

m1

-2

0

0

–1

m2

0

-6

0

–1

m3

0

0

-30

–3

Тепер досить знайти невід'ємні числаі число v, що задовольняють такі умови:

(6.86)

Ліва система нерівності перевизначена, а права недовизначена (у лівій невідомих більше, ніж нерівностей, а в правій менше). Відмітимо, що якщо остання нерівність у правій колонцібуде виконана при, то її буде виконано і при всіх. Отже, вважаючи, праву систему нерівностей можна замінити системою трьох лінійних рівнянь:

з трьома невідомимиі. її розв'язок, очевидно, має вигляд

Підставляючи одержані вирази в рівність (11.32), де, одержимо , тобто ціна гри для риби від'ємна і дорівнює

(6.87)

що дещо менше, ніж у попередньому випадку. Оптимальна стратегія рибалки має вигляд

(6.88)

Вивчимо тепер оптимальну стратегію для риби, оскільки, то й

, тобто комахи т3 дуже небезпечні для життя. Тоді із системи чотирьох нерівностей випадають третє і четверте, якеє наслідком двох перших (їх напівсумою). Таким чином, для визначенняі v маємо систему трьох рівнянь із трьома невідомими

звідки

і з урахуванням

(6.89)

Означає, що оптимальна стратегія для ряби дорівнює

(6.90)

ціна ж її внаслідок (6.89) дорівнює, тобто збігається з (6.88), що, також випливає із загальної теорії.

Моделі, що базуються на теорії ігор, є цікавими, але поки що недостатньо вивчений підхід до вирішення стратегічних екологічних завдань. Розроблення теорії для складніших ігор з ненульовою сумою та ігор багатьох осіб, де між гравцями можуть створюватися коаліції, повинна знайти ефективне застосування в екологічних проектах, пов'язаних із плануванням та оцінкою різних дій на навколишнє середовище.

 
< Попер   ЗМІСТ   Наст >