1. Основные понятия теории игр. Классификация игр
2. Игры с противником: формальное представление, выбор оптимальной стратегии
3. Игры с «неживой» природой
7.1 Основные понятия теории игр. Классификация игр
Предметом теории игр являются такие ситуации, в которых важную роль играют конфликты и совместные действия.
Конфликт может возникнуть в результате различия целей которые отражают не только несовпадающие интересы разных сторон, но и многочисленные интересы одного и того же лица. Например, ЛПР, формирующее экономическую политику фирмы, обычно преследует разнообразные цели, выдвигая противоречивые требования, предъявляемые к ситуации (рост объемов производства, повышение доходов, снижение экологической нагрузки и т. п.). Конфликт также может быть результатом действия тех или иных «стихийных сил», то есть внешнего окружения. Поэтому математическая модель, адекватно отражающая: любое социально-экономическое явление, должна отражать присущие ему черты конфликта, то есть описывать:
- множество заинтересованных сторон; в теории игр они называются игроками;
- возможные действия каждой из сторон, которые называются стратегиями, или ходами;
- интересы сторон, представляемые функциями выигрыши платежной матрицей
В теории игр предполагается, что функции выигрыша и множество стратегий, доступных каждому из игроков, общеизвестны то есть каждый игрок знает свою функцию выигрыша и набор I имеющихся в его распоряжении стратегий, а также функции выигрыша и стратегии остальных игроков, и в соответствии с : информацией организовывает свое поведение.
Различные виды игр можно классифицировать по различным признакам. К ним относятся:
число игроков;
число стратегий;
- свойства функции выигрыша;
- возможность предварительных переговоров и взаимодействия между игроками в ходе игры.
В зависимости от числа игроков различают игры с двумя, тремя и более участниками. В принципе возможны также игры с бесконечным числом игроков. По количеству стратегий различают конечные и бесконечные игры. В конечных играх игроки располагают конечным числом возможных стратегий (например, игра «орел — решка»). Сами стратегии в конечных играх часто называют чистыми стратегиями. Соответственно, в бесконечных играх игроки имеют бесконечное число возможных стратегий (например, в ситуации продавец-покупатель при установлении цены на товар и его количества).
По свойствам функции выигрыша различают:
- антагонистические игры, или игры с нулевой суммой; в данном случае выигрыш одного игрока равен проигрышу другого, то есть налицо прямой конфликт между игроками;
- игры с постоянной разностью, в которых игроки и выигрывают, и проигрывают одновременно, так что им выгодно действовать сообща;
- игры с ненулевыми суммами, где имеются и конфликты, и согласованные действия.
В зависимости от возможности предварительных переговоров между игроками различают кооперативные и некооперативные игры. Игра называется кооперативной, если до начала игры игроки образуют коалиции и принимают взаимообязывающие соглашения о своих стратегиях. Игра, в которой игроки не могут координировать свои стратегии, называются некооперативной. Очевидно, что все антагонистические игры могут служить примером некооперативных игр. Примером кооперативной игры может служить ситуация образования коалиций в парламенте для принятия решения путем голосования.
2. Игры с противником: формальное представление, выбор оптимальной стратегии
Любая игра задается функцией выигрыша, или платежной матрицей, которая в играх партнеров имеет следующий вид:
где i — стратегии строчного игрока;
j — стратегии столбцевого игрока;
aij — платежи столбцевого игрока при выборе им j-той стратегии строчному, если последний выбирает i-тую стратегию.
Если а,} > О, то столбцевой игрок платит строчному; если аij < о то строчный игрок платит столбцевому; если аij = О, никто никому не платит.
В качестве основного допущения в теории игр предполагается, что каждый игрок стремится обеспечить себе максимально возможный выигрыш при любых действиях партнера. Пусть имеется конечная антагонистическая игра с матрицей выигрышей строчного и столбцевого игроков. Строчный игрок считает, что какую бы стратегию он ни выбрал, столбцевой игрок выберет стратегию, максимизирующую свой выигрыш и тем самым минимизирующую выигрыш первого игрока. Поэтому для выбора оптимальной стратегии строчный игрок сначала в каждой выбирает минимальный элемент:
Затем, среди полученного столбца значений выбирав большее значение а, то есть
а считается нижней ценой игры, а стратегия, которую строчный игрок, — максиминной стратегией.
Аналогично, столбцевой игрок сначала в каждом столбце, выбирает наибольшее число
и оптимальной стратегией считает
β считается верхней ценой игры, стратегия, которую выбрал столбцевой игрок, называется минимаксной и, следовательно, а>β
Если а = β, то игра называется игрой с седловой точкой. Элемент, для которого выполняется условие аij = а = β, называется седловым элементом. Не всякая игра имеет седловую точку, но если она имеется, то стратегии игроков определяются однозначно.
3. Игры с «неживой» природой
Пусть в матрице игры строки означают возможные варианты решений, принимаемых игроком (им могут быть менеджер-руководитель и т. п.), столбцы — возможные состояния природы (Т. е. хозяйственной среды). Элемент матрицы аij, означает сумму платежа в ситуации, когда игрок принимает решение i , то есть выбирает стратегию i при состоянии природы j. В этом случае платежная матрица игры будет иметь вид:
Стратегия игрока | Состояния природы | |||||
П1 | П2 | … | Пj | … | Пn | |
А1 | A11 | A12 | … | A1j | … | A1n |
А2 | A21 | A22 | … | A2j | … | A2n |
… | … | … | … | … | … | … |
Аi | Ai1 | Ai2 | … | Aij | … | Ain |
... | … | … | … | … | … | … |
Аm | Am1 | Am2 | … | Amj | … | Amn |
Введем число, которое характеризовало бы не только выигрыши игроков, но и удачность выбора стратегии.
Риском rij игрока при пользовании стратегией Аj, в условиях Пj называется разность между выигрышем, который он может получить, зная условия Пj, и выигрышем, который он получает, не зная их и выбирая стратегию Аj:
Рассмотрим основные критерии, применяемые для выбора оптимального управленческого решения.
Критерий Байеса. Если имеется некоторая статистическая Неопределенность, то есть известны вероятности р1’, р2’ р3’..., рn наступления состояний природы П1’ П2’ П3’..., Пп’, то оптимальной считается стратегия для которой:
а) максимально среднее значение выигрыша по строке
б) минимально среднее значение риска по строке
Критерий Лапласа. Если вероятности неизвестны, то можно считать все состояния природы равновероятными, то есть рj=1/п. В этом случае критерий Байеса преобразуется в критерий Лапласа, который определяется по формуле
Применение этого критерия целесообразно в тех случаях, да велики различия между отдельными состояниями природы, т. е. велика дисперсия значений а... Это очень удобный критерий, но его недостаток заключается в том, что теряется структура игры.
Критерий Вальда. Данный критерий иногда называют критерием крайнего пессимизма, так как оптимальную страте выбирают по нижней цене игры
Достоинством критерия Вальда, как отмечают Льюис и Раис является то, что он предельно консервативен, то есть его применяют в той ситуации, в которой нерезонно рисковать.
Критерий Сэвиджа работает только с матрицей риска называется критерием крайнего пессимизма по риску, так как пытается минимизировать «упущенную выгоду». Оптимальная стратегия выбирается исходя из следующей зависимости:
Данный критерий был разработан в 1951 году и часто используется для выбора долгосрочных стратегических решений, которые должны быть минимально рисковыми.
Критерий Гурвица предлагает компромиссное правило выбора наиболее предпочтительного варианта. Оптимальная стратег определяется по формуле
Число К задается исследователем, изменяется от 0 до 1 и называется параметром оптимизма. Применение этого критерия осложняется, когда нет обоснованного представления о величине параметра К.
Можно отметить, что критерий Вальда является частным случаем критерия Гурвица, если К = 0. Если К = 1, то мы имеем дело с крайне оптимистической точкой зрения, которая называется максимаксной стратегией. Недостатком критерия Гурвица (кроме того, что /с трудно определимый, субъективный параметр) является то, что он охватывает не всю структуру игры целиком, а только одну или два ее элемента, остальная же информация не используется.
Критерий Ходжеса - Лемана использует два субъективных показателя:
- распределение вероятностей р, известное нам по критерию
Байеса;
- «параметр оптимизма» из критерия Гурвица. Оптимальная стратегия определяется по следующей формуле:
Недостатком этого критерия является то, что в нем используется много субъективных факторов.
Стандартное отклонение считается мерой риска, является именованной величиной, указывается в тех же единицах, что и варьирующий признак.
Дисперсия и стандартное отклонение считаются абсолютными оценками риска.
Если анализируемые инвестиционные проекты имеют одинаковое математическое ожидание результата, то абсолютная оценка риска позволяет сделать однозначный выбор между ними: чем! меньше дисперсия или стандартное отклонение, тем менее рискованный проект. Если ожидаемые значения результата по различным проектам неодинаковы, необходимо переходить к анализу этих проектов с помощью относительных величин. В этом случае рассчитывается; коэффициент вариации.
Коэффициент вариации представляет собой отношение стандартного отклонения к среднему ожидаемому значению, выраженное в процентах, показывает степень отклонения ожидав значений и является относительной оценкой риска:
Коэффициент вариации — относительная величина, поэтому на его размер не оказывают влияния абсолютные значения изучаемого показателя. С помощью этого показателя можно сравнивать даже изменчивость показателей, выраженных в различных единицах измерения. Диапазон изменения показателя — от 0 до 100%. Чем больше коэффициент, тем больший разброс значений показателей и тем более рискованный анализируемый проект.
Установлена следующая качественная оценка различных коэффициентов вариации:
до 10% — слабая колеблемость;
10%- до 25% — умеренная колеблемость;
свыше 25% — высокая колеблемость.
В чем заинтересован инвестор? С одной стороны, для него важно получить большую ожидаемую эффективность вклада, с другой, — важно уменьшить риск.
Если предоставить возможность выбора между двумя инвестиционными проектами, у которых X1>Х2, а δ1=δ2, то, конечно, любой разумный инвестор вложит деньги в первый проект. Если, напротив, X1=X2, а δ1>δ2, то инвестор выберет второй вариант, поскольку мера риска у него меньше.
Но в общем случае, когда
Х}<Х2, δ1>δ2 или X1>X2, δ1<δ2 ,
однозначного решения нет. Инвестор может предпочесть вариант с большим средним ожидаемым доходом, связанным с большим риском, либо вариант с меньшим доходом, но и менее рискованный. Каждый инвестор, вкладывая деньги в какой-либо инвестиционный проект, является, в некотором смысле, игроком, и выбор, который он делает, зависит от его характера и склонности к риску. В большинстве случаев предполагается, что ЛПР желает максимизировать ожидаемый денежный выигрыш или минимизировать ожидаемый денежный проигрыш. Однако иногда этот критерий не будет верным и нам понадобится сформулировать более подходящий критерий. Для того, чтобы проиллюстрировать, почему для ЛПР не всегда приемлем критерий максимизации ожидаемого денежного выигрыша, рассмотрим следующую ситуацию.
Предположим, что ЛПР должен сделать выбор из следующих двух альтернатив:
• получить 1 000 000 грн наверняка;
• игра, в которой с вероятностью 0,5 ЛПР выигрывает 2 100 000 грн, либо же вероятностью 0,5 проигрывает 50 000 грн.
Для того, чтобы сделать рациональный выбор из двух предложенных альтернатив, необходимо рассчитать ожидаемый денежный выигрыш для игры и сравнить полученные результаты.
Ожидаемый доход от второй альтернативы составит:
0,5 (2 100 000) + 0,5 (-50 000) = 1 025 000 грн.
Если использовать критерий максимизации ожидаемого денежного выигрыша, ЛПР должен предпочесть игру, а не получение суммы 1 млн. грн наверняка. Однако большинство людей в этой ситуации, видимо, предпочтут гарантированность выигрыша первой альтернативы, даже несмотря на то, что больший ожидаемый выигрыш соответствует игре, представленной второй альтернативой. Напротив, в этой ситуации вполне вероятно, что президент крупной фирмы может предпочесть альтернативу 2. Следовательно, на выбор предпочтительного управленческого решения влияет не только размер ожидаемого дохода от операции, но и отношение субъекта к риску.
Литература
Беленцов В.Н., Брадул С.В., Канарськая Н.В., Куденко Г.Е., Кучеба П.К. Оцінка і обгрунтування підвищення ефективності господарської діяльності промислових підприємств. : Навч.-метод. посібник. Ч.1 – Донецьк: Дон ДУУ, 2002. - 180 с.
Виробничий менеджмент: Навчальний посібник. / За ред. професора П.К.Кучеби. – Донецьк: ТОВ «Юго-Восток» ЛТД», 2002с. – 341 с.
Економіка підприємства: Підручник / За заг. ред. С.Ф.Покропивного. – Вид. 2-ге, переробл. та доп. – К.: КНЕУ, 2001. – 528 с.
Жадан О.В., Кретова А.В., Сичов Г.М. Основи управління якістю: Навч.-метод. посібник. – Донецьк: «АПЕКС», 2004.-99с.
Лафта Дж. К. Эффективность менеджмента организации. - М.: Русская деловая литература, 2007.- 320 с.