5.2. Методы теории игр при принятии решений
Теоретической основой нахождения оптимального решения в
условиях неопределенности и конфликтных ситуаций является теория игр.
Игра – это математическая модель процесса функционирования конфлик-
Электронный
архив
УГЛТУ
127
тующих элементов систем, в котором действия игроков происходят по
определенным правилам, называемым стратегиями.
Основной постулат теории игр – любой субъект системы делает все
возможное, чтобы достигнуть своих целей. От реального конфликта игра
(математическая модель конфликта) отличается тем, что она ведется по
определенным правилам, которые устанавливают порядок и очередность
действий субъектов системы, их информированность, порядок обмена ин-
формацией, формирование результата игры.
В играх, известных под общим названием азартных, основной вид
неопределенности – это
статистическая неопределенность
. Игрок не зна-
ет заранее, как ляжет карта, или какая цифра выпадет при бросании кости.
Другой тип неопределенности характерен для так называемых игр с
полной информацией (шашки, шахматы, рэндзю, решение головоломок
типа кубика Рубика). В любой момент игрок обладает полной информаци-
ей о текущем положении дел. С формально-математической точки зрения
принципиально возможно перебором всех возможных вариантов и про-
слеживанием всех возможных последствий выбрать оптимальный ход. Од-
нако число возможных ходов и их последствий настолько огромно, что на
практике этого нельзя сделать. Неопределенность этого типа называется
комбинаторной
.
Неопределенность более высокого типа связана с тем, что игрок,
пусть даже обладая полной информацией на синтаксическом уровне, не
может до конца выяснить ее смысл. Неопределенность этого типа называ-
ется
семантической
.
Семантическая неопределенность
всегда существует в такой игро-
вой ситуации, как научное познание (игра с природой). Такие постоянно
развивающиеся формы, как понятия, категории, теории, включают на се-
мантическом уровне наряду с определенностью также некоторую неопре-
деленность. Семантической неопределенностью обладают совокупности
экспериментальных данных (неизвестно, какой закон за ними кроется).
Если статистическая неопределенность связана только со структурой
множества возможных ходов (своих или противника), то семантическая
неопределенность связана еще и с особенностями отражения этого множе-
ства в системе (сознании игрока). В случае статистической неопределенно-
сти при незнании конкретного исхода следующего хода все же известно
распределение вероятностей, а в случае семантической неопределенности
неизвестны даже вероятности.
Наиболее сложный вид неопределенности в игре - это
стратегиче-
ская неопределенность
. Игрок не знает, какого образа действий придержи-
вается противник, какие цели перед собой ставит. Неопределенность этого
типа обычно несвойственна играм (в обычном смысле этого слова): цель
Электронный
архив
УГЛТУ
128
игры четко определена правилами. Но она присуща различным сферам
человеческой деятельности (бизнес, политика и т.д.). Информация, снима-
ющая стратегическую неопределенность, – это стратегическая информация.
Частным случаем стратегической неопределенности является не-
определенность прагматическая, состоящая в незнании (вернее, в непол-
ном знании) игроком собственных целей. Прагматическая неопределен-
ность связана с неадекватностью и неполнотой самоотражения субъекта, с
неполной информацией о себе и о своем месте в игровой ситуации.
Существует много классов игр, различающихся по количеству игро-
ков, числу ходов, характеру функций выигрыша и т.д. Выделим следую-
щие основные классы игр:
1) антагонистические (игры со строгим соперничеством) и неантого-
нистические. В первом случае цели игроков противоположны, во втором -
могут совпадать;
2) стратегические и нестратегические (в первых субъект системы
действует независимо от остальных, преследуя свои цели, во вторых субъ-
екты выбирают единую для всех стратегию);
3) парные игры и игры для N лиц;
4) коалиционные и бескоалиционные;
5) кооперативные и некооперативные (в первых возможен обмен ин-
формацией о возможных стратегиях игроков);
6) конечные и бесконечные (в первых - конечное число стратегий).
Наибольшее распространение в технических приложениях имеют
парные стратегические, бескоалиционные, конечные, некооперативные иг-
ры. Модель проблемной ситуации в этом случае имеет вид
1
, W
2
, R
1
, R
2
>, (5.2)
где U – множество стратегий оперирующей стороны (конструктора);
V – множество стратегий оппонирующей стороны (технолог и природа);
W
1
и W
2
– показатели качества игроков;
R
1
и R
2
– системы предпочтения игроков.
Системы предпочтения игроков, в свою очередь, основываются на
двух ведущих принципах рационального поведения: принципе наибольше-
го гарантированного результата и принципе равновесия. Первый основан
на том, что рациональным выбором одного из игроков должен считаться
такой, при котором он рассчитывает на самую неблагоприятную для него
реакцию со стороны другого игрока. Второй принцип гласит, что рацио-
нальным выбором любого игрока считается такая стратегия u$ (или v$) ,
для которого ситуация (u$, v$) обоюдовыгодна: любое отклонение от дан-
ной ситуации игры не является выгодным ни для одного из игроков.
Решается парная матричная игра ( проектируемое изделие – меры и
средства противодействия) с нулевой суммой ( выигрыш одной стороны
равен проигрышу другой) на основе рассмотрения платежной матрицы,
Электронный
архив
УГЛТУ
129
которая представляет собой совокупность значений U и V ( пара стратегий
(u,v) U x V называется ситуацией игры), а также выигрышей Wij при пар-
ном сочетании всевозможных стратегий сторон. Решение парной матрич-
ной игры может быть в чистых стратегиях, когда для каждой из сторон
может быть определена единственная оптимальная стратегия, отклонения
от которой невыгодны обоим игрокам. Если выгодно использовать не-
сколько стратегий с определенной частотой их чередования, то решение
находится в смешанных стратегиях.
Основная особенность использования методов теории игр заключа-
ется в том, что в качестве возможных стратегий со стороны проектируемой
системы рассматриваются возможные варианты ее строения, из которых
следует выбрать наиболее рациональный. В качестве стратегий противника
рассматриваются возможные варианты его противодействия, стратегии их
применения. Число стратегий может быть расширено благодаря реализа-
ции «гибких» решений. Анализ игровых ситуаций в этом случае может
быть направлен не только на выбор рационального варианта проектируе-
мого изделия, но и на определение алгоритмов рационального применения
системы в конфликтной ситуации.
Другая особенность применения методов теории игр заключается в
выборе решений, получаемых на основе анализа конфликтной ситуации. В
теории игр доказывается теорема о том, что оптимальная стратегия для
каждого из игроков является оптимальной и для другого игрока.
Как уже отмечалось, выбор метода анализа ЛПР определяется усло-
виями, в которых принимаются решения. Эти условия классифицируются
по степени точности и уверенности в результатах решений. Имеются три
основные категории состояния ЛПР: уверенность, риск и неопределен-
ность.
В условиях уверенности выбирается альтернатива, которая дает
наибольшее (наименьшее) значение основного критерия.
В условиях неопределенности могут быть четыре направления при-
нятия решений:
maximin
,
maximax
,
laplace
,
minimax regret
.
Maximin
(максимум из минимума)
– выбор решения с лучшим из
всех худших результатов – пессимистический метод, потому что он при-
нимает во внимание только самый плохой из всех возможных результатов.
Maximax
(максимум из максимума) – выбор решения с лучшим из
всех лучших результатов – оптимистический, наступательный метод, в ко-
тором не принимается во внимание никакой возможный результат, кроме
самого лучшего.
Laplace
– выбор решения с наилучшим средним значением результа-
та. В методе предполагается, что все результаты, и худшие, и лучшие, рав-
новероятны.
Minimax regret
– выбор решения с лучшим из худших возможных по-
следствий.
Электронный
архив
УГЛТУ
130
Достарыңызбен бөлісу: |