Критерий сэвиджа
M{x2}=11.5; M{x3}=18.0; M{x4}=21.5. Наилучшим уровнем предложения услуг в соответствии с критерием Лапласа будет x2.
2.1.3. Критерий Сэвиджа. Рассмотрим следующий пример. Пусть множества X={x1, x2} и Y={y1, y2} состоят только из двух элементов. Целевая функция является функцией затрат ОС и задана таблицей. Приме-
y1 |
y2 |
max |
нение критерия наилучшего гарантирован- |
|
x1 |
1010 |
9 |
1010 |
ного результата дает в качестве решения |
x2 |
1000 |
1000 |
1000 |
стратегию x2. Однако, если ОС применит |
Стратегию x1, то при худшем для него варианте y=y1 затраты возрастут по сравнению с гарантированным результатом на 1%, а при благоприятном варианте затраты составят только 0.9% от гарантированных затрат, т. е. уменьшатся на 99.1%.
Учесть подобные ситуации и реализовать выбор стратегии, дающей возможно небольшой проигрыш, но и возможно существенный выигрыш по сравнению со стратегией гарантированного результата, позволяет критерий Сэвиджа. Пусть целевая функция f(x,y) есть функция выигрыша ОС. Следовательно, ОС стремится максимизировать целевую функцию. Составим функцию сожаления:
(5)
Величина выражает «сожаление» ОС в том, что она для данного неопределенного фактора y выбрала стратегию x, а не лучшую стратегию
.
Функцию называют также функцией риска. Затем для функции применяется критерий наилучшего гарантированного результата, то есть оптимальное х0 ищется следующим образом. Для каждого контролируемого фактора хX
. (6)
В случае, когда в модели операции задана функция потерь (проигрыша), функция сожаления будет иметь вид
(7)
и опять выражает «сожаление» ОС о том, что она для данного неопределенного фактора yY применила стратегию x, a не лучшую стратегию :
.
Далее, оптимальная по данному критерию стратегия х0 ищется из критерия наилучшего гарантированного результата для 2(х, у):
.
Функция сожаления и в случае функции выигрыша f (формула (5)) и в случае функции потерь f (формула (7)) выражает величину потерь ОС от неприменения лучшей стратегии. Поэтому критерий наилучшего гарантированного результата в обоих случаях является минимаксным:
(8)
Составим матрицу сожаления для приведенного в начале пункта примера. Так как функция f(i, j) в данном примере есть функция потерь, то
Функцию 2(i, j) запишем в виде матрицы S сожалений:
S=
Теперь из критерия наилучшего гарантированного результата для матрицы S получаем, что оптимальной будет стратегия х1.
Рассмотрим пример 3. Так как в этом примере задана функция потерь, то функция сожаления (i, j) вычисляется по формуле (7).
=5-5=0, , 2(1,3)=21-5=16 и т. д.
Результаты вычислений запишем в виде матрицы S:
|
|
|
|
S=
Для нахождения оптимальной по критерию Сэвиджа стратегии ОС найдем по матрице сожалений S стратегию х0, удовлетворяющую принципу наилучшего гарантированного результата. Для этого в силу (8) нужно найти максимальный элемент в каждой строке матрицы S. Обозначим его b1, b2, b3, b4, соответственно. Затем необходимо найти наименьшее из чисел bi. Тогда номер i*: bi*= min{bj}- определит оптимальную стратегию. В примере 3 b1=10, b2=8, b3=16, b4=25. Соответственно, i0 =2, так как b2=min{b1;b2;b3;b4}. Следовательно, стратегия х2 является оптимальной по критерию Сэвиджа в данном примере. Этот ответ совпадает с ответом, полученным по критерию Лапласа.
Таким образом, для приведенной в примере 3 функции потерь оптимальной и по критерию Лапласа, и по критерию Сэвиджа является стратегия х2. Однако из приведенного примера не стоит делать вывод, что такое совпадение будет всегда выполняться. Можно привести пример, когда эти два критерия будут считать оптимальными различные стратегии.
2.1.4. Критерий Гурвица. Для определения следующего критерия нам понадобится понятие выпуклой комбинации.
Определение 13. Число с называется выпуклой комбинацией чисел a и b, если существует число [О;1] такое, что
c= a +(1 — )b.
Отметим, что множество всех таких чисел образует отрезок [a ; b]. Критерий Гурвица является выпуклой комбинацией критериев крайнего пессимизма W1(x, у) и крайнего оптимизма:
. (9)
Здесь мы считаем, что задана функция выигрыша f(x, y). Критерий крайнего оптимизма предполагает, что неопределенный фактор yY — максимально содействует ОС в ее стремлении увеличить свой выигрыш. Итак, в случае, когда задана функция выигрыша f(x, y) ОС критерий Гурвица имеет вид:
=. (10)
Оптимальной в этом случае считается стратегия х0X, доставляющая максимум функции W5(x), т. е.
W5(х0)=W5(x) .
Для функции потерь (х, у) критерий Гурвица задается равенством:
W6 (x)=. (11)
Оптимальной при этом считается стратегия х0X, на которой достигается минимум функции W6(х), т. е.
W6 (x0)=W6 (x).
Параметр называется показателем оптимизма: при =1 критерий Гурвица превращается в критерий крайнего оптимизма, при =0 – в критерий крайнего пессимизма. Выбор параметра осуществляется ОС, исходя из ее взглядов на данную операцию, то есть является субъективным.
Найдем решение задачи из примера 3 по критерию Гурвица в случае = 0.2. Имеем соответственно:
W6(x1) = [0.2min{5; 10; 18; 25} + mах08{5; 10; 18; 25}] = 0.2´5 + 0.8´25 = 21,
W6(x2) = [0.2´7 + 0.8´23] =19.8, W6(x3) = [0.2´12 + 0.8´21] = 19.2,
W6 (х4) = [0.2´15 + 0.8´30] = 27.
Анализируя зависимость выбора оптимальной стратегии от значения , получим:
(0.5; 1] – оптимальная стратегия х1;
=0.5 – оптимальные стратегии х1 и х2;
(2/7; 0.5) – оптимальная стратегия x2;
= 2/7 – оптимальные стратегии x2 и х3;
[0; 2/7) – оптимальная стратегия х3.
Таким образом, в зависимости от выбранной величины оптимизма ОС может получить различные ответы об оптимальности стратегии.
2.2. Оценка эффективности в условиях риска
Рассмотрим случай, когда Y=, Z=, то есть неконтролируемые факторы являются только случайными. При этом будет предполагаться, что известна либо функция (z) распределения вероятностей случайной величины z (в случае непрерывной случайной величины z), либо для конечного множества Z={z1,…,zm} значений случайной величины известна pi – вероятность того, что случайная величина z примет значение zj, i.
2.2.1. Критерий ожидаемого значения (математическое ожидание) «выигрыша». В критерии ожидаемого значения в качестве оценки эффективности стратегии х принимается математическое ожидание случайной величины выигрыша. Критерий имеет вид:
(12)
в случае непрерывной случайной величины z , и
W7(x)=f(x, zi)qj (13)
для дискретной случайной величины z. Здесь qj – вероятность того, что случайная величина z примет значение zj, Z={z1,…,zm}.
Отметим, что применение осреднения по случайной величине (12) или (13) может быть обосновано только при многократном повторении операции. Действительно, в этом случае средний выигрыш (т. е. сумма выигрышей в проведенных операциях деленная на количество операций) будет достаточно близок к математическому ожиданию выигрыша (12) или (13). Если число повторений операции невелико, то математическое ожидание целевой функции может сильно отличаться от ее среднего значения.
Пример 4. Пусть ОС имеет три стратегии X={x1, x2, x3}, множество неконтролируемых факторов состоит из трех возможных значений Z={z1, z2, z3}. Обозначим – значение целевой функции для контролируемого и случайного факторов соответственно. Пусть матрица A этих значений целевой функции имеет вид:
Пусть вероятности, с которыми выбирается один из трех неконтролируемых факторов: q1=9/24; q2=8/24; q3=7/24. Тогда математические ожидания выигрыша для различных стратегий задаются величинами
Таким образом, по критерию ожидаемого значения наилучшей для ОС является вторая стратегия. Однако отметим, что в случае выбора второй стратегии величина выигрыша с вероятностью q=2/3 не превзойдет 4, в то время как при первой стратегии ОС величина выигрыша не опустится ниже 6. При однократном проведении игры ОС, выбирая вторую стратегию, рискует с большой вероятностью получить выигрыш меньший, чем в случае применения первой стратегии.