Критерий математического ожидания — дисперсии
2.2.2. Критерий математического ожидания – дисперсии. Выбор стратегии по математическому ожиданию, оказывается, связан с большим риском. Одним из способов оценки риска служит математическое ожидание отклонения случайной величины выигрыша от своего математического ожидания, т. е. дисперсия случайной величины выигрыша. Действительно, из неравенства Чебышева (при конечной дисперсии) имеем
(14)
где
,
,
дисперсия выигрыша ОС при его стратегии х в случае непрерывной и дискретной случайной величине z соответственно. Таким образом. s2(f(x, ּ)) оценивает вероятность отклонения от математического ожидания выигрыша W(х) при той же стратегии.
С целью уменьшить «риск» сильного отклонения случайной величины выигрыша от математического ожидания используют критерий математического ожидания – дисперсии. В этом критерии отражено стремление увеличить математическое ожидание выигрыша и уменьшить вероятность отклонения от него случайной величины выигрыша. Критерий имеет вид
W8(x)=W7(x) – Ks (f(x, ּ)). (15)
Здесь К 0 — коэффициент не склонности к риску. В случае минимизации проигрыша ОС соответственно
W9(x)=W7(x) + Ks(f(x, ּ)). (16)
При значении К = 0 ОС ориентируется только на математическое ожидание выигрыша и не интересуется риском отклонения величины выигрыша от математического ожидания W7(х). Если К>0, то максимизируя W8, ОС стремиться к максимизации W7 и минимизации среднеквадратичного отклонения s. Чем больше К, тем большее значение для ОС имеет минимизация s и меньшее значение имеет максимизация W7. Из (15) следует, что при росте величины К ОС все больше стремиться уменьшить вероятность отклонения выигрыша от величины математического ожидания. Тем самым ОС становится все менее склонной к риску. Величина коэффициента К определяется ОС субъективно в зависимости от сложившейся ситуации, т. е. нет четких правил определения величины К. В рассмотренном примере можно отметить, что при малых значениях К (K<k1, k1 0.15) оптимальной остается вторая стратегия, при k1<K< оптимальной станет первая стратегия, а при К> оптимальной по критерию W9 – третья стратегия. Однако при использовании третьей стратегии в случае любой реализации z ОС получит выигрыш не больший, чем при применении первой стратегии. Таким образом, необоснованное увеличение коэффициента К в (15) может привести к неправильным выводам.
Пример 5. Ежедневный спрос на булочки в продовольственном магазине может принимать одно из следующих значений: {100; 150; 200; 250; 300}. Булочки обходятся магазину по 25 ден. ед. Свежие булочки продаются по цене 49 ден. ед., а не проданные в тот же день, продаются в конце дня по 15 ден. ед. Какое число булочек нужно заказывать с тем, чтобы ежедневная валовая прибыль (выручка от продажи минус затраты на закупку) была максимальной. При этом нужно учитывать следующие условия:
а) булочки продаются поддонами по 50 шт. на одном поддоне;
б) по цене 15 ден. ед. продаются все булочки;
в) известны вероятности каждой величины спроса: P(100)=0.2;
P(150)=0.25; P(200)=0.3; P(250)=0.15; P(300)=0.1.
Решение. Контролируемым фактором х является количество заказываемых магазином булочек. Величина х может принимать одно из следующих значений х{0; 50; 100; 150; 200; 250; 300;…}.
Неконтролируемым фактором является спрос на булочки. По условию задачи спрос является случайной величиной, принимающей конечное число значений Z={100;150;200:250; 300}. Неопределенных факторов нет (Y=).
Критерием операции является количество денег, полученных от продажи булочек за вычетом суммы, которую магазин заплатил за них. Если магазин закупил х булочек, а спрос в этот день составил z булочек, то магазин продает будочки по цене 49 ден. ед. в количестве min{x,z}. Действительно, нельзя продать больше, чем имеется, и нельзя продать больше, чем спрашивают покупатели. По цене 15 ден. ед. будет продано (x — min{x,z}) булочек. Если количество х закупленных магазином булочек превосходит спрос z (x — z>0), то z булочек будет продано по цене 49 ден. ед. и (x — z) булочек – по цене 15 ден. ед. Если же спрос z превышает х, то х булочек будет продано по цене 49 ден. ед., а по цене 15 ден. ед. булочки продаваться не будут. Итак, критерий операции имеет вид
F(x, z)= 49(min{x, z}) + 15(x – min{x, z}) – 25x =
= 24(min{x, z})-10(x – min{x, z}).
Таким образом, математическая модель операции { Х, (Z,), f } определена. Исходя из вида целевой функции, можно сократить множество X, на котором следует искать максимум целевой функции по x. Действительно, следует закупать не менее 100 булочек, так как спрашиваться будет не менее 100 булочек и каждая такая булочка приносит прибыль в 24 ден. ед. Каждая булочка сверх 300 не будет продана днем и принесет убытки в 10 ден. ед., следовательно, закупать булочки в количестве более 300 не выгодно. Итак, множество X следует уменьшить до X={100; 150; 200; 250; 300}.Так как множества X и Z конечны, целевую функцию удобно представить в виде таблицы
Таблица значений целевой функции F(x, z)
Значения z | |||||
x | z = 100 | z = 150 | z = 200 | z = 250 | z = 300 |
100 | 2400 | 2400 | 2400 | 2400 | 2400 |
150 | 1900 | 3600 | 3600 | 3600 | 3600 |
200 | 1400 | 3100 | 4800 | 4800 | 4800 |
250 | 900 | 2600 | 4300 | 6000 | 6000 |
300 | 400 | 2100 | 3800 | 5500 | 7200 |
Здесь строка соответствует значению x, а столбец – значению z. Так значение F(200;150) находится на пересечении третьей строки (x=200) и второго столбца (z=150). При этом
F(200, 150)=24´min{200;150} – 10´(200 – min{200;150})=3600 – 500=3100.
Oценим эффективность произвольной стратегии х. Оценивать будем по критериям «ожидаемое значение» и «ожидаемое значение – дисперсия».
По критерию «ожидаемое значение» (13) имеем
=;
=1900
+;
=(
;
Аналогично получаем
=3495; =3040.
Итак, по критерию «ожидаемое значение» лучшей является стратегия х*= 200.
Найдем теперь решение по критерию (см.(15)) при K=1
W9(100)=W7(100) – ;
W9(150)=W7(150) – =
=3260-680=2580;
W9(200)= W7(200) –
–
»3695 – 1447 = 2348;
Аналогично получаем
W9(250) » 2023; W9(300)»1437.
Итак, в этом случае лучшей оказалась более осторожная стратегия закупки – 150 булочек ежедневно.
2.2.3. Критерий предельного уровня. Этот критерий соответствует не понятию оптимальности, а приемлемому способу действия. Данный критерий применяется, когда трудно оценить выигрыш (проигрыш) при той или иной стратегии ОС. Рассмотрим пример.
Пример 6. Предположим, что величина спроса z в единицу времени на товар является случайной величиной с непрерывной функцией плотности распределения (z), т. е. d((z)) = (z)dz или (z) = ‘(z). Если запасы товара в начальный момент невелики, то в некоторый момент возможен дефицит товара. Если запасы очень велики, то к концу рассматриваемого периода (день, неделя, месяц и т. д.) может оказаться большой запас нереализованного товара. В случае дефицита товара появляются потери в связи с уменьшением потенциальной прибыли и потери клиентов, не купивших нужный товар. В случае излишков товара появляются потери, связанные с его закупкой и хранением. Затраты на хранение можно трактовать как плату за то, что денежные средства «лежат» на складе, а не приносят прибыль другим способом.
Определить потери от дефицита товара в полном объеме очень трудно, поэтому ОС может принять решение исходя из критерия предельного уровня, добиваясь, чтобы величина ожидаемого дефицита не превышала А1 единиц, а величина ожидаемых излишков не превышала А2 единиц. Математически это можно записать в данном примере следующим образом. Пусть I — определяемый уровень запасов, тогда
,
При произвольном выборе А1 и А2 указанные условия могут оказаться противоречивыми. В этом случае необходимо увеличить одно или оба ограничения, чтобы обеспечить существование решения.
Приведенный пример не единственная ситуация, когда используется этот критерий. Критерий предельного уровня имеет смысл применять, когда в момент решения нет полного представления о множестве возможных альтернатив либо трудности для ОС по определению всего множества альтернатив и вычислению на этом множестве значений критерия операции превосходят потери от неточного решения.
Пусть, например, владелец предприятия сферы услуг, которое может работать с различной скоростью обслуживания (прачечная, ресторан, парикмахерская), рассматривает вопрос о скорости обслуживания. Быстрое обслуживание, удовлетворяя интересы клиентов, может оказаться невыгодным для владельца, т. к. требует дополнительных затрат на новое оборудование и количество обслуживающего персонала. Медленное обслуживание требует меньших затрат, но может привести к потере клиентов, не желающих долго ждать.
Пусть в данной ситуации можно задать или определить из эксперимента распределение вероятностей потока клиентов и времени их обслуживания. В силу многократного проведения операции по оказанию услуг представляется приемлемым определение оптимального уровня скорости обслуживания исходя из минимизации общих ожидаемых потерь в единицу времени. Общие потери складываются из затрат на оказание услуг и потери ожидаемой прибыли в случае отказа клиента дожидаться обслуживания. Обе составляющие потерь зависят от уровня скорости обслуживания, при этом, чем больше значение первой, тем меньше значение второй и наоборот. Однако рассматриваемый критерий практически неприменим из-за трудности оценивания приемлемого времени ожидания для различных клиентов.
2.3. Оценка эффективности в условиях риска и неопределенности
В случае, когда Z¹Æ и Y¹Æ, для оценки эффективности стратегии ОС xÎX обычно применяется суперпозиция оценок из пунктов 2.1, 2.2. Например, оценка эффективности
является суперпозицией критерия наилучшего гарантированного результата по неопределенным факторам и критерия ожидаемого значения по случайным факторам.
Пример 7. Пусть руководство фабрики решает, какой объем x продукции нужно производить, если известно:
максимальный объем не может превосходить величину V;
цена единицы продукции – случайная величина z, функция распределения вероятностей которой w(z) установлена на основе статистических исследований;
себестоимость единицы продукции зависит от величины объема выпускаемой продукции s(x);
величина налога y (в процентах) может быть изменена правительством перед началом анализируемого года в пределах от Nmin до Nmax.
Цель операции максимизировать сумму, оставшуюся после продажи и уплаты налогов. Предполагается, что реализуется вся продукция.
В рассматриваемом примере контролируемым фактором является величина объема производства продукции xÎX, где X=[0;V]. Неконтролируемые факторы: y – налог, и z – цена. При этом Y=[Nmin; Nmax], Z=[0; ∞).
Валовая прибыль от продажи равна x(z—s(x)), а после уплаты налогов останется сумма равная
(1 – y/100)(z – s(x))x.
Если руководство фабрики будет оценивать свою стратегию исходя из суперпозиции критериев Лапласа и ожидаемого значения, то произвольная стратегия х будет оцениваться величиной
x(z – s(x))d(z)dy
В случае использования суперпозиции критериев гарантированного результата и ожидаемого значения соответствующая оценка будет иметь вид
W(x) = min x(z – s(x))d(z)
2.4. Пример использования «дерева решений»
Пусть операция имеет несколько этапов, на каждом из которых, множество возможных действий ОС зависит от того, какое действие было использовано на предыдущем этапе. В этом случае для поиска решения часто используют так называемое «дерево решений». «Дерево решений» представляет собой граф, в вершинах которого либо происходит выбор одного из возможных действий ОС, либо реализуется одно из возможных значений неконтролируемого фактора. Возможные действия ОС или возможные реализации неконтролируемого фактора изображаются дугами этого графа.
Рассмотрим процедуру принятия решения на следующем примере [1].
В научном центре некоторой компании была разработана технология выпуска новой продукции. Руководство компании (далее ОС) решает, создавать ли для выпуска новой продукции крупное производство, малое предприятие или продать патент другой фирме.
Размер дохода, который компания может получить, зависит от благоприятного или неблагоприятного состояния рынка (таблица 1).
Руководство кампании оценивает вероятность благоприятного состояния рынка величиной 0.55, а и неблагоприятного – 0.45
На основе данной таблицы выигрышей (потерь) можно построить дерево решений (рисунок 1).
Таблица 1
Номер стратегии | Действия компании | Выигрыш, дол., при состоянии рынка | |
благоприятном | неблагоприятном | ||
1 | Строительство крупного предприятия | 200000 | -180000 |
2 | Строительство малого предприятия | 100000 | -20000 |
3 | Продажа патента | 10000 | 10000 |
Процедура принятия решения заключается в вычислении для каждого из возможных действий ОС математического ожидания выигрыша, отбрасывании неперспективных ветвей и выборе ветвей, которым соответствует максимальная величина ожидаемого значения выигрыша.
|
|
|
Определим средний ожидаемый выигрыш (ОВ):
• для вершины 1 ОВ = 0.55´200000 + 0.45´( –180000) = 29000 долл.;
• для вершины 2 ОВ = 0.55´100000 + 0.45´( –20000) = 46000 долл.;
• для вершины 3 ОВ = 10000 долл.
Вывод. Наиболее целесообразно выбрать стратегию строительства малого предприятия, а остальные стратегии дерева решений можно отбросить. ОВ наилучшего решения равен 46000 долл.
Усложним рассмотренную выше задачу.
Пусть перед принятием решения о строительстве руководство компании должно определить, заказывать ли дополнительное исследование состояния рынка или нет, причем предоставляемая услуга обойдется компании в 10 000 дол. Руководство понимает, что дополнительное исследование по-прежнему не способно дать точной информации, но оно поможет уточнить ожидаемые оценки конъюнктуры рынка, изменив тем самым значения вероятностей.
Фирма, которой заказывается прогноз, способна уточнить значения вероятностей благоприятного или неблагоприятного состояния рынка. При этом известно:
– если фирма делает прогноз, что рынок будет благоприятным, то он будет благоприятным с вероятностью 0.78, а неблагоприятным – 0.22;
– если фирма делает прогноз, что рынок будет неблагоприятным, то он будет неблагоприятным с вероятностью 0.73, а благоприятным – 0.27.
На основании дополнительных сведений можно построить новое дерево решений (рис. 2), где развитие событий происходит от корня дерева к исходам, а расчет прибыли выполняется от конечных состояний к начальным. Определим ожидаемый выигрыш в этом случае. Если прогноз конъюнктуры рынка не заказывается, результат уже был получен: нужно строить малое предприятие, ожидаемый выигрыш – 46 000 долл. В случае, когда прогноз заказывается, действия ОС и, соответственно результаты, зависят от прогноза. Если будет получен прогноз о благоприятной конъюнктуре рынка, то вероятность благоприятной конъюнктуры рынка будет 0.78, а неблагоприятной – 0.22. Тогда:
При строительстве большого предприятия ОВ = 200000´0.78 + +(–180000´0.22)= 116 400 долл.;
При строительстве малого предприятия ОВ = 100000´0.78 +
+(–20000´0.22)= 73 600 долл.;
при продаже патента ОВ = 10 000 долл.
Следовательно, при благоприятном прогнозе нужно строить большое предприятие, при этом ОВ = 116 400 долл.
Если будет получен прогноз о неблагоприятной конъюнктуре рынка, то вероятность благоприятной конъюнктуры рынка будет 0.27, а неблагоприятной – 0.73. Тогда:
при строительстве большого предприятия ОВ=200000´0.27 +
+(–180000´0.73)= -77 400 долл.;
при строительстве малого предприятия ОВ = 100000´0.27 +
+(-20000´0.73)= 12 400 долл.;
при продаже патента ОВ = 10 000 долл.
В случае неблагоприятного прогноза необходимо строить малое предприятие, при этом ОВ = 12 400 долл.
Так как руководство компании принимает решение заказывать,
или не заказывать прогноз до того как прогноз будет получен, то для оценки возможного результата оно может воспользоваться своими предварительными данными о вероятности благоприятной и неблагоприятной конъюнктуре рынка. Таким образом, если прогноз будет заказан, ожидаемый выигрыш составит ОВ = 116400´0.55 + 12400´0.45 = =59200долл. После уплаты за прогноз 10000долл. остается 49200 долл., что больше, чем в случае, когда прогноз не заказывается.
Анализируя дерево решений, можно сделать следующие выводы:
• необходимо проводить дополнительное исследование конъюнктуры рынка, поскольку это позволяет существенно уточнить принимаемое решение и увеличить ожидаемую прибыль;
• если фирма прогнозирует благоприятную ситуацию на рынке, то целесообразно строить большое предприятие (ожидаемая максимальная прибыль 116 400 долл.), если прогноз неблагоприятный — малое (ожидаемая максимальная прибыль 12 400 долл.).
Руководство компании может определить для себя ожидаемую ценность информации. Это величина равна разности между ожидаемым выигрышем в случае, когда прогноз будет заказываться и ожидаемым выигрышем без прогноза. В примере эта величина равна 59200 – 46000 = 13200, что больше платы за информацию. Если бы плата была больше ожидаемой ценности информации, то по такой цене эту информацию не имело бы смысла покупать.
3. Примеры решения задач
Здесь будут рассмотрены задачи на составление модели операции и оценку эффективности стратегии.
Составление модели операции состоит в определении множества Х— стратегий ОС, множества Y— неопределенных факторов, множества Z и функции распределения (z) случайных факторов z и в определении критерия операции f(x, у, z) исходя из цели операции.
Задача 1
Скорость движения машин в автомобильном туннеле не превышает 50 км/ч и связана с плотностью потока ( количеством машин на километр дороги ) Р следующим эмпирическим соотношением
Р = , где v0 = 60 км/ч, a z— случайная величина, которая в любой момент определяется отношением грузовых и легковых машин, проходящих через туннель. Известно, что величина z распределена равномерно на отрезке [0.5;1]. Регулировка движения в туннеле производится выбором скорости движения v. За проезд по туннелю с легковой машины взимается плата денежных единиц, а с грузовой — (0<<). Цель операции состоит в получении максимальной платы за 1 час работы туннеля. Требуется составить математическую модель операции и определить оценку эффективности произвольной стратегии ОС.
Решение. Контролируемым фактором х является скорость движения v по туннелю. Множество X контролируемых факторов по условию задачи определяется соотношением
X={x: 0x50}.
Неконтролируемым фактором является случайная величина zZ =[0.5;1] с равномерным законом распределения:
Неопределенных неконтролируемых факторов нет (Y= ).
Критерием операции является количество денег, полученных в течение часа. Так как плата взимается при въезде в туннель, то для определения этой величины найдем количество С(x,z) машин, въезжающих в туннель за один час, при заданных величинах (х, z).
С(x, z)=xP=
Найдем, сколько среди них грузовых и легковых. Так как
z=,
где — количество грузовых машин, a g — количество легковых машин, то
g= ; =
Следовательно:
f(x, z): .
Итак, все компоненты математической модели {X, Y, (Z,(z)), f} определены.
Оценим эффективность произвольной стратегии х. Рассмотрим только два критерия эффективности:
1) критерий ожидаемого значения, т. е. ОС допускает осреднение;