八、风险型与不确定型决策
王国华
E-mail: g***ng@
目录
概念
不确定型决策
风险型决策
决策函数
决策问题构成要素 ,为了表述决策问题
收益函数、损失函数和效用函数统称为决
策函数 ——记作 f = F(a,θ)
收益矩阵、损失矩阵和效用矩阵统称为决
策矩阵——记作
收益函数
把收益值作为决策方案的评价指标,最满
意方案就是收益值最大的方案。
设决策问题的收益值为q,状态变量为θ,
决策变量(方案或策略)为a。当决策变
量a和状态变量θ确定后,收益值q随之确
定。收益值q是a和θ的函数,称为收益函
数,记作 q = Q ( a ,θ)
收益函数
如果决策变量和状态变量是离散的,即
a = ai ( i = 1 , 2 ,…, m )
θ=θj ( j = 1 , 2,…, n ) ,
则收益函数可以表示为: qij = Q ( ai , θj ) ,(
i = 1 , 2 ,…, m;j = 1 , 2,…, n )
收益矩阵
损失函数
损失值又称为遗憾值,表示没有采取最
满意方案或策略时所造成的损失。
当决策变量a和状态变量θ确定后,损失
值r是a和θ的函数,称为损失函数,记
作 r = R ( a ,θ)
在离散情况下,损失值可以表示为
rij = R ( ai , θj ) ( i = 1 , 2 ,…, m;j = 1 , 2,…, n
)
损失函数
损失函数可以表示为损失矩阵,即
损失值可以通过收益值计算出来,计算公
式为
( i = 1 , 2 ,…, m;j = 1 , 2,…, n )
损失函数
损失值rij表示在状态θj的条件下,没有采
取收益值最大方案,“舍优取劣”给决策
带来的损失或遗憾。
一般地,损失函数和收益函数有如下关系
:
举例
收益矩阵
利用公式
求解损失矩阵
效用(utility)
在经济学中,效用是指商品和劳务满足人
的欲望或需要的能力。
在决策中,效用描述可行方案的各种结果
值满足决策者愿望,实现决策者偏好程度
的问题。
效用因人、因时、因地而不相同。
效用的定义
设决策问题的各可行方案有多种可能的结
果值o,依据决策者的主观愿望和价值倾
向,每个结果值对决策者均有不同的值和
作用。反映结果值o对决策者价值和作用
大小的量值称为效用,记作
u=u(o)
效用定义的说明
在决策理论中,效用是概念,反映决策方
案的结果值满足和实现决策者愿望和倾向
的程度。
效用也是量值,可以用具体的方法测定,
并作为决策分析的依据。
决策表
随机型决策分析
存在两个或两个以上自然状态的决策问题,
每一行动方案对应着多个不同的结果,概
率分布可能是已知,也可能是未知。
概率分布倘若已知,经过预测或估算可以
被确定下来,则称为风险型决策。
概率分布若未知,则称为不确定型决策。
不确定型决策分析
不确定型决策问题行动方案的结果值出现
的概率无法估算,决策者根据自己的主观
倾向进行决策,不同的主观态度建立不同
的评价和决策准则。
根据不同的决策准则,选出的最优方案也
可能是不同的。
目录
概念
不确定型决策
风险型决策
不确定型决策分析
设决策问题的决策矩阵为
这里,每种自然状态θj(j=1,2,3,
…,n)出现的概率P(θj)
是未知的。
如何根据不同方案在各状态下的条件结果值oij,确定决
策者最满意行动方案?下面介绍几种常用决策准则。
乐观准则(max-max准则)
基本思路是:假设每个行动方案总是出现
最好的条件结果,即条件收益值最大或条
件损失值最小,那么最满意的行动方案就
是所有oij中最好的条件结果对应的方案。
具体步骤:
根据决策矩阵选出每个方案的最优结果值
在这些最优结果值中选择一个最优者,所对
应的方案就是最优方案。
乐观准则
上述最优结果值是指最大收益值或最大效
用值。在某些情况下,条件结果值是损失
值,最优结果则是指最小损失值。
设方案ai的最大收益值为
则乐观准则的最满意方案a*应满足
乐观准则实质
持乐观准则的决策者在各方案可能出现的
结果情况不明时,采取好中取好 的乐观
态度,选择最满意的决策方案。
由于决策者过于乐观,一切从最好的情况
考虑,难免冒较大的风险。
乐观准则举例
某企业拟定了三个生产方案,方案一(a1)为
新建两条生产线,方案二(a2)为新建一条生产
线,方案三(a3)为扩建原有生产线,改进老
产品。在市场预测的基础上,估算了各个方案
在市场需求的不同情况下的条件收益值如表
(净现值,单位:万元),但市场不同需求状
态的概率未能测定,试用乐观准则对此问题进
行决策分析。
例题——收益值表及决策矩阵
下例
解题步骤
各方案的最优结果值为
最满意方案a*满足
a*=a1为最满意方案
悲观准则(max-min准则)
悲观准则也称保守准则,其基本思路是假
设各行动方案总是出现最坏的可能结果值,
这些最坏结果中的最好者所对应的行动方
案为最满意方案。
具体步骤
根据决策矩阵选出每个方案的最小条件结果值
从这些最小值中挑一个最大者,所对应的方案就是
最满意方案
悲观准则
设方案的最小收益值为
悲观准则的最满意方案应满足
悲观准则实质
持悲观准则的决策者往往经济实力单薄,
当各状态出现的概率不清楚时,态度谨慎
保守,充分考虑最坏的可能性,采取坏中
取好 的策略,以避免冒较大的风险。
悲观准则举例
上例中的决策问题用悲观准则进行决策分
析。
最满意方案a*满足
即a*=a3为最满意方案
折衷准则
乐观准则和悲观准则对自然状态的假设都过于
极端。折衷准则既非完全乐观,也非完全悲观。
折衷准则基本思路是假设各行动方案既不会出
现最好的条件结果值,也不会出现最坏的条件
结果值,而是出现最好结果值与最坏结果值之
间的某个折衷值,再从各方案的折衷值中选出
一个最大者,对应的方案即为最满意方案。
折衷准则的决策步骤
取定乐观系数α(0≤α≤1),计算各方案
的折衷值,方案ai的折衷值记为h(ai),即
从各方案的折衷值中选出最大者,其对应
的方案就是最满意方案,即折衷准则最满
意方案满足
乐观系数
α由决策者主观估计而确定。
当α=1时,就是乐观准则;
当α=0时,就是悲观准则。
折衷准则中的α一般假定为0<α<1。
折衷准则举例
上例中的决策问题用折衷准则进行决策分析。
取乐观系数α=1/3,各方案的折衷值为
最满意方案a*满足
即a*=a2为最满意方案
遗憾准则(min-max准则)
遗憾准则也称为最小遗憾值准则或最小机
会损失准则。
遗憾准则的基本思路是,假设各方案总是
出现遗憾值最大的情况,从中选择遗憾值
最小的方案作为最满意方案。
通常,人们在选择方案的过程中,如果舍
优取劣,就会感到遗憾。
遗憾值
所谓遗憾值,就是在一定的自然状态下没
有取到最好的方案而带来的机会损失。
设在状态θj下选择了方案ai,这时得到条
件收益值qij,则方案ai在状态θj下的遗憾
值rij(或称收益值qij的遗憾值)为
遗憾准则决策步骤
计算在各方案在每种状态下的遗憾值rij
(即机会损失值)
找出各方案的最大遗憾值,即
在各方案的最大遗憾值中取最小值,对应
的方案为最满意方案。即最满意方案a*满
足
遗憾准则举例
上例中的决策问题用遗憾准则进行决策分析。
计算各方案在每种状态下的遗憾值,得遗憾值
矩阵
各方案的最大遗憾值如右:
最满意方案a*满足
即a*=a2为最满意方案
等可能性准则(Laplace准则)
19世纪数学家拉普拉斯(Laplace)提出
来,因此又称为拉普拉斯准则。
这个准则认为,在各自然状态发生的可能
性不清楚的时候,只能认为各状态发生的
概率相等,按相等的概率求出各方案条件
收益的期望值(或期望效用值),最大期
望值对应的方案即是最满意方案。
等可能性准则决策步骤
假定各自然状态出现的概率相等,即
p(θ1)= p(θ2)=
…= p(θn)=1/n
求各方案条件收益期望值或期望效用值
从各方案的条件收益期望值中找出最大者,
或找出期望效用值最大者,所对应的a*为
最满意方案,即a*满足
等可能性准则举例
上例中决策问题用等可能性准则进行决策。
按等可能性准则,各状态发生的概率设为1/3
各方案条件收益的期望值为:
最满意方案a*满足
即a*=a1为最满意方案
不同的决策准则解题比较
在应用多种方法分析之后,一般会发现某
些方案一直未曾入选或被选中的频数相对
较小,可将这样的方案先淘汰掉,再作进
一步分析。
例题中方案a3被选中的频数最低,淘汰。
目录
概念
不确定型决策
风险型决策
风险型决策
各自然状态的概率经过预测或估算被确定
下来,在此基础之上的决策分析所得到的
最满意方案就具有一定的稳定性。
只要状态概率的测算切合实际,风险型决
策方法相对于不确定型决策方法就更为可
靠。
风险型决策分析最主要的决策准则是期望
值准则
风险型决策一般条件
存在着决策者希望达到的目标(如收益最大或
损失最小)
存在着两个或两个以上的方案可供选择
存在着两个或两个以上不以决策者主观意志为
转移的自然状态(如不同的市场条件)
可以计算出不同的方案在不同自然状态下的损
益值
在可能出现的不同自然状态中,决策者不能肯
定未来将出现哪种状态,但能确定每种状态出
现的概率
单目标风险型决策问题的表示
设单目标风险型决策问题的可行方案为a1,a2,
…,am,自然
状态为θ1, θ2,
…, θn,且θj 的概率分布是已知的,
p(θj)=pj (j=1,2,
…,n),各可行方案在不同自然状态下的
条件结果值为oij (i=1,2,
…,m ; j=1,2,…,n)。当方案的个
数和状态的个数皆为有限数时,该问题可表示为决策表
或决策矩阵
期望值准则
期望值准则是指根据各方案的条件结果值
的期望值的大小进行决策。
当条件结果值表示费用,应选期望值最小
的方案,当条件结果值表示收益或效用,
则应选期望值最大的方案。
在实际应用中,风险型决策问题的期望值
准则评价模型有三种情况。
期望效用值评价模型
经过效用标准测定法测算,得到决策者的
效用函数为u=u(x)
由决策矩阵可以求出各条件结果值的效用
值uij=u(oij) (i=1,2,…,m ; j=1,2,…,n)
全部效用值构成效用值矩阵
期望效用值评价
各方案的期望效用值记为
期望效用值hi表示了各方案的优劣程度,
hi越大,方案ai越令人满意,这种表示方
案令人满意程度的指标,称为合意度。
可行方案的优劣排序问题,就可以用各方
案的合意度的大小来表示,求解决策问题,
就是寻找合意度最大的方案。
即
期望结果值评价模型
直接按条件结果期望值的排序来选择最满
意方案,这就是期望结果值评价模型。
当条件结果为条件收益 时,条件结果期
望值最大的方案就是最满意方案 。
当条件结果的条件损失 时,则条件结果
期望值最小的方案为最满意方案。
重复性风险决策
期望结果值评价模型一般应用于重复型风
险决策。
在市场相对稳定的情况下,厂家对产品生
产量的决策,既要保证销售渠道畅通,又
要力求生产相对稳定,一旦作出决策,就
要重复实施多次。
效用曲线是直线型的,合意度的排序与条
件结果期望值的排序是一致的。
考虑时间因素期望值评价模型
在投资决策等问题中,由于方案涉及的时
间周期较长,投资额较大,每一方案在寿
命期的不同时期内的损益情况也在发生着
变化,这就是需要考虑资金的时间价值,
必然涉及到这个方案在各个不同时期的条
件收益。这就是考虑时间因素的期望值准
则评价模型 。
模型决策表
第t时期(t=1,2, …,N;
N为方案寿命期)的决
策表
表示第t时期方案
ai在自然状态θj下的条
件收益 ; 表示第t
时期自然状态θj出现
的概率。
评价模型步骤
计算第t时期方案ai的期
望收益 :
用净现值作为标准,方
案ai总期望收益:
其中,NPV(ai)为方案ai
期望净现值,k为折现
率,Foi为方案ai全部投
资支出的现值总额。
评价模型步骤
最满意方案应满足
其中a*表示最满意方案。
例题
我国某公司与国外一家厂商签订明年的经销协议。如果出口A型机
床,则明年可以稳获利800万元;如果出口另一种B型机床;根据
国际市场需求情况有三种可能:当国际市场需求量高时,可以获利
2500万元;当国际市场需求量一般时,可获利900万元;当国际市
场不景气而滞销时,就会因积压而亏损500万元。根据各方面获得
的信息,预测明年国际市场需求量大的可能性为,需求量一般
的可能性为。公司决策者认为,亏损500万元风险太大,打算放
弃出口B型机床。外商又提出另一种方案,出口C型机床,在国际市
场畅销和一般情况时,可分别获利1500万元和850万元,在滞销的
情况下,可以稍加改制作为其他加工机械销售,仍可获利120万元。
上述情况,除第一方案外,其余两方案均有较大利润而又要承担一
定的风险。试对此问题进行决策分析。
期望值准则评价模型应用实例
假设利用标准效用测定法,得到该公司决策者
效用函数为:
(0≤x ≤1 )
该问题是风险型决策,解题步骤如下:
可行方案有三个
a1: 出口A型机床
a2: 出口B型机床
a3: 出口C型机床
例题解答
自然状态及其概率为
θ1: 国际市场畅销, p(θ1)=
θ2: 国际市场一般, p(θ2)=
θ3: 国际市场滞销, p(θ3)=
决策矩阵
例题解答
对决策矩阵进行归一化处理
+500
/3000
例题解答
根据效用函数
由效用函数求得各效用值
例题解答
由状态概率向量P=(,,)T 得
各方案的合意度为
h1=×+×+×=
h2=, h3=
最满意方案是a1,即出口A型机床。
例题
某报社编辑发行一种晚报,长期以来发行量为15
万份。近来实行改革,推行经济承包责任制,为
提高报社经济效益,对晚报发行量进行决策分析。
经过销售调查,在过去100天的统计资料中,售完
15万份仅12天,其余销售情况是,有20天销售约
14万份,30天销售约13万份,25天销售约12万份
,13天销售约11万份.晚报每份可赚元利润,
如果销售不出去,则有元的成本损失。试分
析该报社晚报发行量多少时,才能获得最佳经济
效益。
例题解答
根据已知条件,这是风险型决策问题。由于发行
量一经确定,在一段时间内将按此发行量发行,
故又是重复性决策。可行方案有五个,即
a1: 发行15万份
a2: 发行14万份
a3: 发行13万份
a4: 发行12万份
a5: 发行11万份
例题解答
该晚报发行销售状态有五种,其状态概率
分别为
θ1: 销售15万份, p(θ1)=
θ2: 销售14万份, p(θ2)=
θ3: 销售13万份, p(θ3)=
θ4: 销售12万份, p(θ4)=
θ5: 销售11万份, p(θ5)=
例题解答
方案ai在状态θj下的条件收益(净利润)为
qij=ai在θj下的销售份数× -
ai在θj下的未销售份数×
如:q11=150000 × - 0 × =7500(元)
同样,可以计算出其他的条件收益值。
得到如下决策矩阵
例题解答
销售状态概率向量为
P=(,,,,)T
例题解答
根据期望值公式
得到:条件结果期望值向量
Q=(1290,3430,4970,5610,5500)T
最满意方案为a*=a4,即发行量为12万份。
此时该报社平均每天获利为5610元,其经济效
益大大超过按固定发行量15万份的平均获利
1290元。
状态优势
如果在所有状态下,方案ai的条件收益值
不小于方案aj的条件收益值,
即qik≥qjk(k=1,2,
…,n)
则称方案ai按状态优于方案aj。
在方案决策时可以将劣方案aj先淘汰掉。
概率优势法则
按概率优势是与按状态优势相对而言的
如果方案ai的条件收益值不小于任一实数
的概率,大于或等于方案aj的条件收益值
不小于同一实数的概率,则称方案ai按概
率优于方案aj。
概率语言描述
设方案ai的收益为qi,x是任意实数
称Ri(x)=P(qi≥x),(i=1,2,
…,n)为方案ai的风
险分布函数。
如果Ri(x) ≥Rj(x),(i≠j)对一切的x都成立,
并且至少有一个x,使得Ri(x) >Rj(x),则称
方案ai按概率优于方案aj。
概率优势法则
在决策中,方案ai与方案aj之间存在按概
率优势关系,则保留按概率处于优势的方
案,淘汰按概率处于劣势的方案。若任意
两个方案之间都存在按概率优势关系,则
最满意方案就是对其他所有方案都具有按
概率优势的方案。
举例
注意到方案a3按状态劣于方案a1,首先淘
汰掉。
举例
计算方案a1和方案a2的风险分布函数
举例
比较R1(x) 和R2(x) ,显然
R1(x) ≥R2(x),对一切的x都成立。
并且存在x,使得R1(x) >R2(x) 。
因此,根据概率优势法则,方案a1按概率
优于方案a2。
状态优势与概率优势
如果一个方案a按状态优于另一个方案a’
,则a必定按概率优于a’;
反之,一个方案a按概率优于另一个方案
a’,则a不一定按状态优于a’。
注意:并非任意两个方案之间都存在按概
率优势关系,也就是说,概率优势法则在
应用对象上存在一定的局限性。
μ – σ 法则的引入
风险型决策分析的期望值评价准则的判据
是方案条件结果的期望值或期望效用值,
这一准则只考虑了方案的收益性,仅从收
益这一个方面来对各方案进行排序选优。
然而实际情况是,任何方案都要冒收益不
确定的风险。
在评价方案的优劣时,只考虑收益的因素
而忽略风险的因素是不合理的。
μ – σ 法则的基本思路
μ-σ法则的基本思路是:在评价一个行动
方案时,不仅考虑方案可能带来的期望收
益值,同时也明确考虑代表风险的条件收
益的方差。
举例
若用期望值准则进行决策,由于
则两方案是等价的。
举例(续)
但对于厌恶风险的决策者来讲,显然更偏爱方
案a2,因为方案a1获得大额收益的可能性只有
20%,而发生亏损的可能性却是80%,而方案a2
是稳赚不赔的。
计算两方案条件收益的方差,得
说明方案a2的条件收益q2更加集中于它的均值附
近,而方案a1的条件收益q1取值较为分散,或具
有较大的波动性。
完全信息的价值
在风险型决策问题中,信息不完全时,一
旦确定了最满意方案为a*,则不论出现何
种自然状态,总是执行方案a*。若信息是
完全的,决策者在任何自然状态下都能根
据他所掌握的信息采取最有利的行动。这
时决策者所获得的收益要大于信息不完全
时所获得的最大收益,两者的差额就是完
全信息的价值。
完全信息价值的数学描述
最满意方案的条件收益期望值
利用完全信息的条件收益期望值
风险型决策完全信息的价值
举例
某个体商贩夏季经销品种为雪糕和面包。
卖雪糕晴天每天可获利50元,雨天只能获
利5元;卖面包晴天每天可获利15元,雨
天可获利30元。已知该季节晴天的概率为
,雨天的概率为。试计算完全信息
的价值。
此为重复性风险型决策,利用期望结果值
评价模型。
举例
解题
卖雪糕,其期望利润值
卖面包,其期望利润值
最满意方案为卖雪糕
如果商贩掌握了完全信息,
晴天卖雪糕,雨天卖面包,
期望利润值为
完全信息的价值是
谢谢观赏
WPS Office
Make Presentation much more fun
@WPS官方微博
@kingsoftwps