3- 1
第三章 效用、损失和风险
(Utility,Loss and Risk)
§3—1 效用的定义和公理系统
一、引言
·为什么要引入效用
决策问题的特点:自然状态不确定——以概率表示;
后果价值待定: 以效用度量。
1.无形后果,非数字量(如信誉、威信、出门带伞问题的后果)需以数值度量;
2.即使是数值量(例如货币)表示的后果,其价值仍有待确定,后果的价值因人而异。
例一:同是100元钱,对穷人和百万富翁的价值绝然不同;对同一个人,身无分文时的100
元,与已有10000元再增加100元的作用不同,这是钱的边缘价值问题。
例二:
上图作为商业、经营中实际问题的数学模型有普遍意义
有人认为打赌不如礼品,即
*由上面两个例子可知:在进行决策分析时,存在如何描述(表达)后果的实际价值,以便反
映决策的人偏好次序(preference order)的问题
*偏好次序是决策人的个性与价值观的反映,与决策人所处的社会、经济地位,文化素养,
心理和生理(身体)状态有关。
* 除风险偏好之外,还时间偏好。 i, 折扣率 ii,其他
而效用(Utility)就是偏好的量化,是数(实值函数).
Daniel Bernoulli 在1738年指出:
若一个人面临从给定行动集(风险性展望集)中作选择的决策问题,如果他知道与给定行动
有关的将来的自然状态,且这些状态出现的概率已知或可以估计,则他应选择对各种可能
后果的偏好的期望值最高的行动。
二、效用的定义
礼品
抽奖
1
1000元
0
2500元
1000元 优于
0
2500元
3- 2
1.符号
i,A∈B(即APB)读作A优于B:(Prefer(ed) A to B)
A∈B(即ARB) A不劣于B
A~B(即AIB) A无差别于B (Indifference)
ii, 展望(prospect): 可能的前景
即各种后果及后果出现概率的组合
P=( … … )
既考虑各种后果 (consequence)
又考虑了各种后果的概率(probability or likelihood)分布
所有P的集合记作p
iii,抽奖(lottery)与确定当量
若 ∈ ( ; )
则称 确定性后果 为抽奖 ( ; ) 的确定当量
2.效用的定义(A)
在集合p上的实值函数u,若它和p上的优先关系∈一致,即:
若 p , ∈ iff u( )≥u( )
则称u为效用函数
三、效用存在性公理 理性行为公理
Von Neumann-Morenstern, [169]
·公理1 连通性 (Connectivity)又称可比性
p, 则 ∈ or ∈ or ∈
·公理2 传递性 (Transitivity)
p, 若 ∈ , ∈ 则 ∈
·公理3 替代性公理 ( 加等量时优先关系不变)
若 p, ∈ 且 0 ∈ ∈ ∈ 1
则 对任何 ∈p ,必有 ∈ +(1-∈) ∈∈ +(1-∈)
或者表达成: ∈ ,∈∈∈ 则 ∈ +(1-∈) ∈ ∈ +(1-∈)
即二种后果中,决策人所偏好的后果出现机会较大的情况是决策人所喜爱的。
·公理4 连续性公理 ---- 偏好的有界性
若 ∈ ∈ 则 存在 0∈∈∈1, 0∈∈∈1, ∈∈∈
使 ∈ +(1-∈) ∈ ∈ ∈ +(1-∈)
由 ∈ +(1-∈) ∈ 可知 不是无穷劣,即 u( )∈∈
由 ∈ ∈ +(1-∈) 可知 不是无穷优, 即 u( )∈ ∈
即使是死亡,亦不至于无穷劣
例:i,过马路
3- 3
若死亡为无穷劣,则不能过马路
ii,狂犬病疫苗
上述公理看来是合乎理性的,事实上并不尽然.
例:Allais 悖论(Paradox 〕
例如,Allais在一次学术会议上提出如下问题,请效用理论权威Svage回答
Savage的回答是A组宁择i,
B组宁择ii,
i.
A
B
i.
ii.
ii.
$2,500,000
$500,000
$500,000
$0$0$0$0$0$0
$0
$0
$500,000$500,000
$2,500,000
.89
.1
.01
.11
.89
.1
.9
1
10 7
无法到
目的地
不过
过
死亡
到目的地
1
10 6
注射
不注射
20 元
死亡
生存
3- 4
Allais指出:B组的i, ii, 均以的$500,000 取代的
$0,即与A组的i,ii,相对应,照公理3、A、B两组中i,ii,的优先关系应当不变。
Savage当时语塞。
·效用的公理化定义
在上述公理系统中,若p上存在实值函数u,使
i, ∈ 当且仅当 u( ) >u( )
ii. u(α, ; 1-α, )= αu( ) +(1-α)u( )
iii, 对满足上述条件的 , 必有 ( ) =b ( )+c , 其中 b, c ∈ , b>0
则u(P)称为(基数)效用函数
*关于线性:将ii. u(α, ; 1-α, )= αu( ) +(1-α)u( ) 推广到一般,
若 ∈p ; ≥0 , i=1,2,…m; =1; 则 u( )= u( )
四、基数效用与序数效用 (Cardinal & Ordinal Utility)
基数:实数:1,2,3,π
序数:第一,二,…,4,3,2,1
·区别:
1.基数效用定义在展望集p上(考虑后果及其概率分布),是实数;
序数效用定义在后果集C上,不涉及概率,可以是整正数
2.基数效用反映偏好强度:(正线性变换下唯一)
原数列可变换为:b+c, 2b+c, 3b+c, πb+c; 其中 b, c ∈ , b>0.
而序数效用不反映偏好强度,(保序变换下唯一), 原序数列可变换为
16,9,4,1;或 8,6,4,2,或10,7,6,1等.
·序数效用的存在性公理
1.连通性(可比)
2.传递性
3.对任何确定的后果x,优势集与劣势集均为闭集。(教材:P29 §)
§ 效用函数的构造
一、离散型的概率分布
后果元素有限
·各后果效用设定的步骤 NM法
由公理4: 若 ∈ ∈ ,则可找到 0<α<1, 使 ∈α +(1-α)
第一步:
选定 , ∈ C , 使 ∈
令 u( )=0, u( )=1
所选择的 、 应使比较易于进行.
第二步:对 ∈ ∈ ,求α(0<α<1), 使 ∈α +(1-α)
则 u( )=u(α +(1-α) )= αu( )+(1-α)u( )
第三步:若 ∈ , 求α(0<α<1), 使 ∈α +(1-α)
则u( )=u(α +(1-α) )=αu( )+(1-α)u( )
∈ u( )=α/(α-1)
第四步:若 ∈ , 求α(0<α<1), 使 ∈α +(1-α)
则u( )=u(α +(1-α) )= αu( )
∈ u( )=1/α
第五步:一致性校验
pi p j pi p j
pi p j pi p j
u1 u2 u1 pi u2 pi R
1
pi p j pi p j
pi i i
i
i
m
1
i pi
i
m
1
i pi
3- 5
设 ∈ ∈ 且 , , 已知,
由 ∈α +(1-α) 求得u’( )
若 u’( ) 与已知的 u( ) 不符,则反复进行二、三、四步,直到一致性校验通过.
例
设 ∈ ∈ ∈
一、u( )=0, u( )=1
二、 ∈ + u( )=
三、 ∈ + u ( )=
校验 设 ∈ + u’( )=≠
重复二、三、若u ( ) 不变 u ( )= 则通过校验.
二、连续型后果集
·当C为连续变量时,u(c)是光滑的,因此可分段构造,求特征点的效用,再连成光滑曲线
例1.每天学习时间的效用曲线
在10~12小时/日 处 效用最大
8小时/日处效率最高(效用/小时)
例2.见讲义P31之例
·注意:效用的唯一性(在正线性变换下唯一)使效用的值域为整个实轴,而不必限于[0,1]
§ 风险与效用
一、效用函数包含的内容
1.对风险的态度
a2
a1
c1
c2
c3 ( )1
( )2
( )1
( )2
下雨看球
无雨看球
下雨看电视
c4 无雨看电视
3- 6
风险厌恶(Risk Aversion)
风险中立(Risk Neutralness)
风险追求(Risk Proneness) 即有冒险倾向
以上是初期对风险的解释(Pratt C.,)
2.对后果的偏好强度
钱的边缘价值:设某人现有积蓄为0,增加800地的作用(价值)与有了800元后再加1200元相
等,则此人的财富的价值函数是凹函数。
若他认为800元∈(,0; ,2000),
则与其说此人是风险厌恶不如说他是相对风险中立。为此有必要对确定性后果的偏好强度
加以量化。
3.效用表示时间偏好十分复杂,我们在第八章再介绍。
二、可测价值函数
——确定性后果偏好强度的量化
定义:
在后果空间X上的实值函数v,对ω,x, y, z∈X有
i, ωx∈yz当且仅当υ(ω)-υ(x)≥υ(y)-υ(z), 且
ii, v对正线性变换是唯一确定的。
则称υ为可测价值函数
说明:i,ωx∈yz表示ω,x之间偏好强度之差超过y,z之间偏好强度之差,
3- 7
ii,由定义之ii,可测价值函数具有基数性质但与基数效用不同:VF不反映DMer的风险态度
。
iii,它定在后果空间上,能起序数效用的作用但又与OUF不同:能反映后果的偏好强度.
三、相对风险态度
设 效用函数u和测价值函数v在X上都是单调递增,且连续二次可微。
1.风险的局部测度
∈ > 0 u在x 处凹, 风险厌恶
r(x)=-u”(x)/u’(x) ∈ = 0 u在x 处线性, 风险中立
∈ < 0 u在x 处凸, 风险追求
2.偏好强度的局部测度
>0 在x处有递减的边缘价值
m(x)=-v”(x)/v’(x)=0 在x处有不变的边缘价值
<0 在x处有递增的边缘价值
3.真正的(相对)风险态度的定义
若m(x)<r(x)称为在X'区内相对风险厌恶
m(x)=r(x)称为在X'内相对风险中立
m(x)=r(x)称为在X'内相对风险追求
四、风险酬金
k∈E(x)-S
这是决策人为了避免风险而顾意损失的金额
k=f(v,P)
五、钱的效用
1.性质
3- 8
i, 单调递增:愈多愈好
有界:全世界财富总量不足$ , u( )与u( )几乎无差异
ii, x较小(相对于决策人资产而言)时,u(x)近乎线性
iii, x>0时u(x)通常是凹的 递减的边缘价值
风险厌恶
x>0与x<0的形状不同, 负债较多有追求风险的倾向.
2.钱的效用曲线的构成
设某人现有1000元存款(某商店有资产10万,企业有1000万等等)
i, NM法(见§)
利用 ~ α +(1-α)
ii,修正的NM法
利用 ~ +
例: 设u(0)=0), u(1000)=1
有300~<0>+<1000> u(300)=
又125~<0>+<100> u(125)=
550~<300>+<1000> u(550)=
由0~<a>+<500>
设 a=-250
则u(-250)=-u(500)=
-250~<b>+<0>
原因:i,价值函数是S型
ii,在一定范围内相对风险态度不变
iii,负债到一定程度以上有冒险倾向
Friedmann-Savage 效用曲线:
3- 9
§ 损失、风险和贝叶斯风险
一、损失函数L
有些文献采用损失函数进行分析
∈u(c)=u(θ,a)
∈l(θ,a)∈-u(θ,a) 则损失函数与效用作用相同
为了使损失值非负,可取
l(θ,a)= u(θ,a)-u(θ,a)
二、风险函数
自然状态集 Θ -----参数空间
行动集 A -----决策空间
观察值集 X -----测度空间
决策规则 δ:x→a , , Δ为策略空间
损失l(θ,a)=l(θ,δ(x))
由于X是随机变量,对给定的θ,采用决策规则δ时定义风险函数
R(θ,δ)= [ l(θ,δ(x))]
= l(θ,δ(x)) ]f (x |θ) dx 或 l(θ,δ(x)) p (x |θ)
三、贝叶斯风险
r(π,δ)∈EπR(θ,δ)
含义:θ的先验分布为π,决策规则为δ时风险函数的期望值叫贝叶斯风险
即: r(π,δ)= R(θ,δ)
= l(θ,δ(x)) f (x |θ) dx ] π(θ) dθ
或 l(θ,δ(x)) p (x |θ) π(θ)
Aa
SupSup