第三章 效用函数
§3—1 效用的定义和公理系统
一、引言
·为什么要引入效用
决策问题的特点:自然状态不确定——以主观概率表示;
后果价值待定——以效用度量。
1. 无形后果,非数字量(如信誉、威信、出门带伞问题的后果)需以数值度量;
2. 即使是数值量(例如货币)表示的后果,其价值仍有待确定,后果的价值因人而异。
例一:同是 100 元钱,对穷人和百万富翁的价值绝然不同;对同一个人,身无分文时的 100
元,与已有 10000 元再增加 100 元的作用不同,这是钱的边际价值问题。
例二:
上图作为商业、经营中实际问题的数学模型有普遍意义。
有人认为打赌不如礼品,即
*由上面两个例子可知:在进行决策分析时,存在如何描述(表达)后果的实际价值,以便反
映决策人偏好次序(preference order)的问题
*偏好次序是决策人的个性与价值观的反映,与决策人所处的社会、经济地位,文化素养,
心理和生理(身体)状态有关。如工资/工作时间权衡,年龄对带伞与否的影响。
* 除风险偏好之外,还有时间偏好。i. 折扣率;ii. 其他。
礼品
抽奖
1
1000元
0
2500元
1000元 优于
0
2500元
而效用(Utility)就是偏好的量化,是数(实值函数)。
Daniel Bernoulli 在 1738 年指出:
“若一个人面临从给定行动集(风险性展望集)中作选择的决策问题,如果他知道与给定行动
有关的将来的自然状态,且这些状态出现的概率已知或可以估计,则他应选择各种可能后果
中偏好期望值最高的行动。”
二、效用的定义
1.符号
i. a∈b (即 aPb)读作“a 优于 b”(a is preferred to b)。∈:严格序
a∈b (即 aRb) “a 不劣于 b”。∈:弱序
a~b (即 aIb) “a 无差别于 b”(I: indifference)。~:无差异
ii. 展望 (prospect): 或称“预期”,可能的前景
即各种后果及后果出现概率的组合
P=( … … )
既考虑各种后果 (consequence)
又考虑了各种后果的概率 (probability or likelihood) 分布
复合展望
所有 P 的集合记作 p
iii. 抽奖 (lottery) 与确定当量(certainty equivalent)
抽奖 L2=< ; >。
若 ∈ L2
则称 确定性后果 为抽奖 L2 的确定当量
2. 效用的定义(A)
在集合 p 上的实值函数 u,若它和 p 上的优先关系≥一致,即:
若 p , ≥ 当且仅当 u( )≥u( )
则称 u 为效用函数
效用函数定义在展望集上,而非后果集上。
三、效用存在性公理(理性行为公理)
Von Neumann-Morgenstern, 1944
p c1 1, ; ; , ;p ci i p cn n,
1. 0
C 3
C1
C 2p
1- p
p C, 2 ( ),1 3 p C
C1
C1
21, PP 1P 2P 1P 2P
·公理 1 连通性 (Connectivity)又称可比性
p, 则 or ∈ or
·公理 2 传递性 (Transitivity)
p, 若 , 则
·公理 3 替代性公理 ( 加等量时优先关系不变)
若 p, 且 0 ∈ ∈ ∈ 1
则 对任何 ∈p ,必有 ∈ +(1-∈) ∈ +(1-∈)
或者表达成: ,∈∈∈ 则 ∈ +(1-∈) ∈ +(1-∈)
即二种后果中,决策人所偏好的后果出现机会较大的情况是决策人所喜爱的。
·公理 4 连续性公理 ---- 偏好的有界性
若 则 存在 0∈∈∈1, 0∈∈∈1, ∈∈∈
使 ∈ +(1-∈) ∈ +(1-∈)
由 ∈ +(1-∈) 可知 不是无穷劣,即 u( )∈∈
由 ∈ +(1-∈) 可知 不是无穷优, 即 u( )∈ ∈
即使是死亡,亦不至于无穷劣
例:i, 过马路
若死亡为无穷劣,则不能过马路
ii, 狂犬病疫苗
21, PP 1P 2P 1P 2P 1P 2P
321 ,, PPP 1P 2P 2P 3P 1P 3P
321 ,, PPP 1P 2P
3P 1P 3P p2 3P
1P 2P 1P 2P 1P 2P
1P 2P 3P
1P 3P 2P 1P 3P
1P 3P 2P 3P 3P
2P 1P 1P 1P
3P
1
10 7
无法到
目的地
不过
过
死亡
到目的地
1
10 6
注射
不注射
20 元
死亡
生存
上述公理看来是合乎理性的,事实上并不尽然.
例:Allais 悖论(Paradox 〕
例如,1953 年 Allais 在一次学术会议上提出如下问题,请效用理论权威 Savage 回答
Savage 的回答是 A 组宁择 i,
B 组宁择 ii,
Allais 指出:B 组的 i, ii, 均以 的$500,000 取代 的 $0,即与 A 组的 i, ii 相对应,
照公理 3、A、B 两组中 i,ii,的优先关系应当不变。
Savage 当时语塞。
·效用的公理化定义
在上述公理系统中,若 p 上存在实值函数 u,使
i. ∈ 当且仅当 u( ) >u( )
ii. u(α, ; 1-α, )= αu( ) +(1-α)u( )——线性性
iii. 对满足上述条件的 、 , 必有 ( ) =b ( )+c , 其中 b, c ∈ , b>0
则 u(P)称为(基数)效用函数
*关于线性:将 ii. u(α, ; 1-α, )= αu( ) +(1-α)u( ) 推广到一般,
若 ∈p ; ≥0 , i=1,2,…m; =1; 则 u( )= u( )
四、基数效用与序数效用 (Cardinal & Ordinal Utility)
i.
A
B
i.
ii.
ii.
$2,500,000
$500,000
$500,000
$0$0$0$0$0$0
$0
$0
$500,000$500,000
$2,500,000
.89
.1
.01
.11
.89
.1
.9
iP jP iP jP
iP jP iP jP
u1 u2 u1 iP u2 iP R
1
iP jP iP jP
iP i i
i
i
m
1
i iP
i
m
1
i iP
基数:实数:2,, 100……
序数:第 1,2,…
·区别:
1. 基数效用定义在展望集 p 上(考虑后果及其概率分布), 是实数;
序数效用定义在后果集 C 上,不涉及概率,可以是自然数
2. 基数效用反映偏好强度:(正线性变换下唯一)
原数列可变换为: b+c, 2b+c, 3b+c, πb+c; 其中 b, c ∈ , b>0.
而序数效用不反映偏好强度,(保序变换下唯一), 原序数列可变换为
16,9,4,1;或 8,6,4,2,或 10,7,6,1 等.
·序数效用的存在性公理
1.连通性(可比)
2.传递性
3.连续性:对任何确定的后果 x,优势集与劣势集均为闭集。(教材:P29 §)
§ 效用函数的构造
一、离散型的概率分布
后果元素有限
·各后果效用设定的步骤 NM 法(von Neumann-Morgenstern),也称概率当量法
由公理 4: 若 ∈ ∈ ,则可找到 0<α<1, 使 ∈α +(1-α)
第一步:
选定 , ∈ C , 使 ∈
令 u( )=0, u( )=1
所选择的 、 应使比较易于进行.
第二步:对 ∈ ∈ ,求α(0<α<1), 使 ∈α +(1-α)
则 u( )=u(α +(1-α) )= αu( )+(1-α)u( )
∈ u( )=α
第三步:若 ∈ ∈ , 求α(0<α<1), 使 ∈α +(1-α)
则 u( )=u(α +(1-α) )=αu( )+(1-α)u( )
∈ u( )=α/(α-1)
第四步:若 ∈ ∈ , 求α(0<α<1), 使 ∈α +(1-α)
则 u( )=u(α +(1-α) )= αu( )
∈ u( )=1/α
第五步:一致性校验
设 ∈ ∈ 且 , , 已知,( ∈ ∈ ∈ ∈ )
由 ∈α +(1-α) 求得 u’( )
若 u’( ) 与已知的 u( ) 不符,则反复进行二、三、四步,直到一致性校验通过.
R1
1P 2P 3P 2P 1P 3P
C1 C2 C2 C1
C1 C2
C1 C2
C2 C3 C1 C3 C2 C1
C3 C2 C1 C2 C1
C3
C4 C1 C2 C1 C2 C4
C1 C2 C4 C2 C4
C4
C5 C2 C1 C2 C5 C1
C2 C5 C1 C5
C5
C5 C3 C4 C5 C4 C3 C5 C2 C3 C1 C4
C3 C5 C4 C3
C3 C3
例
设 ∈ ∈ ∈
一、u( )=0, u( )=1
二、 ∈ + u( )=
三、 ∈ + u ( )=
校验 设 ∈ + u’( )=≠
重复二、三、若 u ( ) 不变 u ( )= 则通过校验.
二、连续型后果集
·当 C 为连续变量时,u(c)是光滑的,因此可分段构造,求特征点的效用,再连成光滑曲线
例 1.每天学习时间的效用曲线
在 10~12 小时/日 处 效用最大
8 小时/日处效率最高(效用/小时)
·注意:效用的唯一性(在正线性变换下唯一)使效用的值域为整个实轴,而不必限于[0,1]
§ 风险与效用
一、效用函数包含的内容
1.对风险的态度
a 2
a1
c1
c 2
c 3 ( )1
( )2
( )1
( )2
下雨看球
无雨看球
下雨看电视
c 4 无雨看电视
C2 C3 C4 C1
C1 C2
C3 C2 C1 C3
C4 C2 C1 C4
C3 C2 C4 C3
C3 C4
风险厌恶(Risk Aversion)
风险中立(Risk Neutrality)
风险追求(Risk Proneness/Seeking) 即有冒险倾向
以上是初期对风险的解释(Pratt C.,1964)
2.对后果的偏好强度
钱的边缘价值:设某人现有积蓄为 0,增加 1000 地的作用(价值)与有了 1000 元后再加
1500 元相等,则此人的财富的价值函数是凹函数。
若他认为 1000 元∈(,0; ,2500), 则与其说此人是风险厌恶不如说他是相对风险
中立。为此有必要对确定性后果的偏好强度加以量化。
3.效用表示时间偏好十分复杂,我们在第八章再介绍。
二、可测价值函数
——确定性后果偏好强度的量化
定义:
在后果空间 X 上的实值函数 v,对ω, x, y, z∈X 有
i, (ω∈x) ∈ (y∈z)当且仅当υ(ω)-υ(x)≥υ(y)-υ(z), 且
ii, υ对正线性变换是唯一确定的。
则称υ为可测价值函数
说明:i,(ω∈x) ∈ (y∈z)表示ω,x 之间偏好强度之差超过 y, z 之间偏好强度之差,
ii. 由定义之 ii,可测价值函数具有基数性质但与基数效用不同:VF 不反映决策人的
风险态度。
iii. 它定在后果空间上,能起序数效用的作用但又与 OUF 不同:能反映后果的偏好
强度.
三、相对风险态度
设 效用函数 u 和可测价值函数 v 在 X 上都是单调递增,且连续二次可微。
1.风险的局部测度
∈ > 0 u 在 x 处凹, 风险厌恶
r(x)=-u”(x)/u’(x) ∈ = 0 u 在 x 处线性, 风险中立
∈ < 0 u 在 x 处凸, 风险追求
2.偏好强度的局部测度
>0 在 x 处有递减的边际价值
m(x)=-v”(x)/v’(x)= 0 在 x 处有不变的边际价值
<0 在 x 处有递增的边际价值
3.真正的(相对)风险态度的定义
若 m(x)<r(x)称为在 X'区内相对风险厌恶
m(x)=r(x)称为在 X'内相对风险中立
m(x) >r(x)称为在 X'内相对风险追求
四、风险酬金
k=E(x)-S 这是决策人为了避免风险而愿意损失的金额
五、货币的效用
1. 性质
i. 单调递增:愈多愈好
有界:全世界财富总量不足$ , u( )与 u( )几乎无差异
ii. x 较小(相对于决策人资产而言)时, u(x)近乎线性
iii. x>0 时 u(x)通常是凹的 递减的边际价值
风险厌恶
x>0 与 x<0 的形状不同, 负债较多有追求风险的倾向.
2. 钱的效用曲线的构成
设某人现有 1000 元存款(某商店有资产 10 万,企业有 1000 万等等)
i. NM 法(见§)
利用 ~α +(1-α)
ii. 修正的 NM 法
利用 ~ +
例: 设 u(0)=0, u(1000)=1
有 300~<0>+<1000> u(300)=
又 125~<0>+<300> u(125)=
550~<300>+<1000> u(550)=
由 0~<a>+<500>
设 a=-250
则 u(-250)=-u(500)=
-250~<b>+<0>
原因:i,价值函数是 S 型
ii,在一定范围内相对风险态度不变
iii,负债到一定程度以上有冒险倾向
1016 10100 1090
x2 x1 x3
x2 x1 x3
Friedmann-Savage 效用曲线(1948):
§ 损失、风险和贝叶斯风险
一、损失函数 L
有些文献采用损失函数进行分析
∈u(c)=u(θ,a)
∈l(θ,a)=-u(θ,a) 则损失函数与效用作用相同
为了使损失值非负,可取
l(θ,a)= u(θ,a)-u(θ,a)
二、风险函数
自然状态集 Θ -----参数空间
行动集 A -----决策空间
观察值集 X -----测度空间
决策规则 δ:x→a , , Δ为策略空间
损失 l(θ,a)=l(θ,δ(x))
由于 X 是随机变量,对给定的θ,采用决策规则δ时定义风险函数
R(θ,δ)= [ l(θ,δ(x))]
= l(θ,δ(x)) ] f (x |θ) dx 或 l(θ,δ(x)) p (x |θ)
三、贝叶斯风险
r(π,δ) = Eπ R(θ,δ)
含义:θ的先验分布为π,决策规则为δ时风险函数的期望值叫贝叶斯风险
即: r(π,δ)= R(θ,δ)
= l(θ,δ(x)) f (x |θ) dx ] π(θ) dθ
或 l(θ,δ(x)) p (x |θ)π(θ)
Aa
SupSup
E X
[
x X
x X
E
[
x X
x X