博弈论与冲突分析
一.博弈论(Game Theory)
1.博弈论的起源:Game
(1)博弈论译自英文:Game Theory,“Game”的本义就
是游戏(弈棋、赌胜)。
Game的共同特征:都有一定的规则;都有一个结果;参
与者都面临策略选择;策略至关重要,与参与者的利益相互
依存。
举例:寡头市场中厂商的产量决策;市场开发竞争中的
策略较量与策略依存性等等。
一.博弈论(Game Theory)
(一).博弈论的起源:Game
1.可以用游戏的规律来研究本质上没有区别的问题
当然,政治、军事、政治等方面的决策较量,不会象日
常生活中的小游戏那么轻松愉快,我们一般也不会把关系到
个人、企业、甚至国家前途命运的决策活动称为游戏,但究
其根本,研究游戏规律得出的结论,完全可以用来指导经济、
管理、政治等活动中的重要决策问题。
一.博弈论(Game Theory)
(二)博弈的定义
博弈即一些个人、队组或其他组织,面对一定的环境条
件,在一定的规则下,同时或先后,一次或多次,从各自允
许选择的行为或策略中进行选择并加以实施,各自取得相应
结果的过程。
博弈的四要素:参加者(Players);策略/行为(Strateg
-ies/Actions);次序(Orders);得益(Payoffs)。
一.博弈论(Game Theory)
(三)几类经典的博弈模型
1.囚徒困境
“ 囚徒困境”博弈
是由图克(Tucker)在1950年
提出的经典模型,它很好地
反映了博弈问题的根本特征,
是解释众多经济现象、研究
经济效率问题的非常有效的基本模型和范式。
囚 坦白
徒
1 不坦白
囚徒2
坦白 不坦白
一.博弈论(Game Theory)
(三)几类经典的博弈模型
2.智猪博弈
假设猪圈里的两头猪都有智
慧,按一下就有10个单位的猪食进槽,但谁先按就要首先支
付2个单位的成本。若大猪先到槽边,大小猪吃到食物的收
益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,
收益比是6∶4。
大猪和小猪应如何选择?行动还是等待?
大 按
猪 不按
小 猪
按 不按
一.博弈论(Game Theory)
(三)几类经典的博弈模型
3.赌胜博弈
博弈本身就包含了“赌”和“胜”的意思,赌胜博弈属
于“零和博弈”的范畴,也就是说,博弈方的收益互为消长。
(1)田忌赛马
(2)猜硬币
(3)石头剪子布
田 忌
齐 威 王
取胜的关键:不能让对方猜中自己的策略;不能偏爱自
己的可选策略,应该以相同的概率选用。
一.博弈论(Game Theory)
(四)博弈的分类
1.博弈方
单人博弈:单人迷宫、运输路线
两人博弈
多人博弈
单人博弈的最大特征是信息拥有量与得益正相关;两人
或多人博弈中,博弈双方不总是相互对抗,也有利益一致的
情形(合作博弈);多人博弈与两人博弈的本质区别就是存在
破坏者(策略选择不影响自身的利益,但会影响其他博弈方
的利益,如奥运会主办权的争夺)。
一.博弈论(Game Theory)
(四)博弈的分类
2.策略的数量
有限博弈:每一博弈方的可选策略都有限
无限博弈:至少一个博弈方具有无限的可选择策略
3.利益
零和博弈:博弈方始终对立(战争)
常和博弈:有对立也有妥协,和平共处(分配奖金)
变和博弈:社会总得益的角度(有效/低效/无效)
一.博弈论(Game Theory)
(四)博弈的分类
4.过程:静态博弈、动态博弈、重复博弈
还可以根据信息结构、博弈方的理性和行为逻辑的差
别等对博弈模型进行分类。
(五)分析方法
上策均衡法(博弈结果是博弈方各自的上策)、严格下策
反复消去法(剔除劣果) 、划线法、箭头法等等。
一.博弈论(Game Theory)
(六)博弈模型的应用实例
1.团队中“搭便车”的现象
2.北约防务支出(大国支出多)
3.双寡头削价竞争
4.制度(英国政府的犯人运输问题)
请思考:以上的实例分别与哪种博弈模型相对应?你的
工作或生活中有没有博弈问题?“机会成本”可以用博弈模
型描述吗?
二.冲突分析
(一) 方法概述
冲突分析(Conflict Analysis)是在博弈论和偏对策理论
(Metageme Theory)基础上发展起来的一种对冲突行为进行
正规分析(Formal Analysis)的决策分析方法。
其主要特点是能最大限度地利用信息,通过对许多难以
定量描述的现实问题的逻辑分析,进行冲突事态的结果预测
和过程分析(预测和评估、事前分析和事后分析),帮助决策
者科学周密地思考问题。它是分析多人决策和解决多人竞争
问题的有效工具之一。
第四章 博弈论与冲突分析
二.冲突分析
(二)冲突的涵义
1.至少卷入了两个以上涉及冲突的客观实体,在对策论
中通常称为局中人。
2.各冲突实体均有影响所有其他各方利益的可行性方案
集。
3.冲突问题中的各方存在着彼此不相一致(冲突的最直
接体现)的利益倾向。
第四章 博弈论与冲突分析
二.冲突分析
(三)冲突分析的要素
1. 时间点
2. 局中人(Players)
3. 选择或行动(Options)
4. 结局(Outcomes)
5. 优先序或优先向量(Preference Vector)
第四章 博弈论与冲突分析
二.冲突分析
(四)冲突分析的一般过程
1. 对冲突事件问题与背景的描述
2. 建模
3. 稳定性分析
4. 结果分析与评价
请思考:水资源管理过程中的冲突分析问题有哪些?
冲突分析
冲突分析理论概述
冲突分析研究方法
冲突分析的一般方法
冲突分析的基本概念
一般来说,两个或两个以上的组织间存在争论,这种情况称为冲突。
将冲突视为一类独立的问题,加以系统地研究,称为冲突分析。
冲突分析的目的在于协调冲突中各参与者之间的矛盾,提出最终权宜解决方案。这是一种着眼于解决现实社会争端的一种特别的游戏理论,属于一般博弈理论的一个分支。
人为不确定决策:
Vij(A)=f(Ai,Bj)
Ai—决策者第i种选择
Bj—竞争对手第j种选
择
Vij(A)—决策者的益损
(赢、支付)函数
对策:
G=(N,A,V)
G—Game
N—局中人集合
A—局中人策略集合
V—赢得、支付或益损值
一般决策:
Vij=f(Ai,θ)
Ai—决策者第i种选择,
i=1,2,····,m(行动
方案、可控因素、
决 策变量)
Θj—决策对象所处的
第j种环境条件,
j=1,2, ····,n(自然
状态、不可控因
素、状态 变量)
Vij—决策系统状态的
价值函数(益损函
数)
对策是决策者在某种竞争场合下作出的决策,是一种人为的不确定型决策(竞争或对抗型决策)。
冲突分析的程序及要素
冲突分析的一般过程或程序如下图所示:
冲突问题
对冲突事
件背景的
认识与描
述
建
模
稳定性
分析
结果
分析与
评价
决
策
Y
n人冲突中第i个局中人稳定性分析的程序
结束
开始
对于
局中人i,结局q
有UI吗?
对于
局中人i,由q的UI结局q
其它局中人是否有
UI?
其它局中
人由q‘造成的一切结局q‘’,对
于局中人i而言,全都比
q更优吗?
对于局中
人i,由结局q的UI结局
还有吗?
q是合理稳定结局,记作r
q是非稳定结局,记作u
(检查同时处罚性稳定,
若是,记作u)
q是连续处罚性稳定结局,
记作s
N
N
Y
Y
N
N
q是全局平稳结局,
记作E
Y
稳定性分析的一般程序框图
N
例1——某地区饮料厂决策
冲突问题的背景:某地区一个小型饮料厂(简称甲厂),在2006年末经过市场调查,发现本地区的饮料大部分是由南方某大厂(简称乙厂)生产的,因此他们需要决定是否引进新的生产线扩大生产。如果生产,必须决定旨在本地区销售,还是在全国(主要是南方)销售,而乙厂需要决定是否在该地区继续出售产品,如果出售要决定出售价格的高低。
1 参与者
1)甲厂
2)乙厂
2 选择方案
1)甲厂采取的方案:
①开辟本地区市场; ②开辟南方市场。
2)当甲厂采取行动时,乙厂可能的对策是:
①不在甲厂所在地区销售产品;②高价进入甲厂所在地区;③低价进入甲厂所在地区。
3 结局的表示和简化
在冲突中,每个参与者都可根据别的参与者采取方案的情况选择自己的对策。当每个参与者选定了一个方案之后,冲突事件所形成的局势称为一个结局。对于该例所列的甲乙可能选择的方案来说,每个方案都有选择和不选择两种可能,所以理论上来说,此冲突可能有25=32个结局。
表1 本例的基本结局
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
十进制
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
③
0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1
②
0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1
①
乙厂
0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1
②
0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1
①
甲厂
实际上有许多结果是不可能的,应首先在所有结局中剔除从逻辑或偏好选择看来不可行的结局,得到可行结局集。一般来说,以下四类结局可以剔除:
对于某一参与者来说,在逻辑上是无效的结局。
如乙厂既采取高价进入甲厂所在地区,又低价进入甲厂所在地区;
本例中有以下结局属于此类:
12,13,14,15,20,21,22,23,24,25,26,27,28,29,30,31
某一参与者根本无法接受的结局。
如甲厂在乙厂以低价在所在地销售产品的情况下不采取任何行动.
本例中结局16,8属于此类,应予删除.
在参与者之间逻辑上无效的结局。
如,唯一的一件东西,两个参与者都想获得,但两个参与者同时得到这件东西的结局是逻辑上无效的。这类结局剔除的难处在于有时方案的定义不太严格,如上述那件东西是否可以共享或分享,搞得不清便会出现差错。故应当十分慎重,并进行仔细分析。
某两个或两个以上参与者选择的策略使结局至少对一个参与者从某优先结构上考虑是不可行的结局。
如乙厂高价进入甲厂所在地区,甲厂理应开辟本地区市场,或不采取任何措施,对甲厂来说,在其优先次序上采取开辟南方市场是不可行方案。但是,在一定的条件下,这种现象发生的可能性将会影响参与者的选择行为。因此,这类结局的剔除很困难。一般,当结局很多时(≥50个),可以剔除这类结局,当有效结局较少时(20~25个),这类结局剔除要十分小心。
本例中结局10,2,6属于此类,应予删除.
剔除无效元素结局最简单的方法是使用计算机,也可以用手算的方法进行。一般有以下三种方法:
第一种方法: 按数字次序排列所有的结局,剔除无效结局后即得有效结局。如乙厂不采取任何策略下,甲厂可能采取的各种策略所形成的结局为:
按照这种方法的好处在于结局的剔除是大块大块的,
如 : 均可剔除,即有23=8个
第二种方法:将要剔除的结局用含有尽可能多的破折符集表 示。
例如:有5个方案的冲突问题,所有理论上的结局可用 (-----)表示。
1、如要剔除(1----),显然余下的结局为
(0----)
2、如要剔除(10---)余下的结局为
(00---)
(01---)
(11---)
(0----)
(11---)
(00---)
(-1---)
3、从所有结局中剔除一组结局只须简单地逐组剔除。
如要在(-----)中剔除(10---), (1--1-),(--00-)和 (0---0)。可按下列步骤:
①从 (-----)中剔除(10---)得
(0----)
(11---)
②再要剔除(1--1-)只影响后一组
(11---)
即得 (0----)
(11-0-)
③再剔除(--00-)(从上两组中讨论)
即得 (0-01-)
(0-10-)
(0-11-)
(1110-)
将第二、三组合并得
(0-01-)
(0-1--)
(1110-)
④再剔除(0---0)
第三组中不含此类结局,故只从第一、二组剔除。
即得 (0-011)
(0-1-1)
(1110-)
这样表示结局很简捷,计算结局数很方便。
第三种方法:是每一个参与者都选出有效结局,并把它们合并在一起,
如乙厂的有效结局可表示为:
(--001)
在本案例的32个结局中
对甲厂:
a类结局:14,22,26,30;
b类结局:8,16;
d类结局:2,6,10,18;
是不可行的,应删除.
对乙厂:
a类结局:12,13,15,20,21,23,24,25,27,28,29,31;
b类结局:4;
也不可行,应删除,故可行结局只有9个。
表2 本例的可行结局
0 1 3 5 7 9 11 17 19
十进制
0 0 0 0 0 0 0 1 1
③
0 0 0 0 0 1 1 0 0
②
0 0 0 1 1 0 0 0 0
①
乙厂
0 0 1 0 1 0 1 0 1
②
0 1 1 1 1 1 1 1 1
①
甲厂
甲厂开辟市场,首选同时开辟本地区市场和南方市场;乙厂参与竞争时,按照低价-原价-高价的次序采取策略。
各参与者按照自己的目标要求及好恶对可行结局排序,得偏好向量。
甲厂的偏好向量是:
7 5 11 9 3 1 19 17 0
乙厂的偏好向量是:
0 17 19 1 3 9 11 5 7
4 优先顺序
甲厂:
(7,5) (11,9,3,1,19,17) (0)
乙厂:
(0) (17,19,1,3,9,11) (5,7)
甲开辟市场
乙退出市场
甲开辟市场
双方竞争
甲保持现状
乙退出市场
甲开辟市场
双方竞争
甲保持现状
乙独霸市场
5 稳定性分析
定义一个单方面改善UI结局,即在其他参与者策略不变的情况下参与者改变自己的策略得到的改善结局。
在冲突模型中,有四种可能的稳定性。对于某个给定的参与者,一个结局可能是:
1)合理型(r):对于该结局参与者没有UI.
例如对于甲厂,结局7,11,3,19都没有UI(已采取了可以采取的所有有利措施),是合理性稳定结局.
表2 本例的可行结局
0 1 3 5 7 9 11 17 19
十进制
0 0 0 0 0 0 0 1 1
③
0 0 0 0 0 1 1 0 0
②
0 0 0 1 1 0 0 0 0
①
乙厂
0 0 1 0 1 0 1 0 1
②
0 1 1 1 1 1 1 1 1
①
甲厂
2)不稳定型(u):参与者至少有一个UI,而且该UI不受其他参与者的可靠行动的阻碍。
例如,对于乙厂,考虑结局1(甲厂开辟本地区市场,乙厂保持现状)。乙厂通过改变自己的策略可以得到一个UI结局17,同时对于甲厂,结局17也存在一个UI结局19,对于乙厂结局19比结局1优,所以该结局是非稳定性结局。
甲(7 5 11 9 3 1 19 17 0 ) 乙(0 17 19 1 3 9 11 5 7)
0 1 3 5 7 9 11 17 19
十进制
0 0 0 0 0 0 0 1 1
③
0 0 0 0 0 1 1 0 0
②
0 0 0 1 1 0 0 0 0
①
乙厂
0 0 1 0 1 0 1 0 1
②
0 1 1 1 1 1 1 1 1
①
甲厂
3)惩罚型(s):因为其他参与者采取可靠的行动而导致该参与者得到一个更糟的结局,所以该参与者从这一结局出发采取单方面提高(UI)将会受阻。
例如,对于甲厂,考虑结局9。甲厂通过改变自己的策略可以得到一个UI结局11,同时对于乙厂,结局11也存在一个UI结局19,但是对于甲厂结局19不比结局9优,所以该结局惩罚性稳定结局。
4)同时稳定型(l):这种稳定性要在上面三种稳定性对所有参与者和所有结局皆确定之后才能求得。当某一结局对至少两个参与者不稳定时,一个以上的参与者同时采取行动有可能导致更糟的结局发生,这样对给定的参与者原认为不稳定的结局会成为稳定的。
5)全局稳定结局:如果某结局对于每一个参与者都属于r,s则该结局为全局稳定结局,记为E。
表3 本案例的稳定性分析 (甲7 5 11 9 3 1 19 17 0)
(乙0 17 19 1 3 9 11 5 7)
甲厂
19
19
19
19
17
19
17
19
17
UI
7
5
11
9
3
1
19
17
0
偏好向量
u
u
u
u
u
u
r
r
r
个体稳定
乙厂
1
19
3
11
7
UI
0
17
19
1
3
9
11
5
7
偏好向量
u
u
r
s
r
s
r
s
r
个体稳定
E
全局稳定
表2 本例的可行结局
0 1 3 5 7 9 11 17 19
十进制
0 0 0 0 0 0 0 1 1
③
0 0 0 0 0 1 1 0 0
②
0 0 0 1 1 0 0 0 0
①
乙厂
0 0 1 0 1 0 1 0 1
②
0 1 1 1 1 1 1 1 1
①
甲厂
本案例的全局稳定结局为{19}。
结局19表示甲厂本地与南方两地市场同时开辟,而乙厂以低价在甲厂所在地销售本产品。
2002年的奥斯卡金像奖影片《美丽心灵》,这部以纳什的生平经历为基础而创作的人物传记片几乎包揽了2002年电影类全部的全球最高奖项。约翰·纳什生于1928年6月13日 ,30岁时得了严重的精神分裂症,1994年获得诺贝尔奖经济学奖。 图克是纳什的导师。
2002年的奥斯卡金像奖影片《美丽心灵》,这部以纳什的生平经历为基础而创作的人物传记片几乎包揽了2002年电影类全部的全球最高奖项。约翰·纳什生于1928年6月13日 ,30岁时得了严重的精神分裂症,1994年获得诺贝尔奖经济学奖。 图克是纳什的导师。
2002年的奥斯卡金像奖影片《美丽心灵》,这部以纳什的生平经历为基础而创作的人物传记片几乎包揽了2002年电影类全部的全球最高奖项。约翰·纳什生于1928年6月13日 ,30岁时得了严重的精神分裂症,1994年获得诺贝尔奖经济学奖。 图克是纳什的导师。
2002年的奥斯卡金像奖影片《美丽心灵》,这部以纳什的生平经历为基础而创作的人物传记片几乎包揽了2002年电影类全部的全球最高奖项。约翰·纳什生于1928年6月13日 ,30岁时得了严重的精神分裂症,1994年获得诺贝尔奖经济学奖。 图克是纳什的导师。
2002年的奥斯卡金像奖影片《美丽心灵》,这部以纳什的生平经历为基础而创作的人物传记片几乎包揽了2002年电影类全部的全球最高奖项。约翰·纳什生于1928年6月13日 ,30岁时得了严重的精神分裂症,1994年获得诺贝尔奖经济学奖。 图克是纳什的导师。
2002年的奥斯卡金像奖影片《美丽心灵》,这部以纳什的生平经历为基础而创作的人物传记片几乎包揽了2002年电影类全部的全球最高奖项。约翰·纳什生于1928年6月13日 ,30岁时得了严重的精神分裂症,1994年获得诺贝尔奖经济学奖。 图克是纳什的导师。
2002年的奥斯卡金像奖影片《美丽心灵》,这部以纳什的生平经历为基础而创作的人物传记片几乎包揽了2002年电影类全部的全球最高奖项。约翰·纳什生于1928年6月13日 ,30岁时得了严重的精神分裂症,1994年获得诺贝尔奖经济学奖。 图克是纳什的导师。
2002年的奥斯卡金像奖影片《美丽心灵》,这部以纳什的生平经历为基础而创作的人物传记片几乎包揽了2002年电影类全部的全球最高奖项。约翰·纳什生于1928年6月13日 ,30岁时得了严重的精神分裂症,1994年获得诺贝尔奖经济学奖。 图克是纳什的导师。
2002年的奥斯卡金像奖影片《美丽心灵》,这部以纳什的生平经历为基础而创作的人物传记片几乎包揽了2002年电影类全部的全球最高奖项。约翰·纳什生于1928年6月13日 ,30岁时得了严重的精神分裂症,1994年获得诺贝尔奖经济学奖。 图克是纳什的导师。
2002年的奥斯卡金像奖影片《美丽心灵》,这部以纳什的生平经历为基础而创作的人物传记片几乎包揽了2002年电影类全部的全球最高奖项。约翰·纳什生于1928年6月13日 ,30岁时得了严重的精神分裂症,1994年获得诺贝尔奖经济学奖。 图克是纳什的导师。
2002年的奥斯卡金像奖影片《美丽心灵》,这部以纳什的生平经历为基础而创作的人物传记片几乎包揽了2002年电影类全部的全球最高奖项。约翰·纳什生于1928年6月13日 ,30岁时得了严重的精神分裂症,1994年获得诺贝尔奖经济学奖。 图克是纳什的导师。
2002年的奥斯卡金像奖影片《美丽心灵》,这部以纳什的生平经历为基础而创作的人物传记片几乎包揽了2002年电影类全部的全球最高奖项。约翰·纳什生于1928年6月13日 ,30岁时得了严重的精神分裂症,1994年获得诺贝尔奖经济学奖。 图克是纳什的导师。