6
5
4
3
2
1
组员
适用于:
只有两个选手参加的零和博弈
工具:
威廉斯算术方法、混合策略图表
网球博弈
不到最后一瞬不要选定一个方向,使对方处于猜测之中。
发球者努力使自己的发球变得不可预测。
接球者不能完全倾向于奔跑于一边,要对回球路线做出准确预测。
假设条件
接球者正手稍强。
预计正确时:
正手回球成功概率为90%
反手回球成功概率为60%
预计错误时:
跑向反手,而球飞向正手,回球成功概率为30%
跑向正手,而球飞向反手,回球成功概率为20%
最佳策略选择
50:50混合策略下
预测正确的概率为1/2(假想抛硬币)
接球者向正手方移动:
回球成功概率:1/2×90%+1/2×20%=55%
接球者向反手方移动:
回球成功概率:1/2×60%+1/2×30%=45%
单纯站在自己角度,接球者的最佳选择:向正手方移动
但是由于不可预测性的存在,参与者可以通过系统地偏向一边而改善自己的表现,来降低对方的收益。
发球者的最佳混合策略
发球者:40%的时间瞄准对方的正手是最佳策略(均衡策略为40:60)
接球者:无论防正手还是防反手,回球成功概率都是48%
接球者的最佳混合策略
接球者:30%的时间向正手方移动是最佳策略(均衡策略为30:70)
无论发球者选择瞄准哪一方,接球者成功回球的概率均为48%
威廉斯的算术方法
一、方法介绍
纵列选手得失情况为对象:
1.左列对右列的均衡比例:(D-B):(A-C)
2.纵列选手选择左列概率为p
有:pA+(1-p)B= pC+(1-p)D
p/(1-p)=(D-B):(A-C)
行列选手得失情况为对象:
有:均衡混合策略就是: (D-C):(A-B)
威廉斯的算术方法应用
发球者的最佳混合策略计算:
40:60=(60-20):(90-30)
接球者的最佳混合策略计算:
30:70=(60-30):(90-20)
最小最大收益
——以发球者为对象
由前普林斯顿数学家约翰·冯·诺依曼与奥斯卡·摩根斯顿创立。
定理:在零和博弈中,参与者的利益严格相反(一人所得等于另一人所失),每个参与者尽量使对手的最大收益最小化,而他的对手努力使自己的最小收益最大化
最大收益的最小值(最小最大收益)等于最小收益的最大值(最大最小收益)
最大最小收益
——以接球者为对象