博弈论习题参考答案()
发布时间:2019-04-22 22:48:36
发布时间:2019-04-22 22:48:36
《博弈论》习题参考答案(第2次作业)
1.B 2.C 3.A 4.A 5.B 6.ABCD
7.C 8.B 9.C
1.F 上策均衡是比纳什均衡更严格的均衡概论
2.T 上策均衡是比纳什均衡更严格的均衡概论
3.T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈
4.F 博弈双方偏好存在差异的条件下,一个博弈模型中可能存在2个纳什均衡,如性别战
5.T 零和博弈指参与博弈各方在严格竞争下,一方收益等于另一方损失,博弈各方收益与损失之和恒为零,所以双方不存在合作可能性
6.T 上策均衡是通过严格下策消去法(重复剔除下策)所得到的占优策略,只能有一个纳什均衡
7.F 纳什均衡是上策的集合,指在给定的别人策略情况下,博弈方总是选择利益相对较大的策略,并不保证结果是最好的。
8.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标
9.T 纳什均衡是上策的集合,指在给定的别人策略情况下,没有人会改变自己的策略而减低自己的收益
10.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标
11.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标
12.T 虽然斯塔格伯格模型各方利润总和小于古诺模型,但是领导者的利润比古诺模型时高
1、 (1)画出A、B两企业的损益矩阵。
B企业 | |||
做广告 | 不做广告 | ||
A企业 | 做广告 | 20,8 | 25,2 |
不做广告 | 10,12 | 30,6 | |
(2)求纯策略纳什均衡。
(做广告,做广告)
2、画出两企业的损益矩阵求纳什均衡。
(1)画出A、B两企业的损益矩阵
百事可乐 | |||
原价 | 涨价 | ||
可口可乐 | 原价 | 10,10 | 100,-30 |
涨价 | -20,30 | 140,35 | |
(2)求纳什均衡。
两个:(原价,原价),(涨价,涨价)
3、假定某博弈的报酬矩阵如下:
甲 | 乙 | ||
左 | 右 | ||
上 | a,b | c,d | |
下 | e,f | g,h | |
(1)如果(上,左)是上策均衡,那么,a>?, b>?, g, f>?
答:a>e, b>d, f>h, g
(2)如果(上,左)是纳什均衡,上述哪几个不等式必须满足?
答:a>e, b>d
4、答:(1)将这一市场用囚徒困境的博弈加以表示。
北方航空公司 | |||
合作 | 竞争 | ||
新华航空公司 | 合作 | 500000,500000 | 0,900000 |
竞争 | 900000,0 | 60000,60000 | |
(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。
答:若新华选择“竞争”,则北方也会选择“竞争”(60000>0);若新华选择“合作”,北方仍会选择“竞争”(900000>500000)。
若北方选择“竞争”,新华也将选择“竞争”(60000>0);若北方选择“合作”,新华仍会选择“竞争”(900000>0)。
由于“竞争”为双方的占优策略,故均衡结果为两家公司都选择竞争性策略。
5、博弈的收益矩阵如下表:
乙 | |||
左 | 右 | ||
甲 | 上 | a,b | c,d |
下 | e,f | g,h | |
(1)如果(上,左)是占优策略均衡,则a、b、c、d、e、f、g、h之间必然满足哪些关系?
答:从占优策略均衡的定义出发:
对甲而言,策略“上”(a,c)优于策略“下”(e,g);
对乙而言,策略“左” (b,f)优于策略“右”(d,h)。
所以结论是:a>e, b>d, f>h, c>g
(2)如果(上,左)是纳什均衡,则(1)中的关系式哪些必须满足?
答:纳什均衡只需满足:a>e, b>d,
(3)如果(上,左)是上策均衡,那么它是否必定是纳什均衡?为什么?
答:占优策略均衡一定是纳什均衡,因为占优策略均衡的条件包含了纳什均衡的条件。
(4)在什么情况下,纯策略纳什均衡不存在?
答:当对每一方来说,任意一种策略组合都不满足纳什均衡时,纯战略纳什均衡就不存在。
7、求纳什均衡。
小猪 | |||
按 | 等 | ||
大猪 | 按 | 5,1 | 4,4 |
等 | 9,-1 | 0,0 | |
纳什均衡为:大猪“按”,小猪“等”,即(按,等)
6、
乙 | |||
低价 | 高价 | ||
甲 | 低价 | 100,800 | 50,50 |
高价 | -20,-30 | 900,600 | |
(1)有哪些结果是纳什均衡?
答:(低价,低价),(高价,高价)
(2)两厂商合作的结果是什么?
答:(高价,高价)
8、用反应函数法结合划线法,求出下列博弈的所有纯策略纳什均衡。
参与人1 | 参与人2 | ||||
甲 | 乙 | 丙 | 丁 | ||
A | 2,3 | 3,2 | 3,4 | 0,3 | |
B | 4,4 | 5,2 | 0,1 | 1,2 | |
C | 3,1 | 4,1 | 1,4 | 10,2 | |
D | 3,1 | 4,1 | -1,2 | 10,1 | |
参与人1的反应函数:
R1(2)=B,若2选择甲
=B,若2选择乙
=A,若2选择丙
=C或D,若2选择丁
参与人2的反应函数:
R2(1)=丙,若2选择A
=甲,若2选择B
=丙,若2选择C
=丙,若2选择D
求共集,得纯策略纳什均衡为(B,甲)与(A,丙)
9、求出下面博弈的纳什均衡(含纯策略和混合策略)。
甲 | 乙 | ||
L | R | ||
U | 5,0 | 0,8 | |
D | 2,6 | 4,5 | |
解:(1)纯策略Nash均衡:由划线法可知,该矩阵博弈没有纯策略Nash均衡。
(2)混合策略Nash均衡
设甲选择“U”的概率为P1,则选择“D”的概率为1-P1
乙选择“L”的概率为P2,则选择“R”的概率为1-P2
对甲而言,最佳策略是按一定的概率选“U”和“D”,使乙选择“L”和“R”的期望值相等
即 P1*0+(1-P1)*6= P1*8+(1-P1)*5
解得 P1=1/9
即(1/9,8/9)按1/9概率选“U”、8/9概率选“D”为甲的混合策略Nash均衡
对乙而言,最佳策略是按一定的概率选“L”和“R”,使乙选择“U”和“D”的期望值相等
即 P2*5+(1-P2)*0= P2*2+(1-P2)*4
解得 P2=4/7
即(4/7,3/7)按4/7概率选“L”、3/7概率选“R”为乙的混合策略Nash均衡
10、根据两人博弈的损益矩阵回答问题:
甲 | 乙 | ||
左 | 右 | ||
上 | 2,3 | 0,0 | |
下 | 0,0 | 4,2 | |
(1) 写出两人各自的全部策略。
答:全部策略:(上,左),(上,右),(下,左),(下,右)
(2) 找出该博弈的全部纯策略纳什均衡。
答:由划线法可知,该矩阵博弈全部纯策略Nash均衡为
(上,左)和(下,右)两个
(3) 求出该博弈的混合策略纳什均衡。
解:设甲选择“上”的概率为P1,则选择“下”的概率为1-P1
乙选择“左”的概率为P2,则选择“右”的概率为1-P2
对甲而言,最佳策略是按一定的概率选“上”和“下”,使乙选择“左”和“右”的期望值相等
即 P1*3+(1-P1)*0= P1*0+(1-P1)*2
解得 P1=2/5
即(2/5,3/5)按2/5概率选“上”、3/5概率选“下”为甲的混合策略Nash均衡
对乙而言,最佳策略是按一定的概率选“左”和“右”,使乙选择“上”和“下”的期望值相等
即 P2*2+(1-P2)*0= P2*0+(1-P2)*4
解得 P2=2/3
即(2/3,1/3)按2/3概率选“左”、1/3概率选“右”为乙的混合策略Nash均衡
11、某寡头垄断市场上有两个厂商,总成本均为自身产量的20倍, 市场需求函
数为Q=200-P。
求:(1)若两个厂商同时决定产量,产量分别是多少?
(2)若两个厂商达成协议垄断市场,共同安排产量,则各自的利润情况如何?
(3)用该案例解释囚徒困境。
答:(1)由已知条件 Q=200-P,P=200-Q
TC1=20q1,TC2=20q2 q1+q2=Q
可得1,2厂商的利润函数分别为:
K1=Pq1-TC1=(200-(q1+q2))q1-20q1=180q1-q12-q1q2
K2=Pq2-TC2=(200-(q1+q2))q2-20q2=180q2-q22-q1q2
令dK/dq1=0 得厂商1的反应函数为180-2Q1-Q2=0,
令dK/dq2=0 得厂商2的反应函数为180-Q1-2Q2=0,
联解可得q1=q2=60
K1=K2=3600
(2) 由已知条件 Q=200-P,P=200-Q
TC=TC1+TC2=20q1+20q2 =20Q
可得1,2厂商的总利润函数为:
K=PQ-TC=(200-Q)Q-20Q=180Q-Q2
令dK/dQ=0 得 Q=90,q1=q2=45
K=PQ-TC=(200-Q)Q-20Q=180Q-Q2=8100
K1=K2=4050
(3) 将q1=45,q2=60 和q1=60,q2=45分别代入1,2厂商的利润函数
可得1,2厂商的利润为:
K1(q1=45,q2=60)=Pq1-TC1=(200-(q1+q2))q1-20q1=180q1-q12-q1q2=3375
K1(q1=60,q2=45)=Pq1-TC1=(200-(q1+q2))q1-20q1=180q1-q12-q1q2=4500
K2 (q1=45,q2=60)=Pq2-TC2=(200-(q1+q2))q2-20q2=180q2-q22-q1q2=4500
K1(q1=60,q2=45)=Pq1-TC1=(200-(q1+q2))q1-20q1=180q1-q12-q1q2=3375
厂商2 | |||
合作(q2=45) | 不合作(q2=60) | ||
厂商1 | 合作(q1=45) | 4050,4050 | 3375,4500 |
不合作(q1=60) | 4500,3375 | 3600,3600 | |
根据划线法,可得厂商1.2的上策是(不合作,不合作)即(3600,3600)
双方利润均低于(合作,合作)(4050,4050)显然它属于“囚徒困境”
13、(市场威慑)考虑下面一个动态博弈:首先,在一个市场上潜在的进入者选择是否进入,然后市场上的已有企业(在位者)选择是否与新企业展开竞争。在位者可能有两种类型,温柔型(左图)和残酷型(右图),回答下面问题。
.
左图:温柔型 右图:残酷型
(1)找出给定在位者的两种类型所分别对应的纳什均衡,以及子博弈精炼纳什均衡
(1)温柔型在位者的纳什均衡为 (进入, 默认)
残酷型在位者的纳什均衡为 (不进入, (进入,斗争))
(2)已有企业为温柔型的概率至少多少时,新企业才愿意进入?
1、解释“囚犯困境”,并举商业案例说明。
(1)假设条件举例:两囚徒被指控是一宗罪案的同案犯。他们被分别关在不同的牢房无法互通信息。各囚徒都被要求坦白罪行。如果两囚徒都坦白,各将被判入狱5年;如果两人都不坦白,两囚徒可以期望被从轻发落入狱2年;如果一个囚徒坦白而另一个囚徒不坦白,坦白的这个囚徒就只需入狱1年,而不坦白的囚徒将被判入狱10年。
(2)囚徒困境的策略矩阵表。每个囚徒都有两种策略:坦白或不坦白。表中的数字分别代表囚徒甲和乙的得益。
囚徒乙 | |||
坦白 | 不坦白 | ||
囚徒甲 | 坦白 | -5, -5 | -1, -10 |
不坦白 | -10, -1 | -2, -2 | |
(3)分析:通过划线法可知:在囚徒困境这个模型中,纳什均衡就是双方都“坦白”。给定甲坦白的情况下,乙的最优策略是坦白;给定乙坦白的情况下,甲的最优策略也是坦白。而且这里双方都坦白不仅是纳什均衡,而且是一个上策均衡,即不论对方如何选择,个人的最优选择是坦白。其结果是双方都坦白。
(4)商业案例:寡头垄断厂商经常发现它们自己处于一种囚徒的困境。当寡头厂商选择产量时,如果寡头厂商们联合起来形成卡特尔,选择垄断利润最大化产量,每个厂商都可以得到更多的利润。但卡特尔协定不是一个纳什均衡,因为给定双方遵守协议的情况下,每个厂商都想增加生产,结果是每个厂商都只得到纳什均衡产量的利润,它远小于卡特尔产量下的利润。
2、解释并讨论古诺的双寡头模型的纳什均衡。为什么其均衡是一种囚徒困境?
见上课笔记
或计算题第11题
3、用“小偷与守卫的博弈”说明“激励(监管)悖论”。
(1)假设条件举例:偷窃和防止偷窃是小偷和门卫之间进行博弈的一场游戏。门卫可以不睡觉,或者睡觉。小偷可以采取偷、不偷两种策略。如果小偷知道门卫睡觉,他的最佳选择就是偷;如果门卫不睡觉,他最好还是不偷。对于门卫,如果他知道小偷想偷,他的最佳选择是不睡觉,如果小偷采取不偷,自己最好去睡觉。
(2)小偷与门卫的支付矩阵表(假定小偷在门卫睡觉时一定偷成功,在门卫不睡觉时偷一定会被抓住):
门卫 | |||
睡觉 | 不睡觉 | ||
小偷 | 偷 | 1,-1 | -2, 0 |
不偷 | 0, 2 | 0, 0 | |
(3)分析:通过划线法可知:这个博弈是没有纳什均衡的。门卫不睡觉,小偷不偷,双方都没有收益也没有损失;门卫不睡觉,小偷偷,门卫因为是本职工作得不到奖励,小偷被判刑丧失效用2单位;门卫睡觉,小偷不偷,门卫睡觉的很愉快得到效用2单位,小偷没有收益也没有损失;门卫睡觉,小偷偷,门卫因失职被处分而丧失效用1单位,小偷偷窃成功获得效用1单位。
(4)“激励(监管)悖论”说明:现实中,我们看到,当门卫不睡觉时,偷窃分子便收敛一阵;严打的时期一过,偷窃分子又开始兴风作浪,在不能容忍小偷过分猖狂的时候,门卫不得不再次开始认真。即偷的小偷越多,那么不睡觉的门卫将会越多,偷的小偷越少,不睡觉的门卫将越少;反过来,不睡觉的门卫越多,偷的小偷就越少,不睡觉的门卫越少,偷的小偷就越多。如果偷窃集团倾巢出动,那么门卫的选择也是全部不睡觉,但门卫一旦全部不睡觉,小偷最好选择全部不偷,小偷一旦选择全部不偷,门卫最好全部选择睡觉。
(5)结论:加重对小偷的处罚在长期中并不能抑制偷窃(而只能使门卫偷懒);加重处罚失职门卫恰恰是会降低偷窃发生的概率。这种门卫和小偷的博弈所揭示的,政策目标和政策结果之间的这种意外关系,常被称为“激励的悖论”。
爱情的美妙,就在于人的多情和心甘情愿,在甜蜜的热恋阶段,全身心的投入和付出都无怨无悔。
男人深情缱绻地对女人说:“我负责赚钱养家,你负责貌美如花。”那时那刻的话语,相信他是真心的,出自于肺腑之言。
随着感情在烟火生活中的磨砺,渐渐淡化或者冷却,他对她越来越没有之前的殷勤,越来越没有之前的心甘情愿。
工作的压力,生活的琐碎,让他感觉身边的女人为何不能自食其力,为何像寄生虫一般依附着他,让他感到压抑和逃避。
电视剧《我的前半生》里的罗子君就是最好的例子。
貌美如花的她,嫁给深爱她的陈俊生,听了他的情话“我负责赚钱养家,你负责貌美如花”之后,立刻辞掉工作,专心在家做一个少奶奶,养尊处优,每天把自己打扮的美美哒,只为了保持“貌美如花”给老公看。
最后的结局不想而知,她的老公出轨了,理由是他太累了,他每天累死累活地工作,回家却跟罗子君没有共同语言,心里的苦闷无处安放,只能找一个灵魂知己。
对于罗子君和陈俊生两个人的婚姻,不能说孰是孰非,最根本的症结在于这句情话“我负责赚钱养家,你负责貌美如花”.
两个人的婚姻在于共同成长,共同支持,而不是把自己的一生寄托在另一个人的身上。
不管是女人,还是男人,独立的人格和独立的经济是必须的,只有自己独立了,你才能获得别人的尊重和爱护。
好的婚姻,一定是三观相同,家境匹配的两个人在悠长的岁月里,一起经营,一起成长,相互陪伴,相互支持,才能携手走得更远,共度一生。
如果在婚姻里一方在进步,而另一方在退步,或者停滞不前,久而久之,两个人的三观就会产生不同,理念和思想就会渐行渐远,变成两条平行线,永远不能交集。
不要相信“我负责赚钱养家,你负责貌美如花”这样的情话。
随着岁月的磨砺,人心会随着时间和环境而改变。