新浪博客

博弈论—胆小鬼博弈和囚徒困境博弈

2016-07-21 09:16阅读:
博弈论—胆小鬼博弈和囚徒困境博弈

学习感悟:厦大之行听了张苾芜教授的讲座《中国和平崛起的理论和实践》,记忆特别深刻的是张教授那富有激情的讲授,枯燥的政治理论用丰富的肢体语言,夸张的行为,生动的事例,变得通俗易懂,时而用流利的英语,幽默风趣,让我大开眼界,也深刻地认识到了国际关系处理的一些技巧。特别是张教授讲到了两个外交模式,即威慑模式和螺旋模式,分别是类似于胆小鬼博弈和囚徒困境博弈。
其实,用博弈论可以解决一些社会问题,包括两个国家之间的纷争,如这次的南海仲裁事件。用博弈论知识也可以帮助我理解两国之间关系的一些学问。
一、胆小鬼博弈
假设这样一种情形:两名赛车手各自驾驶汽车沿着一条划定的直线相向而行,相撞前首先转向的一方就是胆小鬼,英语中常用
chicken 来形容胆小的人,所以这个假想游戏也被称为 chicken game。此外,现实中的劳资谈判问题也可以看做是胆小鬼博弈——双方都不妥协必然就会两败俱伤,一方妥协往往意味着重大让步。
在胆小鬼博弈中,我们假定双方可以采取的策略只有 2 种:死磕到底(用DareD表示)或者认怂(用ChickenC表示),双方(甲、乙)采取不同策略的收益可以用下表来表示:
博弈论—胆小鬼博弈和囚徒困境博弈
这里数字的绝对值并不十分重要,主要是用来表示双方损失或收益的的相对大小。通常一个结果可以用(DC)这样的形式来表示,即甲方死磕到底,乙方最终认怂。
认怂固然丢面子,但相比玉石俱焚的结果来说,保命显然更重要。因此对一个足够理性的人来说,应该在他能够控制的最后时刻选择C策略,即果断认怂。而如果甲方相信乙方是一个足够理性的人的话,那他应该能够预料到乙方会在最后时刻放弃,所以甲方的最佳策略是死磕到底(D策略),对应的结果就是(DC),类似的情况反转过来是(CD)。当然要是双方都这么想的话,最后的结果很可能是(DD)。
有趣的是,在胆小鬼博弈中当一方的选择受到了限制时,其赢面可能会变大。例如,在赛车的虚拟游戏中,甲方的方向盘被锁死,不得不选择 D 的话,乙方再傻也会知道识时务者为俊杰,选择 C 的结果 -1要远好于同归于尽的 -10
通常,(CD)和 (DC)被称为胆小鬼博弈的纳什均衡点,即在这个状态下,如果一方不改变其策略,不论对方采取什么策略都不会有更大收益。例如,对于(DC)而言,甲方心意已决,就算乙方将对策由认怂改为死磕,结果也是两败俱伤而不会收益更高。类似的,如果乙方已经决定认怂,甲方不再死磕也选认怂的话,其收益将从 +1 变为 0

二、囚徒困境博弈
一个经典的囚徒困境描述如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下选择:认罪并作证检控对方(相关术语称背叛对方)或是保持沉默(相关术语称合作)。
若一人选择背叛,而对方选合作,则此人将即时获释,合作者将判监10年。
若二人都选合作,则二人同样判监半年。若二人都互相背叛,则二人同样判监2年。
我们可以用一张表格来表述:
博弈论—胆小鬼博弈和囚徒困境博弈
如果你是其中之一,只考虑尽量使自己服刑年份最小化的话,你会怎么选?我相信大部分的人会选择背叛,确实有太多理由让人选择背叛了,比如有人坚信对方会背叛你,而你不愿意选择合作而服刑10年,所以你选择背叛而服刑2年。他的理由对他来说已经很充分了,但是我们还需要考虑另一种情况,就是乙坚信甲不会背叛他,那么乙应该选择什么?乙还是应该选择背叛,因为乙选择背叛就能立即获释,而乙选择合作还需要服刑半年。在这种情况下,无论甲作何选择,对乙来说选择背叛总是优于选择合作,那么我们称背叛是乙的优势策略。无论是实验的事实还是简单的分析,都告诉我们背叛是每个人的最佳选择。所以最终两个人都会选择背叛,而同服刑2年,这就是囚徒困境的结果。

我的更多文章

下载客户端阅读体验更佳

APP专享