囚徒困境的均衡辨析

技术经济与管理研究2011年第2期

囚徒困境的均衡辨析

郭洪伟

(首都经济贸易大学统计学院,北京100070)

摘要:传统的《博弈论》分析最终结果是两个囚徒均会坦白,但这并不是两个囚徒的最好结局,如何才能达到最好结

局?本文从懈弈动中“理性人”的假设出发。对传统的(坦白。坦白)均衡提出质疑。本文指出理性人不会满足于传统

的均衡,理性人会积极寻找双方利益最大化的均衡,并达到此均衡。本文给出了新的均衡:广义均衡。并给出广义均衡的求解过程。通过对引入公共支付函数的概念。公共支付函数表达了两个人的共同利益。通过公共支付函数的最大化,使两个囚

徒公共利益最大化,以求得囚徒困境的新的均衡,让两个囚徒的结果达到最好一即两人均抵赖。本文还将公共支付函数运

用于其他傅弈论)案例,并指出广义均衡比纳什均衡更具有社会意义,因为前者体现了公共利益。文中还对囚徒困境的机

制设计问题做了分析,指出囚徒困境中机制的设计会诱导囚徒作出不正确的选择,从而没有迭到双方利益的最大化。

关键词:囚徒困境;公共支付;纳什均衡;广义均衡;支付函数

中图分类号:F224

文献标识码:A

文章编号:l004-292x(2011)02-0022-04

AStudy

to

Pl'J舯nei's’Dnemma

Honlg-wei

GU0

(Statisti岱m砌tIl钯.Capital

Abstract:Thefinal陀ault

UmversityofEeonomi岱&Busine鲢,BeUing100070,China)

of”gametIIeoW’‘isthattlIepfi∞nemwoddeoIll:eaa,butt}Iisi8nottIIebestoutcomeoftIletwo

pd∞ne玛.Howc锄weachjevetllebeatoutcome?ThispaperquestionedtlIe”rationalmall”assumptionofd地”gametIleory”andtl圯

tradifional

equilibfium(frank。frank).ThispaperpointedouttIle弛asonthatpeopledonotgetthetractionalequilibfium.Rafiomd

peoplewill∞fively盼ektomaximi∞tlleiIIte弛8t8ofbotII,∞thattlleywouldequilibriumWaft,named脑general

equilibrium,and,hem,Ⅱ地processhowto

Call

舶Ilieve

get

anew

equilibfium.IIItllispaper'tIlenew

generalequilibrium

isalsogiven.Thispaper

introducedtheconceptoftllepublicpayofffuncfion.wllich

teUtl把total

inter髓ts

0ftIIetwopfi∞nem.BymaximizingtIlefunction

ofpubicpayo正inaltlOtlleFwords,bymaximizingtlIepublicintereBt,tlletwopfisone糟cangettllebestresul协.ThisfunfioneoddbeweUappliedto

paper

otlI盯渊of”game

out

tlIeory”.Ill出epapertlIepunishingml∞ofthePh∞ner,8

Dilemma靴弛also

analyzed.This

pointed

thattlIepumshingmle8ofPri80ner8DilemmawoIddiIlducepilsnertomaketlIewrongchoice.whichdidnot

meettIlebestinterestsofbotllpeople.

Keywords:Prisone聘’dilemma;Pubicpayoff;Nashequilibfium;Generalequilibrium;Payofffunction

一、前言在最大化偏好时.需要相互合作,而合作中又存在着冲突。下面分析博弈论中经典的案例——囚徒困境,如表l所示。

假设有两名嫌疑人作案后被警察抓住,分别被关在不同的

表1囚徒困境

博弈论研究的是存在相互影响关系下的个人选择问题。这里的参与人都是理性人。按照文南虹1】的定义:理性人是在面临给定的约束条件下,能最大化自己偏好的那些人。这里理性的人与

自私的人不同。理性人可能是利己主义者。也可能是利他主义者。理性人假设是博弈论的分析前提。基于这个前提,所有的参与人都尽量使自己的偏好(利益)最大化,如果存在某种行动会

坦白

使参与人变的更好,参与人会积极努力达成更好的结果。理性人

收稿日期:2010-06-01

囚捷^槲

作者简介:郭洪伟(1970-).男.安教人,博士研究生。研究方向:应用数理统计。

・22・

万方数据

屋子里接受审讯(关在不同的屋子里是怕他们串供,这也是影响他们博弈的关键因素之一)。警察告诉他们:如果两人都坦白,各判刑8年,即他们各自的收益(又称嫂用或支付)均是一8;如果两人都抵赖。各判1年(或许因证据不足)。即他们各自的收益均是一l;如果其中一人坦白另一人抵赖.坦白的放出去(收益为0),不坦白的判刑lO年(收益是一10)。这也体现坦白从宽、抗拒从严的执法态度。

在这个例子中所有教材给出的纳什均衡都是(坦白,坦白)。给定B坦白的情况下,A的最优战略是坦白;同样,给定A坦白的情况下,B的最优战略也是坦白。事实上.这里的(坦白,坦白)不仅是纳什均衡,而且是—个占优战略均衡,即不论对方如何选择.两个囚徒各自的最优选择都是坦白。从表l可知.如果B不坦白,A坦白的话就可以不被定罪,不坦白的话判1年,所以坦白比不坦白好。如果B坦白,A坦白的话判8年,不坦白判lO年,所以,坦白还是比不坦白好。这样坦白就是A占优战略。同样,坦白也是B占优战略。所以,最后的结果是两人都会选择各自的占优战略即坦白,那么最后双方都被判8年。

一般的教材。还会继续讨论个人理性与集体理性的矛盾。因为上述例子中.如果两人都选择抵赖,各判1年.显然比各判8年好。所以总体上看。两人都选择抵赖是最好的策略。所以上述均衡策略还有改进的余地,但这个帕累托改进办不到,因为它不满足个人理性要求.

(抵赖。抵赖)不是纳什均衡。

二、囚徒困境的分析

笔者对于囚徒困境的上述论断持不同意见。笔者的观点主要缘于两点:①冈徒是真的理性人吗?⑦纳什均衡到底指什么?

博弈论假设参与人都是理性人,他们都聪明绝顶。囚徒困境的结果是各判8年.实际上他们可以各判1年。他们自己会比较被判1年好还是被判8年好。他们肯定不会满足于被判8年,所以如果囚徒真是“理性人”,他们都会选择抵赖,最后的结果是各判1年。这是从“理性人”的假设中自然得到的结论。如果按照经典博弈论的分析。囚徒困境的纳什均衡是(坦白,坦白)。这显然违背了“理性人”假设。这个结果实际上是两个自私自利的人“聪明反被聪明误”的结局,不是真正的“聪明绝顶”的人所做出的决策。如果是真正的“理性人”.他应该掌握博弈论的基本知识,能预计到自己的处境,最后两个囚徒都会毫无顾忌的选择抵赖。

另外从纳什均衡的定义出发也可以得到各判1年的结果。纳什均衡的定义:假设有N个人参与博弈,给定其他人战略的条件下,每个人选择自己的最优战略,所有参与人选择的战略一起构成一个战略组合。纳什均衡指这样一个战略组合,这种战略组合由所有参与人的最优战略组成.也就是说.给定别人战略的情况下.没有任何单个参与人有积极性选择其他战略,从而没有任何人有积极性打破这种均衡。在冈徒硝境的例子里,各判8年不是大家最好的结果.因为有更好的选择是链判1年。如果在最初有个攻守同盟,即两人都抵赖。两个“聪明”的冈徒如果能分析所有可能的战略.他们应该不会打破攻守同盟的协议。因为打破攻守同盟意味着各判8年,执行攻守同盟只判1年。所以攻守同盟(抵赖.抵赖)是纳什均衡。

万方数据

囚徒困境的均衡辨析

同时上述(坦白,坦白)战略也不符合纳什均衡的定义。纳什均衡说给定别人战略的情况下,没有人有积极性选择其他的战略。但纳什均衡没有说别人的战略是不是可以变。如果双方最初的同盟是(抵赖,抵赖),大家会看到如果有一方想法改变,另一方也会跟着改变。从而使情况进展两步,达到一个更坏的结局各判8年,在这种情况下“理性人”会想改变同盟战略吗?当然不会。所以根据纳什均衡的定义(抵赖.抵赖)是纳什均衡。这是两个“真正的理性人”博弈最后达到的均衡。

三、囚徒困境产生的原因

什么原因导致上述困境的产生?我们来看一下各个囚徒的决策过程。如果我们通过下划线的方式,剔除劣策略,显然得到的均衡是(坦白.坦白)。但下划线决策过程,只是把表l中的行和列的策略在行内和列内各自比较。具体做法是比较第一行的两个选优,再比较第二行的选优,再比较第一列的选优,再比较第二列的再选优,最后得到最优策略。这个决策过程没有把(一8,一8)和(一1.一1)相比较,也没有把(一10。0)和(0,一10)相互比较.实际上述均衡得到时,没有把战略空间的所有战略一一相互比较。这是因为上述选优策略的前提是,在对方选定既定战略的前提下.自己选择最优策略。这样只能在行和列之间相互比较。导致最后的结果是(一8,一8)。这就是下划线方法的

局限性。

实际上在这个例子中“给定他人的战略条件”不充足,因为你看到对方“抵赖”时你选择坦白。实际上对方同时也在考虑这个问题。他想到你选择坦白.他就不会选择“抵赖”,这样你假设的“给定他人的战略”就变了。成了他人的战略不确定。这个案例虽然是静态博弈,但是博弈双方考虑整个过程时都在模拟对方的选择.这其中有动态的成分(你假设对方抵赖,你选择坦白.实际对方猜到你选择坦白,他会改变自己的策略不再抵赖也选择坦白,最后达到均衡(坦白,坦白)这个决策过程有先后顺序,实际上是动态博弈过程)。所以完全按照静态博弈方法分析会有问题.导致囚徒困境的产生。

这个案例有动态博弈的成分.因为你在假设对方“抵赖”时,对方猜到你会坦白,他就不会抵赖.这样你决策的依据“给定他人的战略”就变了。实际上恰恰就是在对方抵赖时你才有机会选择最优的战略抵赖,只有你选择“抵赖”.对方才不会改变.这时你的决策依据“给定他人的战略”确实可以作为依据。所以问题就出在这里。最后导致博弈的结果不是双方最优的结果。

从理性人的角度看,上述结论的产生也可能源于双方不是真正的“理性人”。双方相互不能猜透对方.从而各自只能采取自已的占优策略。如果是两个嫌疑人都是理性人.而且都是博弈论专家.他们相互理解对方且确信对方的策略。最后博弈均衡就会变为(抵赖。抵赖)。所以说到底.是参与人的不完全理性.导致了冈徒阑境的发生。

四、如何改进囚徒困境

通过上面的分析。可以发现囚徒用境的决策过程是有问题的。最后导致结果不是最优的。导致闪徒硝境的深层次原因似乎是参与人狭隘的“自私自利”观念。因为参与人想损人利已。达到最好的结果——被释放.如果参与人都这么想的话,

・23・

技术经济与蕾理碍究2011年第2期

最后的结局只能是各被判8年。如果双方跳出自私自利的圈子,考虑到“利他和利己”的结合,其结果就完全不一样。

如果两个囚徒在做上述决策时考虑合作,计算公共利益(例如两人是父子或兄弟),那么其决策过程就很简单。

我们引入公共支付函数P,显然:P=a+b,P是公共支付,代表大家的共同利益;a代表囚徒A的支付;b代表冈徒B的支付。那么表1中的四个战略组合的公共支付分别为:一16,一10。一10,-2。

显然(抵赖,抵赖)战略是最优的,这样两个囚徒就无可厚非的选择此战略。其实即使这两个囚徒不是父子或兄弟,也有积极性寻找此战略,只要双方有互利的先前约定.肯定会找到此均衡。我们把这种考虑公共支付的均衡称为广义均衡。从上面囚徒困境的案例分析广义均衡与传统的纳什均衡有可能不完全相同。因为此博弈过程中.虽然博弈双方有相互牵制的机制设计,但不是零和博弈。所以可以通过共同的努力找到使双方共同利益达到最大的战略,从而达到广义均衡。类似地。智猪博弈也是非零和博弈。也可以通过引入公共支付函数来分析。

假设猪罔里有一头大猪和一头小猪,猪圈的一头有个食槽。另一头有个控制猪食的按钮。按下按钮,有8个单位的猪食进槽,但需要支出2个单位的成本。若大猪先到,大猪吃到7个单位.小猪只能吃到1个单位;若小猪先到,小猪和大猪都吃到4个单位;若两猪同时到,大猪吃到5个单位,小猪吃到3个单位。每个猪都可以选择按或等待。不同战略组合下的支付矩阵如下:

大街纛E三j丑

表2智猪博彝

d-ll'

等待

要想找出上述博弈的最优战略组合,我们可以利用公共支付函数。计算表2中的四个战略组合的公共支付函数分别为:

4。6,6.0

所以从公共支付最大的角度看,(2,4)及(7,一1)分别对应的(等待。按)和(按,等待)可能成为广义均衡。从现实角度看,任何人不会采取损己利人的策略.所以(7。一1)对应的“小猪按,大猪等待”情况不可能发生。这里,只剩下“大猪按.小猪等待”的战略组合,所以最后的广义均衡是(等待,按),即大猪按小猪等待。这和参考文献[Hee利用“重复剔出严格劣战略”得到的纳什均衡结论相同。从这个案例的探讨,也能看出利用公共支付函数可以帮助分析非零和博弈的纳什均衡。

另外—个例子:市场进入阻挠博弈,也能利用公共支付函数很好地分析。有—个垄断者已在市场上(称为“在位者”).另一个企业(称为“进入者”)想进入该市场。在位者可选的战略有两个:默许和争斗。进入者的可选战略也有两个:进入和不进

表3市场进入阻挠博彝

j习0

在住者

枣沣

丰争

…:E噩0

不进人I

.300

300

・24・

万方数据

入。这是—个非零和博弈,各种战略组合下的支付矩阵如表3。

文献【11指出,此博弈有两个纳什均衡:

(进入,默许)和

(不进入,斗争),其中前者是强纳什均衡,后者是弱纳什均衡。但很容易发现上述强纳什均衡对整个社会来说并不是最优的。

计算公共支付函数,得到上述战略组合的结果分别为:

90,-10.300,300

比较公共支付函数可知.(不进入,默许)和(不进入,

斗争)是广义均衡。但是这两个战略组合都是在进入者选择不进入才有的结论。在此博弈过程中,在位者和进入者地位不对等(在冈徒困境和智猪博弈中双方地位完全对等),进入者有先手优势,在位者很被动。进入者有优先选择战略的权利。完全从公共利益考虑,进入者应该选择不进入。但这样对进入者本身没有任何好处,进入者考虑自身利益,会分析选择进入战略.最后的均衡为(进入。默许),这与前述强纳什均衡吻合。这个例子可以看出,对整个社会来说强纳什均衡也不是最好的,广义均衡才是最好的。基于此原因,政府会通过立法或设置壁垒严禁一些行业的进入从而保护公共利益。但是不幸的是,由于这些保护而没有竞争进人的威胁。造成垄断行业效率低下,这是另外的问题。不在本文讨论范围内。

其实做决策时,让所有人都考虑公共利益不太现实。但是,作为聪明的理性人也应该知道在不损害自己利益的同时,能增加

公共利益(如国家利益)是对自己有好处的,所以建议以后博弈

论讨论支付函数时,引入公共支付函数。在各自利益最大化和公

共支付函数最大化之间权衡.这样才能让个人和集体都受益。

讨论集体利益不能不说公共物品的供给。考虑公共物品的供给.有时可能是个囚徒斟境问题。作为普通的参与人考虑公共利益的积极性不强.作为政府部门或其他组织,应该通过政策或法律规定及其他手段(其作用相当于一只看不见的手),鼓励参与人(企业、个人)在博弈决策时尽量兼顾公共利益。这样才能使整个社会协调发展,达到个人和集体的和谐统一。

同时在文献【l】中也提到,重复博弈中可以看到参与人的合作行为。因为重复博弈中.参与人可能会为了长远利益而柄牲眼前利益从而选择不同的均衡战略。所以,在囚徒博弈过程中,如果两个囚徒在刑满释放后再作案,再次面临坦白或抵赖的决策选择时。可能会吸取过去的教训,从而避免囚徒困境的再次发生。这一点也可以理解为,他们通过亲身体会,学到了必需的博弈论知识,变成真正的“理性人”,再次面对闪徒博弈时.能有效决策,选择公共支付最大的战略组合:

(抵赖,抵赖)。

学习,他们肯定会在第二次的重复博弈中选择(抵赖,抵赖)战略,否则只能说明他们还不够“理性”。

五、囚徒困境的机制设计

我们从上面的分析看出,就一次决策来看,

(坦白.坦白)

和(抵赖。抵赖)都是囚徒困境的均衡。但实际上,在现实生活中(坦白.坦白)是经常出现的结果。这也正是司法界人士

从这一点看.笔者不同意文献f11中的有关冈徒困境重复博弈的结论。如果因为囚徒的“不完全理性”在第一次博弈中他们采取(坦白.坦白)战略,那么经过8年的牢狱生活和对博弈论的想要的结果。因为我们设计这个机制的目的就是要让罪犯坦白

从宽、抗拒从严。通过上述机制设计会使罪犯认罪伏法.这是所有人都想看到的结果。但问题是如果两人都抵赖.你还能认定他们有罪吗?如果认定有罪判1年是否太轻了?如果两人都抵赖就是无罪那就应该释放(而不应该各判1年)。所以在本文所给的表格中,如果两人都选择抵赖,各自的支付应该为0,

因为认定他们无罪就不应该判刑。如果这个支付改为(O,0)那么在做剔除严格劣策略时,就无法选择。更容易导致(抵赖.

抵赖)均衡的出现。所以为了能更好的让罪犯认罪,当两人都抵赖时,即使无罪.也各自被判一年,这看起来有点不公平,万一两个嫌疑人真的无罪,那将很不公平。如果双方抵赖的结

果是释放的话。会导致更多罪犯的也抵赖,这样会错放很多罪犯。权衡错放罪犯和错判无罪良民,估计后者概率更小,所以本案例设计了(一l,一1)的支付。

所以从囚徒困境的机制设计看。就是为了让嫌疑犯坦白,但是好像机制的设计不尽公平。因为两人都抵赖应该无罪释放,但都被判1年,而一人坦白,一人抵赖,坦白的人肯定也是罪犯但会被释放,但两人都抵赖时,说明有可能两人都是良民还会被判1年。更糟糕的是如果两人都是良民,有一人钻此机制设计的空子,自己不是罪犯坦白说是罪犯,另一个良民会坚决抵赖,那么坦白的人会释放,而不是被判一年,另外一个抵赖的良民会被判lOg。所以这个机制会逼迫良民说自己是罪犯。如果两个良民都想被释放的话。会争先恐后地承认自己是罪犯。导致都被判8年,这是机制设计者不想看到的结果。

通过上述分析可以看出,本案例的设计机制就是诱导嫌疑人坦白。即使良民也会有坦白的动机,这样会导致冤假错案的发生。在以人为本的社会中,我们不得不反思此机制设计的缺陷。

同时这个设计机制也不能杜绝坏人有抵赖的冲动。如果聪明绝顶的坏人会发现此案例中有两个均衡:纳什均衡:

(坦

白,坦白)和广义均衡:

(抵赖。抵赖),他们会执行战略组

合(抵赖,抵赖)。而且作为罪犯,他们吃苦受罪能力强(有前科的话还有反侦察经验),不容易被警察的刑讯逼供认罪,更容易达到(抵赖.抵赖)的均衡。这样真正的罪犯就会逃脱法律的制裁。对上述机制作修改.看下面的支付函数会对应怎

样的均衡结果。

设定上述支付函数的理由如下:①如果有一方坦白,证明

嫌疑人都是罪犯,对于那个抵赖的罪犯我们重判lO年,而对于

那个坦白的罪犯也不能就此放了.他毕竟犯了罪,轻判1年。②如果两人均抵赖,从保护嫌疑人的角度分析,可能嫌疑人是清白的,所以就不应再判刑,所以最后两个人都应该释放.即

两人都抵赖时,支付函数为(O,0)。如果这样设计支付函数。会有(坦白.坦白)和(抵赖,抵赖)两个均衡。笔者认为这样的机制设计更合理.这样可以让该坦白的就坦白,会得到应有的惩

罚。而清白的嫌疑人也不会挖空心思去坦白.无罪的人都会被释

放。当然聪明的罪犯也会设法追求(抵赖,抵赖)均衡。这样会放走一部分罪犯。但是经典的冈徒困境设计会导致无罪人也可能坦白,这样会造成冤假错案的发生。所以比较这两个设计机制各

有的优缺点.如果严打时期就应采用经典的支付矩阵机制设计。这时的指导思想是“宁可错杀一千.不能放走一个”;如果社会

万方数据

囚徒困境的均衡辨析

治安较好,比较宽松的环境下,可采用本文给出的改进支付矩阵来破案,这样有助于保护那些清白的嫌疑人。好在警察办案不仅

囚徒B

坦白

抵箱

瞰^抵赣r_—百若广—f—■i1…三三E三j翌

是看嫌疑人抵赖还是坦白。还有很多其他的证据,本案例的机制

设计只是辅助的诱导作用,真正的执法过程要看证据.所以可以

通过其他手段避免此案例机制设计的缺陷。

六、结语

对于囚徒困境的分析在重复博弈和动态博弈中还都有论述。值得一提的是在无限次重复博弈过程中,只要参与人有足够耐心.冷酷战略是无限次囚徒博弈的一个子博弈精炼纳什均衡,

(抵赖,抵赖)是每个阶段的均衡结果。囚徒走出了一次

性博弈时的困境。实际上聪明绝顶的理性人在第一次博弈之前就能看出多次重复博弈的后果,所以。按照本文的观点,两个理性的囚徒在第一次博弈中就能得到均衡结果(抵赖,抵赖),而且如果博弈重复下去。这个博弈均衡永远不会改变。但是如果两个囚徒在第一次博弈结束时达到的均衡是(坦白.坦白),如果重复多次.他们会找到另外一个均衡(抵赖,抵赖)。

囚徒困境的纳什均衡应该有两个:纳什均衡(坦白,坦白)和广义均衡(抵赖.抵赖)。如果博弈双方在之前有攻守同盟。即博弈的起始战略是(抵赖,抵赖)。双方都不会打破僵局.因为打破此战略会有一连串的反应导致双方更坏的结果。所以(抵赖.抵赖)是纳什均衡。如果决策双方没有攻守同盟,博弈的起始战略是(坦白,坦白),那么有一方想改变

成抵赖时。只能使自己被判刑的时间更长,而令一方会受益,

所以不会有人想再改变此结果,

(坦白。坦白)是纳什均衡。

囚徒困境博弈的最终结果是这两个均衡的哪一个,要看参与双方的最初的意见。如果双方有攻守同盟其最后达到的均衡是

(抵赖。抵赖)。如果最初没有攻守同盟。同时双方又不够聪明,不够信任。会聪明反被聪明误,最后达到的纳什均衡(坦

白.坦白)。一但达到此均衡双方再没改变的余地。这个结论

与现实生活也相符。例如如果两个囚徒相互信任且足够聪明,

假设两个人是兄弟,那么最后的纳什均衡就是(抵赖,抵赖),否则就是(坦白.坦白)。现实中还要考率警察刑讯逼供等因

素。实际最后达到(抵赖,抵赖)均衡的就更少。

【参考文献】

【11张维迎.博弈论与信息经济学【M1.上海人民比版社.2004(11).【2】NMh.J.Equilibrium

PointsinPerson

Gam∞lJ].Proceedings

of

theNa-

tiongalAcademyofSciences1950.36.

【3】杨懋,祁守成.囚徒困境从单次博弈到重复博弈IJl.商业时代.2009.

【4】孙鑫.囚徒阑境博弈及其应用浅析lJl.产业与科技论坛,20∞(4).

【5】傅俊华.陈惠雄.快乐理论对刚徒硝境的新解释Ul经济论坛.2009(7).【6】陈建先.博弈视角的冲突与合作均衡解【J】.广州大学学报(社科版)。

2010(6).

・25・


相关范文

  1. 博弈论通识教育课堂教学改革研究

    关键词:博弈论 社会科学 案例教学法 模拟教学法 抽象思维能力 1960年,托马斯·谢林在<冲突的战略>一书中开创性地运用博弈框架分析经济学以外的社会科学问题[1],而后拓展研究纷至沓来,涉及政治.军事.国际关系与外交等多个学科.随着博弈论研究在社会科学多个领域的不断深入与成功应用,大学 ...

  2. 囚犯困境模型

    囚徒困境(Prison Dilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择.虽然困境本身只属模型性质,但现实中的价格竞争.环境保护等方面,也会频繁出现类似情况. 单次发生的囚徒困境,和多次重复的囚徒困境结果不会一样. 在重复的囚徒困境中,博弈被反复地进行.因而每个 ...

  3. 博弈论经典案例"囚徒困境"及其实证分析

    博弈论经典案例"囚徒困境"及其实证分析 发帖时间:2005-10-27 11:06:52 功能:[回复] [收藏] [使用卡片] [违规举报] [复制地址] [点242/回2] 分页:第一页 [1-50] 下一页 尾页 [新开阅读] [只看楼主] [刷新本帖] [楼主] [每日必 ...

  4. 囚徒的困境与出路_一个包含心理过程的博弈模型

    5经济师62008年第2期 p新人新作 摘 要:囚徒困境作为博弈论的经典案例,说明了个人理性与集体理性之间的冲突.文章将心理过程应用于博弈分析,得出了不同于传统囚徒困境的结论.在此基础上提出博弈分析中应考虑心理.文化.制度的影响.这一研究对于博弈理论在社会科学中的应用及实验经济学的理论发展具有一定的 ...

  5. 国际气候合作中的非合作性博弈困境及其超越_李强

    理论与实践理论月刊2011年第9期 国际气候合作中的非合作性博弈困境及其超越 李 强 (天津外国语大学涉外法政学院,天津300204) * 摘要:以"囚徒困境"为主要表现形式的非合作博弈是困扰国际气候谈判进展缓慢的关键障碍,其原因就在于各国(国家集团)在气候变化问题上的个体利益诉 ...

  6. 南开大学远程教育管理经济学(二)论文

    南开大学现代远程教育学院考试卷(专科) 2012-2013年度秋季学期期末(2013.3) <管理经济学(二)> 主讲教师: 卿志琼 学习中心:____________________________ 专业:_______________________ 姓 名:____________ ...

  7. 浅谈生活中的博弈论

    浅谈生活中的博弈论 目录 一 博弈论的简介 ...................................... 2 二 博弈论的历史 ...................................... 3 三 博弈论的基本概念 .......................... ...

  8. 博弈论中的"囚徒困境"

    在博弈论中,有一个流传颇为广泛的故事,叫做"囚徒困境"(Pris-oner,s Dilemma). 案例是有一天,一位富翁在家中被杀,财物被盗.警方在此案的侦破过程中,抓到两个犯罪嫌疑人A和B,并从他们的住处搜出被害人家中丢失的财物.但是,他们都矢口否认曾杀过人,辩称是先发现富翁 ...

  9. 简述运筹学的起源与发展历程

    简述运筹学的起源与发展历程--应用博弈论思想分析团队合作中个人理性和集体利益的关系 作者:张舒悦 学号:14122690 日期:2015年1月19日 [摘要] 我们说理性表现为参与人为自己的目标进行推理或计算.因此·在博弈对峙的局面中,每个人的理性判断最终导致的行为选择,也许反而会使导致集体利益的最 ...