本文目录一览:
关于博弈论的演讲
我非常欣赏你的想法 博弈论 这么多年的发展已经完善成为一门十分重要的经济学分支学科,不管是在结构分析还是决策预测等方面都发挥着越来越重要的作用,尤其对于理性人来说懂得如何博弈就显得越发重要。
当然作为一名高中生的演讲,就不需要讲得太深奥,我个人觉得讲得活泼生动即可,仅仅向大家传达一个信息,博弈论很重要,很有趣,很有研究价值即可。因此我觉得应该少讲理论,而应该多举例子,至于为什么会出现这样的策略选择则不是你要和大家讲的,如果大家要是感兴趣可以在以后的人生中去品味学习,让大家对博弈论产生兴趣,那么--你的演讲就相当成功了,同时也为博弈论在中国的传播做出了相当的贡献,。
下面我说一下我个人的想法。博弈(GAME)其实就是一种游戏,是如何做出对自己有利选择的游戏,但又区别于传统的如体育运动、下棋、打牌等游戏,同时又和这些有些有本质的共同特征,如都有一定的规则,都有一个结果,策略至关重要,同时策略和得益有相互依存性,游戏者不同的策略会带来不同的结果。这样看来博弈好像和我们身边普通的游戏是一样的,其实这并不奇怪,其实博弈本身的含义就是博弈参与者在一定的规则条件下选择相应的策略以期获得足够的利益的过程,这和传统的游戏是相通的,如最常见的斗地主,就是在一定的规则下(如连牌至少5张一连等等),选择如何出牌(出牌的组合以及出牌的顺序等等)而获胜(当然也可能输)的过程,这本身就是一个三方博弈的过程。那么为什么不把GAME翻译成游戏,而要翻译成博弈呢?在我用的教科书中是这么说的,博弈 ”毕竟是一个不常用的文言味的词,因此就有较强的理论色彩,甚至有点高深莫测的感觉。这可能会使得一些读者不敢去碰博弈论的书,不过,对更多的具有钻研精神的读者来说,用 博弈(GAME) 和博弈论(GAME Theory)这种学术味更浓的称呼,而不是 游戏 和游戏理论 等容易让人觉得浅薄的称呼,更可能会让他们觉得值得一读而拿来翻翻,不至于错过了解他的机会。
了解了博弈的含义,那么下面我们来看一下几类经典的博弈模型
第一个当然是任何与博弈有关的书籍中都会讲到的 囚徒困境
囚徒困境的博弈的基本模型是这样的:警察抓了两个合伙犯罪的罪犯,但却缺乏足够的证据指证他们所犯的罪行。如果其中至少有一个供认犯罪就能确认罪名成立。为了得到所需的口供,警察将这两名罪犯分别关押以防止他们串供或结成攻守同盟,并给他们同样的选择机会:如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判一年徒刑;如果两人中有一人坦白认罪,则坦白者从轻处理,立即释放,而另一人则将重判8年徒刑;如果两人同时坦白认罪,则他们将被各判5年监禁。
如果分别用-1,-5和-8表示判刑1年、5年、8年的得益,用0表示被立即释放的得益,则我们可以用一个特殊的矩阵将这个博弈表示出来,如图1.这种矩阵是表示博弈问题的一种常用方法,我们称这种矩阵为一个博弈的:得益矩阵:
图1中囚徒1 囚徒2代表两个博弈方,他们各自都有“坦白”和“不坦白”两种可选择的策略;因为这两个囚徒被隔离开,其中任何一个人在选择策略时都不可能知道另外一个选择什么,因此可能两人做出选择时间不同,但是在选择时不知道对方的决定,因此我们在理论上可以看做他们同时做出选择,那么下面我们就来分析一下,他们会如何选择呢,如果是其中一个是你,你又会如何选择呢?
在分析之前我必须要说明一下,我们这里的博弈方是理性的,即他总是考虑自身是否能得到最大的利益,而不是集体得到最大的利益。
例如对于囚徒1来说,囚徒2有坦白和 不坦白两种可能的选择,假设囚徒2选择的是“不坦白”,则对囚徒1来说,“不坦白”的得益为-1,坦白的得益为 0,那么他肯定会选择坦白, 假设囚徒2选择的是“坦白”那么 囚徒1坦白的得益为-5,不坦白的得益为 -8 ,他肯定 也会选择 坦白。因此在本博弈中,无论囚徒2采用何种策略,只考虑自身利益的囚徒1的选择是唯一的,那就是“坦白”,因为在另一方的两种可能选择的情况下,“坦白”给他自己带来的得益都是最大的。同样的,因为囚徒2与囚徒1的情况完全相同,因此囚徒2与囚徒1的决策思路和选择也会和囚徒1完全一样,囚徒2在这个博弈中唯一合理的选择也是“坦白”。所以该博弈的最终结果必然是两博弈方同时选择“坦白”策略,同时被判5年。 也许你会感到和奇怪,他们怎么都不选择“不坦白”呢,如果这样的话他们不是都只判1年刑了吗?事实上通过上述分析我们知道那是不可能的 除非在两人串供的基础上,但我们的前提是他们被分别关押,根本没有串供的可能。这个结果或许你会感到不能理解,但通过我上述运用博弈知识的分析,你应该清楚了吧,而这也正是博弈论的魅力所在。 如果这个例子你听我讲过之后能够明白的话,那么下面这个例子就不一定了:
有5个海盗,他们要分100个金币,假设他们分别为1、2、3、4、5,这5个人都非常聪明,都想获得最多可能的钱,并且绝对理性。就在给出以下分配方案:由1 开始说自己的分配方案,如果有超过一半的人同意,那么该分配方案得以实行,如果没有超过一半的人同意那么 他就被推到海里,有2号说自己的分配方案,同理如果有超过一半的人同意,那么该分配方案得以实行,如果没有超过一半的人同意那么 他就被推到海里,接着由3、4说自己的方案直到只剩下5号一个人,那么现在 问:1号应该怎么分配金币,才能得到最多的金币,且不被推到海里,我相信现在没有一个人能够说出正确答案,即使你知道正确答案,你也不知道为什么会是这样吧,下面我来告诉正确答案:97 0 1 2 0 ,想不到吧,想知道为什么吗,那么就去学一下博弈论吧。
我说的例子只是博弈论中非常简单的例子,现代博弈论在纳什均衡定理的推动下已经得到了极大的发展,尤其是有限理性博弈模型更是发展迅速,要想真正理解博弈论那么我们还要很长的一段路要走。谢谢 (校园网网速慢,图片明天早上发给你) 希望我所说的能够帮到你,同时也希望你对博弈论一直保持兴趣,我也是一名迷茫的博弈论追随者 ,共勉!
博弈论是什么?博弈论的思想是什么?
博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。
博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。
博弈要素:
1.决策人:在博弈中率先作出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。(博弈圣经)
2.对抗者:在博弈二人对局中行动滞后的那个人,与决策人要作出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。他的策略可能依赖于决策人劣势的策略选择,占去空间特性,因此对抗是唯一占优的方式,实为领导人的阶段性终结行为。(博弈圣经)
3.生物亲序:所有生物在恶劣、未知的环境中都有寻找规律和有序的本能。在博弈中指参与者有从混乱的环境中等待、寻找有序的亲近行为。(博弈圣经)
4.局中人(players):在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为 “多人博弈”。
5.策略(strategiges):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。
6.得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。
7.次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。
8.博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。所谓纳什均衡,它是一稳定的博弈结果。
纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。
这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:偶对(a, b*)≤偶对(a*,b*)≤偶对(a*,b)。
对于非零和博弈也有如下定义:一对策略a*(属于策略集A)和策略b*(属于策略集B)称为非零和博弈的均衡偶,对任一策略a(属于策略集A)和策略 b(属于策略集B),总有:对局中人A的偶对(a, b*) ≤偶对(a*,b*);对局中人B的偶对(a*,b)≤偶对(a*,b*)。
有了上述定义,就立即得到纳什定理:
任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。
纳什定理的严格证明要用到不动点理论,不动点理论是经济均衡研究的主要工具。通俗地说,寻找均衡点的存在性等价于找到博弈的不动点。
纳什均衡点概念提供了一种非常重要的分析手段,使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。
但纳什均衡点定义只局限于任何局中人不想单方面变换策略,而忽视了其他局中人改变策略的可能性,因此,在很多情况下,纳什均衡点的结论缺乏说服力,研究者们形象地称之为“天真可爱的纳什均衡点”。
塞尔顿(R·Selten)在多个均衡中剔除一些按照一定规则不合理的均衡点,从而形成了两个均衡的精炼概念:子博弈完全均衡和颤抖的手完美均衡。弈论的研究方法和其他许多利用数学工具研究社会经济现象的学科一样,都是从复杂的现象中抽象出基本的元素,对这些元素构成的数学模型进行分析,而后逐步引入对其形势产影响的其他因素,从而分析其结果。
基于不同抽象水平,形成三种博弈表述方式,标准型、扩展型和特征函数型利用这三种表述形式,可以研究形形色色的问题。因此,它被称为“社会科学的数学”从理论上讲,博弈论是研究理性的行动者相互作用的形式理论,而实际上正深入到经济学、政治学、社会学等等,被各门社会科学所应用。
博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博弈论是个非常重要的理论概念。
什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法…
面对如许重重迷雾,博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢?现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球,一个人赢一着则另一个人必输一着,净获利为零。在这里抽象化后的博弈问题是,已知参与者集合(两方) ,策略集合(所有棋着) ,和盈利集合(赢子输子) ,能否且如何找到一个理论上的“解” 或“平衡” ,也就是对参与双方来说都最“合理” 、最优的具体策略?怎样才是“合理” ?应用传统决定论中的“最小最大” 准则,即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运算,对于每一个二人零和博弈,都能够找到一个“最小最大解” 。通过一定的线性运算,竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤,就可以最终达到彼此盈利最大且相当。当然,其隐含的意义在于,这套最优策略并不依赖于对手在博弈中的操作。用通俗的话说,这个著名的最小最大定理所体现的基本“理性” 思想是“抱最好的希望,做最坏的打算” 。
博弈论--这是一个热得烫手的概念。它不仅仅存在于数学的运筹学中,也正在经济学中占据越来越重要的地位(近几年诺贝尔经济学奖就频频授予博弈论研究者),但如果你认为博弈论的应用领域仅限于此的话,那你就大错了。实际上,博弈论甚至在我们的工作和生活中无处不在!在工作中,你在和上司博弈,也在和下属博弈,你也同样会跟其他相关部门人员博弈;而要开展业务,你更是在和你的客户以及竞争对手博弈。在生活中,博弈仍然无处不在。博弈论代表着一种全新的分析方法和全新的思想。
诺贝尔经济学奖获得者包罗·萨缪尔逊如是说:
要想在现代社会做个有价值的人,你就必须对博弈论有个大致的了解。
也可以这样说,要相赢得生意,不可不学博弈论;要想赢得生活,同样不可不学博弈论。
博弈论很深奥吗?通过本教材你将发现深奥的博弈论原来也可以这么生动、通俗和易懂。大量的案例、平实的语言,将帮助你轻松掌握博弈论这个今天最时髦的工具。
《博弈圣经》中也说到:21世纪,应站在博弈论的前沿。尽管博弈经济学家很少,但其获诺贝尔奖的比例最高。最能震动人类情感的是博弈,对未来最有影响力的还是博弈。评论一个人和一个国家的穷富,就看他分享博弈正理的多少。
可见博弈之重要。
经济学中的“智猪博弈”(Pigs’payoffs)
这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的食物数量和踏板与投食口之间的距离。
如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。
改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。
如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。
改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。
对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。
改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。
对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。
原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。
比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智猪博弈”增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的大猪也不会有动力了----就象“智猪博弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三----减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。
许多人并未读过“智猪博弈”的故事,但是却在自觉地使用小猪的策略。股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等。因此,对于制订各种经济管理的游戏规则的人,必须深谙“智猪博弈”指标改变的个中道理。
[编辑本段]纳什博弈论的原理与应用
1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。然而,纳什天才的发现却遭到冯·诺依曼的断然否定,在此之前他还受到爱因斯坦的冷遇。但是骨子里挑战权威、藐视权威的本性,使纳什坚持了自己的观点,终成一代大师。要不是30多年的严重精神病折磨,恐怕他早已站在诺贝尔奖的领奖台上了,而且也绝不会与其他人分享这一殊荣。
纳什是一个非常天才的数学家,他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。然而,他的天才发现———非合作博弈的均衡,即“纳什均衡”并不是一帆风顺的。
1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁。当时普林斯顿可谓人杰地灵,大师如云。爱因斯坦、冯·诺依曼、列夫谢茨(数学系主任)、阿尔伯特·塔克、阿伦佐·切奇、哈罗德·库恩、诺尔曼·斯蒂恩罗德、埃尔夫·福克斯……等全都在这里。博弈论主要是由冯·诺依曼(1903—1957)创所立的。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论,而且提出了计算机的基本原理。早在20世纪初,塞梅鲁(Zermelo)、鲍罗(Borel)和冯·诺伊曼已经开始研究博弈的准确的数学表达,直到1939年,冯·诺依曼遇到经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern),并与其合作才使博弈论进入经济学的广阔领域。
1944年他与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。正是在这个时候,非合作博弈———“纳什均衡”应运而生了,它标志着博弈论的新时代的开始!纳什不是一个按部就班的学生,他经常旷课。据他的同学们回忆,他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课,但纳什争辩说,至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者,可是,没上几次课,纳什就认定这门课不符合他的口味。于是,又走人了。然而,纳什毕竟是一位英才天纵的非凡人物,他广泛涉猎数学王国的每一个分支,如拓扑学、代数几何学、逻辑学、博弈论等等,深深地为之着迷。纳什经常显示出他与众不同的自信和自负,充满咄咄逼人的学术野心。1950年整个夏天纳什都忙于应付紧张的考试,他的博弈论研究工作被迫中断,他感到这是莫大的浪费。殊不知这种暂时的“放弃”,使原来模糊、杂乱和无绪的若干念头,在潜意识的持续思考下,逐步形成一条清晰的脉络,突然来了灵感!这一年的10月,他骤感才思潮涌,梦笔生花。其中一个最耀眼的亮点就是日后被称之为“纳什均衡”的非合作博弈均衡的概念。纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)。1950年他才把自己的研究成果写成题为“非合作博弈”的长篇博士论文,1950年11月刊登在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低几天之后,他遇到盖尔,告诉他自己已经将冯·诺依曼的“最小最大原理”(minimax solution)推到非合作博弈领域,找到了普遍化的方法和均衡点。盖尔听得很认真,他终于意识到纳什的思路比冯·诺伊曼的合作博弈的理论更能反映现实的情况,而对其严密优美的数学证明极为赞叹。盖尔建议他马上整理出来发表,以免被别人捷足先登。纳什这个初出茅庐的小子,根本不知道竞争的险恶,从未想过要这么做。结果还是盖尔充当了他的“经纪人”,代为起草致科学院的短信,系主任列夫谢茨则亲自将文稿递交给科学院。纳什写的文章不多,就那么几篇,但已经足够了,因为都是精品中的精品。这一点也是值得我们深思的。国内提一个教授,要求在“核心的刊物”上发表多少篇文章。按照这个标准可能纳什还不一定够资格。
1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章,特殊的人才,必须有特殊的选拔办法。
纳什在上大学时就开始从事纯数学的博弈论研究,1948年进入普林斯顿大学后更是如鱼得水。20岁出头已成为闻名世界的数学家。特别是在经济博弈论领域,他做出了划时代的贡献,是继冯·诺依曼之后最伟大的博弈论大师之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。后续的研究者对博弈论的贡献,都是建立在这一概念之上的。由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。
博弈论在乒乓球的运用
博弈论始于1944 年,它是以冯·诺伊曼( Von
Neumann) 和摩根斯坦恩( Oskar Morgenstern) 合作的
《博弈论与经济行为》一书的出版为标志。[1]到20 世
纪50 年代,合作博弈发展到鼎盛期,非合作博弈也开
始产生。纳什( Nash. J. F. ) 的《N 人博弈的均衡点》
( 1950) ,《非合作博弈》( 1951) 明确提出了纳什均衡
( Nash Equilibrium) ,图克( Tucker) 则定义了囚徒困境
( Prisoners’Dilemma,1950) 。[2][3][4]两人的著作奠定现
代非合作博弈论的基石。博弈论思想在国际上已经
覆盖了广泛的领域,经济、政治、外交以及战争中都有
深刻的体现,生物学已深受进化博弈概念的影响,心
理学和哲学也与策略博弈的研究相互影响。事实上,
每当人们为达成协议或解决冲突而彼此互动时,博弈
就蕴含其中了。
阿维纳什·迪克西特与苏珊·斯克丝用( 美式)
橄榄球总的单次对局构建了进攻与防守的博弈模型,
系统的描述了离散型策略同时行动博弈的“博弈矩阵
表( game table) ”、“支付表( payoff table) ”及“策略式
( strategic form) ”的相关概念[5]。Mark Walker 与John
Wooders( 1998) 年用专业的网球比赛数据,以实际比
赛验证博弈理论中的混合策略均衡[6]。Joko Sindiky
与Nives Vidak( 2007) 就如何在团队比赛中运用博弈
思想进行战术决策进行了研究,提出了基于博弈思想
的团队比赛战术决策基本方法[7]。但是博弈理论在
国外运用最成功的体育项目是在足球的点球射门的
博弈中,耶鲁大学的博弈课程教学时,用博弈理论构
建了射手与守门员的博弈模型并在此基础上对现实
比赛中的世界杯比赛进行了博弈分析[8]。在我国体
育领域中李益群( 2002) 等人已经出版了《体育博弈
论》专著,宏观描述了体育博弈的本质特征等,提出体
育博弈论现象、博弈系统、博弈制胜规律、博弈决策、
博弈战略、博弈策略、博弈创新、博弈方法、博弈实践、
博弈实战等等构成基本概念体系[9]。乒乓球领域中,
陈家鸣( 2008) 博士论文《乒乓球比赛战术的博弈分
析》一文旨在开阔思路、提高战术思维层次,在竞技实
践中减少决策失误,提高获胜几率,奠定中国乒乓球
竞技运动理论基础出发,运用博弈论方法、案例分析
法从乒乓球战术、战略概念进行了梳理,也试着对竞
赛过程做了分析[10]。刘文明( 2010) 对基于博弈理论
分析的基础上提出了乒乓球战术行为耦合系统的概
念并对其进行了解释[11]。
纳什均衡( Nash equilibrium) 又称为非合作博弈
均衡,是博弈论的一个重要术语,以约翰·纳什命名。
纳什均衡指的是这样一种战略组合,这种策略组合由
所有参与人最优策略组成。即在给定别人策略的情
况下,没有人有足够理由打破这种均衡。纳什均衡之
所以重要是因为他具有“一致性预测”即所有博弈方
都预测一个特定的博弈结果会出现,那么所有的博弈
方都不会利用该预测或这种预测能力,选择与预测结
果不一致的策略。一致性预测是纳什均衡的本质属
性同时在博弈分析中具有重要地位,也只有纳什均衡
才具有一致预测的性质[12]。本文主要目的是探讨在
乒乓球比赛中纳什均衡的存在形式,从而使得对乒乓
球运动员的战术行为预测成为可能。
1 研究对象与方法
1. 1 研究对象以乒乓球战术行为博弈过程为研究
对象,具体包括乒乓球战术行为博弈理论体系构建与
实证研究两个方面。
1. 2 研究方法
1. 2. 1 录像观察法根据博弈理论中的策略互动和
乒乓球战术行为的针对性,根据专家意见和研究需要
确定为王皓、波尔两名世界优秀乒乓球运动员,收集
2004—2010 年度的比赛录像为分析对象,进行战术行
为信息采集,比赛录像搜集过程中需注意研究对象之
间的特异性,即中国某乒乓球队员对外国某名队员的
全部比赛录像( 奥运会、世锦赛、世界杯、国际乒联巡
回赛) 。收集的录像为2004 年国际乒联规则修改之
后的乒乓球比赛,这样避免了规则对运动员技战术行
为的影响( 表1) 。在录像观察时剔除不符合博弈规则
的比赛录像信息,如2009 年乒联巡回赛王皓与波尔的
比赛中在比赛进行到第五局,当时局分王皓3∶ 1 领先,
小分10∶ 1 王皓领先并取得赛点之后的几分球是明显
的表演性质,不具备博弈性质,所以没有录入比赛
信息。
1. 2. 2 数理统计法数理统计指标根据专家访谈结
果和以往科研经历依据并张晓蓬( 2008) 提出的乒乓
球战术指标选取原则( 目的性、严肃性、可接受性、简
明性、可操作性) [13],并结合专家访谈的实际,本研究
筛选出两类指标,落点指标、得失分技术指标。将原
始数据比赛战术信息按时间顺序录入Microsoft Excel,
并建立分析对象数据库。再转制为SPSS 统计分析软
件,进行数据分析处理。
1. 2. 2. 1 击球技术指标乒乓球击球技术指标包括
弧圈球、快攻、挑打、扣杀、摆短、劈长、挡球、放高球、
被攻9 项。在实际研究中发现,很多技术在录像观察
中比较模糊并不是非常清晰,根据实际需要进行了合
并,如弧圈球与快攻技术统称为拉攻技术。
1. 2. 2. 2 击球落点指标乒乓球击球落点指标有正
手短球、正手长球、中路短球、中路长球、反手短球、反
手长球共6 项。击球落点区域划分可以用( 图1) 进行
1. 2. 2. 3 博弈阶段划分首先从发球轮次的角度进行
了划分,分为发球轮次与接发球轮次; 再次,从击球顺序
与战术行为结合的角度进行了博弈阶段划分( 表2) 。
1. 2. 3 博弈软件求解方法乒乓球战术行为阶段博
弈的矩阵分析,是以落点和技术相结合的角度建立乒
乓球阶段博弈矩阵模型,利用GAMBIT 博弈分析软件
遵循迭代剔除( 弱) 劣势策略对各个阶段矩阵博弈模
型求解[14 - 15],最终确定乒乓球战术行为博弈双方的
“路径依赖”策略。
乒乓球战略式博弈模型求解方法采用GAMBIT
软件,此软件可构建并分析战略式和扩展式博弈。软
件的设计能够使其在Linux,Mac OS X 和Windows 上
运行。
2 结果与分析
2. 1 乒乓球战术行为博弈理论建构
2. 1. 1 乒乓球战术行为博弈理论的概念乒乓球战
术行为博弈理论,即是关于乒乓球战术行为合理运用
的理论体系,是研究如何在乒乓球竞赛实践中战胜对
手,提高胜算,获取比赛优胜的理论。乒乓球战术行
为博弈理论是以“博弈论”的基础理论、思想方法去研
究和探索乒乓球技战术在竞赛过程中合理运用的微
观问题的理论,探讨在乒乓球运动竞赛中如何去战胜
对手、提高胜算、获取优胜的科学理论。博弈双方之
2. 1. 2 乒乓球战术行为博弈的构成要素乒乓球战
术行为博弈要素包括: 参与人( players) 这里指乒乓球
运动员; 行动( action or moves) 这里指乒乓球的具体技
术,如拉攻、摆短、挑打、劈长等技术也指正短、正长等
落点; 信息( information) 是关于对手的已知信息,乒乓
球运动员都知道对手拥有的技术和落点信息集合; 战
略( strategy) 这里指乒乓球战术策略,也可以说是技术
组合如技术组合或者是落点组合,也可以说是具体技
术的战术运用; 支付( payoff) 一分球得分或者失分; 次
序( order) 包括发球轮次与击球的先后顺序; 结果( outcome)
是博弈的最终形式包括战术行为的博弈整个过
程的所有情况,是技战术分析人员最感兴趣的部分;
均衡( equilibrium) 指双方战术最优组合形式。对一个
乒乓球战术行为博弈描述至少必须包括参与人、战略
和支付,而行动与信息则是建筑材料。参与人、行动、
次序和结果结合起来称为乒乓球战术行为博弈的规
则( rules of the game) ,我们的研究目的在于运用博弈
的规则来确定并分析乒乓球战术行为博弈的均衡[16]。
2. 1. 3 乒乓球战术行为的博弈类属研究乒乓球战
术行为的博弈类属可从不同角度出发进行分类,从博
弈的参与人数量角度上乒乓球战术行为博弈是两人
博弈,因为直接参与其中是双方运动员; 从博弈的次
序角度上可定义为序贯博弈,即轮转发球和击球顺
序; 从博弈的得益特点角度为零和博弈,一方得分必
是另一方失分,总和为零; 从博弈的次数角度为重复
博弈,重复多次进行; 从博弈的信息角度本研究定义
为完美信息博弈,因为博弈双方都知道技术与落点信
息,但是在实际当中却不可能做到这一点; 乒乓球战
术行为博弈有着特定的博弈规则,双方运动员必须遵
守,并且规则对战术行为的实施有着非常明显的影
响。乒乓球战术行为的博弈类属是确定其纳什均衡
的基本前提[17]。
2. 2 乒乓球战术行为博弈分析的实证研究王皓与
波尔比赛共7 场见表2,王皓6 胜1 负,波尔1 胜6 负,
王皓胜率为85. 71%,波尔胜率为14. 29%; 共36 局,
王皓26 胜10 负,波尔10 负26 负,王皓的胜率为
72. 22%,波尔胜率为27. 78%; 共统计具有有效分析
分数为659 分,王皓总得分为374 分,波尔总得分为
285 分,王皓得分率为56. 75%,波尔得分率为
43. 25%。
2. 2. 1 波尔发球轮博弈分析
2. 2. 1. 1 波尔发球轮博弈矩阵构建
1) 发球与接发球。
波尔发球落点策略集合包括: 正手短球、正手长
球、中路短球、反手短球、反手长球5 项策略,其中中路
短球策略得分最多共16 分; 王皓接发球技术策略集合
包括: 拉攻、挑打、摆短、劈长4 项策略,其中挑打技术
得分最多为24 分。但针对波尔中路短球策略王皓摆
短技术得分最多为17 分( 图3) 。