资源描述
,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,博弈论初步,博弈论初步,博弈论与主流经济学的发展,传统经济学的假设及其局限性,两个基本假设:完全竞争,完美信息,局限性:交易主体的数量其实很有限;信息是不对称的,一般均衡理论是整个经济学的理论基石和道义基础,市场机制是完美的,帕累托最优成立,平等与效率可以兼顾。然而在以下情况不成立:,非完全竞争:垄断越来越普遍,外部性:市场不可能把所有的成本收益都计算在内,公共产品:市场无非解决,“,搭便车,”,问题,逆向选择问题:柠檬市场,道德风险问题:为什么市场的交易费用比较高,?,博弈论与主流经济学的发展传统经济学的假设及其局限性,博弈论与主流经济学的发展,博弈论研究的是:在策略性环境中如何进行策略性决策和采取策略性行动的科学。当成果无法由个体完全掌握,而结局须视群体共同决策而定时,个人为了取胜,应该采取什么策略,博弈论成为通用方法论,经济学、政治学、管理、军事、外交、国际关系、公共选择、犯罪学,博弈论与主流经济学的发展博弈论研究的是:在策略性环境中如何进,博弈论与主流经济学的发展,传统微观经济学与博弈论的比较,传统微观经济学的个人决策是在给定一个价格参数和收入的条件下最大化自己的效用,个人的效用与其他人无关,所有其他人的行为都被总结在“价格”参数之中,博弈论中,个人效用不仅依赖于自己的选择,还以来于他人的选择,研究在存在外部经济条件下的个人选择问题,事实上,行为主体的数量通常不多,相互之间存在明显影响,经济学对博弈论寄予厚望,认为用博弈论可以重写经济学原理,博弈论改写经济学,从放宽新古典的完全竞争和完全信息两个条件展开,博弈论与主流经济学的发展传统微观经济学与博弈论的比较,博弈论的代表人物及其贡献,1944,年,,J,冯,诺依曼、,O,摩根斯坦恩在,博弈理论与经济行为,首先提出一些博弈论的概念。,1994,年,纳什、泽尔腾和海萨尼获得诺贝尔,经济学奖。,1996,年,,莫里斯和维克里获得诺贝尔经济学奖。,2001,年,阿克洛夫、斯蒂格利茨和斯宾塞获得诺贝尔经济学奖,2005,年,奥曼和谢林获得诺贝尔经济学奖。,博弈论的代表人物及其贡献1944年,J冯诺依曼、O摩根,一、什么是博弈论:从,“,囚徒困境,”,谈起,囚徒困境,两个小偷甲和乙联手作案,私入民宅被警方逮住但未获证据。警方将两人分别置于两间房间分开审讯,政策是若一人招供但另一人未招,则招者立即被释放,未招者判入狱,10,年;若二人都招则两人各判刑,8,年,;,若两人都,不招则未获证据但因私入民宅,各拘留,1,年。,一、什么是博弈论:从“囚徒困境”谈起 囚徒困境,表,1,囚徒困境博弈,乙,招 不招,招,甲,不招,(,问题:甲、乙如何选择?),-8,-8,0,-10,-10,0,-1,-1,表1 囚徒困境博弈-8,-80,-10-10,0-1,-1,尽管甲不知乙是否招供,但他认为自己选,“,招,”,最好,因而甲会选择,“,招,”,,乙也同样会选择,“,招,”,,结果各判,8,年;但若两人都不招,结果是两人只被判,1,年,但这种结果是不会出现的。,我们可以运用,“,剔除劣战,略,”,的方法来获得这样的结果。,尽管甲不知乙是否招供,但他认为自,甲或乙可以作出的选择被称为“战略”,如“招”或“不招”都是战略。,甲或乙可以作出的选择被称为“战略”,如“,思想,“,囚徒困境,”,博弈的经济和社会意义在于,个人理性不一定导致集体理性,或者说,人人为自己未必导致整体利益。,这与市场机制的思想是不同的。不过,两者是相辅相成的。,思想“囚徒困境”博弈的经济和社会意义在于,个人理性不一定导致,囚徒困境的几个事例:,价格大战,两个寡头企业选择产量,军备竞赛,做广告,围观时踮脚尖,应试教育,贸易自由与壁垒,地方保护主义,囚徒困境的几个事例:,博弈论要点,博弈:决策主体在互相对抗中,对抗双方,(,或多方,),互相依存的一系列策略和行动的过程集合,参与人的利益有冲突,博弈是一个过程集合,(,参与人、策略、行动、信息等,),。把博弈视为集合是思维从具体到抽象的重要一步,博弈的一个本质特征是策略的相互依存性,博弈论:专门研究博弈如何出现均衡的规律的学问,博弈论要点博弈:决策主体在互相对抗中,对抗双方(或多方)互相,博弈论要点,博弈论的基本概念包括:参与人、参与人的策略、参与人的支付(效用),博弈有不同的种类:,从行动顺序角度:,静态博弈,。,参与人同时选择行动,动态博弈。参与人的行动有先后顺序,从拥有信息角度:,完全信息博弈。每个参与人对所有其他参与人的特征、战略空间、支付函数有准确的知识,不完全信息博弈。,博弈论要点博弈论的基本概念包括:参与人、参与人的策略、参与人,博弈的分类与对应的均衡概念,静态博弈,:博弈中参与人同时选择行动或虽非同时但后行动者并不知道前行动者采取什么行动;,动态博弈(序贯博弈),:参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。,完全信息,指的是每个参与人对所有其他参与人(对手)的特征、战略空间及支付函数有准确的知识,否则就是,不完全信息,。,博弈的分类与对应的均衡概念静态博弈:博弈中参与人同时选择行动,博弈的种类,合作博弈与非合作博弈,厂商之间的经济博弈可以是合作的,也可以是非合作的。区别在于是否存在一个有约束力的协议。如果有,就是合作博弈;如果没有,就是非合作博弈。前者强调团体理性,即效率、公平和公正;后者强调个人理性和个人最优决策。,博弈的种类合作博弈与非合作博弈,同时博弈与序贯博弈,前者是博弈各方在不了解对方情况下制定决策;后者是一方看到另一方的行动之后再采取行动。,同时博弈与序贯博弈,一次博弈与重复博弈,博弈行动只进行一次的是一次博弈;博弈行动进行多次的是重复博弈,双人博弈与 多人博弈,前者只有两人参加行动,后者有多人参加行动,一次博弈与重复博弈,零和博弈与非零和博弈,在零和博弈中,一方之所得即为另一方之所失;,在非零和博弈中,双方的得失取决于各自选择采取的行动,。,零和博弈与非零和博弈,二、同时博弈:纯策略博弈,同时博弈与序贯博弈,同时博弈是参与人同时进行决策或行动的博弈;,所谓,同时,或,先后,主要是看参与人在决策时是否已经知道其他参与人的决策,序贯博弈是参与人的决策和行动有先有后的博弈。,二、同时博弈:纯策略博弈同时博弈与序贯博弈,支付矩阵(也称报酬矩阵)被用来描述和分析一个博弈。,支付矩阵(也称报酬矩阵)被用来描述和分析一个博弈。,占优策略,无论其他参与者采取什么策略,某参与者都存在唯一的最优策略选择,这一最优策略就是他的占优策略。,如果某个参与者具有占优策略,那么,无论其他参与者选择什么策略,该参与者确信自己所选择的唯一策略都是最优的。,博弈均衡,指博弈中的所有参与者都不想改变自己的策略的一种状态。,占优策略,纳什均衡,是指这样一种状态,任何一个参与者都不会改变自己的策略,如果其他参与者不改变策略;,在该策略组合上,任何参与人单独改变策略都不会得到好处;,纳什均衡,条件策略下划线法,条件策略,参与人给定条件下的相对优势策略,如甲厂商在乙厂商选择合作条件下的条件(优势)策略为不合作。,首先用下划线表示甲厂商的条件策略,其次用下划线表示乙厂商的条件策略,最后找到在两个数字之下都画线的单元格即为博弈的均衡。,条件策略下划线法,智猪博弈,(boxed pigs),猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的食槽中就会有,10,单位的猪食进槽,但每按一下按钮会耗去相当于,2,单位猪食的成本。如果大猪先到食槽,则大猪吃到,9,单位食物,小猪仅能吃到,1,单位食物;如果两猪同时到食槽,则大猪吃,7,单位,小猪吃,3,单位食物;如果小猪先到,大猪吃,6,单位而小猪吃,4,单位食物。表,4,给出这个博弈的支付矩阵,。,纳什均衡,智猪博弈(boxed pigs)纳什均衡,小猪,按 等待,大猪,按,等待,5,,,1,4,,,4,9,,,-1,0,,,0,小猪按 等待大猪按5,14,49,-10,小猪的最优策略:等待,大猪无最优策略:即大猪的最优策略是依赖于,小猪的策略,此时用重复剔除严格劣策略的思路找出均衡:小猪的严格劣策略为按,剔除“按”后,小猪只有一种策略等待,大猪仍有两个策略,但此时,“等待”已成为大猪的劣策略,剔除,大猪的最优策略,按,这是一个“多劳不多得,少劳不少得”的均衡,小猪的最优策略:等待,股市博弈,在股票市场上,大户是大猪,他们要进行技术分析,收集信息、预测股价走势,但大量散户就是小猪。,他们不会花成本去进行技术分析,而是跟着大户的投资战略进行股票买卖,即所谓“散户跟大户”的现象,。,股市博弈,为什么中小企业不会花钱去开发新产品?,在技术创新市场上,大企业是大猪,它们投入大量资金进行技术创新,开发新产品,而中小企业是小猪,不会进行大规模技术创新,而是等待大企业的新产品形成新的市场后生产,模仿大企业的新产品的产品去销售。,为什么中小企业不会花钱去开发新产品?,三、,序贯博弈,在序贯博弈中,参与人的决策有先有后,特别是,后行动的参与人可以观察到先行动的参与人已经采取了的策略。,在图中,有两个房地产开发商,A,和,B,分别决定在同一地段上开发一栋写字楼。由于市场需求有限,如果他们都开发,则在同一地段会有两栋写字楼,超过了市场对写字楼的需求,难以完全出售,空置房太多导致各自亏损,1,百万。,三、序贯博弈在序贯博弈中,参与人的决策有先有后,特别是,后行,当只有一家开发商在这个地段开发一栋写字楼时,它可以全部售出,赚得利润,1,百万。假定,A,先决策,,B,在看见,A,的决策后再决策,是否开发写字楼。在图中,,用“博弈树”表示博弈过程。,当只有一家开发商在这个地段开发一栋写,房地产开发博弈,A,不开发,开发,B,B,开发,不开发,开发,不开发,(-1,-1),(1,0),(0,1),(0,0),A不开发开发BB开发不开发开发不开发(-1,-1)(1,0),在其中每一条“路径”的末端用向量给出,A,和,B,的支付,称为支付向量。,下面用“逆向归纳法”可以求解这个博弈。在,B,进行决策的,2,个“决策结”上,,B,在左边的决策结上选择“不开发”;而在右边的决策结上选择“开发”。即给定,A,开发,,B,就不开发;给定,A,不开发,,B,就开发。,B,应避免同时与,A,都选择开发而蒙受损失,。,在其中每一条“路径”的末端用向量给出A和B,在这种情况下,,A,在自己的决策结上当然选择“开发”,因为他预计当自己选择“开发”后,,B,会选择“不开发”,自己就净赚一百万。当,B,威胁,A,说:“不管你是否开发,我都会在这里开发写字楼。”倘若,A,将,B,的话当了真,,A,就不敢开发,让,B,单独开发写字楼占便宜。但是,,B,的威胁是“不可置信”的。,当,A,不理会,B,的威胁而果断地开发出一栋写字楼时,,B,其实不会将事前的威胁付诸实施。因为“识时务者为俊杰”,在,A,已开发的情况下,,B,的最优决策是“不开发”而不是“开发”。,在这种情况下,A在自己的决策结上当然选择“开,但是,如果,B,在向,A,发出威胁的同时又当着,A,的面与第三者,C,打赌一定要在该地段上开发出一栋写字楼,否则输给,C 2,百万元。,B,与,C,为此签定合同并加以公证有效。,思考:这时情况又会发生什么样的变化呢?,但是,如果B在向A发出威胁的同时又,情侣博弈,丈夫,足球,芭蕾,妻子,足球,芭蕾,足球,芭蕾,(,2,,,1,),(,0,,,0,),(,-1,,,-1,),(,1,,,2,),妻子,情侣博弈丈夫足球芭蕾妻子足球芭蕾足球芭蕾(2,1)(,先动优势,在夫妻博弈中,有两个纳什均衡,即(足球,足球)和(芭蕾,芭蕾),前者对男方更加有利,后者对女方更加有利,但是由于男方是先行动者,通过逆向归纳法得到的最终结果就是对男方更加有利的纳什均衡。,先动优势,先行动者的得益大于后行动者,先
展开阅读全文