第10章博弈论初步剖析课件

上传人:无*** 文档编号:241638803 上传时间:2024-07-12 格式:PPT 页数:42 大小:1,008.50KB
返回 下载 相关 举报
第10章博弈论初步剖析课件_第1页
第1页 / 共42页
第10章博弈论初步剖析课件_第2页
第2页 / 共42页
第10章博弈论初步剖析课件_第3页
第3页 / 共42页
点击查看更多>>
资源描述
第十章 博弈论初步本章框架2024/7/121第十章 博弈论初步一、纳什均衡博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。策略性环境是指每个人进行的决策和采取的行动都会对其他人产生显著的影响;策略性决策和策略性行动是指每个人要根据其他人的可能的反应来决定自己的决策和行动。博弈的三个基本要素:参与人、参与人的策略和参与人的支付。在每个支付组合中,所有支付相加之和等于零则称为零和博弈,否则为非零和博弈。根据参与人拥有的策略的数量,博弈可分为有限博弈和无限博弈。根据参与人在实施策略上是否具有时间的先后,可分为静态博弈(或同时博弈)和动态博弈(或序贯博弈)。条件策略指在其他参与人选定策略的条件下,参与人的最优策略。与参与人条件策略相联系的策略组合称为参与人的条件策略组合。条件策略或条件策略组合代表了博弈中某个参与人在某个条件下的均衡状态。纳什均衡指参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。2024/7/122第十章 博弈论初步二、寻找纳什均衡的方法寻找纳什均衡的方法为条件策略下划线法。根据纳什均衡的定义和条件策略组合的定义可得,纳什均衡是所有参与人的条件策略组合的公约数,即纳什均衡是每一个参与人的条件策略组合。条件策略下划线法是指在支付矩阵中每一个参与人的条件策略所对应的支付下面划线,如果支付组合中都有下划线,则该支付组合代表的策略组合即为纳什均衡。2024/7/123第十章 博弈论初步三、纳什均衡的存在性、唯一性、稳定性和最优性在完全信息的静态博弈中,(纯策略的)纳什均衡既可能存在。也可能不存在。在完全信息的静态博弈中,如果纳什均衡存在,则它既可能是唯一的,也可能是不唯一的。在完全信息的静态博弈中,如果纳什均衡存在,则它既可能是稳定的,也可能是不稳定的。在完全信息的静态博弈中,如果纳什均衡存在,则它既可能是最优的,也可能不是最优的。2024/7/124第十章 博弈论初步四、纳什均衡和社会福利纳什均衡如果是“最优”或“非最优”的,是指针对参与人而非针对整个社会而言。针对整个社会而言,纳什均衡有可能对社会有利,也有可能对社会不利。2024/7/125第十章 博弈论初步五、二人同时博弈的一般理论二人同时博弈(两个策略)的每个参与人都有9种可能的支付矩阵,整个博弈有81种可能的支付矩阵。全部纳什均衡可分为五种类型:第一种:四个均衡;第二种:三个均衡;第三种:两个均衡;第四种:一个均衡;第五种:零个均衡。2024/7/126第十章 博弈论初步六、混合策略均衡混合策略指赋予纯策略的概率向量。纯策略可以是有限的,由于概率取值的无限性,以有限的纯策略为基础的混合策略一定是无限的。混合策略组合为(p1,p2),(q1,q2)。期望支付是指对于每一个混合策略组合,参与人都有一个期望支付即支付的期望值。条件混合策略是指在其他参与人选择既定的混合策略的条件下,参与人所选择的可以使其期望支付最大的混合策略。混合策略的纳什均衡指参与人条件混合策略曲线的交点。纯策略纳什均衡为混合策略纳什均衡的一个特例。2024/7/127第十章 博弈论初步七、完全信息动态博弈与纳什均衡的精炼完全信息动态博弈的纳什均衡也不具有唯一性。纳什均衡的精炼指从所有的纳什均衡中寻找到最有可能实现的纳什均衡。逆向归纳法包括两个步骤:第一步,先从博弈的最后阶段的每一个决策点开始,确定相应参与人此时所选择的策略,并把参与人所放弃的其他策略删除,从而得到原博弈的一个简化博弈;第二步,对简化博弈重复第一步骤的程序,直到最后得到原博弈的一个最简博弈,即原博弈的解。逆向归纳策略指由逆向归纳法倒推得到的最优策略组合。逆向归纳策略总是纳什均衡,但是纳什均衡并不一定是逆向归纳策略。2024/7/128第十章 博弈论初步八、例题1.什么是纳什均衡?纳什均衡一定是最优的吗?2024/7/129解答:(1)所谓纳什均衡,是参与人的一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。(2)不一定。如果纳什均衡存在,纳什均衡可能是最优的,也可能不是最优的。例如,在存在多个纳什均衡的情况下,其中有一些纳什均衡就不是最优的;即使在纳什均衡是唯一时,它也可能不是最优的因为与它相对应的支付组合可能会小于与其他策略组合相对应的支付组合。如:囚徒困境。第十章 博弈论初步八、例题2.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有几个?为什么?2024/7/1210第十章 博弈论初步八、例题3.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡可能有三个。试举一例说明。2024/7/1211第十章 博弈论初步八、例题4.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,如何找到所有的纯策略纳什均衡?2024/7/1212解答:可使用条件策略下划线法。具体步骤如下:首先,把整个博弈的支付矩阵分解为两个参与人的支付矩阵;其次,在第一个(即位于整个博弈矩阵左方的)参与人的支付矩阵中,找出每一列的最大者,并在其下画线;再次,在第二个(在位于整个博弈矩阵上方的)参与人的支付矩阵中,找出每一行的最大者,并在其下画线;再再次,将已经画好线的两个参与人的支付矩阵再合并起来,得到带有下划线的整个博弈的支付矩阵;最后,在带有下划线的整个的支付矩阵中,找到两个数字之下均画有线的支付组合。由该支付组合代表的策略组合就是博弈的纳什均衡。第十章 博弈论初步八、例题5.设有A、B两个参与人。对于参与人A的每一个策略,参与人B的条件策略有无可能不止一个。试举一例说明。2024/7/1213第十章 博弈论初步八、例题6.如果无论其他人选择什么策略,某个参与人都只选择某个策略,则该策略就是该参与人的绝对优势策略(简称优势策略)。试举一例说明某个参与人具有某个优势策略的情况。2024/7/1214解答:例如,在如下的二人同时博弈中,无论参与人A是选择上策略还是选择下策略,参与人B总是选择左策略,因为他此时选择左策略的支付总是大于选择右策略。因此,在这一博弈中,左策略就是参与人B的绝对优势策略。同时上策略是A的绝对优势策略。B的策略的策略左策略右策略A的策略上策略7,62,5下策略5,41,3第十章 博弈论初步八、例题7.混合策略博弈与纯策略博弈有什么不同?2024/7/1215解答:在纯策略博弈中,所有参与人对策略的选择都是“确定”的,即总是以100%的可能性来选择某个策略,而在混合策略博弈中,参与人则是以一定的可能性来选择某个策略,又以另外的可能性选择另外一些策略。在这种情况下,参与人选择的就不再是原来的100%的确定策略(如上策略或下策略),而是一个概率向量(如以某个概率选择上策略,以另外一个概率选择下策略)。第十章 博弈论初步八、例题8.条件混合策略与条件策略有什么不同?2024/7/1216解答:例如,在一个只包括参与人A与参与人B的二人同时博弈中,参与人A的条件策略是A在B选择某个既定策略时所选择的可以使其支付达到最大的策略。相应地,参与人A的条件混合策略是A在B选择某个既定的混合策略时所选择的可以使其期望支付达到最大的混合策略。第十章 博弈论初步八、例题9.混合策略纳什均衡与纯策略纳什均衡有什么不同?2024/7/1217解答:在纯策略博弈中,纳什均衡是参与人的一种策略组合,在该策略组合上,任何参与人单独改变其策略都不会得到好处;在混合策略博弈中,纳什均衡是参与人的一种概率向量组合,在该概率向量组合上,任何参与人单独改变其概率向量都不会得到好处。第十章 博弈论初步八、例题10.设某个纯策略博弈的纳什均衡不存在。试问:相应的混合策略博弈的纳什均衡会存在吗?试举一例说明。2024/7/1218解答:在同时博弈中,纯策略的纳什均衡可能存在,也可能不存在,但相应的混合策略纳什均衡总是存在的。例如,在下面的二人同时博弈中,根据条件策略下划线法可知,由于没有一个单元格中两个数字之下均有下划线,故纯策略的纳什均衡不存在,但是,相应的混合策略纳什均衡却是存在的。B的策略的策略q11-q1左策略右策略A的策略p1上策略3,69,21-p1下策略7,32,8第十章 博弈论初步八、例题10.设某个纯策略博弈的纳什均衡不存在。试问:相应的混合策略博弈的纳什均衡会存在吗?试举一例说明。2024/7/1219第十章 博弈论初步八、例题11.设某个纯策略博弈的纳什均衡是有限的。试问:相应的混合策略博弈的纳什均衡会是无限的吗?试举一例说明。2024/7/1220解答:当纯策略博弈的纳什均衡为有限时,相应的混合策略博弈的纳什均衡既可能是有限的,也可能是无限的。例如,在只包括A与B的二人同时博弈中,混合策略纳什均衡的“集合”可以是单位平面、三条线段、两条线段、一条线段、三个点、两个点和一个点,其中,前四种情况就意味着存在无限多个纳什均衡。第十章 博弈论初步八、例题12.在序贯博弈中,纳什均衡与逆向归纳策略有什么不同?2024/7/1221解答:与同时博弈一样,在序贯博弈中,纳什均衡也是指这样一些策略组合,在这些策略组合中,没有哪一个参与人会单独改变自己的策略。同样,在序贯博弈中,纳什均衡也可能不止一个。在这种情况下,可以通过逆向归纳法对纳什均衡进行“精炼”,即从多个纳什均衡中,排除掉那些不合理的纳什均衡,或者,从众多的纳什均衡中进一步确定“更好”的纳什均衡。经由逆向归纳法的精炼而得到的纳什均衡就是所谓的逆向归纳策略。第十章 博弈论初步八、例题13.在下面的博弈树中,确定纳什均衡和逆向归纳策略。2024/7/1222解答:纳什均衡和逆向归纳策略都是同一个,即与支付向量(1,3)相应的策略组合(决策1,决策3)。第十章 博弈论初步八、例题14.用逆向归纳法确定下面的“蜈蚣博弈”的结果。在该博弈中,第1步是A决策:如果A决定结束博弈,则A得到支付1,B得到支付0,如果A决定继续博弈,则博弈进入到第2步,由B做决策。此时,如果B决定结束博弈,则A得到支付0,B得到支付2,如果B决定继续博弈,则博弈进入到第3步,又由A做决策,如此等等,直到最后,博弈进入到第9 999步,由A做决策。此时,如果A决定结束博弈,则A得到支付9 999,B得到支付0;如果A决定继续博弈,则A得到支付0,B得到支付10 000。2024/7/1223解答:首先考虑第9 999步A的决策。此时,A肯定会结束博弈结束博弈A可以得到支付9 999,否则只能得到0。于是,我们可以把该博弈中最后一条水平线段删除;其次考虑第9 998步B的决策。此时,B也肯定会结束博弈结束博弈B可以得到9 998,否则只能得到0。于是,我们可以把该博弈中倒数第二条水平线段(以及它后面的最后一条垂直线段)也删除。这样倒推下来的结果是,任何一个人在轮到自己决策时都会决定结束博弈。因此,整个博弈的结果是:在第1步,A就决定结束博弈,于是,A得到1,B得到0。第十章 博弈论初步八、例题15.在下面的情侣博弈中,如果将第二个支付向量(0,0)改为(0,1.5),纳什均衡和逆向归纳法策略会有什么变化?改为(0,1)呢?2024/7/1224解答:(1)当第二个支付向量不变,仍然为(0,0)时,有两个纳什均衡,即(足球,足球)和(芭蕾,芭蕾),逆向归纳策略为(足球,足球)。(2)将第二个支付向量由(0,0)改为(0,1.5)后,纳什均衡和逆向归纳法策略都是(芭蕾,芭蕾)。(3)如果将第二个支付向量改为(0,1),则纳什均衡仍然为(足球,足球)和(芭蕾,芭蕾),但逆向归纳法失效:当男方选择芭蕾时,女方也选择芭蕾,从而,男方可得到支付1,但是,当男方选择足球时,女方既可以选择足球,也可以选择芭蕾,如果女方选择足球,则男方可以得到更大的2,如果女方选择芭蕾,则男方只能得到更小的0。第十章 博弈论初步九、知识点强化训练1.(名词解释)纳什均衡与帕累托最优状态。2024/7/1225第十章 博弈论初步九、知识点强化训练2.下表博弈中的混合策略均衡是()。A.1采取A的概率是3/7,采取B的概率是4/7;2采取U的概率是3/7,采取D的概率是4/7B.1采取A的概率是4/7,采取B的概率是3/7;2采取U的概率是4/7,采取D的概率是3/7C.1采取A的概率是4/7,采取B的概率是3/7;2采取U的概率是3/7,采取D的概率是4/7D.1采取A的概率是1/2,采取B的概率是1/2;2采取U的概率是1/2,采取D的概率是1/22024/7/1226C2UD1A8,30,0B0,06,4第十章 博弈论初步九、知识点强化训练3.在一条狭窄的巷子里,两个年轻人骑着自行车相向而行。每人都有两个策略,即或者选择“冲过去”即或者选择“避让”,不管对方采取什么策略,他得到的收益都是0。如果其中一人采取“冲过去”的策略,如果对方采取“避让”,那么他得到的收益是9;如果对方不避让,那么他得到的收益是-36.这个博弈有两个纯策略纳什均衡和()。A一个混合策略纳什均衡,即两人都以80%的概率选择“避让”,以20%的概率选择“冲过去”B两个混合策略纳什均衡,即每个年轻人轮流选择“避让”或者“冲过去”C一个混合策略纳什均衡,即一人以80%的概率选择“避让”,另一人以20%的概率选择“冲过去”D一个混合策略纳什均衡,即两人都以40%的概率选择“避让”,以60%的概率选择“冲过去”2024/7/1227A第十章 博弈论初步九、知识点强化训练3.在一条狭窄的巷子里,两个年轻人骑着自行车相向而行。每人都有两个策略,即或者选择“冲过去”即或者选择“避让”,不管对方采取什么策略,他得到的收益都是0。如果其中一人采取“冲过去”的策略,如果对方采取“避让”,那么他得到的收益是9;如果对方不避让,那么他得到的收益是-36.这个博弈有两个纯策略纳什均衡和()。A一个混合策略纳什均衡,即两人都以80%的概率选择“避让”,以20%的概率选择“冲过去”B两个混合策略纳什均衡,即每个年轻人轮流选择“避让”或者“冲过去”C一个混合策略纳什均衡,即一人以80%的概率选择“避让”,另一人以20%的概率选择“冲过去”D一个混合策略纳什均衡,即两人都以40%的概率选择“避让”,以60%的概率选择“冲过去”2024/7/1228A乙乙选择概率选择概率冲过去避让甲冲过去-36,-369,0r避让0,90,01-r选择概率c1-c第十章 博弈论初步九、知识点强化训练4.假定甲乙两个企业都仅有选择“合作”或“抗争”的经营策略。若两个企业都选择“合作”的策略,则每个企业的收益均为100;若两个企业都选择“抗争”的策略,则两个企业的收益都为零;若一个企业选择“抗争”的策略,另一个企业选择“合作”的策略,则选择“合作”策略的企业的收益为S,选择“抗争”策略的企业的收益为T。要使“抗争”成为占优策略,S和T必须满足条件()A.S+T200 B.S100 C.S100 D.以上都不是2024/7/1229C第十章 博弈论初步九、知识点强化训练4.假定甲乙两个企业都仅有选择“合作”或“抗争”的经营策略。若两个企业都选择“合作”的策略,则每个企业的收益均为100;若两个企业都选择“抗争”的策略,则两个企业的收益都为零;若一个企业选择“抗争”的策略,另一个企业选择“合作”的策略,则选择“合作”策略的企业的收益为S,选择“抗争”策略的企业的收益为T。要使“抗争”成为占优策略,S和T必须满足条件()A.S+T200 B.S100 C.S100 D.以上都不是2024/7/1230C乙乙合作抗争甲合作100,100S,T抗争T,S0,0第十章 博弈论初步九、知识点强化训练5.假设两家厂商A和B之间就做广告与不做广告展开博弈,他们的博弈矩阵如表所示(单位:百万元)。现假设博弈是可重复的,但只进行5次,两家厂商均采取“以牙还牙”的对策,厂商A在第一回合不做广告,对于厂商B则有两种情况:在第一次做广告或不做广告。试分别计算这两种情况下厂商B的累积利润,并判断厂商B该采取何种行动。2024/7/1231厂商厂商B做广告不做广告厂商A做广告100,100300,0不做广告0,300200,200第十章 博弈论初步九、知识点强化训练6.两个厂商按贝朗特模型,单方降价则获得垄断利润,另一家利润为零,反之亦然。若串谋制定垄断价格,则各自获得垄断利润/2。(1)画出该囚徒困境博弈的矩阵图,求纳什均衡解。(2)若两厂商进行T次有限次重复博弈,求子博弈纳什均衡解。(3)若两厂商都要获得垄断利润,应该怎么做?采取什么策略?2024/7/1232厂商厂商B降价不降价厂商A降价0,0,0不降价0,/2,/2第十章 博弈论初步九、知识点强化训练7.在货币政策博弈中,博弈双方货币当局和工会的策略分别是:是否增加货币供给和是否提高工资。其支付矩阵(用货币测度的好处)如表(1)单期静态博弈的结果。(2)根据跨期博弈讨论“规则”及其信誉。2024/7/1233政府政府不增加货币供给增加货币供给工会不提高工资6,61,8提高工资8,12,2第十章 博弈论初步九、知识点强化训练8.中新网2012年2月7日报道,在中国第三届大学生艺术展演活动中央媒体见面会上,浙江省教育厅厅长刘希平再次表达了改革教育的决心。早在两年前,浙江省教育厅举办的课业减负相关会议上,刘希平就痛批“应试绑架了教育”,倡导开展教育减负的改革。2010年8月,浙江省教育厅就减轻义务阶段中小学生过重课业负担下发通知,制定了“六个严格”和“六项制度”,对中小学课时、课程开设、规范考试、学生休息时间等都做了严格的规定。两年后,减负工作成效如何,刘希平感叹,顽疾难治,但决心不改,帮助孩子减负需要教育人持之以恒。“在减负的道路上,那么多年来我们可以说是屡战屡败、屡败屡战,但要改变应试教育的危害,减轻学生负担是必须要做的第一步,我们绝不可以退让。”试用博弈论分析目前的应试教育现象。2024/7/1234第十章 博弈论初步九、知识点强化训练8.中新网2012年2月7日报道,在中国第三届大学生艺术展演活动中央媒体见面会上,浙江省教育厅厅长刘希平再次表达了改革教育的决心。早在两年前,浙江省教育厅举办的课业减负相关会议上,刘希平就痛批“应试绑架了教育”,倡导开展教育减负的改革。2010年8月,浙江省教育厅就减轻义务阶段中小学生过重课业负担下发通知,制定了“六个严格”和“六项制度”,对中小学课时、课程开设、规范考试、学生休息时间等都做了严格的规定。两年后,减负工作成效如何,刘希平感叹,顽疾难治,但决心不改,帮助孩子减负需要教育人持之以恒。“在减负的道路上,那么多年来我们可以说是屡战屡败、屡败屡战,但要改变应试教育的危害,减轻学生负担是必须要做的第一步,我们绝不可以退让。”试用博弈论分析目前的应试教育现象。2024/7/1235第十章 博弈论初步九、知识点强化训练8.中新网2012年2月7日报道,在中国第三届大学生艺术展演活动中央媒体见面会上,浙江省教育厅厅长刘希平再次表达了改革教育的决心。早在两年前,浙江省教育厅举办的课业减负相关会议上,刘希平就痛批“应试绑架了教育”,倡导开展教育减负的改革。2010年8月,浙江省教育厅就减轻义务阶段中小学生过重课业负担下发通知,制定了“六个严格”和“六项制度”,对中小学课时、课程开设、规范考试、学生休息时间等都做了严格的规定。两年后,减负工作成效如何,刘希平感叹,顽疾难治,但决心不改,帮助孩子减负需要教育人持之以恒。“在减负的道路上,那么多年来我们可以说是屡战屡败、屡败屡战,但要改变应试教育的危害,减轻学生负担是必须要做的第一步,我们绝不可以退让。”试用博弈论分析目前的应试教育现象。2024/7/1236学校学校B减负不减负学校A减负中升学率,中升学率低升学率,高升学率不减负高升学率,低升学率中升学率,中升学率第十章 博弈论初步九、知识点强化训练9.假设政府与流浪者之间存在如下社会福利博弈:请分析一下,在这场博弈中政府和流浪汉各自有没有优势策略均衡,有没有纳什均衡,在此基础上说明优势策略均衡和纳什均衡的区别于联系。2024/7/1237流浪汉流浪汉寻找工作游手好闲政府救济(3,2)(-1,3)不救济(-1,1)(0,0)第十章 博弈论初步九、知识点强化训练10.试论述囚徒困境对于经济学的意义。2024/7/1238第十章 博弈论初步九、知识点强化训练10.试论述囚徒困境对于经济学的意义。2024/7/1239嫌疑犯嫌疑犯B坦白抵赖嫌疑犯A坦白5,50,9抵赖9,02,2第十章 博弈论初步九、知识点强化训练10.试论述囚徒困境对于经济学的意义。2024/7/1240第十章 博弈论初步九、知识点强化训练11.论述博弈论的基本原理及主要均衡策略。2024/7/1241第十章 博弈论初步九、知识点强化训练11.论述博弈论的基本原理及主要均衡策略。2024/7/1242
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!