马尔可夫链数学建模课件

上传人:94****0 文档编号:241319094 上传时间:2024-06-17 格式:PPTX 页数:55 大小:796.50KB
返回 下载 相关 举报
马尔可夫链数学建模课件_第1页
第1页 / 共55页
马尔可夫链数学建模课件_第2页
第2页 / 共55页
马尔可夫链数学建模课件_第3页
第3页 / 共55页
点击查看更多>>
资源描述
马尔可夫链建模法马尔可夫链建模法1马尔可夫链基本理论和结论马尔可夫链基本理论和结论2服务网点的设置问题3常染色体遗传模型常染色体遗传模型4常染体隐性疾病模型常染体隐性疾病模型马尔可夫链建模法马尔可夫链基本理论和结论1马尔可夫链的应用马尔可夫链的应用预备知识:马尔可夫链随机过程:设 是一族随机变量,T是一个实数集合,若对任意的 实数 ,是一个随机变量,则称 为随机过程。马尔可夫链的应用预备知识:马尔可夫链随机过程:设 2例一 在一条生产线上检验产品质量,每次取一个,废品记为1 合格品记为0。以 表示第n次检验结果,则 是一个随机 变量.不断检验,得到一系列随机变量,记为 它是一个 随机序列,其状态空间为E=0,1例二:在m个商店联营出租相机业务中(顾客从其中一个商店租出 可以到m个商店中的任意一个归还)规定一天为一个时间单位 表示第t天开始时照相机在第j个商店,j=1,2,.m.则 是一个随机序列,其状态空间为例一 在一条生产线上检验产品质量,每次取一个,废品记为13例3:某商店每月考察一次经营情况,其结果用销路好或坏这两种状况中的一种表示。已知若果本月销路好,下月任保只这种状况的概率为0.5;如果本月销路坏,下月转变为销路好的概率为0.4,试分析假若开始时商店处于销路好的状态,过若干月后能保持销路好的概率有多大?如果开始是处于销路坏呢?E=1,2,.m,n=0,1,2,.称为这个经营系统的状态例3:某商店每月考察一次经营情况,其结果用销路好或坏这E=4称为无后效性,由此,更椐全概率公式容易得到称为无后效性,由此,更椐全概率公式容易得到5如表所示,由数字变化规律可以看出开始销路好时状态概率的变化n0 1 2 3 1 0.5 0.45 0.445 4/90 0.5 0.55 0.555 5/9如表所示,由数字变化规律可以看出开始销路好时状态概率的变化n6表2 开始销路坏时的状态概率的变化0 1 2 3 n0 0.4 0.44 0.444 4/91 0.6 0.56 0.556 5/9马尔可夫链的定义:设是一个随机序列,状态空间E为有限或可列对于任意的正整数m,n,若i,j,有则称为一个 马尔可夫链表2 开始销路坏时的状态概率的变化0 1 7马氏链及其基本方程由状态转移的无后效性和全概率公式可以写出马氏链的基本方程马氏链及其基本方程由状态转移的无后效性和全概率公式可以写出马8马尔可夫链数学建模课件9马氏链至少包括一个吸收状态,并且从每一个非吸收状态出发,能以正的概率经有限次转移达到某个吸收状态则称此马氏链为吸收链。定理2:正则链存在唯一的极限状态概率马氏链至少包括一个吸收状态,并且从每一个非吸收状定理2:正则10引入状态概率向量和转移概率矩阵(7)则基本方程(3)可表为(8)(9)引入状态概率向量和转移概率矩阵(7)则基本方程(3)可表为(11因此对于马氏链模型最基本的问题是:构造状态xn及写出转移矩阵p,一旦有了P,则给定初始状态a(0)就可以用(9)或(8)计算任意时间n的状态概率a(n)定义1:一个有k个状态的马氏链,如果存在正整数N,使从任意状态i经N次转移,都以大于0的概率达到状态j(I,j=1,2,k)称此马氏链为正则链。正则链。因此对于马氏链模型最基本的问题是:构造状态xn及写出转移矩阵12马尔可夫链的应用模型六:服务网点的设置问题为适应日益扩大的旅游事业的需要,某城市的甲乙丙三个照相馆组成一个联营部,联合经营出租相机的业务。游客可由甲乙丙三处任一处租出相机,用完后,还到三处中的任一处即可。估计其转移概率为:租相机处甲乙丙还 相 机 处甲乙丙0.2 0.8 00.8 0 0.20.1 0.3 0.6马尔可夫链的应用模型六:服务网点的设置问题为适应日益扩大的旅13今欲选择其中之一附设相机维修点,请你设计一种方案。模型分析模型分析由于旅客还相机的情况只与该次租机地点有关,而与相机以前所处的点址无关。今欲选择其中之一附设相机维修点,请你设计一种方案。模型分析由14由(10)有,设极限概率为W即:由(10)有,设极限概率为W即:15解上列方程组可得:由计算看出,经过长期经营后,该联营部的每架照相机还到甲乙丙照相馆的概率为17/41,16/41,8/41。由于还到甲的照相机的概率最大,因此维修点设在甲馆较好。模型推广:生物基因遗传等方面的应用。模型推广:生物基因遗传等方面的应用。解上列方程组可得:由计算看出,经过长期经营后,该联营部的每架164.3 马氏链模型马氏链模型随着人类的进化,为了揭示生命的奥秘,人们越来越注重遗随着人类的进化,为了揭示生命的奥秘,人们越来越注重遗传学的研究,特别是遗传特征的逐代传播,已引起人们广泛传学的研究,特别是遗传特征的逐代传播,已引起人们广泛的注意。无论是人,还是动、植物都会将本身的特征遗传给的注意。无论是人,还是动、植物都会将本身的特征遗传给下一代,这主要是因为后代继承了双亲的基因,形成自己的下一代,这主要是因为后代继承了双亲的基因,形成自己的基因对,由基因又确定了后代所表现的特征。本节将利用数基因对,由基因又确定了后代所表现的特征。本节将利用数学的学的 马氏链方法马氏链方法来建立相应的遗传模型等,并讨论几个简来建立相应的遗传模型等,并讨论几个简单而又有趣的实例。单而又有趣的实例。马氏链(马尔柯夫链)马氏链(马尔柯夫链)研究的是一类重要的随机过程,研究研究的是一类重要的随机过程,研究对象的状对象的状 态态s(t)是不确定的,它可能是不确定的,它可能 取取K种种 状态状态si(i=1,k)之一,有时甚至可取无穷多种状态。在建模时,之一,有时甚至可取无穷多种状态。在建模时,时间变量也被离散化,我们希望通过建立两个相邻时刻研究时间变量也被离散化,我们希望通过建立两个相邻时刻研究对象取各种状态的概率之间的联系来研究其变化规律,故马对象取各种状态的概率之间的联系来研究其变化规律,故马氏链研究的也是一类状态转移问题。氏链研究的也是一类状态转移问题。4.3 马氏链模型随着人类的进化,为了揭示生命的奥秘,人17例例4.6 设某商店经营情况可能有三种状态:设某商店经营情况可能有三种状态:好(好(S1:利润丰厚)、一般(利润丰厚)、一般(S2)和不好和不好(S3:亏损)。根据统计资料,上月状态为亏损)。根据统计资料,上月状态为Si,下月状态为下月状态为Sj的概率为的概率为pij(i=1,2,3;j=1,2,3),),0pij1例例4.6中的关系既可用一转移矩阵表示中的关系既可用一转移矩阵表示 例4.6 设某商店经营情况可能有三种状态:好(S1:利润丰18例例4.7 研究某一草原生态系统中物质磷的循环,考研究某一草原生态系统中物质磷的循环,考虑土壤中含磷、牧草含磷、牛羊体内含磷和流失于虑土壤中含磷、牧草含磷、牛羊体内含磷和流失于系统之外四种状态,分别系统之外四种状态,分别 以以S1,S2,S3和和S4表示表示这四种状态。以年为时间参数,一年内如果土壤中这四种状态。以年为时间参数,一年内如果土壤中的磷以的磷以0.4的概率被牧草生长吸收,水土流失于系统的概率被牧草生长吸收,水土流失于系统外的概率为外的概率为 0.2;牧草中的含磷以;牧草中的含磷以 0.6的概率被牛羊的概率被牛羊吃掉而转换到牛羊体内,吃掉而转换到牛羊体内,0.1的概率随牧草枯死腐败的概率随牧草枯死腐败归还土壤;牛羊体中的磷归还土壤;牛羊体中的磷 以以0.7的概率因粪便排泄的概率因粪便排泄而还归土壤,又以自而还归土壤,又以自 身身0.1的比率因屠宰后投放市场的比率因屠宰后投放市场而转移到系统外。我们可以建立一个马尔柯夫链来而转移到系统外。我们可以建立一个马尔柯夫链来研究此生态系统问题,其转移概率列表于下:研究此生态系统问题,其转移概率列表于下:1000S4流失系流失系统外统外0.10.200.7S3羊体含羊体含磷磷00.60.30.1S2牧草含牧草含磷磷0.200.40.4S1土壤含土壤含磷磷i时段状时段状态态S4S3S2S1i+1时段状态时段状态状态转移概率状态转移概率例4.7 研究某一草原生态系统中物质磷的循环,考虑土壤中含19相应的转移矩阵相应的转移矩阵 为:为:且且Sj+1=SjM马氏链模型的性质完全由其转移矩马氏链模型的性质完全由其转移矩 阵决定,故研究马氏链的数学工阵决定,故研究马氏链的数学工 具是线性代数中有关矩阵的理论。具是线性代数中有关矩阵的理论。首先,任一转移矩阵的行向量均为概率向量,即有首先,任一转移矩阵的行向量均为概率向量,即有(1)(I,j=1,n)(2)(i=1,n)这样的矩阵被称为这样的矩阵被称为 随机矩阵随机矩阵。相应的转移矩阵 为:且Sj+1=SjM首先,任一转移矩阵的行20常染色体遗传模型常染色体遗传模型 下面给出双亲体基因型的所有可能的结合,以及其后代形成下面给出双亲体基因型的所有可能的结合,以及其后代形成每种基因型的概率,如每种基因型的概率,如 表所示。表所示。在常染色体遗传中,后代从每个亲体的基因对中各继承一在常染色体遗传中,后代从每个亲体的基因对中各继承一个基因,形成自己的基因时,基因对也称为基因型。如果个基因,形成自己的基因时,基因对也称为基因型。如果我们所考虑的遗传特征是由两个基我们所考虑的遗传特征是由两个基 因因A和和a控制的,(控制的,(A、a为表示两类基因的符号)那么就有三种基因对,记为为表示两类基因的符号)那么就有三种基因对,记为AA,Aa,aa。1000aa010Aa0001AA后后代代基基因因型型aaaaAaaaAaAaAAaaAAAaAAAA父体父体母体的基因型母体的基因型双亲随机结合的较一般模型相对比较复杂,这些我们仅研究一双亲随机结合的较一般模型相对比较复杂,这些我们仅研究一个较简单的特例个较简单的特例。常染色体遗传模型 下面给出双亲体基因型的所有可能的结合,以及21例例4.8 农场的植物园中某种植物的基因型农场的植物园中某种植物的基因型 为为AA,Aa和和aa。农场计划采用农场计划采用 AA型的植物与每种基因型植物型的植物与每种基因型植物相结合的方案培育植物后代。那么经过若干年后,这相结合的方案培育植物后代。那么经过若干年后,这种植物的任一代的三种基因型分布情况如何?种植物的任一代的三种基因型分布情况如何?(a)假设假设:令:令n=0,1,2,。(i)设设an,bn和和cn分别表示第分别表示第n代植物中,基因型代植物中,基因型 为为AA,Aa和和aa的植物占植物总数的百分比的植物占植物总数的百分比 。令。令x(n)为第为第n代植物的基因型分代植物的基因型分布:布:当当n=0时时表示植物基因型的表示植物基因型的初始分布(即培育初始分布(即培育开始时的分布)开始时的分布)例例4.8 农场的植物园中某种植物的基因型农场的植物园中某种植物的基因型 为为AA,Aa和和aa。农场计划采用农场计划采用 AA型的植物与每种基因型植物型的植物与每种基因型植物相结合的方案培育植物后代。那么经过若干年后,相结合的方案培育植物后代。那么经过若干年后,这种植物的任一代的三种基因型分布情况如何?这种植物的任一代的三种基因型分布情况如何?例4.8 农场的植物园中某种植物的基因型 为AA,Aa和a22(b)建模建模根据假设根据假设(ii),先考虑第先考虑第n代中的代中的AA型。由于第型。由于第n1代的代的AA型与型与AA型结合。后代全部是型结合。后代全部是AA型;第型;第n1代的代的Aa型与型与AA型型结合,后代是结合,后代是AA型的可能性为型的可能性为 1/2,而,而 第第n1代的代的aa型与型与AA型结合,后代不可能型结合,后代不可能 是是AA型。因此当型。因此当n=1,2时时即即类似可推出类似可推出cn=0 显然有显然有(ii)第第n代的分布与代的分布与 第第n1代的分布之间的关系是通过表代的分布之间的关系是通过表5.2确定的。确定的。(4.2)(4.3)(4.4)(b)建模即类似可推出cn=0 显然有(4.2)(4.3)(23将将(4.2)、()、(4.3)、()、(4.4)式相加,得式相加,得根据根据假设假设(I),可递推得出:可递推得出:对于对于(4.2)式式.(4.3)式和式和(4.4)式,我们采用矩阵形式简记式,我们采用矩阵形式简记为为其中其中(注:这里注:这里M为转移矩阵的位置)为转移矩阵的位置)(4.5)将(4.2)、(4.3)、(4.4)式相加,得根据假设(I)24由由(4.5)式递推,得式递推,得(4.6)(4.6)式给出第式给出第n代基因型的分布与初始分布的关系。代基因型的分布与初始分布的关系。为了计算出为了计算出Mn,我们将我们将M对角化,即求出可逆矩对角化,即求出可逆矩 阵阵P和对角和对角库库D,使使 M=PDP-1因而有因而有 Mn=PDnP-1,n=1,2,其中其中这里这里 ,是矩是矩 阵阵M的三个特征值。对于的三个特征值。对于(4.5)式式中的中的M,易求得它的特征值和特征向量:易求得它的特征值和特征向量:=1,=1/2,=0由(4.5)式递推,得(4.6)(4.6)式给出第n代基因型25因此因此所以所以 通过计算,通过计算,P-1=P,因此有因此有因此所以 通过计算,P-1=P,因此有26即即即27所以有所以有当当时,时,所以从(,所以从(4.7)式得到)式得到即在极限的情况下,培育的植物都即在极限的情况下,培育的植物都 是是AA型。型。若在上述问题中,不选用基若在上述问题中,不选用基 因因AA型的植物与每一植物结合,型的植物与每一植物结合,而是将具有相同基因型植物相结合,那么后代具有三种基因而是将具有相同基因型植物相结合,那么后代具有三种基因型的概率如型的概率如 表所示。表所示。11/40aa01/20Aa01/41AA后后代代基基因因型型aaaaAaAaAAAA父体父体母体的基因型母体的基因型所以有当时,所以从(4.7)式得到即在极限的情况下,培育的28并且并且,其中,其中M的特征值为的特征值为通过计算,可以解出与通过计算,可以解出与 、相对应的两个线性无关的特征相对应的两个线性无关的特征向量向量e1和和e2,及与相对应的特征内及与相对应的特征内 量量e3:因此因此并且,其中M的特征值为通过计算,可以解出与 、29解得:解得:当当 时,时,所以,所以因因此此,如如果果用用基基因因 型型相相同同的的植植物物培培育育 后后代代,在在极极限限情情况况 下下,后后代代仅仅具具有有基基 因因 A A和和 a a。解得:当 时,所以因此,如果用基因 30例例4.9 常染体隐性疾病模型常染体隐性疾病模型现在世界上已经发现的遗传病有将现在世界上已经发现的遗传病有将 近近4000种。在一种。在一般情况下,遗传疾病和特殊的种族、部落及群体般情况下,遗传疾病和特殊的种族、部落及群体 有有关。例如,遗传病库利氏贫血症的患者以居住在关。例如,遗传病库利氏贫血症的患者以居住在 地地中海沿岸为多,镰状网性贫血症一般流行在黑人中,中海沿岸为多,镰状网性贫血症一般流行在黑人中,家族黑蒙性白痴症则流行在东欧犹太人中间。家族黑蒙性白痴症则流行在东欧犹太人中间。患者患者经常未到成年就痛苦地死去,而他们的父母则经常未到成年就痛苦地死去,而他们的父母则 是疾是疾病的病源。假若我们能识别这些疾病的隐性患病的病源。假若我们能识别这些疾病的隐性患 者,者,并且规定两个隐性患者不能结合(因为两个隐并且规定两个隐性患者不能结合(因为两个隐 性病性病患者结合,他们的后代就可能成为显性患者),那么患者结合,他们的后代就可能成为显性患者),那么未来的儿童,虽然有可能是隐性患者,但绝不未来的儿童,虽然有可能是隐性患者,但绝不 会出会出现显性特征,不会受到疾病的折磨。现显性特征,不会受到疾病的折磨。例4.9 常染体隐性疾病模型31现在,我们考虑在控现在,我们考虑在控制结合的情况下,如制结合的情况下,如何确定后代中隐性患何确定后代中隐性患者的概率。者的概率。(a)假设假设(i)常染色体遗传的正常基因记常染色体遗传的正常基因记 为为A,不不 正常基因记正常基因记 为为a,并以并以 AA,Aa,aa 分别表示正常人,隐性患者,显性患分别表示正常人,隐性患者,显性患 者的基因型者的基因型(ii)设设an,bn分别表示第分别表示第n代中基因型为代中基因型为 AA,Aa的人占总人数的百分比,的人占总人数的百分比,记记 ,n=1,2,(这里这里 不考不考 虑虑aa型是因型是因 为这些人不可能成年并结婚)为这些人不可能成年并结婚)(iii)为使每个儿童至少有一个正常的父为使每个儿童至少有一个正常的父 亲或母亲,因此隐性患者必须与正常亲或母亲,因此隐性患者必须与正常 人结合,其后代的基因型概率由人结合,其后代的基因型概率由 下表下表 给出:给出:1/20Aa1/21AA后后代代基基因因型型AAAaAAAA父母的基因型父母的基因型现在,我们考虑在控制结合的情况下,如何确定后代中隐性患者的概32(b)建模建模由由假设(假设(iii),),从第从第n1代到第代到第n代基因型分布的变化取代基因型分布的变化取决于方程决于方程所以所以,其中,其中如果初始分如果初始分 布布x(0)已知,那么已知,那么 第第n代基因型分布为代基因型分布为解解 将将M对角化,即求出特征值及其所对应的特征向量,得对角化,即求出特征值及其所对应的特征向量,得(b)建模所以,其中如果初始分 布x(0)已知,那么 第n代33计算计算 =(4.8)因为因为,所以当,所以当 时,时,隐性患者逐渐消失。隐性患者逐渐消失。从从(4.8)式中可知式中可知每代隐性患者每代隐性患者的概率是前一的概率是前一代隐性患者概代隐性患者概率的率的1/2。(4.9)计算 =(4.8)因为,所以当 时,隐性患者逐渐消失34(c)模型讨论模型讨论研究在随机结合的情况下,隐性患者的变化是很有意思的,但研究在随机结合的情况下,隐性患者的变化是很有意思的,但随机结合导致了非线性化问题,超出了本章范围,然而用其它随机结合导致了非线性化问题,超出了本章范围,然而用其它技巧,在随机结合的情况下可以技巧,在随机结合的情况下可以 把把(4.9)式改写为式改写为(4.10)下面给会出数值例子:下面给会出数值例子:某地区有某地区有10%的黑人是镰状网性盆血症隐性患者,如果控制的黑人是镰状网性盆血症隐性患者,如果控制结合,根据结合,根据(4.9)式可知下一代式可知下一代(大约(大约27年)的隐性患者年)的隐性患者将减少到将减少到5%;如果随机结合,根据如果随机结合,根据(4.10)式,可以预言)式,可以预言下一代人中下一代人中 有有9.5%是隐性患者,并且可计算出大约每出生是隐性患者,并且可计算出大约每出生400个黑人孩子,其中有一个是显性患者。个黑人孩子,其中有一个是显性患者。(c)模型讨论(4.10)下面给会出数值例子:35(近亲繁殖)(近亲繁殖)近亲繁殖是指父母双方有一个或两个共同的祖先,一般追踪到近亲繁殖是指父母双方有一个或两个共同的祖先,一般追踪到四代,即至少有相同的曾祖父(母)或外曾祖父(母)。为简四代,即至少有相同的曾祖父(母)或外曾祖父(母)。为简单起见,我们来考察一对表兄妹(或堂兄妹)结婚的情况,其单起见,我们来考察一对表兄妹(或堂兄妹)结婚的情况,其中中代表男性,代表男性,代表女性。代表女性。设曾祖父有某基因设曾祖父有某基因 对对A1A2,曾祖母有某基因曾祖母有某基因 对对A3A4,容易求容易求得:祖父母取得:祖父母取 得得A1的概率为的概率为 1/2,故祖父母同,故祖父母同 有有A1基因的概率基因的概率为为1/4;父母同有;父母同有A1基因的概率为基因的概率为 1/16,而子女从父母那里获,而子女从父母那里获得基因对得基因对A1A1的概率为的概率为 1/64,而获得相同基因对(称为基因纯,而获得相同基因对(称为基因纯合子)合子)A1A1,A2A2,A3A3或或A4A4之一的概率为之一的概率为 1/16,此概率被此概率被称为表兄称为表兄 妹妹(或堂兄妹或堂兄妹)结婚结婚(表亲表亲)的的近交系数近交系数。类似可求得半堂亲(只有一个共同祖先)的近交系数类似可求得半堂亲(只有一个共同祖先)的近交系数 为为1/32,从表亲(父母为表亲)的近交系数,从表亲(父母为表亲)的近交系数 为为1/64;非近亲结婚不可;非近亲结婚不可能发生重复取某祖先的一对基因对中的某一基因作为自己的基能发生重复取某祖先的一对基因对中的某一基因作为自己的基因对的情况,故近交系数因对的情况,故近交系数 为为0。(近亲繁殖)设曾祖父有某基因 对A1A2,曾祖母有某基因 对36(群体的近交系数)(群体的近交系数)设某群体中存在近亲婚配现象,称各种近交系数的数学期望为设某群体中存在近亲婚配现象,称各种近交系数的数学期望为该群体的近交系数。例如,某村镇共有该群体的近交系数。例如,某村镇共有2000对婚配关系,其对婚配关系,其中有中有59对表亲,对表亲,22对半堂亲对半堂亲 和和28对从表亲,则该村镇的近亲对从表亲,则该村镇的近亲系数为系数为 现在,我们来研究近亲结现在,我们来研究近亲结 婚会产生什么结果。婚会产生什么结果。设某基因对由设某基因对由 A、a两种基因组成,出两种基因组成,出 现现A的概率为的概率为p,出现出现a的概率为的概率为q=1-p。在随机交配群体中,其子女在随机交配群体中,其子女 为为AA、Aa及及aa型的概率分别型的概率分别 为为p2、2pq及及q2。对近交系数对近交系数 为为F的群体,根据条件概率公式,后代出的群体,根据条件概率公式,后代出 现现aa型型基因对的概率为基因对的概率为(群体的近交系数)37比较存在近亲交配的群体与不允许近亲交配比较存在近亲交配的群体与不允许近亲交配 (F=0)的群体,的群体,令令 若若a为某种隐性疾病的基因,易见,在近交群体中,后代产为某种隐性疾病的基因,易见,在近交群体中,后代产 生遗传病(生遗传病(aa型)的概率增大了,型)的概率增大了,且且F越大,后代患遗传病越大,后代患遗传病 的概率也越大。的概率也越大。同样,后代出现同样,后代出现AA型基因对的概率型基因对的概率 为为p2+Fpq。Aa型不可能型不可能 是共同祖先同一基因的重复,故其出现的概率为是共同祖先同一基因的重复,故其出现的概率为2pq(1-F)。比较存在近亲交配的群体与不允许近亲交配 (F=0)的群体38例如例如,苯丙酮尿症苯丙酮尿症是一种隐性基因纯合子是一种隐性基因纯合子 aa型疾病(型疾病(a为为隐性疾病基因),隐性基因出现的频率隐性疾病基因),隐性基因出现的频率 ,求表,求表兄妹结婚及非近亲结婚的子女中患有苯丙酮尿症的概率。兄妹结婚及非近亲结婚的子女中患有苯丙酮尿症的概率。由前,表兄妹结婚的近交系数为由前,表兄妹结婚的近交系数为 1/16,故其子女发生该疾病故其子女发生该疾病的概率为的概率为而对禁止近亲结婚的群体,子女发生该疾病的概率为而对禁止近亲结婚的群体,子女发生该疾病的概率为q2=10-4。表兄妹(或堂兄妹)结婚使子女发生该疾病的概表兄妹(或堂兄妹)结婚使子女发生该疾病的概率增大了大率增大了大 约约7.19倍,由此可见,为了提高全民族的身体倍,由此可见,为了提高全民族的身体素质,近亲结婚是应当素质,近亲结婚是应当 禁止禁止的。的。例如,苯丙酮尿症是一种隐性基因纯合子 aa型疾病(a为隐性疾39例例4.10 X链遗传模型的一个实例链遗传模型的一个实例X链遗传链遗传是指另一种遗传方式:雄性具有一个基是指另一种遗传方式:雄性具有一个基 因因A或或a,雌性具有两个基雌性具有两个基 因因AA,或或Aa,或或aa。其遗传规律是雄性后其遗传规律是雄性后代以相等概率得到母体两个基因中的一个,雌性后代从父体中代以相等概率得到母体两个基因中的一个,雌性后代从父体中得到一个基因,并从母体的两个基因中等可能地得到一个。下得到一个基因,并从母体的两个基因中等可能地得到一个。下面,研究面,研究 与与X链遗传有关的近亲繁殖过程。链遗传有关的近亲繁殖过程。(a)假设假设(i)从一对雌雄结合开始从一对雌雄结合开始,在它们的后代在它们的后代 中中,任选雌雄各一任选雌雄各一 个成配偶个成配偶,然后在它们产生的后代中任选两个结成配然后在它们产生的后代中任选两个结成配 偶偶,如此继续下去如此继续下去,(在家畜、家禽饲养中常见这种现在家畜、家禽饲养中常见这种现 象象)(ii)父体与母体的基因型组成同胞对,同胞对的形式有父体与母体的基因型组成同胞对,同胞对的形式有 (A,AA),(A,Aa),(A,aa),(a,AA),(a,Aa),(a,aa)6种。初始种。初始一一 对雌雄的同胞对,是这六种类型中的任一种,其后代的对雌雄的同胞对,是这六种类型中的任一种,其后代的 基因型如下表所示。基因型如下表所示。例4.10 X链遗传模型的一个实例(a)假设40(iii)在每一代中,配偶的同胞对也是六种类型之一,并在每一代中,配偶的同胞对也是六种类型之一,并 有确定的概率。为计算这些概率有确定的概率。为计算这些概率 ,设设an,bn,cn,dn,en,fn 分别是第分别是第n代中配偶的同胞对代中配偶的同胞对 为为(A,AA),(A,Aa),(A,aa),(a,AA),(a,Aa),(a,aa)型的概率,型的概率,n=0,1,。令令(iv)如果第如果第n1代配偶的同胞对是代配偶的同胞对是(A,Aa)型,那么它型,那么它 们的雄性后代将等可能地得到基们的雄性后代将等可能地得到基 因因A和和a,它们的雌它们的雌 性后代的基因型将等可能地性后代的基因型将等可能地 是是AA或或Aa。又由于又由于 第第n 代雌雄结合是随机的,那么代雌雄结合是随机的,那么 第第n代配偶的同胞对将等代配偶的同胞对将等 可能地为四种类型可能地为四种类型(A,AA),(A,Aa),(a,AA),(a,Aa)之一,之一,对于其它类型的同胞对,我们可以进行同样分析,对于其它类型的同胞对,我们可以进行同样分析,因此有因此有11/20000aa01/2111/20Aa00001/21AA11/2011/20a01/2101/21AA后后代代基基因因型型(a,aa)(a,Aa)(a,AA)(A,aa)(A,Aa)(A,AA)父体父体母体的基因型母体的基因型(4.11)(iii)在每一代中,配偶的同胞对也是六种类型之一,并 1141其中其中从(从(4.11)式中易得)式中易得经过计算,矩阵经过计算,矩阵 M的特征值和特征向量为的特征值和特征向量为,其中从(4.11)式中易得经过计算,矩阵 M的特征值和特征向42,M对角化,则有对角化,则有(4.12),M对角化,则有(4.12)43 其中:其中:其中:44马尔可夫链数学建模课件45当当 时时因此,当因此,当 时,(时,(4.12)式中)式中当 时因此,当 时,(4.12)式中46即即因此,在极限情况下所有同胞对或者是因此,在极限情况下所有同胞对或者是(A,AA)型,或者是型,或者是(a,aa)型。如果初始的父母体同胞对型。如果初始的父母体同胞对 是(是(A,Aa)型,即型,即b0=1,而而a0=c0=d0=e0=f0=0,于是,当于是,当时时即同胞对是即同胞对是(A,AA)型的概率是型的概率是2/3,是,是(a,aa)型的概率为型的概率为1/3。即因此,在极限情况下所有同胞对或者是(A,AA)型,或者是47(正则链与吸收链)(正则链与吸收链)根据转移矩阵的不同结构,马氏链可以分为多个不同的类型,根据转移矩阵的不同结构,马氏链可以分为多个不同的类型,这里,我们只简单介绍其中常见而又较为重要的两类:正则这里,我们只简单介绍其中常见而又较为重要的两类:正则链与吸收链。链与吸收链。定义定义2 对于马氏链,若存在一正整对于马氏链,若存在一正整 数数K,使其转移矩阵使其转移矩阵 的的K次幂次幂MK0(每一分量均大每一分量均大 于于0),则称此马尔链为一正则),则称此马尔链为一正则(regular)链。链。定理定理2 若若A为正则链的转移矩阵,则必有:为正则链的转移矩阵,则必有:(1)当)当 时,时,其中,其中W为一分量均大于零为一分量均大于零 的随机矩阵。的随机矩阵。(2)W的所有行向量均相同。的所有行向量均相同。(正则链与吸收链)定义2 对于马氏链,若存在一正整 数K48定理定理3 记定理记定理 2中的随机矩阵中的随机矩阵W的行向量为的行向量为V=(v1,vn),则:则:(1)对任意随机向)对任意随机向 量量x,有有(2)V是是A的不动点向量的不动点向量,即即VA=V,A的不动点向量是唯一的。的不动点向量是唯一的。定义定义3 状态状态Si 称为马氏链的吸收状态,若转移矩阵的称为马氏链的吸收状态,若转移矩阵的 第第i 行行满足:满足:Pii=1,Pij=0(ji)定义定义4 马氏链被称为马氏链被称为 吸收链,若其满足以下两个条件:吸收链,若其满足以下两个条件:(1)至少存在一个吸收状态)至少存在一个吸收状态。(2)从任一状态出发)从任一状态出发,经有限步转移总可到达某一吸收经有限步转移总可到达某一吸收 状态状态 根据定义根据定义3,例,例4.7中状态中状态S4即即为一吸收链为一吸收链 定理3 记定理 2中的随机矩阵W的行向量为V=(v1,49具有具有r个吸收状态,个吸收状态,nr个非吸收状态的吸收链,它的个非吸收状态的吸收链,它的nn转移转移矩阵的标准形式为矩阵的标准形式为 (注:非标准形式可经对状态重新编号(注:非标准形式可经对状态重新编号 )其中其中Ir为为r 阶单位阵,阶单位阵,O为为rs零阵,零阵,R为为sr 矩阵,矩阵,S为为ss矩矩阵。令阵。令上式中的子阵上式中的子阵Sn表达了以任何非吸收状态作为初始状态,经表达了以任何非吸收状态作为初始状态,经过过n步转移后,处于步转移后,处于s个非吸收状态的概率。个非吸收状态的概率。在吸收链中,令在吸收链中,令F=(IS)-1,称称F为基矩阵。为基矩阵。具有r个吸收状态,nr个非吸收状态的吸收链,它的nn转移50定理定理4 吸收链的基矩吸收链的基矩 阵阵F中的每个元素,表示从一个非吸收中的每个元素,表示从一个非吸收 状态出发,过程到达每个非吸收状态的平均转移次状态出发,过程到达每个非吸收状态的平均转移次 数。数。定理定理5 设设N=FC,F为吸收链的基矩阵,为吸收链的基矩阵,C=(1,1,1)T,则则N 的每个元素表示从非吸收状态出发,到达某个吸收的每个元素表示从非吸收状态出发,到达某个吸收 状态被吸收之前的平均转移次数。状态被吸收之前的平均转移次数。定理定理6 设设B=FR=(bij),),其中其中F为吸收链的基矩阵,为吸收链的基矩阵,R为为T中中 的子阵,则的子阵,则bij表示从非吸收状表示从非吸收状 态态i出发,被吸收状态出发,被吸收状态 j 吸收的概率。吸收的概率。定理4 吸收链的基矩 阵F中的每个元素,表示从一个非吸收 51例例4.12(竞赛问题)(竞赛问题)甲乙两队进行一场抢答竞赛,竞赛规则规定:开始时每队各甲乙两队进行一场抢答竞赛,竞赛规则规定:开始时每队各记记2分,抢答题开始后,如甲取胜则甲分,抢答题开始后,如甲取胜则甲 加加1分而乙减分而乙减1分,反分,反之则乙加之则乙加1分甲减分甲减1分分,(每题必需决出胜负每题必需决出胜负)。规则还规定,。规则还规定,当其中一方的得分达当其中一方的得分达 到到4分时,竞赛结束。现希望知道:分时,竞赛结束。现希望知道:(1)甲队获胜的概率有多大?)甲队获胜的概率有多大?(2)竞赛从开始到结束,平均转移的次数为多少?)竞赛从开始到结束,平均转移的次数为多少?(3)甲获得)甲获得1、2、3分的平均次数是多少?分的平均次数是多少?设甲胜一题的概率设甲胜一题的概率 为为p,(,(0p1),),p与两队的实力有关。与两队的实力有关。甲队得分有甲队得分有5种可能,即种可能,即0,1,2,3,4。我们分别记为状态。我们分别记为状态S0,S1,S2,S3,S4,其中其中S0和和S4是吸收状态,是吸收状态,a1,a2和和a3是非吸收状态。过程是非吸收状态。过程 以以S2作为初始状态。根据甲队赢作为初始状态。根据甲队赢 得得1分的概率为分的概率为 p,建立转移矩阵:建立转移矩阵:例4.12(竞赛问题)设甲胜一题的概率 为p,(0p1)52S 0 S 1 S 2 S 3 S 4 将上式改记为标准形将上式改记为标准形 式式T:其中其中S 0 S 1 S 2 S53计算计算 F:令令q=1-p,则则因为因为a2是初始状态,根是初始状态,根 据定理据定理4,甲队获分为,甲队获分为1,2,3分的分的平均次数为平均次数为,。又。又 计算 F:令q=1-p,则因为a2是初始状态,根 据定理4,54=根据定理根据定理5,以,以a2为初始状态,甲队最终获胜的平均转为初始状态,甲队最终获胜的平均转 移欠移欠数为数为。又因为,。又因为,根据定理根据定理6,甲队最后获胜的概率,甲队最后获胜的概率。=根据定理5,以a2为初始状态,甲队最终获胜的平均转 移55
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!