第七章个体遗传评定之BLUP法-课件

上传人:文**** 文档编号:241909335 上传时间:2024-08-04 格式:PPT 页数:70 大小:806.73KB
返回 下载 相关 举报
第七章个体遗传评定之BLUP法-课件_第1页
第1页 / 共70页
第七章个体遗传评定之BLUP法-课件_第2页
第2页 / 共70页
第七章个体遗传评定之BLUP法-课件_第3页
第3页 / 共70页
点击查看更多>>
资源描述
第七章 个体遗传评定BLUP法第七章 个体遗传评定BLUP法1线性模型基础知识线性模型基础知识BLUP法估计育种值法估计育种值线性模型基础知识2线性模型线性模型基础知识基础知识线性模型基础知识3线性!模型?线性模型?畜禽育种中的线性模型 张沅、张勤,1993线性!畜禽育种中的线性模型4XYY=a+bX线性关系:直线关系例如:育种值与表型观察值Y与X之间XYY=aX非线性关系:曲线关系例如:产奶曲线、生长曲线线 性XYY=a+bX线性关系:直线关系Y与X之间XYY=aX非5模型的定义模型的定义模型:数学表达式,科学合理地描述数据模型:数学表达式,科学合理地描述数据直接影响数据统计分析的效果直接影响数据统计分析的效果数据:来自试验结果;来自调查测定结果数据:来自试验结果;来自调查测定结果数据统计分析:数据统计分析:一般分析:一般分析:均数、方差均数、方差等等统计分布特征统计分布特征 特殊分析:遗传特殊分析:遗传参数参数、个体、个体育种值育种值E模型表达了数据的特性;反映了生物学模型表达了数据的特性;反映了生物学问题的规律问题的规律模型的定义模型:数学表达式,科学合理地描述数据6参 数:总体分布中的未知常数。如:总体均数、总体标准差、总体方差统计量:反映样本特征的数值。如:样本均数、样本标准差、样本方差均值:反映性状变量集中性的数值方差:反映性状变量离散性的数值群体均值参 数:总体分布中的未知常数。如:总体均数、总体标准差、总7模型的定义模型的定义自由落体运动模型,T为时间S为距离S为S的一个观察值,e为随机误差模型的定义自由落体运动模型,T为时间S为距离S为S的一个观8线性模型的概念线性模型的概念观察值(记录):观察值(记录):对试验个体直接测量的结果,对试验个体直接测量的结果,包括包括客观客观和和主观主观获得的测量结果获得的测量结果。E观察值一般都是具有观察值一般都是具有多元分布多元分布的随机变量的随机变量E当观察值分布的形式已知(正态分布、卡方当观察值分布的形式已知(正态分布、卡方分布),则需要详尽地了解分布的分布),则需要详尽地了解分布的参数参数(平均(平均数、方差)数、方差)参数是对分布的数据说明线性模型的概念观察值(记录):对试验个体直接测量的结果,包括950100307012050 20不同平均数、相同标准差的正态分布(XN(,2)XN(50,202)100 20XN(100,202)随机变量X符合正态分布50100307012050不同平均数、相同标准差的正态1050307050 20不同标准差、相同平均数的正态分布50 550307050不同标准差、相同平均数的正态分布5011线性模型的概念线性模型的概念E建立线性模型的目的:为了分析影响观建立线性模型的目的:为了分析影响观察值的各因素(因子)察值的各因素(因子)E建立模型时需考虑所有的影响因素建立模型时需考虑所有的影响因素因子:因子:直接或间接影响观察值的因素直接或间接影响观察值的因素例如例如:影响母牛产奶的因素有:头胎产犊年龄、:影响母牛产奶的因素有:头胎产犊年龄、产犊季节、本身的遗传潜力、空怀天数等等产犊季节、本身的遗传潜力、空怀天数等等线性模型的概念12根据因子的变异形式根据因子的变异形式:因子可能是不连续变异的,或连续变异的因子可能是不连续变异的,或连续变异的建模时也有时将连续变异的因素划分为等级,建模时也有时将连续变异的因素划分为等级,例如头胎产犊年龄划为例如头胎产犊年龄划为4 4级,即级,即20202424、25252828、29293232、3333月龄;月龄;因子的类型因子的类型根据因子的变异形式:因子的类型13因子的类型因子的类型依据因子的性质依据因子的性质:固定效应:固定效应:事先知道所有可能出现的等级或事先知道所有可能出现的等级或水平,并且可以观察到的,例如:动物个体水平,并且可以观察到的,例如:动物个体的性别、年龄、泌乳胎次、牧场(饲养管理的性别、年龄、泌乳胎次、牧场(饲养管理体系)、畜舍、笼位、品种等等体系)、畜舍、笼位、品种等等随机效应随机效应:随机地从一个无穷大的群体中抽随机地从一个无穷大的群体中抽取的样本时,可能出现的水平取的样本时,可能出现的水平(预先不能判(预先不能判断效应的大小,只能从抽样中估测)断效应的大小,只能从抽样中估测)因子的类型依据因子的性质:14例子:比较北京南郊6个猪场与上海松江县6个猪场的差别 现对这12家猪场进行详细的调查 得出结论,北京南郊6个猪场与上海松江县6个 猪场在某某方面不同(固定效应)比较北京和上海养猪水平的差别 从两市分别随机抽取6个猪场进行比较 得出结论,北京与上海养猪在某某方面不同(随机效应)总体总体因子的类型因子的类型例子:总体总体因子的类型15区分因子性质的标准区分因子性质的标准模型中因子可能的模型中因子可能的水平数水平数在一个大群体中考虑的水平数在一个大群体中考虑的水平数在同一试验或调查中,同一水平在同一试验或调查中,同一水平重复重复出现的可能出现的可能能否能否预知预知或定义出可能出现的效应或定义出可能出现的效应通过调查得到的数据的方式通过调查得到的数据的方式区分因子性质的标准模型中因子可能的水平数16线性模型线性模型方差组分模型方差组分模型协方差分析模型协方差分析模型方差分析模型方差分析模型线性回归模型线性回归模型线性模型线性模型(linear model)的概念的概念是一类十分重要的统计模型线性模型方差组分模型协方差分析模型方差分析模型线性回归模型线17线性模型线性模型(linear model)的概念的概念产奶量品种性别个体线性模型(linear model)的概念产奶量品种性别个体18线性模型的内容线性模型的内容:l数学方程式(数学模型式,数学方程式(数学模型式,equationequation)l模型中随机效应和随机变量的模型中随机效应和随机变量的数学期望数学期望和和方差方差l建立模型时的所有假设和约束条件建立模型时的所有假设和约束条件线性模型的概念线性模型的概念理论上的均值线性模型的内容:线性模型的概念理论上的均值19线性模型式线性模型式用矩阵的形式表示该线性模型,令:用矩阵的形式表示该线性模型,令:设y和x1xk之间服从线性关系,对y及x1xk同时作n次观察后,得到n组数据,对于第i组数据,有:线性模型式用矩阵的形式表示该线性模型,令:设y和x1xk20线性模型的矩阵表达式线性模型的矩阵表达式I为单位阵线性模型的矩阵表达式I为单位阵21虚变量模型虚变量模型 虚变量模型 22模型举例模型举例1模型举例123模型举例模型举例1模型举例124模型举例模型举例1设计矩阵关联矩阵结构矩阵模型举例1设计矩阵25设有肉牛设有肉牛190190210210日龄的体重资料,将日龄按每日龄的体重资料,将日龄按每5 5天间天间隔分组,隔分组,190190210210日龄就可分为日龄就可分为4 4组,欲分析不同日龄组,欲分析不同日龄组对体重的影响。可建立如下的线性模型组对体重的影响。可建立如下的线性模型:y yij ij=+a+ai i+e+eijij上式中:上式中:y yijij :在第:在第i i个日龄组中的第个日龄组中的第j j头肉牛的体重,为可观察头肉牛的体重,为可观察的随机变量;的随机变量;:总平均数,是一常量;:总平均数,是一常量;a ai i :第:第i i个日龄组的效应,它是固定效应;个日龄组的效应,它是固定效应;e eijij:剩余效应,也称为随机误差;:剩余效应,也称为随机误差;模型举例模型举例2设有肉牛190210日龄的体重资料,将日龄按每5天间隔分组26上式中随机变量的期望和方差及协方差为上式中随机变量的期望和方差及协方差为:E(E(e eijij)=0)=0,E(E(y yijij)=)=+a ai i ,Var(Var(y yijij)=Var()=Var(eijeij)=)=2 2Cov(Cov(e eijij,e eijij)=Cov()=Cov(e eijij,e eijij)=Cov()=Cov(e eijij,e eijij)=0)=0 此模型的假设和约束条件包括:此模型的假设和约束条件包括:1)1)所有犊牛都来自同一品种所有犊牛都来自同一品种,2)2)母亲的年龄对犊牛体重无影响母亲的年龄对犊牛体重无影响,3)3)犊牛的性别相同或性别对体重无影响犊牛的性别相同或性别对体重无影响,4)4)所有犊牛都在相同的环境下以相同的饲养方式饲养所有犊牛都在相同的环境下以相同的饲养方式饲养模型举例模型举例2上式中随机变量的期望和方差及协方差为:模型举例227现有一数据表现有一数据表模型举例模型举例2190194日龄日龄200204日龄日龄195199日龄日龄205210日龄日龄现有一数据表模型举例2190194日龄200204日龄128每一观察值都可根据上面的模型建立一个方程式:每一观察值都可根据上面的模型建立一个方程式:每一观察值都可根据上面的模型建立一个方程式:29y=Xa+eE(e)=0,E(y)=XaVar(y)=Var(e)=I2矩阵矩阵X X称为关联矩阵,称为关联矩阵,因为其中的元素指示了因为其中的元素指示了y y中的元素与中的元素与a a中的元素中的元素的的关联情况关联情况,I I是单位是单位矩阵。矩阵。y=Xa+e矩阵X称为关联矩阵,因为其中的元素指示了30线性模型分类线性模型分类日粮日粮牧场线性模型分类日粮日粮牧场31线性模型分类线性模型分类线性模型分类32线性模型分类线性模型分类效应的性质效应的性质固定效应:固定效应:可人为控制;不因其他因素的变化而改变可人为控制;不因其他因素的变化而改变随机效应:随机效应:来自一个总体的随机样本,其有可能表现不来自一个总体的随机样本,其有可能表现不同的状态,人为不能控制同的状态,人为不能控制线性模型分类效应的性质固定效应:随机效应:33固定模型:除了随机误差(e)外,完全由固定效应组成的模型称为固定效应模型,或固定模型(fixed effects model)随机模型:除了群体均数()外,完全由随机效应组成的模型称为随机效应模型,或随机模型(random effects model)混合模型:除了群体均数()和随机误差(e)外,一个模型既含有固定效应,又含有随机效应,则称为混合模型(mixed model)线性模型分类线性模型分类BLUP固定模型:除了随机误差(e)外,完全由固定效应组成的模型称为34线性模型分类线性模型分类线性模型分类35线性模型分类线性模型分类线性模型分类36线性模型分类线性模型分类环境效应:环境效应:外界因素对家畜个体作用所产生的效应外界因素对家畜个体作用所产生的效应随机环境效应随机环境效应(对于一个大群体,基本上可以相互抵消)人为不可控制,作用于人为不可控制,作用于个别个体个别个体的环境效应的环境效应 永久性随机环境效应;暂时性随机环境效应永久性随机环境效应;暂时性随机环境效应系统环境效应系统环境效应(必须掌握其影响,并从表型值中剔除)在一定时间内作用于在一定时间内作用于所有个体所有个体的环境效应的环境效应(牧场、季节)(牧场、季节)遗传效应:遗传效应:由基因对个体产生的效应由基因对个体产生的效应随机遗传效应:随机遗传效应:任何个体均是一个群体的随机抽样任何个体均是一个群体的随机抽样固定遗传效应:固定遗传效应:公牛组效应公牛组效应线性模型分类环境效应:外界因素对家畜个体作用所产生的效应遗传37数据资料的结构数据资料的结构均衡资料(balanced data):所有水平组合中重复数相等的资料称之不均衡资料(unbalanced data):水平组合中重复数不等的资料称之(畜牧上大部分数据属于此类)均衡资料是不均衡资料的特例数据资料的结构均衡资料(balanced data):所有水38数据资料的结构数据资料的结构对于这类资料估计各种效应比较容易数据资料的结构对于这类资料估计各种效应比较容易39数据资料的结构数据资料的结构E对于结构不均衡数据资料的分析需要采用对于结构不均衡数据资料的分析需要采用特殊的统计方法特殊的统计方法,才能保证获得无偏估值,才能保证获得无偏估值数据资料的结构对于结构不均衡数据资料的分析需要采用特殊的统计40线性模型基础知识线性模型基础知识BLUP法估计育种值法估计育种值线性模型基础知识41个体遗传评定个体遗传评定BLUP法估计育种值法估计育种值个体遗传评定42遗传评定的概念遗传评定的概念遗传评定方法使用问题遗传评定方法使用问题育种值相关知识育种值相关知识利用所有亲属信息利用所有亲属信息遗传评定的概念43关于关于BLUP育种值估计方法育种值估计方法BLUP:结合了选择指数法和最小二乘法的优点关于BLUP育种值估计方法BLUP:结合了选择指数法和最小二44选择指数法的基本要点选择指数法的基本要点不存在系统环境效应不存在系统环境效应个体随机来自同一总体个体随机来自同一总体各遗传参数事先已估计出来各遗传参数事先已估计出来v当满足三个前提时,使用选择指数法,当满足三个前提时,使用选择指数法,可得到育种值的可得到育种值的最佳线性预测最佳线性预测(BLPBLP)E在家畜育种实践中使用选择指数的在家畜育种实践中使用选择指数的重要原则是满足第二个前提重要原则是满足第二个前提选择指数法的基本要点不存在系统环境效应当满足三个前提时,使用45最小二乘法最小二乘法(LS)(LS)的基本要点的基本要点v19341934年,年,YatesYates提出;提出;19601960年,年,HarveyHarvey引入引入 到畜牧统计中到畜牧统计中v可估计影响观察值的各种固定效应可估计影响观察值的各种固定效应v可将观察值中的固定效应校正出去可将观察值中的固定效应校正出去v对于不平衡数据可获得最佳线性无偏估对于不平衡数据可获得最佳线性无偏估 计值(计值(BLUEBLUE)v利用最小二乘法(利用最小二乘法(Least Squares,LSLeast Squares,LS)校)校 正后的观察值称最小二乘均数正后的观察值称最小二乘均数最小二乘法(LS)的基本要点1934年,Yates提出;1946vBLUP=最佳线性无偏预测最佳线性无偏预测(Best Linear Unbiased Prediction)最佳最佳-估计误差最小,估计育种值与真实育种值估计误差最小,估计育种值与真实育种值的相关最大的相关最大线性线性-估计是基于线性模型(估计值与观察值呈估计是基于线性模型(估计值与观察值呈线性关系)线性关系)无偏无偏-估计值的数学期望为真值(固定效应)或估计值的数学期望为真值(固定效应)或被估计量的数学期望(随机效应)被估计量的数学期望(随机效应)预测预测-预测一个个体将来作为亲本的种用价值预测一个个体将来作为亲本的种用价值(随机遗传效应)(随机遗传效应)BLUP的概念的概念BLUP=最佳线性无偏预测BLUP的概念47vBLUPBLUP是一种是一种统计方法统计方法,畜禽育种中适合应,畜禽育种中适合应用这一方法预测个体育种值,即遗传评定用这一方法预测个体育种值,即遗传评定(genetic evaluation)genetic evaluation)BLUP的概念的概念v应用应用BLUPBLUP法进行种畜遗传评定,可以提高法进行种畜遗传评定,可以提高选种的准确性,进而加快群体的遗传进展选种的准确性,进而加快群体的遗传进展v应用应用BLUPBLUP的效果除了取决于方法本身因素的效果除了取决于方法本身因素外,还受综合育种措施,诸如性能测定、外,还受综合育种措施,诸如性能测定、种群结构、选配计划等多项因素的影响种群结构、选配计划等多项因素的影响BLUP是一种统计方法,畜禽育种中适合应用这一方法预测个体育48BLUP法的基础法的基础v统计学意义统计学意义:将观察值表示成固定效应、随机效应:将观察值表示成固定效应、随机效应和随机残差的线性组合和随机残差的线性组合v遗传学意义遗传学意义:将表型值表示成遗传效应、系统环境:将表型值表示成遗传效应、系统环境效应(如畜群、年度、季节、性别等)、随机环境效应(如畜群、年度、季节、性别等)、随机环境效应(如窝效应、永久环境效应)和剩余效应(包效应(如窝效应、永久环境效应)和剩余效应(包括部分遗传效应和环境效应)的线性组合括部分遗传效应和环境效应)的线性组合E在同一个估计方程组中既完成固定效应在同一个估计方程组中既完成固定效应的估计,又能实现随机遗传效应的预测的估计,又能实现随机遗传效应的预测BLUP法的基础统计学意义:将观察值表示成固定效应、随机效应49随机向量,期望向量随机向量,期望向量和方差和方差-协方差矩阵协方差矩阵 随机向量,期望向量和方差-协方差矩阵 50Var(x)=E(x)=随机随机向量向量期望期望向量向量方差斜方差斜方差矩阵方差矩阵Var(x)=E(x)=随机向量期望向量方差斜方差51个体间的加性遗传相关个体间的加性遗传相关|个体个体x x和和y y间的加性遗传相关间的加性遗传相关是指在它们的基因组中具是指在它们的基因组中具有同源相同基因的比例,或者说从个体有同源相同基因的比例,或者说从个体x x的基因组中随的基因组中随机抽取的一个基因在个体机抽取的一个基因在个体y y的基因组中也存在的概率的基因组中也存在的概率 n n1 1和和n n2 2:分别为由个体:分别为由个体x x和和y y到它们的共同祖先到它们的共同祖先A A的世的世代数;代数;f fA A:为:为A A的近交系数;的近交系数;:表示当:表示当x x和和y y有多个共同祖先时要对所有连接有多个共同祖先时要对所有连接x x和和y y的通径求和的通径求和 个体间的加性遗传相关个体x和y间的加性遗传相关是指在它们的基52|对于一个群体,如果我们将所有个体相互间的加性对于一个群体,如果我们将所有个体相互间的加性遗传相关用一个矩阵表示出来,设群体中的个体为遗传相关用一个矩阵表示出来,设群体中的个体为1 1,2 2,n n,则这个矩阵为,则这个矩阵为A=这个矩阵称为加性遗传相关矩阵(这个矩阵称为加性遗传相关矩阵(Additive genetic relationship matrix)或分子亲缘相关矩阵)或分子亲缘相关矩阵(numerator relationship matrix)个体间的加性遗传相关个体间的加性遗传相关个体间亲缘相关系数计算公式中的分子部分对于一个群体,如果我们将所有个体相互间的加性遗传相关用一个矩53用BLUP方法估计育种值时,首先要根据资料的性质建立适当的模型:公畜模型(sire model)、公畜母畜模型(sire-dam model)、外祖父模型(maternal grandsire model)以及动物模型(animal model)等 育种实践中普遍采用动物模型动物模型:将动物个体本身的加性遗传效应(即育种值)作为随机效应放在模型动物模型BLUP:基因动物模型的BLUP育种值估计方法(牛、猪育种实践中普遍采用)动物模型BLUP用BLUP方法估计育种值时,首先要根据资料的性质建立适当的模54矩阵表示为:式中:y为观察值向量为固定效应向量,如牧场a为随机的加性遗传效应向量,即个体育种值向量e为随机残差向量X、Z分别是与固定效应和加性遗传效应对应的关联矩阵 动物模型BLUP矩阵表示为:动物模型BLUP55牧场个体父亲母亲观察值12225132001425525132502613198272424528242602924235现有如下资料:动物模型BLUP举例牧场个体父亲母亲观察值122251320014256对上述资料可用如下模型估计育种值:在第i个牧场中个体j的观察值 第个i牧场的固定效应 第j个个体的育种值 与观察值 对应的随机误差动物模型BLUP举例对上述资料可用如下模型估计育种值:动物模型BLUP举例57写成矩阵形式为:观察值向量个体育种值向量个体育种值的关联矩阵随机残差效应向量固定效应的关联矩阵固定效应向量(牧场)写成矩阵形式为:观察值向量个体育种值向量个体育种值的关联矩阵58写成矩阵形式为:向量a中不仅包含有观察值个体的育种值,还包括没有观察值个体的育种值写成矩阵形式为:向量a中不仅包含有观察值个体的育种值,还包括59与此模型对应的混合模型方程组(MME)求解关键XX XZZXZZ Xy ZyXZA:加性遗传相关矩阵AA-1k=(1-h2)/h2与此模型对应的混合模型方程组(MME)求解关键XX XA609个个体间的加性遗传相关矩阵为:1 2 3 4 5 6 7 8 9A-19个个体间的加性遗传相关矩阵为:1 2 61第七章个体遗传评定之BLUP法-课件62方程组的解为:9个个体排列优劣名次:a4a3 a8 a7 a9 a2 a5 a1 a6方程组的解为:9个个体排列优劣名次:a4a3 a8 63BLUP育种值估计方法类型公畜模型BLUP:公畜母畜模型BLUP:外祖父模型BLUP:动物模型BLUP:公畜(父亲)遗传效应向量个体加性效应向量外祖父遗传效应向量母亲遗传效应向量BLUP育种值估计方法类型公畜模型BLUP:公畜(父亲)遗传64BLUP法估计育种值法估计育种值的主要优点的主要优点能更有效地校正环境效应能更有效地校正环境效应能更充分利用所有亲属的信息能更充分利用所有亲属的信息能校正由于非随机交配造成的偏差能校正由于非随机交配造成的偏差能对不同群体进行联合遗传评定能对不同群体进行联合遗传评定 (前提前提:群体间有一定的遗传联系):群体间有一定的遗传联系)育种值估计的精确性更高育种值估计的精确性更高BLUP法估计育种值的主要优点65BLUP法的应用最早在乳用种公牛育种值估计上推广准确地排列出公畜间和母畜间的优劣名次大大加快了奶牛育种改良的进度BLUP法的应用最早在乳用种公牛育种值估计上推广66十年美国荷斯坦牛牛群规模十年美国荷斯坦牛牛群规模:不断减少不断减少BLUP法的应用十年美国荷斯坦牛牛群规模:不断减少BLUP法的应用67十年美国荷斯坦牛平均产奶量:不断增加十年美国荷斯坦牛平均产奶量:不断增加BLUP法的应用十年美国荷斯坦牛平均产奶量:不断增加BLUP法的应用68在肉牛、猪、绵羊等家畜育种选种也广为应用肉牛:美国、加拿大猪:国内已开展猪的联合育种绵羊:利用BLUP法估计个体育种值,提高羊毛产量和质量BLUP法的应用在肉牛、猪、绵羊等家畜育种选种也广为应用BLUP法的应用69BLUP法的缺点:受计算条件的限制n对一些跨群(场)的遗传评定,方程组个数可达几万至几十万,用手工计算是根本不可能的近年来,世界各国育种学家在BLUP法的计算问题上做了大量的工作,已开发出相应的电脑软件wPEST wNETPIGwBLUP育种值估计软件BLUP法的缺点:受计算条件的限制BLUP育种值估计软件70
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!