研究生专题关联分析ppt课件

上传人:hloru****lorv6 文档编号:243125870 上传时间:2024-09-16 格式:PPTX 页数:74 大小:10MB
返回 下载 相关 举报
研究生专题关联分析ppt课件_第1页
第1页 / 共74页
研究生专题关联分析ppt课件_第2页
第2页 / 共74页
研究生专题关联分析ppt课件_第3页
第3页 / 共74页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2021/2/5,#,2024/9/16,1,一、利用遗传连锁图进行,QTL,定位,一,.,数量性状的分析方法,二、用关联分析法进行,QTL,定位,连锁分析法,,即根据减数分裂时染色体发生交换和重组的原理,通过研究遗传标记在家系中与目标性状连锁与否及连锁的程度,确定标记与目标基因的遗传距离。,关联分析法以,连锁不平衡,为基础,鉴定某一群体内性状与遗传标记或候选基因间的关系。,2024/9/16,2,以目标性状存在较大差异的两个亲本创建,F2,、,RIL,、,DH,等分离群体,田间种植分离群体,考察目标性状,并构建分子标记连锁图,利用适当的,QTL,分析软件对控制目标性状的基因进行全基因组,QTL,扫描。,利用遗传连锁图进行,QTL,定位,2024/9/16,3,用遗传分析法进行,QTL,定位的缺点,构建分离群体时,由于杂交和自交次数的限制,发生的重组次数有限,,QTL,作图的精度一般在,10-30cM,。,如果控制某性状的位点在两个亲本中存在相同的等位基因,在分离群体中该位点控制的性状没有差异的,此时常规,QTL,分析的方法不能鉴定出该,QTL,。,2024/9/16,4,关联分析是一种以,连锁不平衡,为基础,鉴定某一群体内目标性状与遗传标记或候选基因关系的分析方法。又称连锁不平衡作图,(linkage disequilibrium mapping),或关联作图,(association mapping),,是传统,QTL,分析方法的一种替代方法。,随着大量,SNP,标记的开发以及生物信息学的迅猛发展,用关联分析方发掘植物数量性状基因已成为植物基因组学研究的热点之一。,关联分析法定位,QTL,2024/9/16,5,Association Tests,Evaluate whether nucleotide polymorphisms associate with phenotype,Natural populations,Exploit extensive recombination,1.3m,1.5m,1.4m,1.8m,2.0m,2.0m,T,A,G,A,A,C,G,G,A,A,C,G,T,A,A,A,A,T,C,G,T,G,T,A,G,T,G,G,A,G,2024/9/16,6,一般以现有的自然群体为材料(如地方品种、育成品种、种质资源等),无需构建专门的作图群体,花费的时间少。,特别适合于多年生木本植物如果树、林木等异花授粉植物。,可以同时检测同一座位的多个等位基因,便于发掘优良的等位基因。,定位的精度高,可达到单基因的水平。,关联分析的优点,2024/9/16,7,连锁,(linkage),:,当同一染色体上的某些位点由于相距很近,在减数分裂过程中这些位点之间发生重组的几率较小,而共同从亲代传递到子代的现象。,连锁不平衡(,LD,):,就是同一染色体上不同位点上等位基因的非随机组合,(non-random association),。,单倍型:,指一条染色体上紧密连锁的分子标记位点的等位基因倾向以一个单元传递给后代。,1,、 连锁不平衡的定义,二 关联分析的原理,2024/9/16,8,人类,HLA,基因的遗传:人体细胞为二倍体型,两个单倍型分别来自父亲和母亲,共同组成个体的基因型(,genotype,)。,HLA,是人类白细胞抗原(,Human Leucocyte Antigen,),由于一条染色体上,HLA,各位点的距离非常近,很少发生同源染色体之间的交换,因此后代的,HLA,以单倍型为单位将遗传信息传给子代。,父亲,母亲,后代,很少出现的重组类型,单倍型,品种,1,品种,2,品种,5,品种,3,品种,4,品种,6,品种,7,品种,10,品种,8,品种,9,2024/9/16,9,2024/9/16,10,2.,如何判断位点之间存在连锁不平衡,若连锁的两个基因座位上的等位基因分别为,A,、,a,和,B,、,b,它们频率分别为,(A),、,(a),、,(B),和,(b),;,组成的单倍型有,AB,、,Ab,、,aB,和,ab,这些单倍型的频率分别为,(AB),、,(Ab),、,(aB),和,(ab),。,若,(AB),(A),(B),,则表明,A,、,B,位点间存在,LD,。即当位于某一座位的特定等位基因与同一条染色体另一座位的某一等位基因同时出现的几率大于群体中因两个等位基因自由组合而同时出现的几率时,表明这两个座位间存在,LD,。,A,B,A,b,a,B,a,b,40,个品种,45,个品种,3,个品种,2,个品种,(A)=0.48,(a)=0.52,(B)=0.47,(b)=0.53,(AB)=0.44,(A),(B)=0.226,(AB),(A),(B),,,位点,A,、,B,之间存在连锁不平衡,2024/9/16,11,A,B,A,b,a,B,a,b,20,个品种,22,个品种,18,个品种,22,个品种,(A)=0.44,(a)=0.56,(B)=0.54,(b)=0.46,(AB)=0.243,(A),(B)=0.238,(AB),(A),(B),,,位点,A,、,B,之间不存在连锁不平衡,2024/9/16,12,2024/9/16,13,3.,连锁不平衡度量方法,D,(difference),表示某一单倍型的实际频率与期望频率的差值。,当,D,= 0,时,两基因座位处于,连锁平衡,状态;,当,D,0,时,两基因座位处于,连锁不平衡,状态;,当,D,= 1,时,两基因座位处于,完全连锁不平衡,状态。,通常用,D,来判断两个位点间是否存在连锁不平衡,五 影响关联分析的因素及解决策略,而优良玉米自交系则达 100kb。,人类基因组进行全基因组的LD分析大约需要70 000个标记,,Identification of More Favorable Alleles,D1=D0(1-);,交配体系是影响LD 的最重要因素之一:,5 basic steps required for association studies:,不同玉米种质资源的LD 衰减距离,位点上只存在两个等位基因时,LD显著性可以用2 2列联表进行2测验,P5% 表明两位点的等位基因不是自由组合的,存在关联。,如果两个等位基因频率不同的群体混合,就会产生LD。,也可以分两步走:即首先利用LD衰减慢的骨干亲本进行全基因组扫描以确定候选基因区域, 然后再利用地方品种和野生种质进行高分辨率的LD精细作图以发掘候选基因,并进一步确定基因内关键多态性位点。,Domestication Gene,亚群的混合使整个群体的LD 强度增强,可能导致不连锁的基因多态性位点与性状的关联,从而得出假阳性结果。,A total of 517 landraces were selected and comprehensively phenotyped,候选基因关联分析虽然获得的信息量较少,但它可以减少基因型检测的数量,更重要的是它可以避免检测覆盖全基因组的位点时所涉及到的统计问题。,优良玉米自交系只需要50 000个标记。,定位的精度高,可达到单基因的水平。,如果目标群体LD衰减很慢,即在很长的物理距离内存在LD, 那么此群体适宜采用基于全基因组扫描的策略;,25,经过10代后,D10=0.,有些作物中,前期的研究已经建立核心种质,并获得了相应的遗传和表型资料,可直接用于关联分析。,Nucleotide variation across the O.,2024/9/16,14,3.1,连锁不平衡度量,也可以用,r,2,度量,LD,。,对于只有两个等位基因的,标记,如 SNP 和 AFLP, 通常用,D,和,r,2,来估计两个座位之间的 LD 水平,,二者都是以,D,为基础的。,连锁不平衡系数,D,2024/9/16,15,r,2,和,D,取值范围:,0(,连锁平衡,)1(,连锁不平衡,),。,D,和,r,2,反映了,LD,的不同方面,在不同条件下表现不同。,R,2,反映了重组史和突变史,而,D,仅反映重组史。,D,准确地估测重组差异,但样本较小时发现,4,种等位基因低频率组合的可能性大大减小,因此,D,不适宜小样本研究中的应用。,r,2,可以提供标记是否能与,QTL,相关的信息,因此,LD,作图中,通常采用,r,2,来表示群体的,LD,水平,。,2024/9/16,16,越大,,LD,衰减越快。不连锁的位点之间,LD,每代衰减,50,。,如果两位点紧密连锁,经过很多世代随机交配后,,D,t,D,0,e,-,n,LD,随自由交配世代增加而衰减,群体内随机交配过程中,重组导致配子和单倍型频率趋向平衡值。在没有突变、选择和其它随机因素影响,在连续世代间连锁不平衡系数的关系,:,D,1,=D,0,(1-,);,D,2,=D,1,(1-,)=,D,0,(1-,),2,;, D,n,=,D,0,(1-,),n,公式,D,n,=,D,0,(1-,),n,就是关联分析的基础理论,是两位点间的重组值;,n,表示随机交配的世代数目;,D,0,是起始代的连锁不平衡系数,.,LD,随自由交配世代增加而衰减,群体内随机交配过程中,,重组导致配子和单倍型频率趋向平衡值,。,是两位点间的重组值;,n,表示随机交配的世代数目;,D,0,是起始代的连锁不平衡系数,.,越大,,LD,衰减越快。不连锁的位点之间,LD,每代衰减,50,。,在没有突变、选择和其它随机因素影响,在连续世代间连锁不平衡系数的关系,:,D,1,=D,0,(1-,);,D,2,=D,1,(1-,)=,D,0,(1-,),2,;, D,n,=,D,0,(1-,),n,公式,D,n,=,D,0,(1-,),n,就是关联分析的基础理论,例如,在最初时配子,AB,和,ab,的概率都为,0.5,,,D,0,=1,,处于完全连锁不平衡状态。,如果,=0.01,,,经过,10,代后,,D,10,=0.2261,如果,=0.1,,,经过,10,代后,,D,10,=0.0872,如果,=0.25,,,经过,10,代后,,D,10,=0.0141,如果,=0.5,,,经过,10,代后,,D,10,=0.0002,当,n,趋向无穷时,,D,n,趋向,0,,但是,Dn,变化速度与,有很大关系。,当,很小时,,D,n,趋近,0,的速度很慢;,当接近,0.5,时,,D,n,收敛趋近的速度很快。,LD,衰减与重组率的关系,2024/9/16,20,4. LD,显著性的统计检验,位点上只存在两个等位基因时,,LD,显著性可以用,2,2,列联表进行,2,测验,,,P,5%,表明两位点的等位基因不是自由组合的,存在关联。,也可以用,F,测验,存在多个等位基因时,,LD,的统计显著性,(P-value),用多因子置换分析计算(,multifactorial permutation analysis,),(Weir, 1996).,必须注意:,两个不连锁的位点间也可能存在,LD,,这种情况可能是由群体结构导致的。,进行关联分析前,必须先进行群体结构分析。,2024/9/16,21,5,连锁不平衡的表示方法,描述,LD,在染色体上的分布有两种表示方法:,LD,衰减散点图:,可以观测,LD,随遗传或物理距离的下降速率。,LD,配对检测的矩阵图:,可以直接观测同一染色体的基因座位或基因的多态性位点之间,LD,的线性排列。,描述,LD,在染色体上的衰减距离一般为,D,=0.5,或,r,2,=0.1,时在染色体上的遗传距离。,2024/9/16,22,2024/9/16,23,2024/9/16,24,LD,是由,突变产生,的多态性形成的,因重组的发生而被打破。由此可见,突变和重组是影响,LD,的重要因素。,其他生物因素和历史因素,例如,物种交配体系,、,染色体位置,、,群体大小,、基因或染色体片段所受的,选择强度,、,遗传漂变,等也影响,LD,的程度和分布。,6. LD,的衰减及影响,LD,的因素,2024/9/16,25,交配体系是影响,LD,的最重要因素之一:,自交物种每次减数分裂时重组率很高,,但由于自交趋向纯合,,这样有效的重组率就会很低,最终导致,自交物种的,LD,衰减距离远远大于异交物种,。拟南芥、水稻和大麦是自交物种, LD,衰减都很慢,异花授粉植物,如玉米,其,LD,衰减得较快。,无性繁殖物种,如甘蔗,它们的,LD,衰减更慢。,2024/9/16,26,2024/9/16,27,异花授粉植物的不同群体,LD,衰减也存在很大差异;,玉米农家种为,1 kb,具有广泛变异的玉米自交系大约为,1.5 kb,而优良玉米自交系则达,100kb,。,不同玉米种质资源的,LD,衰减距离,ae1和sh1与直链淀粉含量关联,其他生物因素和历史因素,例如物种交配体系、染色体位置、群体大小、基因或染色体片段所受的选择强度、遗传漂变等也影响LD 的程度和分布。,又称连锁不平衡作图(linkage disequilibrium mapping)或关联作图(association mapping),是传统QTL分析方法的一种替代方法。,Identification of More Favorable Alleles,构建分离群体时,由于杂交和自交次数的限制,发生的重组次数有限,QTL作图的精度一般在10-30cM。,进行关联分析前,必须先进行群体结构分析。,Identification of More Favorable Alleles,关联分析法以连锁不平衡为基础,鉴定某一群体内性状与遗传标记或候选基因间的关系。,研究对象:包括7种常见病:躁郁症、冠状动脉粥样硬化、 小肠克罗恩氏病、类风湿关节炎、I型糖尿病、II型糖尿病和高血压,如果两个等位基因频率不同的群体混合,就会产生LD。,r2 和 D 取值范围:0(连锁平衡)1(连锁不平衡)。,Plant Breeding,5,经过10代后,D10=0.,也可以分两步走:即首先利用LD衰减慢的骨干亲本进行全基因组扫描以确定候选基因区域, 然后再利用地方品种和野生种质进行高分辨率的LD精细作图以发掘候选基因,并进一步确定基因内关键多态性位点。,1、 连锁不平衡的定义,Domestication Gene,候选基因法:基于序列水平,通过统计分析在基因水平上将那些对目标性状有正向贡献的等位基因从种质资源中挖掘出来,一般涉及候选基因的功能预测。,n 表示随机交配的世代数目;,ae1和sh2与糊化温度显著关联,三 关联分析的基本方法,大多数作物在顺化过程中经历了至少一次瓶颈。,2024/9/16,28,id1,、,tb1,、,sh1,、,d3,等四个基因在来自全球玉米自交系群体中的,LD,衰减距离大约为,1.5 kb ,同一群体中的,d8,和,su1,两个基因的,LD,衰减距离较大,尤其是,su1,基因在,10 kb,内几乎不衰减,这可能是在玉米的驯化过程中,近期对,su1,基因进行了人工选择。,玉米八氢番茄红素合成酶基因,Y1,的,LD,衰减距离为,2 kb ,而其假基因,PSY2,在相同玉米群体中的,LD,衰减距离却只有,250 bp,。,不同基因的,LD,衰减距离也不同。,2024/9/16,29,不同玉米基因,LD,衰减距离不同,r,2,2024/9/16,30,B.,瓶颈效应、奠基者效应和遗传漂变增加,LD,瓶颈效应,使群体大小极端减少,导致变异减少,,LD,增加,.,大多数作物在顺化过程中经历了至少一次瓶颈。育种家的选择导致瓶颈效应,如从很少的几个亲本材料中引入一个新抗病基因或农艺性状。,奠基者效应是一种特例,当一个物种在一个新环境生存下来,最开始的奠基者是非常小的一个群体,仅仅是几个种子或几个家庭,.,遗传漂变,会增加,LD,。,2024/9/16,31,The Bottom Line for Diversity,Teosintes,Maize,Landraces,Maize,Inbred Lines,Unselected Gene,Domestication Gene,Improvement Gene,Plant Breeding,Domestication,In which category do the,genes responsible for YOUR trait,belong?,2 - 4%,(1200),of maize genes have undergone selection,Selection Screens,Very low genetic diversity,Genes that contribute to agronomic traits have been targets of selection.,2024/9/16,32,C. Migration and population admixture,如果两个等位基因频率不同的群体混合,就会产生,LD,。,群体混合和迁移也会产生,LD.,通常,迁移和混合产生群体结构,进行,LD,分析出现假关联问题。,2024/9/16,33,D. Selection,当种群受到,平衡选择,( balancing selection) 的作用时, 群体中会存在两,个,或几,个,频率较高的等位基因,。,当某,个,等位基因受到强烈的,正选择作用,(positive selection) 时, 其附近与之紧密连锁的,位点,上的等位基因,频率也随着增加,,这样的现象被称为,搭载效应,(hitchhiking)或,选择扫荡,(selective sweep ),。,2024/9/16,34,2024/9/16,35,而优良玉米自交系则达 100kb。,有些作物中,前期的研究已经建立核心种质,并获得了相应的遗传和表型资料,可直接用于关联分析。,Inbred Lines,躁郁症检测到1个易发病主效位点,其他生物因素和历史因素,例如物种交配体系、染色体位置、群体大小、基因或染色体片段所受的选择强度、遗传漂变等也影响LD 的程度和分布。,公式Dn=D0(1-)n 就是关联分析的基础理论,四 关联分析的基本步骤,通常,迁移和混合产生群体结构,进行LD分析出现假关联问题。,而优良玉米自交系则达 100kb。,必须要有高通量、低成本的SNP标记检测技术:,例如,在最初时配子AB和ab的概率都为0.,利用遗传连锁图进行QTL定位,利用遗传连锁图进行QTL定位,当很小时,Dn趋近0的速度很慢;,ae1和sh1与直链淀粉含量关联,1,经过10代后,D10=0.,当很小时,Dn趋近0的速度很慢;,LD显著性的统计检验,根据连锁分析的结果,选择效应值比较大的位点,利用更多的标记进行LD 分析,对目标位点进行精细定位,然后根据已知基因组的信息选择适当的候选基因进行关联分析。,利用适当的QTL分析软件对控制目标性状的基因进行全基因组QTL扫描。,Proportion of various LD decay rate in the genome,2024/9/16,37,Copyright 2007 by the Genetics Society of America,Olsen, K. M. et al. Genetics 2006;173:975-983,Nucleotide variation across the O. sativa Wx genomic region on chromosome 6,2024/9/16,38,新产生的突变与其它位点之间存在,LD: the new mutation only occurs on a single haplotype.,在随后的世代,重组产生新的单倍型,引起,LD,衰减;,紧密连锁的标记之间,LD,衰减需要很多世代,.,在群体中,一个突变要经过很多交配世代后才能达到我们能检测的等位基因频率,所以我们通常观察到的多态性都是古老的变异,.,E. Mutation,2024/9/16,39,关联分析有两种方法:,全基因组分析法,:基于标记水平,通过对引起表型变异的突变位点进行全基因组扫描来实现,一般不涉及候选基因的预测。,候选基因法:,基于序列水平,通过统计分析在基因水平上将那些对目标性状有正向贡献的等位基因从种质资源中挖掘出来,一般涉及候选基因的功能预测。,三 关联分析的基本方法,两种方法如何选择?,如果目标群体,LD,衰减很慢,,即在很长的物理距离内存在,LD,那么此群体适宜采用基于全基因组扫描的策略,;,相反,如果目标群体的,LD,衰减很快,,即在很短的物理距离内迅速衰退,则此群体适宜采用基于候选基因的高分辨率,LD,作图策略。,已完成全基因组测序,的物种适合采用全基因组关联分析。一般可以用,SNP,芯片或全基因组重测序方法进行高通量,SNP,基因型分析;没有完成基因组测序的物种,可以采用候选基因关联分析方法。,也可以,分两步走,:即首先利用,LD,衰减慢的骨干亲本进行全基因组扫描以确定候选基因区域,然后再利用地方品种和野生种质进行高分辨率的,LD,精细作图以发掘候选基因,并进一步确定基因内关键多态性位点。,2024/9/16,41,候选基因的选择,候选基因的选择需要利用多学科如突变体分析、生化途径分析、病理学、基因表达谱和比较基因组等信息,根据这些信息列出一个候选基因清单。,或者在以前定位的,QTL,区段的基因作候选基因,每个候选基因的序列必须是已知的,可用于设计引物。,目标性状:玉米籽粒成分和淀粉特性,考察的性状:蛋白、油分和淀粉含量、直链淀粉含量、淀粉胶稠度、糊化温度,候选基因:,amylose extender,1(,ae1), brittle endosperm2,(,bt2,),shrunken1,(,sh1,),sh2,sugary1,waxy1,结果:,bt2, sh1,和,sh2,与籽粒成分如蛋白、油分和淀粉含量显著关联,ae1,和,sh2,与糊化温度显著关联,ae1,和,sh1,与直链淀粉含量关联,全基因组关联分析,必须要有高通量、低成本的,SNP,标记检测技术:,SNP,芯片,Next-generation sequencing,dHPLC,Re-sequencing,(,traditional and novel sequencing techniques,),SNaPshot,SNplex,研究对象:包括,7,种常见病:躁郁症、冠状动脉粥样硬化、 小肠克罗恩氏病、类风湿关节炎、,I,型糖尿病、,II,型糖尿病和高血压,SNP,检测:,Affymetrix GeneChip 500K Mapping Array Set,群体:每种病人,2000,人,对照:正常人,3000,人,分析方法:病例,-,对照比较法,结果(显著度,P 5,10,-7,),躁郁症检测到,1,个易发病主效位点,冠状动脉粥样硬化检测到,1,个易发病主效位点,小肠克罗恩氏病检测到,9,个易发病主效位点,类风湿关节炎检测到,3,个易发病主效位点,I,型糖尿病检测到,7,个易发病主效位点,II,型糖尿病检测到,3,个易发病主效位点,高血压没有检测到效应特别大的位点,所有这些位点都是以前的研究中报道的,证明全基因组关联分析定位复杂数量性状是可行的,躁郁症,冠状动脉粥样硬化,1,个,小肠克罗恩氏病,9,个,高血压,0,个,类风湿关节炎,3,个,I,型糖尿病,7,个,II,型糖尿病,3,个,5,D0=1,处于完全连锁不平衡状态。,LD随自由交配世代增加而衰减,LD的衰减及影响LD的因素,在没有突变、选择和其它随机因素影响,在连续世代间连锁不平衡系数的关系:,群体:每种病人2000人,Genes that contribute to agronomic traits have been targets of selection.,用遗传分析法进行QTL定位的缺点,也可以分两步走:即首先利用LD衰减慢的骨干亲本进行全基因组扫描以确定候选基因区域, 然后再利用地方品种和野生种质进行高分辨率的LD精细作图以发掘候选基因,并进一步确定基因内关键多态性位点。,I型糖尿病检测到7个易发病主效位点,D0 是起始代的连锁不平衡系数.,gelatinization temperature,优良玉米自交系只需要50 000个标记。,n 表示随机交配的世代数目;,构建分离群体时,由于杂交和自交次数的限制,发生的重组次数有限,QTL作图的精度一般在10-30cM。,所有这些位点都是以前的研究中报道的,证明全基因组关联分析定位复杂数量性状是可行的,D2=D1(1-)= D0(1-)2;,5 basic steps required for association studies:,ae1和sh2与糊化温度显著关联,Choice of target trait(s),在没有突变、选择和其它随机因素影响,在连续世代间连锁不平衡系数的关系:,小肠克罗恩氏病检测到9个易发病主效位点,2024/9/16,47,候选基因关联分析虽然获得的信息量较少,但它可以减少基因型检测的数量,更重要的是它可以避免检测覆盖全基因组的位点时所涉及到的统计问题。可能遗漏部分,QTL,。,全基因组关联分析信息量大,可以检测到所有的,QTL,。,全基因组与候选基因关联分析比较,Genome-wide association studies of 14 agronomic traits in rice landraces,A total of,517 landraces,were selected and comprehensively phenotyped,All sequences used for SNP calling comprised,508-fold coverage,of the rice genome.,A total of,3,625,200 nonredundant SNPs,were identified, resulting in an average of,9.32 SNPs per kb,9/16/2024,LD decay rate across the genome,indica,japinica,9/16/2024,Proportion of various LD decay rate in the genome,9/16/2024,Genome wide association analysis of heading date,Regions of the genome showing association signals around known genes controlling,heading date,Regions of the genome showing strong association signals near previously identified genes,gelatinization temperature,Grain length,Amylose content,2024/9/16,54,四 关联分析的基本步骤,5 basic steps,required for association studies:,germplasm choice;,estimation of population structure;,trait evaluation;,Genotyping of the population,statistical analysis.,2024/9/16,55,2024/9/16,56,种质资源选择是关联分析成功的关键。种质资源应包括尽可能多的表型变异,代表一个作物的育种资源谱。,根据遗传和表型调查数据鉴定出一套遗传多样性丰富的种质资源,使其包括尽可能多的等位基因。,有些作物中,前期的研究已经建立核心种质,并获得了相应的遗传和表型资料,可直接用于关联分析。,自然存在的异花授粉树木是关联分析最好的群体。,A. Choice of germplasm,2024/9/16,57,B. Estimation of population structure,群体结构的存在可导致出现假阳性,必须通过统计分析排除,.,用,大量独立的分子标记,(通常为,50-150,个,根据基因组大小确定)对选用群体群体结构进行分析,判断是否存在群体结构,.,如果存在群体结构,需要对群体数据进行校正。,Genome-wide association studies of 14 agronomic traits in rice landraces,根据连锁分析的结果,选择效应值比较大的位点,利用更多的标记进行LD 分析,对目标位点进行精细定位,然后根据已知基因组的信息选择适当的候选基因进行关联分析。,候选基因法:基于序列水平,通过统计分析在基因水平上将那些对目标性状有正向贡献的等位基因从种质资源中挖掘出来,一般涉及候选基因的功能预测。,Choice of candidate genes,D2=D1(1-)= D0(1-)2;,结果(显著度P 510-7),根据连锁分析的结果,选择效应值比较大的位点,利用更多的标记进行LD 分析,对目标位点进行精细定位,然后根据已知基因组的信息选择适当的候选基因进行关联分析。,五 影响关联分析的因素及解决策略,也可以分两步走:即首先利用LD衰减慢的骨干亲本进行全基因组扫描以确定候选基因区域, 然后再利用地方品种和野生种质进行高分辨率的LD精细作图以发掘候选基因,并进一步确定基因内关键多态性位点。,D0 是起始代的连锁不平衡系数.,Domestication Gene,异花授粉植物如玉米,其LD 衰减得较快。,id1、tb1、 sh1、 d3 等四个基因在来自全球玉米自交系群体中的LD衰减距离大约为1.,构建分离群体时,由于杂交和自交次数的限制,发生的重组次数有限,QTL作图的精度一般在10-30cM。,Association Analysis,假关联:位于不同染色体上的标记与性状存在关联。,n 表示随机交配的世代数目;,当D = 1 时,两基因座位处于完全连锁不平衡状态。,Unselected Gene,5 basic steps required for association studies:,也可以分两步走:即首先利用LD衰减慢的骨干亲本进行全基因组扫描以确定候选基因区域, 然后再利用地方品种和野生种质进行高分辨率的LD精细作图以发掘候选基因,并进一步确定基因内关键多态性位点。,2024/9/16,58,C. Choice of target trait(s),选择的性状必须是能准确测量、可遗传的,.,必须设置多年或多点重复、随机区组设计,调查,10-15,个单株。,2024/9/16,59,Forward Genetics,Trait,Positionally cloned gene,Reverse Genetics,Trait,Candidate gene,QTL,Candidate Polymorpism,D. Choice of candidate genes,2024/9/16,60,Association Analysis,Identification of More Favorable Alleles,Enhanced Marker Assisted Breeding,Choice of candidate genes,2024/9/16,61,影响关联分析的因素,LD,是关联分析的基础和前提,决定关联分析的精度和所选用标记的数量、密度,以及试验方案有关。,在全基因组扫描时,需要大量分子标记,据估计:,人类基因组进行全基因组的,LD,分析大约需要,70 000,个标记,,拟南芥需要,6 000,个标记,,玉米农家种则需要,750 000,个标记,,优良玉米自交系只需要,50 000,个标记。,五 影响关联分析的因素及解决策略,位点A、B之间不存在连锁不平衡,三 关联分析的基本方法,5 basic steps required for association studies:,关联分析是一种以连锁不平衡为基础,鉴定某一群体内目标性状与遗传标记或候选基因关系的分析方法。,选择的性状必须是能准确测量、可遗传的.,玉米农家种则需要750 000个标记,,而优良玉米自交系则达 100kb。,Plant Breeding,构建分离群体时,由于杂交和自交次数的限制,发生的重组次数有限,QTL作图的精度一般在10-30cM。,D0 是起始代的连锁不平衡系数.,Copyright 2007 by the Genetics Society of America,位点上只存在两个等位基因时,LD显著性可以用2 2列联表进行2测验,P5% 表明两位点的等位基因不是自由组合的,存在关联。,拟南芥、水稻和大麦是自交物种, LD 衰减都很慢,Domestication,D0 是起始代的连锁不平衡系数.,位点A、B之间存在连锁不平衡,(AB) (A) (B),,5,D0=1,处于完全连锁不平衡状态。,研究对象:包括7种常见病:躁郁症、冠状动脉粥样硬化、 小肠克罗恩氏病、类风湿关节炎、I型糖尿病、II型糖尿病和高血压,例如,在最初时配子AB和ab的概率都为0.,人类基因组进行全基因组的LD分析大约需要70 000个标记,,2024/9/16,62,群体结构,指的是一个群体内存在亚群的情况。亚群的混合使整个群体的,LD,强度增强,可能导致不连锁的基因多态性位点与性状的关联,从而得出假阳性结果。,假关联:位于不同染色体上的标记与性状存在关联。,五 影响关联分析的因素及解决策略,2024/9/16,63,解决策略,选择,LD,程度高的群体进行全基因组关联分析,可减少使用的标记数量。,连锁分析和关联分析相结合对特定位点进行研究。根据连锁分析的结果,选择效应值比较大的位点,利用更多的标记进行,LD,分析,对目标位点进行精细定位,然后根据已知基因组的信息选择适当的候选基因进行关联分析。,用实验设计和多种统计方法消除群体结构引起的假阳性。,2024/9/16,64,六 关联分析相关的软件,2024/9/16,65,2024/9/16,66,2024/9/16,67,一般以现有的自然群体为材料(如地方品种、育成品种、种质资源等),无需构建专门的作图群体,花费的时间少。,特别适合于多年生木本植物如果树、林木等异花授粉植物。,可以同时检测同一座位的多个等位基因,便于发掘优良的等位基因。,定位的精度高,可达到单基因的水平。,关联分析的优点,2024/9/16,68,越大,,LD,衰减越快。不连锁的位点之间,LD,每代衰减,50,。,如果两位点紧密连锁,经过很多世代随机交配后,,D,t,D,0,e,-,n,LD,随自由交配世代增加而衰减,群体内随机交配过程中,重组导致配子和单倍型频率趋向平衡值。在没有突变、选择和其它随机因素影响,在连续世代间连锁不平衡系数的关系,:,D,1,=D,0,(1-,);,D,2,=D,1,(1-,)=,D,0,(1-,),2,;, D,n,=,D,0,(1-,),n,公式,D,n,=,D,0,(1-,),n,就是关联分析的基础理论,是两位点间的重组值;,n,表示随机交配的世代数目;,D,0,是起始代的连锁不平衡系数,.,2024/9/16,69,5,连锁不平衡的表示方法,描述,LD,在染色体上的分布有两种表示方法:,LD,衰减散点图:,可以观测,LD,随遗传或物理距离的下降速率。,LD,配对检测的矩阵图:,可以直接观测同一染色体的基因座位或基因的多态性位点之间,LD,的线性排列。,描述,LD,在染色体上的衰减距离一般为,D,=0.5,或,r,2,=0.1,时在染色体上的遗传距离。,位点上只存在两个等位基因时,LD显著性可以用2 2列联表进行2测验,P5% 表明两位点的等位基因不是自由组合的,存在关联。,如果控制某性状的位点在两个亲本中存在相同的等位基因,在分离群体中该位点控制的性状没有差异的,此时常规QTL分析的方法不能鉴定出该QTL。,D (difference) 表示某一单倍型的实际频率与期望频率的差值。,In which category do the,公式Dn=D0(1-)n 就是关联分析的基础理论,The Bottom Line for Diversity,若连锁的两个基因座位上的等位基因分别为A、a 和B、b,它们频率分别为(A)、 (a)、 (B)和 (b);,位点A、B之间不存在连锁不平衡,当D 0 时,两基因座位处于连锁不平衡状态;,LD显著性的统计检验,利用遗传连锁图进行QTL定位,三 关联分析的基本方法,构建分离群体时,由于杂交和自交次数的限制,发生的重组次数有限,QTL作图的精度一般在10-30cM。,5 连锁不平衡的表示方法,类风湿关节炎检测到3个易发病主效位点,描述LD 在染色体上的分布有两种表示方法:,n 表示随机交配的世代数目;,r2 和 D 取值范围:0(连锁平衡)1(连锁不平衡)。,2024/9/16,70,The Bottom Line for Diversity,Teosintes,Maize,Landraces,Maize,Inbred Lines,Unselected Gene,Domestication Gene,Improvement Gene,Plant Breeding,Domestication,In which category do the,genes responsible for YOUR trait,belong?,2 - 4%,(1200),of maize genes have undergone selection,Selection Screens,Very low genetic diversity,Genes that contribute to agronomic traits have been targets of selection.,目标性状:玉米籽粒成分和淀粉特性,考察的性状:蛋白、油分和淀粉含量、直链淀粉含量、淀粉胶稠度、糊化温度,候选基因:,amylose extender,1(,ae1), brittle endosperm2,(,bt2,),shrunken1,(,sh1,),sh2,sugary1,waxy1,结果:,bt2, sh1,和,sh2,与籽粒成分如蛋白、油分和淀粉含量显著关联,ae1,和,sh2,与糊化温度显著关联,ae1,和,sh1,与直链淀粉含量关联,2024/9/16,72,C. Choice of target trait(s),选择的性状必须是能准确测量、可遗传的,.,必须设置多年或多点重复、随机区组设计,调查,10-15,个单株。,2024/9/16,73,Association Analysis,Identification of More Favorable Alleles,Enhanced Marker Assisted Breeding,Choice of candidate genes,2024/9/16,74,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!