比较基因组学原理及应用-课件

上传人:仙*** 文档编号:241521264 上传时间:2024-07-01 格式:PPT 页数:90 大小:3.95MB
返回 下载 相关 举报
比较基因组学原理及应用-课件_第1页
第1页 / 共90页
比较基因组学原理及应用-课件_第2页
第2页 / 共90页
比较基因组学原理及应用-课件_第3页
第3页 / 共90页
点击查看更多>>
资源描述
比较基因组学比较基因组学原理及应用原理及应用成员:韩柳 阎永伟 黄继 马寿光朱琳 姜南 李春丽2020/10/281比较基因组学比较基因组学相关概念相关概念韩柳2020/10/282精品资料3基因组学概念及范畴基因组学概念及范畴基因组基因组(genome)泛泛指指一一个个有有生生命命体体、病病毒毒或或细细胞胞器器的的全全部部遗遗传传物物质质;在在真真核核生生物物,基基因因组组是是指指一一套套染染色色体(单倍体)体(单倍体)DNA。基因组学基因组学(genomics)就是发展和应用就是发展和应用DNA制图、测序新技术以制图、测序新技术以及计算机程序,分析生命体(包括人类)全部基及计算机程序,分析生命体(包括人类)全部基因组结构及功能。因组结构及功能。2020/10/284基因组学概念基因组学概念2020/10/285比较基因组学概念定义:定义:比较基因组学(Comparative Genomics)是基于基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科。研究内容:研究内容:种间的比较基因组学 和 种内的比较基因组学2020/10/2862020/10/287概念工具:工具:1、FASTA 2、BLAST 3、CLUSTAL W基因组分类:基因组分类:1、通过比较确知其功能的。2、在数据库中有相匹配的蛋白,但不知道其功能。3、在现有的数据库中找不到任何相匹配的蛋白质序列的新基因。2020/10/2882020/10/289部分真核、原核生物基因组成成份分析部分真核、原核生物基因组成成份分析2020/10/2810通过基因组数据进行比较基因组学研究通过基因组数据进行比较基因组学研究例子:尿殖道支原体带有已知最小的基因组,可依此确定能自我复制的细胞必需的一套最少的核心基因。流感嗜血杆菌的基因组为1.83MB,尿殖道支原体的基因组只有0.58Mb,二者相差3倍多,那么,基因组是大小影响了基因的数目还是基因的尺度?2020/10/2811流感嗜血杆菌的基因大小平均900bp,尿殖道支原体的基因为1040bp,他们基因大小差不多流感嗜血杆菌中平均1024bp有一个基因,尿殖道支原体平均1235bp有一个基因。结论:结论:基因尺度减小并不引起基因密度的增加和基因本身尺寸的减小。二者的差别在于基因数量上,流感嗜血杆菌基因有1743个ORF,而尿殖道支原体只有470个ORF2020/10/2812比较基因组有助于解决进化距离问题比较基因组有助于解决进化距离问题2020/10/2813 测序技术与测序技术与 比较基因组学比较基因组学阎永伟2020/10/2814 比较基因组学是在基因组图谱和测序的基础上,利用某个基因组研究获得的信息推测其他原核生物、真核生物类群中的基因数目、位置、功能、表达机制和物种进化的学科。该学科的发展及所取得的成果与序列的积累相同步,尤其是人类全基因组序列的分析与比较使比较基因组学成为整个生物学领域最新、最重要、进展最快和影响最大的学科之一。2020/10/28151.已完成的测序已完成的测序比较基因组学从一开始就是人类基因组计划的一部分。人类基因组计划的原始计划是测定人类和一部分模式生物(如细菌,酵母,果蝇,秀丽隐杆线虫,小鼠等)的全基因组序列。2020/10/2816Homo sapiens 2010年全部完成Pan troglodytes Lander et al.2005;Mus musculus Waterston et al.2002;Rattus norvegicus Gibbs et al.2004;Drosophila melanogaster Adams et al.2000;Escherichia coli Blattner et al.1997;Saccharomyces cerevisiae Goffeau et al.1996;Ciona intestinalis Dehal et al.2002,Small et al.2007;Caenorhabditis elegans Stain et al.2003,Stein et al.1998。2020/10/2817HGP完成以后:Gallus gallus 鸡 Blattner et al.2004,Bos taurus 牛 Elsik et al.2009,Canis familiaris 狗 Lindblad-Toh et al.2005,Apis mellifera 蜜蜂 Lindblad-Toh et al.2006,Anthocidaris crassispina 紫海丹 Sodergren et al.2006Macaca mulatta 恒河猴 Gibbs et al.20072020/10/2818 In Entrez Genome,10001000 complete Prokaryotic Genomes are available!测测序序完完成成情情况况统统计计2020/10/28192.2.测序技术概述测序技术概述 绝大多数生物的遗传物质为DNA,然而遗传信息却仅仅由四种碱基A,T,C,G排列组合而成。自从DNA的双螺旋结构被发现以后,能够知道DNA分子上四种碱基的顺序就成为了一个新的热点。于是,继蛋白质和RNA测序之后,又出现了DNA测序。2020/10/2820自1977年出现DNA测序技术至今,第一代测序技术 第二代测序技术 第三代测序技术2020/10/2821(1)测序技术的出现及第一代测序技术 1)测序技术的出现 1975年,Sanger和Coulson发明了“加减法”测定DNA序列;1977年,又引入ddNTP,发明了双脱氧终止法;1977,Maxam和Gilbert发明了化学降解法测定DNA序列。2020/10/2822 Fig1.双脱氧终止法测序2020/10/28232)第一代测序技术 传统的化学降解法、双脱氧链终止法以及在它们的基础上发展来的各种DNA测序技术统称为第一代DNA测序技术。第一代测序技术在分子生物学研究中发挥过重要的作用,如人类基因组计划主要基于第一代DNA测序技术。2020/10/2824 目前基于荧光标记和Sanger的双脱氧链终止法原理的荧光自动测序仪(如ABI 3730XL)仍被广泛地应用。杂交测序技术也是第一代测序技术,但是并非基于以上两种原理。速度快,但是误差大。2020/10/2825Fig.2 ABI 3730XL2020/10/2826(2)第二代测序技术 后基因组时代亦即功能基因组时代的测序技术,显著特征是高通量、低成本。主要包括罗氏454公司的GS FLX测序平台、Illumina公司的Solexa Genome Analyzer测序平台和ABI公司的SOLiD测序平台。2020/10/2827 Fig.3 Roche 454GS FLX 平台2020/10/28282020/10/2829Fig.4IlluminaSolexa平台2020/10/28302020/10/2831Fig.5ABISOLiD平台2020/10/28322020/10/2833参考文献:DNA测序技术的发展历史与最新进展,解增言等;DNA测序技术发展及其展望,孙海汐等。2020/10/2834(3)第三代测序技术以单分子测序为特点;如:BioScience Corporation的HeliScope Single Molecular Sequencer;Pacific Biosciences的Single Molecule RealTime(SMRT)DNA sequencing technology(正在研制);Oxford Nanopore Technologies Ltd的纳米孔单分子测序技术。中科院北京基因组研究所,2013年,第一台国产样机2020/10/28353.3.测序技术与比较基因组学测序技术与比较基因组学4.4.DNA测序已经成为分子生物学研究中一种基本的研究手段与工具,对于这种手段的需要也已经极大地促进了DNA测序技术的进步与发展。5.在此基础上,将会有更多的生物的全基因组序列被测定,那么针对任何一种生物的比较基因组学研究将会变得更加简单。2020/10/2836基因组序列分析的计算方法基因组序列分析的计算方法1.引言2.点阵图3.两序列比对4.多序列比对5.数据库搜索朱琳2020/10/2837引言引言l人类基因组计划(HGP)遗传图、物理图、序列图和转录图l区分两个概念:同源性-共同的祖先相似性-定量特征高度相似很可能是同源序列;相似性很低的序列也可能具有同源序列2020/10/2838点阵图点阵图ACTGTTAGACTTTAGCACTGTTAG|ACT-TTAG2020/10/2839两序列比对两序列比对面临的问题:进化的过程中同源序列可经过多次的插入或缺失,导致它们长度不同,这就给比对带来了麻烦。要解决的问题:最优比对算法-寻找最佳的缺失方式使比对序列的相似度达到整体最大2020/10/2840Needleman-wunsch全局比对算法全局比对算法首先构建具有m行n列的矩阵M,根据残基配对的函数,给每个矩阵单元格赋值,将矩阵初始化。再进行变换操作,规则是将某单元格右下方路径中的最大值叠加到该单元格即M(I,j)=M(I,j)+maxM(i+1,j+1);M(i+1,j+2,jmax)-gappenalty;M(i+2,imax,j+1)-gappenalty使用最简单的打分系统进行比对,残基相同时分值是1,不同时分值为0,空位罚分。此外还有Smith-waterman算法2020/10/2841基因组比对基因组比对只能对序列密切相关或非常相似的基因组比对,序列太长,既有的算法无能为力方法:suffixtree数据结构软件MUMer能找出两个基因组的DNA序列上最大且唯一的匹配区域,然后除去序列中用Smith-waterman最佳局部比对算法对大量插入序列、重复序列、短变异区域进行局部鉴定时插入的空位,完成这两个基因组序列的比对。2020/10/2842多序列比对多序列比对三条或多条序列的同时比对是序列的分析中最常用的技术之一。通过一系列同源序列的全局比对来实现的递进法:基本思想是同源序列与系统发育相关。具体步骤:1、比对所有可能的序列对。2、用相邻连接法使用两两比对的相似度分值构建(tree)。3、这种树用于指导递进的多序列比对。2020/10/2843数据库搜索数据库搜索三大核酸数据库:GenBank、EMBL、DDBJ2020/10/2844数据库搜索使用的最广泛的算法:FASTA算法和BLAST算法。FASTA算法运用一种包括四个连续阶段的启发式方法来检测被查序列与一组序列是相似性。BLAST算法采用非常快的算法来查找数据库中与预查询序列最相似是序列。基本思想是:两个同源序列即使有很大的差异,也有可能共有高分值的相似片段,这使我们可以理解可靠的区分相关和非相关的序列。2020/10/2845蛋白质序列分析蛋白质序列分析对新蛋白质序列进行分析的第一步是用BLAST进行数据库搜索。l如果有明显相似性可以推测其序列的功能l如果没有,可用模式识别方法根据特定的结构域或蛋白质家族的特征进行搜索。-模式数据库已经成为识别新序列的特定功能活性的重要工具。InterPro数据库是最重要的蛋白质模式数据库之一。2020/10/2846此外还有蛋白质信号肽的识别及亚细胞定位的预测预测卷曲螺旋和螺旋-转角-螺旋结构蛋白质折叠的识别与分类等2020/10/2847 种内比较基因组学种内比较基因组学 模式生物模式生物姜南2020/10/2848种内基因组的比较同种群体内基因组存在大量的变异和多态性,正是这种基因组序列的差异构成了不同个体与群体对疾病的易感性和对药物与环境因子不同反应的遗传学基础。2020/10/2849我总结了:凡是能够用来研究同一种群内两个个体基因组的不同的分子手段都属于种内比较基因组学的范畴。主流方法是分子标记技术:RAPD,RFLP,AFLP,基因芯片。回顾分子标记2020/10/2850水产界举例李太武老师等用20条随机引物对皱纹盘鲍、杂色鲍进行RAPD分析,结果均能产生清晰可重复扩增产物,计算出各群体扩增位点的多态性比例分别为43.66%和53.05%,群体平均遗传杂合度分别为0.1557和0.1686,群体间的遗传距离0.2898,表明皱纹盘鲍与杂色鲍的亲缘关系较远。2020/10/2851模式生物基因进化上的保守往性和遗传密码的通用性,从某一生物得到的有关基因性质或功能方面的信息往往也适用于其他生物。个体小,易操作,易培养,繁殖快。病毒,大肠杆菌,酵母,线虫,果蝇,斑马鱼,小鼠,拟南芥2020/10/2852种间比较基因组学研究种间比较基因组学研究马寿光黄继2020/10/2853通过对不同亲缘关系物种的基因组序列进行比较,能够鉴定出编码序列、非编码调控序列及给定物种独有的序列。而基因组范围之内的序列比对,可以了解不同物种在核苷酸组成、同线性关系和基因顺序方面的异同,进而得到基因分析预测与定位、生物系统发生进化关系等方面的信息。2020/10/28541全基因组的比较研究2系统发生的进化关系分析2020/10/2855比较基因组学的基础是相关生物基因组的相似性。两种具有较近共同祖先的生物,它们之间具有种属差别的基因组是由祖先基因组进化而来,两种生物在进化的阶段上越接近,它们的基因组相关性就越高。如果生物之间存在很近的亲缘关系,那么它们的基因组就会表现出同线性(synteny),即基因序列的部分或全部保守。1.全基因组的比较研究2020/10/2856Synteny可以这样假设,人与小鼠或其它哺乳动物有一个共同的祖先,在漫长的进化中,染色体发生断裂,重排,加上基因内部的变化,成为各种不同的物种。但是未发生断裂重排的完整片段内部的基因组织和连锁顺序在不同的物种中保持不变,这就是synteny,是基因组比较作图的基础所在。2020/10/2857在各种不同的物种中,绝大多数的核心生物功能是由相当数量的orthologous蛋白承担,所谓or-thologous蛋白就是一些在不同物种中有共同祖先的蛋白质。在不同的物种中这些蛋白的数量十分相似,它们主要是在生物体中执行中介代谢,DNA,RNA代谢,蛋白折叠,trafficking,和降解的功能。在较为复杂的生物中,随着功能不断地复杂,就会出现许多蛋白以执行其复杂的功能,而维持最基本生命活动的蛋白是保守的。两种物种中蛋白总数上的差别是由承担各自特有任务的蛋白数目的不同而造成的。2020/10/2858可以利用模基因组之间编码顺序上和结构上的同源性,通过已知基因组的作图信息定位另外基因组中的基因,从而揭示基因潜在的功能、阐明物种进化关系及基因组的内在结构。2020/10/2859人类与多个灵长类动物的比较基因组学研究,在阐明灵长类特异基因调节元件和划分多基因的外显子方面显示出了很大的优势。林木可与拟南芥(已经获得了全基因组序列,一些基因的功能已被注释)和毛果杨等功能基因组研究较深入的物种进行比较基因组学研究,这将为林木上相关基因功能的研究提供便利。2020/10/2860生物最本质的特征是进化,比较基因组学同样以进化理论作为理论基石,同时其研究结果又前所未有地丰富和发展了进化理论。当在两种以上的基因组间进行序列比较时,实质上就得到了序列在系统发生树中的进化关系。基因组信息的增多使得在基因组水平上研究分子进化、基因功能成为可能。2.系统发生的进化关系分析2020/10/2861通过对多种生物基因组数据及其垂直进化、水平演化过程进行研究,就可以对与生命至关重要的基因的结构及其调控作用有所了解。但由于生物基因组中约有15145的基因与“横向迁移现象”有关,即基因可以在同时存在的种群间迁移,这样就会导致与进化无关的序列差异。2020/10/2862横向迁移现象对人类基因组的分析发现,有几十个人的基因只与细菌基因相似,而在果蝇、线虫中都不存在。如果以人的这些基因序列来研究进化将会得到荒谬的结论。所以在当前的分子进化研究中必须选择垂直进化的分子作为样本。并且在系统发生分析中需要建立较完整的生物进化模型,以避免基因转移和欠缺合适的多物种共有保守序列的影响。2020/10/2863Z曲线的GC轮廓图方法基因组序列变换为等价的三维空间曲线Z曲线,经过适当的投影和座标旋转后得到Z曲线,后者又称为累积GC轮廓图(CumulativeGCprofile)。定义:在基因组某一碱基处的G+C含量正比于Z曲线在该点切线的斜率。而在某一窗口中的平均G+C含量则正比于此量在该窗口内的定积分。对于任一给定的DNA序列,有唯一的一条Z曲线与之对应;反之,给定一条Z曲线,它所代表的DNA序列可以唯一地导出。因此,Z曲线携带了DNA序列的全部息。对两个基因组或染色体序列的比较,可以通过对它们所对应的Z曲线的比较来进行。2020/10/2864在研究物种间的进化关系时,传统的分子进化研究方法一般选取一个大分子(如16SRNA)的序列为标准,研究其在各个物种同源序列之间的差异,并以此构建进化树。但是一个物种的基因组编码了成千上万个序列,以其中一个序列的差异来代表整个生物体的差异是不全面的。因此,从全基因组的水平来研究生物的进化应该更为合理。利用比较基因组学的方法在基因组水平上构建的进化树将会更加合理的阐述物种之间的进化关系。2020/10/2865物种序列的优化选择:当在比较4080My进化距离的DNA序列时,其编码序列与一些重要的非编码序列将是保守的,如人与鼠。然而至今在这一进化距离内保守的非编码序列中只有少数被鉴定为有特征性的功能元件,其它的仅被认为是临近或200kb附近基因的转录调控元件。在进化距离较远(450My)的序列比较时,将主要揭示保守的编码序列,主要是因为蛋白质要维持其功能,因此对替换更为严谨保守,进化的稍慢一点。所以在建立多序列比较时加入一支稍远的物种序列(450My)将提高保守序列的鉴别能力。比较分析较近的物种序列如:人与himpanzees或与其它的类人猿可以用来鉴定在近期进化史上发生的基因改变和重组等。因此在建立多序列的比较分析中加入一支近距离的物种序列不仅有助于编码和非编码的功能序列的识别,也能揭示那些相关物种特征的基因组信息、2020/10/2866在进行DNA序列比较而鉴定保守序列时,有两种比较分析手段:局部比对和整体比对。局部比对是对序列亚区分析获得最高一致性的计算方法,其基本原理是在两序列排队时采用不同的比对方法,排除了从头到尾的单一匹配方式。例如当两长序列进行匹配时,可能内含的同源基因亚区的排列顺序或基因的走向不同,因此对这种比对采用多种方式进行搜索分析的结果将比较准确,常用的分析工具是PipMarker服务器。整体比对是寻找所要比较的整个基因序列上的最大的同源性分值,它适用于高度分化但组织结构同源的序列比对,整体比对适用于基因序列整体上同源性较高的比较分析,如保守片断(conservedsegments)的比对,可以使用VISTA进行分析。2020/10/2867Smith-Waterman算法时间复杂度O(n2);Sij=maxof0Si-1,j-1+(xi,yj)Si-1,j-d(从左到右)Si,j-1-d(从上到下)本例中:gap:d=12,线性罚分模型。2020/10/2868例5:Smith-Waterman算法进行双序列局部比对两条序列如下:L D S C HG E S L C Kr目标:使用局部优化算法寻找比对的结果目标:使用局部优化算法寻找比对的结果2020/10/2869例5:Smith-Waterman算法进行双序列局部比对两条序列如下:L D S C HG E S L C Kr目标:使用局部优化算法寻找比对的结果目标:使用局部优化算法寻找比对的结果2020/10/2870Smith-Waterman算法GapLDSCHGap000000G0SijE0S0L0C0K0Smith-Waterman算法;算法;Sij=max of Si-1,j-1+(xi,yj)Si-1,j-d(从左到右从左到右)Si,j-1-d(从上到下从上到下)02020/10/2871Smith-WatermanSmith-Waterman算法算法GapLDSCHGap000000G0SijE0S0L0C0K0-12-12-32020/10/2872Smith-Waterman算法GapLDSCHGap000000G000E0S0L0C0K0-12-12-42020/10/2873Smith-Waterman算法GapLDSCHGap000000G000000E002000S002600L040050C001092K000008-12-22020/10/2874局部比对结果:GapLDSCHGap000000G000000E002000S002600L040050C001092K000008L D S C HG E S L C K2020/10/2875中性突变与随机漂移学说的核心就是认为大部分对生物种群的遗传结构与进化有贡献的分子突变在自然选择的意义上都是中性或近中性的,因而自然选择对这些突变并不起到筛选的作用。中性突变产生后是通过一代一代的随机漂移,或者被固定在种群中并占有一定的比例,或者消失。生物种群内的遗传多样性,如蛋白质(酶)以及DNA的多态性,都是通过这类中性或近中性突变的随机漂移而产生的。中性理论并不是说所有突变都是中性的,实际上,相当大的一部分突变是有害的,这一部分突变具体有多少与有关分子本身可容许的变化程度有关。有害的突变产生后,会影响携带这些突变的蛋白质以及基因的正常功能,影响生物的生存与繁殖,因此很快就会被淘汰掉,从而在进化上是没有意义的。另一方面,对生物有利的所谓正突变其实是很少的,从而对种群的遗传结构也没有什么贡献,不能说明分子进化中的多态性现象。自然选择只对那些对种群的遗传结构并不重要的有害突变和正突变起作用,却不能决定对种群的遗传结构起重要作用的中性或近中性突变的命运,中性或近中性突变的命运是由随机因素决定的。因此,又可以把中性理论看作是一种“幸运者生存”的学说。2020/10/28763从模式生物基因组研究中得出一些规律3.1模式生物基因组一般都比较小,但是编码基因的比例较高,重复顺序和非编码顺序较少,是一些“压缩”的基因组3.2模式生物基因组的G+C%比较高同时CpG岛的比例也比较高。Fugurubripes的G+C%时442%(这是脊椎动物种最高的),而人类则是403%。这可能是因为低等生物中编码顺序的比例比较高,另一个原因与模式生物的密码子第三位的碱基选择有关。3.3模式生物的基因组中,内含子和外显子的结构组织比较保守,剪切位点在多种生物中一致。这是Fugurubripes和现有的哺乳动物的基因组顺序比较的结果3.4在几种模式生物都发现了重复(duplication)。同时存在两份或两份以上的顺序一致或十分相似的编码蛋白的DNA顺序,称为冗余。理解重复的真正本质是阐明基因组中基因生物功能和物种进化的前提。3.5生物体的复杂性一般表现在“生物学”的复杂性,与基因组的C值大小及基因数量未必一定呈线性关系。2020/10/2877首先比较基因组学建立的基础是功能元件由于选择的作用其进化的速率稍慢一点,这有背于中性理论;其次在序列的比较中对保守区域的thresholds(lengthandpercentidentity)的选择还没有一套有效的方法,往往两个物种不同区域的thresholds各异2020/10/2878比较基因组学的应用揭示非编码功能序列揭示非编码功能序列发现新基因发现新基因发现功能性发现功能性SNPSNP阐述物种间的进化史阐述物种间的进化史阐明人类疾病过程的分子机制阐明人类疾病过程的分子机制李春丽2020/10/2879比较基因组学与进化比较基因组学与进化 古细菌古细菌-产甲烷球菌产甲烷球菌l与原核生物共同之处:与原核生物共同之处:1 染色体组织与结构:环状基因组、基因的操纵子结构等染色体组织与结构:环状基因组、基因的操纵子结构等 2 能量产生和固氮基因与细菌基因有很高的同源能量产生和固氮基因与细菌基因有很高的同源 3 与细胞分裂有关的蛋白质、与细胞分裂有关的蛋白质、20多个编码无机离子运输蛋多个编码无机离子运输蛋白的白的ORF与细菌基因同源与细菌基因同源 4 调控模式类似于原核生物调控模式类似于原核生物l与真核生物共同之处:与真核生物共同之处:1 细胞遗传信息传递,尤其是转录和翻译系统细胞遗传信息传递,尤其是转录和翻译系统 2 分泌系统分泌系统l说明该细菌与真核生物亲缘关系较近。说明该细菌与真核生物亲缘关系较近。2020/10/2880比较基因组学与进化比较基因组学与进化 比较基因组学提供的结果表明,在进化系统树上,比较基因组学提供的结果表明,在进化系统树上,古细菌与真核生物亲缘关系比原核生物更近。古细菌与真核生物亲缘关系比原核生物更近。自养生物的三个分支,细菌、古细菌和真核自养生物的三个分支,细菌、古细菌和真核生物中,细菌的分化发生较早。生物中,细菌的分化发生较早。2020/10/2881比较基因组学的具体应用方法和策比较基因组学的具体应用方法和策略略序列的比对分析序列的比对分析确定基因组序列的进化关系确定基因组序列的进化关系 基因共线性基因共线性synteny:染色体片段的分析染色体片段的分析物种序列的优化选择物种序列的优化选择对对DNADNA序列的信息注释序列的信息注释2020/10/2882比较基因组学研究举例比较基因组学研究举例原核模式生物比较基因组学原核模式生物比较基因组学酿酒酵母基因组酿酒酵母基因组人类基因组人类基因组2020/10/2883模式生物比较基因组研究特点模式生物比较基因组研究特点l1 1 模式生物基因组一般都比较小模式生物基因组一般都比较小,但编码基因的但编码基因的比例较高比例较高,重复序列和非编码序列较少重复序列和非编码序列较少,是是“压压缩缩”的基因组的基因组。l2 2 模式生物基因组中模式生物基因组中G+C%含量高含量高,同时同时CpG岛岛的比例也比较高。的比例也比较高。l3 3 一些模式生物,特别在人的基因组中发现了重一些模式生物,特别在人的基因组中发现了重复。复。l4 4 各种不同的物种中各种不同的物种中,大多数重要生物学功能是大多数重要生物学功能是由相当数量的同源序列基因蛋白承担由相当数量的同源序列基因蛋白承担。l5 5 同线同线(synteny)连锁的同源基因在不同物种基因连锁的同源基因在不同物种基因组中有相同连锁关系组中有相同连锁关系。2020/10/2884模式生物基因组的研究模式生物基因组的研究l尿殖道支原体是已知最小的基因组尿殖道支原体是已知最小的基因组0.58Mb,由此可能确,由此可能确定能自我复制的细胞必需的一套最少的核心基因。定能自我复制的细胞必需的一套最少的核心基因。l 流感嗜血杆菌的基因组为流感嗜血杆菌的基因组为1.83Mbl 流感嗜血杆菌基因大小平均流感嗜血杆菌基因大小平均900 bp,尿殖道支原体的,尿殖道支原体的基因为基因为1040bp,基因大小差不多;,基因大小差不多;l 流感嗜血杆菌中平均流感嗜血杆菌中平均1042 bp 有有1个基因,尿殖道支个基因,尿殖道支原体中平均原体中平均1235 bp 有有1个基因。个基因。可见基因组尺度减小并可见基因组尺度减小并不引起基因密度的增加和基因尺寸的减小。不引起基因密度的增加和基因尺寸的减小。l 二者差别在于基因数量上,流感嗜血杆菌基因组有二者差别在于基因数量上,流感嗜血杆菌基因组有1743个个ORF,尿殖道支原体只有,尿殖道支原体只有470个个ORF。2020/10/2885模式生物基因组的研究模式生物基因组的研究通过对尿殖道支原体与流感嗜血杆菌这两通过对尿殖道支原体与流感嗜血杆菌这两个亲缘关系较远的生物基因组的比较,选个亲缘关系较远的生物基因组的比较,选取其共同的基因(共取其共同的基因(共240个),再加上一些个),再加上一些其他基因,最后组成一套含其他基因,最后组成一套含256个基因的最个基因的最小基因组。小基因组。2020/10/2886人类基因组基因的三条推测依据人类基因组基因的三条推测依据1.根据已测定大片段DNA中ORF的比例;2.CpGisland的个数(56%的已知基因5都与CpG相连,而人基因组中有45000个Islands)3.ESTs已经报道的是第22染色体和第21染色体。第21染色体全长33.65Mb,长臂上有33.546Mb,仍有7个缺口,长约3kb,99.7%。Chromosome21上有127个已知基因,98个推测的基因59个pseudogenes。Chromosome22中有545个编码基因第21+22染色体共占2%的人类总DNA,共有77%基因2020/10/2887模式生物基因组研究对人类基因组模式生物基因组研究对人类基因组研究的促进作用研究的促进作用1 利用基因序列上的同源性克隆人类疾病基因利用基因序列上的同源性克隆人类疾病基因 当人类当人类cDNA 与已知功能的模式生物基因高与已知功能的模式生物基因高度相关度相关,当该表型的候选基因定位于与当该表型的候选基因定位于与cDNA 相相同的位置上同的位置上,就有助于识别该基因。就有助于识别该基因。2 模式生物基因组研究揭示了人类疾病基因的功模式生物基因组研究揭示了人类疾病基因的功能。能。由于某些模式生物基因的功能已知由于某些模式生物基因的功能已知,这就对人这就对人类疾病基因的功能研究有很大的促进作用。这一类疾病基因的功能研究有很大的促进作用。这一跨种关系使模式生物基因的有效功能数据立刻用跨种关系使模式生物基因的有效功能数据立刻用于研究它的高等生物的同源体。于研究它的高等生物的同源体。2020/10/2888模式生物基因组研究对人类基因组模式生物基因组研究对人类基因组研究的促进作用研究的促进作用3 充分利用模式生物实验系统上的优越性充分利用模式生物实验系统上的优越性 模式生物实验上的优越性成为人类疾病状态下分子机模式生物实验上的优越性成为人类疾病状态下分子机制的阐明和基因功能分析的有效手段。制的阐明和基因功能分析的有效手段。以酵母为例,它就是一个很好的实验系统。以酵母为例,它就是一个很好的实验系统。首先它是一个单细胞首先它是一个单细胞,可以在特定的培养基上生长可以在特定的培养基上生长,这样就可能完全控制其化学和物理环境。这样就可能完全控制其化学和物理环境。其次酵母的生命周期也很适合被用来作遗传分析其次酵母的生命周期也很适合被用来作遗传分析,有有可能构建一套可能构建一套16 条染色体单倍型的详尽的图谱。条染色体单倍型的详尽的图谱。第三第三,现今的技术可以将其现今的技术可以将其6000 个基因中的任何一个个基因中的任何一个用突变的等位基因替代或准确地从基因组中缺失。用突变的等位基因替代或准确地从基因组中缺失。2020/10/2889模式生物基因组研究对人类基因组模式生物基因组研究对人类基因组研究的促进作用研究的促进作用4 比较基因组作图在人类基因组研究中的应用。比较基因组作图在人类基因组研究中的应用。应用之一是使连锁信息和基因组资源从作图较为详尽应用之一是使连锁信息和基因组资源从作图较为详尽的物种转移到作图不完善的物种。例如:通过定位一套在的物种转移到作图不完善的物种。例如:通过定位一套在哺乳动物中进化上保守的位点哺乳动物中进化上保守的位点,把这些保守位点作为出发把这些保守位点作为出发点点,使连锁信息从人使连锁信息从人、鼠等物种扩展到牛鼠等物种扩展到牛、猪猪、羊等物种羊等物种,以促进基因组研究。以促进基因组研究。另一个应用是把比较基因组作图用于复杂性状的分析。另一个应用是把比较基因组作图用于复杂性状的分析。许多遗传性状是由一个以上的基因控制的许多遗传性状是由一个以上的基因控制的,这些基因的识这些基因的识别通常在老鼠中比在人中来得容易。一旦一个候选疾病基别通常在老鼠中比在人中来得容易。一旦一个候选疾病基因或疾病区域被在老鼠中确认因或疾病区域被在老鼠中确认,我们就可以筛选同源基因我们就可以筛选同源基因或同源区域或同源区域,看看是否与人类遗传病相对应。看看是否与人类遗传病相对应。2020/10/2890
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!