7核酸蛋白质序列进化分析

上传人:仙*** 文档编号:47416369 上传时间:2021-12-20 格式:PPT 页数:56 大小:618.50KB
返回 下载 相关 举报
7核酸蛋白质序列进化分析_第1页
第1页 / 共56页
7核酸蛋白质序列进化分析_第2页
第2页 / 共56页
7核酸蛋白质序列进化分析_第3页
第3页 / 共56页
点击查看更多>>
资源描述
主讲人:胡银岗主讲人:胡银岗西北农林科技大学农学院遗传教研组西北农林科技大学农学院遗传教研组古生物遗体、化石保存的三种信息:古生物遗体、化石保存的三种信息:形态学信息形态学信息化学信息化学信息(生物的代谢产物和一般的生物化学分子)(生物的代谢产物和一般的生物化学分子)遗传信息遗传信息(保存的一级结构生物大分子保存的一级结构生物大分子,即基因产物或基因片即基因产物或基因片段段)(Molecular Systematics):从生物大分子):从生物大分子(氨基酸、核苷酸)的遗传信息推断生物进化的历史,(氨基酸、核苷酸)的遗传信息推断生物进化的历史,并以系统树(谱系)的形式表达出来。并以系统树(谱系)的形式表达出来。:利用古代:利用古代DNA保留的遗传信息进行分子保留的遗传信息进行分子系统学研究系统学研究经典的进化学方法经典的进化学方法 (Fossil) (Comparative morphology) (Comparative physiology)进化学的分子方法进化学的分子方法 由由4种核酸组成种核酸组成 分子水平的进化表现为:分子水平的进化表现为:DNA序列序列和氨基酸序列演化和氨基酸序列演化 比较不同物种的有关比较不同物种的有关DNA序列序列 建立建立DNA序列和氨序列和氨基酸序列的演化模型(数学模型)基酸序列的演化模型(数学模型) (形态、性状的演(形态、性状的演化模型?)化模型?) 与形态、性状包含的信息相比,基因组序列包含更多、与形态、性状包含的信息相比,基因组序列包含更多、更复杂的信息结构更复杂的信息结构:源于同一祖先:源于同一祖先DNA/氨基酸序列的两条氨基酸序列的两条DNA/氨氨基酸序列,考察二者的差异。基酸序列,考察二者的差异。:进化过程中分子突变的痕迹:进化过程中分子突变的痕迹:以累计在:以累计在DNA/氨基酸分子上的历史信息为基氨基酸分子上的历史信息为基础,研究分子水平的生物进化过程和机制。础,研究分子水平的生物进化过程和机制。分子系统学为生物分类问题提供了许多崭新的见解。分子系统学为生物分类问题提供了许多崭新的见解。生物进化的分子机制生物进化的分子机制基因突变基因突变1、核苷酸替代、插入/缺失、重组2、基因转换固定在生物个体固定在生物个体以及物种内以及物种内遗传漂变遗传漂变自然选择自然选择传递给后代传递给后代产生新的形态、性状产生新的形态、性状分子系统学是研究进化机制的一个重要工具。分子系统学是研究进化机制的一个重要工具。性状改变性状改变DNA分子的改变分子的改变核苷酸替代substitution核苷酸缺失deletion核苷酸插入insertion核苷酸倒位invertion Thr Tyr Leu LeuACC TAT TTG CTGACC TCT TTG CTG Thr Ser Leu Leu替代替代 Thr Tyr Leu LeuACC TAT TTG CTGACC TAC TTT GCT G Thr Tyr Phe Ala插入插入 Thr Tyr Leu LeuACC TAT TTG CTGACC TAT TGC TG- Thr Tyr Cys -缺失缺失 Thr Tyr Leu LeuACC TAT TTG CTGACC TTT ATG CTG Thr Phe Met Leu倒位倒位(transition)嘌呤嘌呤 嘌呤嘌呤嘧啶嘧啶 嘧啶嘧啶(transvertion)嘌呤嘌呤 嘧啶嘧啶嘧啶嘧啶 嘌呤嘌呤胞嘧啶胞嘧啶腺嘌呤腺嘌呤胸腺嘧啶胸腺嘧啶鸟嘌呤鸟嘌呤在大多数在大多数DNA片段中,转换出现的概率高于颠换出现的概率。片段中,转换出现的概率高于颠换出现的概率。Why?仍然为同义密码子的核苷酸替代仍然为同义密码子的核苷酸替代如:如: TAT TAC Tyr Tyr导致产生非同义密码子的核苷酸替代导致产生非同义密码子的核苷酸替代如:如: TAT AAT Tyr Asn导致产生终止密码子的核苷酸突变导致产生终止密码子的核苷酸突变如:如: TAT TAA Tyr STP问题:假设所有密码子以同一概率出现,上述三种突变的比例?问题:假设所有密码子以同一概率出现,上述三种突变的比例? 25%,71%,4%:编码同一个氨基酸的多个同义密码子具有不同的使用频率编码同一个氨基酸的多个同义密码子具有不同的使用频率E. coli的的RNA聚合酶聚合酶 缬氨酸缬氨酸Val GTT GTC GTA GTG 55 21 34 34 精氨酸精氨酸Arg CGU CGC CGA CGG 89 46 1 0为什么会出现密码子使用频率的偏倚性?为什么会出现密码子使用频率的偏倚性? 与同功能与同功能tRNA的丰度有关?的丰度有关? 突变压力与净化选择双重控制?突变压力与净化选择双重控制? Open problemabcdabcd拓扑结构:拓扑结构:有根树:有根树:反映时间顺序反映时间顺序无根树:无根树:反映距离反映距离 理论上,一个理论上,一个DNA序列在物种形成或基因复制时,分序列在物种形成或基因复制时,分裂成两个子序列,因此系统发育树一般是二歧的。裂成两个子序列,因此系统发育树一般是二歧的。 一般考虑二歧的树结构:二歧树一般考虑二歧的树结构:二歧树分支:分支:内部分支内部分支外部分支外部分支节点:节点:内部节点内部节点外部节点外部节点abcdabcdabcd adbcbacdcabddabcacbdbcadcbaddbacadbcbaaccdabdcab考虑考虑4个分类群时,共有个分类群时,共有15种可能的有根树种可能的有根树abcdacbdadbc考虑考虑4个分类群时,共有个分类群时,共有3种可能的无根树种可能的无根树 : 代表一个物种或代表一个物种或群体进化历史的系统群体进化历史的系统发育树发育树 两个物种分歧的两个物种分歧的时间:两个物种发生时间:两个物种发生生殖隔离的时间生殖隔离的时间 : 由来自各个物种由来自各个物种的一个基因构建的系的一个基因构建的系统发育树(不完全等统发育树(不完全等同于物种树),表示同于物种树),表示基因分离的时间。基因分离的时间。ab cd ef基因分裂基因分裂基因分裂基因分裂基因分裂基因分裂物种分裂物种分裂: 一个用无限长的序列或每一一个用无限长的序列或每一分支的期望替代数构建的树分支的期望替代数构建的树假设所研究的序列无限假设所研究的序列无限长,从中随机抽样进行长,从中随机抽样进行统计分析。统计分析。所研究的序列是短序列,所研究的序列是短序列,统计得到的替代数目存统计得到的替代数目存在大量随机误差。在大量随机误差。: 建立在实际替代数基础上的树建立在实际替代数基础上的树构树方法构树方法1、特征数据特征数据(character data): 提供了基因、个体、群体或物种的信息提供了基因、个体、群体或物种的信息2、距离数据距离数据(distance data)或或相似性数据相似性数据(similarity data): 涉及的则是成对基因、个体、群体或物种的信息。涉及的则是成对基因、个体、群体或物种的信息。 距离矩阵距离矩阵距离数据可以由特征数据计算得到。距离数据可以由特征数据计算得到。反之反之?根据每对物种之间的距离直接计算得到。所根据每对物种之间的距离直接计算得到。所生成的树的质量取决于距离尺度的质量生成的树的质量取决于距离尺度的质量 通过寻求物种间最小的变更数来完成的通过寻求物种间最小的变更数来完成的 通过标准的统计推断建立系统发育的概率模通过标准的统计推断建立系统发育的概率模型型神经网络方法、神经网络方法、Hadamard结合法结合法1、拓扑结构的判别、拓扑结构的判别(从大量的拓扑结构中搜寻、判别)(从大量的拓扑结构中搜寻、判别)2、一个既定拓扑结构的分支长度的估计、一个既定拓扑结构的分支长度的估计最优原则最优原则1、首先要获得所有分类群之间的进化距离。、首先要获得所有分类群之间的进化距离。2、系统发育树的构建是基于进化距离之间的关系。、系统发育树的构建是基于进化距离之间的关系。1、选定分类群共同的特征序列、选定分类群共同的特征序列氨基酸序列、核苷酸氨基酸序列、核苷酸序列序列 如:人、马、牛、袋鼠、蝾螈、鲤鱼的血红蛋白如:人、马、牛、袋鼠、蝾螈、鲤鱼的血红蛋白 链的氨基酸序链的氨基酸序 列(列(140aa);人、猕猴、黑猩猩的线粒体);人、猕猴、黑猩猩的线粒体DNA中细胞色素中细胞色素b基因的核基因的核苷酸序列(苷酸序列(1,125bp););2、比较两两序列之间的差异、比较两两序列之间的差异p;3、根据不同的概率统计模型,由两条序列的差异、根据不同的概率统计模型,由两条序列的差异p值构值构建它们的进化距离建它们的进化距离 氨基酸序列:氨基酸序列:PC(Poisson校正)距离、校正)距离、 距离距离 核苷酸序列:核苷酸序列:Jukes-Cantor模型、模型、Kimura模型、模型、HKY模型模型等等4、如何根据不同的概率统计模型,由两条序列的差异、如何根据不同的概率统计模型,由两条序列的差异p值构建它们的进化距离值构建它们的进化距离(Unweighted Pair-Group Method using an arithmetic Average )谱系聚类,使用算术平均的非加权成组谱系聚类,使用算术平均的非加权成组配对方法配对方法UPGMA:(Unweighted Pair-Group Method using an arithmetic Average, 使使用算术平均的非加权成组配对方法用算术平均的非加权成组配对方法)Sokal & Michener (1958)Sneath & Sokal (1973)方法原理:谱系聚类方法原理:谱系聚类首先将首先将t个样本各自视为一类:得到初始的分类个样本各自视为一类:得到初始的分类G(1) (含有(含有t类),计算类),计算t个样本两两之间的距离,它们等价于初始的类个样本两两之间的距离,它们等价于初始的类间距离,得到初始的距离矩阵间距离,得到初始的距离矩阵D(1) ; 将距离最近的两类合并为一新类,得到新的分类将距离最近的两类合并为一新类,得到新的分类G(2)(含有(含有t-1类),并计算新类与其它类的类间距离,得到新类),并计算新类与其它类的类间距离,得到新的类间距离矩阵的类间距离矩阵D(2) ,再按照最小距离准则并类,得到,再按照最小距离准则并类,得到G(3)(含有(含有t-2类)、类)、D(3), 。直到所有样本都并成一类。直到所有样本都并成一类 ; 画出谱系聚类图,决定分类的个数及各类的成员。画出谱系聚类图,决定分类的个数及各类的成员。在基因替代速率恒定假设成立时,在基因替代速率恒定假设成立时,UPGMA方法比较适用;方法比较适用;UPGMA方法适用于具有较小变异系数的距离测度;方法适用于具有较小变异系数的距离测度;UPGMA是一种既构建拓扑结构又计算分支长度的方法;是一种既构建拓扑结构又计算分支长度的方法;UPGMA方法既可以得到有根树,也可以得到无根树。方法既可以得到有根树,也可以得到无根树。最小进化(最小进化(ME)思想:在所有可能的拓扑结构中,选择分)思想:在所有可能的拓扑结构中,选择分支长度和支长度和S最小作为最优树。(全局优化思想)最小作为最优树。(全局优化思想)(Edwards & Cavalli-Sforza,1963)Saitou & Nei (1987):在每一阶段应用最小进化原理,是:在每一阶段应用最小进化原理,是ME方法的简化。方法的简化。S:所有分支长度总和:所有分支长度总和jXiXijLLd其中其中X为连接类群为连接类群i, j的节点,的节点,LiX为类群为类群i到到X的分支长度。的分支长度。: 6个分类群的距离矩阵个分类群的距离矩阵dijdij123456109121520162071015113051064011750860S=32.4XYS=29.5YXS=28.3YXS=28.0S=28.0S=28.0NJ法本质上是一种寻找最优拓扑结构的谱系聚类算法。同法本质上是一种寻找最优拓扑结构的谱系聚类算法。同时给出系统发育树的拓扑结构以及分支的长度。时给出系统发育树的拓扑结构以及分支的长度。优点:优点:可以较快地构建系统树;可以较快地构建系统树;适用于分析较大的数据集;适用于分析较大的数据集;能够较方便地进行自展(能够较方便地进行自展(Bootstrap)检验。)检验。(Fitch, 1971; Hartigan, 1973)考虑)考虑m个核个核苷酸(或氨基酸)序列(苷酸(或氨基酸)序列(m 4),假定),假定4种核苷酸(或种核苷酸(或20种种氨基酸)可突变为与自身不同的任何一种。氨基酸)可突变为与自身不同的任何一种。对于任一给定的拓扑结构,可以推断每个位点的祖先状态;对于任一给定的拓扑结构,可以推断每个位点的祖先状态;对于该拓扑结构,可以计算出用来解释整个进化过程所需的核苷酸对于该拓扑结构,可以计算出用来解释整个进化过程所需的核苷酸(或氨基酸)的最小替代数目;(或氨基酸)的最小替代数目;对所有可能正确的拓扑结构计算它们的最小替代数目,选择其中最对所有可能正确的拓扑结构计算它们的最小替代数目,选择其中最小的作为最优拓扑结构。小的作为最优拓扑结构。特定结构树的最小替代数目估计特定结构树的最小替代数目估计AAAGGTAGGGAAAGGTAAAT祖先节点的核苷酸不能完全唯一确定。祖先节点的核苷酸不能完全唯一确定。计算所有结构树并选取最短树长计算所有结构树并选取最短树长对于任一给定的拓扑结构,计算它的树长(即所有位点对于任一给定的拓扑结构,计算它的树长(即所有位点的最小替代数目之和)的最小替代数目之和)L;选取具有最短树长的拓扑结构为最大简约树。选取具有最短树长的拓扑结构为最大简约树。信息位点、趋同进化信息位点、趋同进化在所有分类群中相同核苷酸或氨基酸的位点。在所有分类群中相同核苷酸或氨基酸的位点。 不变位点不提供任何信息。不变位点不提供任何信息。:位点上至少有两种不同的核苷酸或氨基酸,:位点上至少有两种不同的核苷酸或氨基酸,且每种至少出现两次。且每种至少出现两次。 MP法构建系统树的位点:法构建系统树的位点:只利用简约信息位点;只利用简约信息位点;既利用简约信息位点,也利用单一位点。既利用简约信息位点,也利用单一位点。:位点上只有一个分类群具有一种不同的核苷酸或氨基酸。:位点上只有一个分类群具有一种不同的核苷酸或氨基酸。 对所有的拓扑结构都只能用相同的替代数目表示。对所有的拓扑结构都只能用相同的替代数目表示。 单一位点也不提供任何单一位点也不提供任何MP信息。信息。:考虑任意两个密码子之间变换的可能路径:考虑任意两个密码子之间变换的可能路径分支长度估计分支长度估计通过考虑每个非不变位点的所有进化通径,并计算每个内通过考虑每个非不变位点的所有进化通径,并计算每个内部分支或外部分支的平均替代数来估计部分支或外部分支的平均替代数来估计MP树的分支长度。树的分支长度。(具体算法略)(具体算法略)MP法适用的问题法适用的问题位点不存在回复突变、平行突变;位点不存在回复突变、平行突变;被分析的序列较长,核苷酸或氨基酸数目很大;被分析的序列较长,核苷酸或氨基酸数目很大;序列的相似度较高;序列的相似度较高;核苷酸或氨基酸替代速率较稳定。核苷酸或氨基酸替代速率较稳定。(Felsenstein, 1981; Kishino, 1990)以一个特定的替代模型分析一组给定的核苷酸(或氨基酸)以一个特定的替代模型分析一组给定的核苷酸(或氨基酸)序列数据,使获得的每一个拓扑结构的似然率均为最大,挑序列数据,使获得的每一个拓扑结构的似然率均为最大,挑选其中最大似然率最大的拓扑结构,选为最终系统树。选其中最大似然率最大的拓扑结构,选为最终系统树。ML法考察的既可以是拓扑结构,也可以是既定拓扑结构的法考察的既可以是拓扑结构,也可以是既定拓扑结构的分支长度。分支长度。ML法采用了标准的统计方法,以建立进化的概率模型。法采用了标准的统计方法,以建立进化的概率模型。计算量非常大。计算量非常大。软件名称网址说明PHYLIPhttp:/evolution.gs.washington.edu/phylip.htmlIt includes programs to carry out parsimony, distance matrix methods, maximum likelihood, and other methods on a variety of types of data, including DNA and RNA sequences, protein sequences, restriction sites, 0/1 discrete characters data, gene frequencies, continuous characters and distance matrices. PAUPhttp:/paup.csit.fsu.edu/It includes parsimony, distance matrix, invariants, and maximum likelihood methods and many indices and statistical tests.Tree of Lifehttp:/phylogeny.arizona.edu/tree/program/program.htmlArizona大学开发的软件软件名称网址说明MEGAhttp:/美国宾州州立大学Masatoshi Nei开发(It carries out parsimony, distance matrix and likelihood methods for molecular data.)MOLPHYhttp:/www.ism.ac.jp/software/ismlib/softother.e.html#molphy日本国立统计数理研究所开发。(Carrying out maximum likelihood inference of phylogenies for either nucleotide sequences or protein sequences.)PAMLhttp:/abacus.gene.ucl.ac.uk/software/paml.html英国伦敦学院Z. H. YANG开发。(A package of programs for the ML analysis of nucleotide or protein sequences.)PUZZLEftp:/fx.zi.biologie.uni-muenchen.de/pub/puzzle应用Quarter puzzling方法(一种最大简约法)构建系统发育树TreeViewhttp:/taxonomy.zoology.gla.ac.uk/rod/treeview.htmlA program for displaying trees on Apple Macs and Windows PCs. It can draw rooted and unrooted trees, display bootstrap values, and supports the native font and graphics file formats of both Macs and PCs.phylogenyhttp:/www.ebi.ac.uk/biocat/phylogeny.htmlEBI的系统发育树分析软件“一个半世纪以前,一个半世纪以前,Charles Darwin可能没有意识到他所给予可能没有意识到他所给予科学的是一件从未有过的强大武科学的是一件从未有过的强大武器,即他的进化理论。科学家用器,即他的进化理论。科学家用这把坚利之剑斩断了无知、迷信这把坚利之剑斩断了无知、迷信和傲慢,这些束缚人类对亿万年和傲慢,这些束缚人类对亿万年来的生命的了解的镣铐。来的生命的了解的镣铐。”美国自然博物馆成立美国自然博物馆成立125周年纪周年纪念专刊念专刊前言前言Charles Darwin(1809-1882)1、 一切生物都能发生变异,至少有一部分变异能够遗传给后代一切生物都能发生变异,至少有一部分变异能够遗传给后代2、 繁殖过剩:任何生物产生的生殖细胞或后代数目要远远多于可能存活繁殖过剩:任何生物产生的生殖细胞或后代数目要远远多于可能存活的个体数目;而在所产生的后代中,那些最具有适应环境条件的有利变异的个体数目;而在所产生的后代中,那些最具有适应环境条件的有利变异的个体有较大的生存机会,并繁殖后代,从而使有利变异可以世代积累,的个体有较大的生存机会,并繁殖后代,从而使有利变异可以世代积累,不利变异被淘汰。不利变异被淘汰。 “选择选择”不是超自然的上帝的作用。不是超自然的上帝的作用。3、 性状分歧原理性状分歧原理在同一个种内,个体之间在结构、习性上越是歧异,在同一个种内,个体之间在结构、习性上越是歧异,则在适应不同环境方面愈是有利,因而将会繁育更多的个体,分布道更广则在适应不同环境方面愈是有利,因而将会繁育更多的个体,分布道更广的范围。由此一个种会逐渐演变为若干变种、亚种乃至新种。的范围。由此一个种会逐渐演变为若干变种、亚种乃至新种。 新种的形成、种间的竞争、种的绝灭、外界环境的作用新种的形成、种间的竞争、种的绝灭、外界环境的作用 系统树系统树由于性状分歧和中间类型的绝灭,新种不断产生、旧种不由于性状分歧和中间类型的绝灭,新种不断产生、旧种不断绝灭,种间差异不断扩大,形成时间、空间上的物种系统树。断绝灭,种间差异不断扩大,形成时间、空间上的物种系统树。第一次:第一次: 1900s,Weismann等,消除等,消除Lamarck的的“获得性遗传获得性遗传”学说、学说、Buffon的的“环境直接作用环境直接作用”学说,强调学说,强调“自然选择自然选择”为进化的主要因素;为进化的主要因素;第二次:第二次: 1930-40s,遗传学、生物系统学、古生物学的重大贡献:对,遗传学、生物系统学、古生物学的重大贡献:对“自然选自然选择择”、“物种变异物种变异”等概念的新认识。等概念的新认识。 适应:繁殖的相对优势适应:繁殖的相对优势 适应度:个体或基因型对后代或后代基因库的相对贡献适应度:个体或基因型对后代或后代基因库的相对贡献 适应和选择:繁殖或基因传递的相对差异适应和选择:繁殖或基因传递的相对差异 第三次:第三次:NOW 原因:现代分子生物学、古生物学的发展。原因:现代分子生物学、古生物学的发展。 宏观(对生物进化实际过程的了解):古生物学揭示生命进化的宏观(对生物进化实际过程的了解):古生物学揭示生命进化的规律、进化速度、进化趋势、物种的形成和绝灭规律、进化速度、进化趋势、物种的形成和绝灭 微观:现代分子生物学揭示生物大分子的进化规律和携带遗传信微观:现代分子生物学揭示生物大分子的进化规律和携带遗传信息的物质基础及其复杂结构息的物质基础及其复杂结构 新的认识:新的认识:1. 生物进化过程并非生物进化过程并非“匀速匀速”、“渐变渐变”的,而是的,而是“快速进化快速进化”与与“进化停滞进化停滞”相间;相间;2. 生物进化与分子进化都显示出相当大的随机性,自然选择并非总是生物进化与分子进化都显示出相当大的随机性,自然选择并非总是进化的主要因素;进化的主要因素;3. 遗传系统本身具有某种进化功能,进化过程中可能存在内因的遗传系统本身具有某种进化功能,进化过程中可能存在内因的“驱驱动动”和和“导向导向”。 Continuing1、进化的动力是什么?、进化的动力是什么?2、进化是否有一定的方向?、进化是否有一定的方向?3、进化的速度是否恒定?是渐、进化的速度是否恒定?是渐近的还是跳跃的?近的还是跳跃的?分子进化理论同样必须回答上述分子进化理论同样必须回答上述三个问题。三个问题。分子进化速率分子进化速率 生物大分子随时间的改变主要表现为核苷酸、蛋白质的生物大分子随时间的改变主要表现为核苷酸、蛋白质的一级结构的改变,即分子序列中核苷酸、氨基酸的替换一级结构的改变,即分子序列中核苷酸、氨基酸的替换不同物种同源大分子的分子进化速率大体相同不同物种同源大分子的分子进化速率大体相同 例子:比较不同物种血红蛋白氨基酸序列差异例子:比较不同物种血红蛋白氨基酸序列差异 人、马人、马0.8 10-9/AA.a 人、鲤鱼人、鲤鱼0.6 10-9/AA.a分子进化速率远远比表型进化速率稳定分子进化速率远远比表型进化速率稳定原因?原因? 序列的核苷酸或氨基酸替换是否随机过程?序列的核苷酸或氨基酸替换是否随机过程?保守性保守性功能上重要的大分子或大分子的局部在进化速率上明显低于那些在功功能上重要的大分子或大分子的局部在进化速率上明显低于那些在功能上不重要的大分子或者大分子局部。能上不重要的大分子或者大分子局部。引起表型发生显著改变的突变发生的频率要低于无明显表型发生显著引起表型发生显著改变的突变发生的频率要低于无明显表型发生显著改变得突变发生的频率。改变得突变发生的频率。n 氨基酸氨基酸 例子:血红蛋白分子的外区的功能要次于内区的功能,外区的进例子:血红蛋白分子的外区的功能要次于内区的功能,外区的进化速率是内区进化速率的化速率是内区进化速率的10倍。倍。n 核苷酸核苷酸 例子:例子:DNA密码子的同义替代频率高于非同义替代频率;内含子密码子的同义替代频率高于非同义替代频率;内含子上的核苷酸替代频率较高。上的核苷酸替代频率较高。 生物大分子进化并非完全随机生物大分子进化并非完全随机 存在某种制约因素,存在某种机制存在某种制约因素,存在某种机制?Neutral theory of molecular evolution(Kimura & Ohta, 1968, 1971) (King & Jukes, 1969)提出分子层次上的提出分子层次上的“non-Darwinian evolution”“生物分子层次上的进化不是由对有利突变的自然选择作用生物分子层次上的进化不是由对有利突变的自然选择作用引起的,而是在连续突变压下选择中性或非常接近中性的引起的,而是在连续突变压下选择中性或非常接近中性的突变的随机固定造成的。中性突变是指对当前适应度无影突变的随机固定造成的。中性突变是指对当前适应度无影响的突变。响的突变。”、否认自然选择在分子进化中的作用,认为生物大分子的进否认自然选择在分子进化中的作用,认为生物大分子的进化主要因素是化主要因素是和和。分子层次上的大多数变异是选择中性的分子层次上的大多数变异是选择中性的 蛋白质和核苷酸分子的进化速率高且相对恒定蛋白质和核苷酸分子的进化速率高且相对恒定 突变压在分子进化中的作用得到研究证实突变压在分子进化中的作用得到研究证实按照群体遗传学的数学模型,自然选择的代价太高。按照群体遗传学的数学模型,自然选择的代价太高。 1、中性论解释分子层次的进化现象、中性论解释分子层次的进化现象 自然选择只作用于表型,并不直接作用于分子。自然选择只作用于表型,并不直接作用于分子。 衡量尺度的区别:分子的显著性改变并不意味着表型的显著性衡量尺度的区别:分子的显著性改变并不意味着表型的显著性改变。改变。 中性论只涉及生物大分子一级结构单元的替换,并不包含和解中性论只涉及生物大分子一级结构单元的替换,并不包含和解释分子层次的全部改变(如蛋白质三级结构、功能的改变)释分子层次的全部改变(如蛋白质三级结构、功能的改变)2、分子进化的保守性表明选择仍然起作用、分子进化的保守性表明选择仍然起作用负选择的存在:任何发生在重要功能的大分子或大分子保守区负选择的存在:任何发生在重要功能的大分子或大分子保守区的突变,由于造成适应度的下降而被选择淘汰。(随机作用)的突变,由于造成适应度的下降而被选择淘汰。(随机作用)存在某种机制阻止功能重要的大分子或大分子保守区的突变产存在某种机制阻止功能重要的大分子或大分子保守区的突变产生。(非随机作用)生。(非随机作用)3、选择中性突变的复杂调控系统、选择中性突变的复杂调控系统 中性突变的可能原因:复杂的调控机制。基因表达受到中性突变的可能原因:复杂的调控机制。基因表达受到内外因素的制约。内外因素的制约。 决定中性突变的调控系统受到自然选择的影响。决定中性突变的调控系统受到自然选择的影响。 4、选择在分子的适应进化中起作用、选择在分子的适应进化中起作用 在分子层次上可能存在两种进化形式:在分子层次上可能存在两种进化形式: 中性进化(导致分子多样性)中性进化(导致分子多样性) 适应进化(通过选择实现,导致分子适应)适应进化(通过选择实现,导致分子适应)能否打倒的能否打倒的Darwinian进化论进化论?分子钟分子钟 根据分子系统学研究与古生物学资料相结合,建立推根据分子系统学研究与古生物学资料相结合,建立推论生物进化事件发生的时间表。论生物进化事件发生的时间表。 假定分子进化速率假定分子进化速率r恒定,则分子进化改变量(替代数恒定,则分子进化改变量(替代数目或替代率)与进化时间成正比。以两条序列为例:目或替代率)与进化时间成正比。以两条序列为例:其中,其中,t是进化时间,是进化时间,d是这两条序列每个位点的替代数目。是这两条序列每个位点的替代数目。rtd2分子钟成立的先决条件:分子钟成立的先决条件:分子进化速率恒定分子进化速率恒定。分子钟成立的证据:分子钟成立的证据:至少某些生物大分子(如珠蛋白)的进化速率在相当长的至少某些生物大分子(如珠蛋白)的进化速率在相当长的地质时间内的相对稳定、均匀;地质时间内的相对稳定、均匀;许多不同物种的多种同源大分子在相当长时间内的平均进许多不同物种的多种同源大分子在相当长时间内的平均进化速率近似恒定。化速率近似恒定。1. 选择所要比较的生物大分子种类选择所要比较的生物大分子种类根据具体研究目标和已掌握的资料,选择进化速率相对恒定、速率根据具体研究目标和已掌握的资料,选择进化速率相对恒定、速率大小合适、分布范围能涵盖各待比较物种的生物大分子。大小合适、分布范围能涵盖各待比较物种的生物大分子。2. 选择所要比较的物种,确定各比较组合及其所代表的进选择所要比较的物种,确定各比较组合及其所代表的进化事件化事件3. 获得生物大分子一级结构的资料获得生物大分子一级结构的资料4. 获得有关的代表性进化事件发生的地质时间数据获得有关的代表性进化事件发生的地质时间数据5. 通过比较大分子一级结构,选择合适的数学模型,计算通过比较大分子一级结构,选择合适的数学模型,计算得到进化产生的分子差异得到进化产生的分子差异d,通过回归分析等统计方法得到,通过回归分析等统计方法得到大分子的进化速率大分子的进化速率r(t)6. 由此可以推断未知进化事件的发生时间由此可以推断未知进化事件的发生时间对长期进化而言,不存在以恒定速率替换的生物大分子一对长期进化而言,不存在以恒定速率替换的生物大分子一级结构;(基因功能的改变、基因数目的增加)级结构;(基因功能的改变、基因数目的增加)不存在通用的分子钟;不存在通用的分子钟;争议:争议:分子钟的准确性分子钟的准确性中性理论(分子钟成立的基础)中性理论(分子钟成立的基础)基因组计划为许多生物进化关键问题的研究提供了基础基因组计划为许多生物进化关键问题的研究提供了基础基因组计划产生的大量数据为分子进化研究提供了新的素材;基因组计划产生的大量数据为分子进化研究提供了新的素材;人类基因组计划、模式生物基因组计划人类基因组计划、模式生物基因组计划可以从生物大分子层次研究进化的机制可以从生物大分子层次研究进化的机制 进化机制:基因重复、拷贝?(低等生物进化机制:基因重复、拷贝?(低等生物高等生物)高等生物) 多基因家族的一致进化?多基因家族的一致进化? 提供有关重复基因、提供有关重复基因、DNA缺失插入、基因易位、转座子插入等缺失插入、基因易位、转座子插入等信息,为分子系统学研究提供更多的研究对象。信息,为分子系统学研究提供更多的研究对象。思思 考考 题题1. 生物进化的理论有哪些?简述主要的生物生物进化的理论有哪些?简述主要的生物进化理论。进化理论。2. 分子进化分析的基础是什么?分子进化分析的基础是什么?3. 分子进化分析的意义在哪里?分子进化分析的意义在哪里?4. 分子进化分析的主要方法有哪些?分子进化分析的主要方法有哪些?5. 简述进行分子进化分析的主要过程。简述进行分子进化分析的主要过程。
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 成人自考


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!