生物信息-进化教学课件

上传人:无*** 文档编号:241596622 上传时间:2024-07-08 格式:PPT 页数:62 大小:1.27MB
返回 下载 相关 举报
生物信息-进化教学课件_第1页
第1页 / 共62页
生物信息-进化教学课件_第2页
第2页 / 共62页
生物信息-进化教学课件_第3页
第3页 / 共62页
点击查看更多>>
资源描述
61、辍学如磨刀之石,不见其损,日有所亏。62、奇文共欣赞,疑义相与析。63、暧暧远人村,依依墟里烟,狗吠深巷中,鸡鸣桑树颠。64、一生复能几,倏如流电惊。65、少无适俗韵,性本爱丘山。生物信息生物信息 进化进化第一节第一节 基本概念基本概念系统发生树系统发生树:物种物种(遗传特征遗传特征)之间之间的关系的关系;进化树进化树:从低等到高等从低等到高等,有始有终有始有终 经典系统发生学经典系统发生学主要是物理或表型特征主要是物理或表型特征如生物体的大小、颜色、触角个数如生物体的大小、颜色、触角个数即通过表型比较来推断生物体的基因型即通过表型比较来推断生物体的基因型(genotype),研究物种之间的进化关系研究物种之间的进化关系.有时候亲缘关系远的物种也能进化出相似的表有时候亲缘关系远的物种也能进化出相似的表型型,所谓的所谓的趋同进化趋同进化(convergent evolution).所以所以表型为依据的进化分析有时候并不正确表型为依据的进化分析有时候并不正确.如是否有眼睛如是否有眼睛?现代系统发生学现代系统发生学利用从遗传物质中提取的信息作为物种特征利用从遗传物质中提取的信息作为物种特征具体地说就是核酸序列或蛋白质分子具体地说就是核酸序列或蛋白质分子 根据现有生物基因或物种多样性根据现有生物基因或物种多样性重建生物的进重建生物的进化史化史是一个非常重要的问题是一个非常重要的问题.根据核酸和蛋白质根据核酸和蛋白质的序列信息的序列信息,可以推断物种之间的系统发生关系可以推断物种之间的系统发生关系.基本原理基本原理:从一条序列变为另一条序列所需要从一条序列变为另一条序列所需要的变换越多的变换越多,两条序列的相关性就越小两条序列的相关性就越小,从共同从共同祖先分歧的时间越早祖先分歧的时间越早,进化距离越大进化距离越大;反之反之,两个两个序列越相似序列越相似,它们之间的进化距离可能越小它们之间的进化距离可能越小.所有的生物都可以追溯到共同的祖先所有的生物都可以追溯到共同的祖先,生物的生物的产生和分化就象数一样地生长产生和分化就象数一样地生长,分叉分叉,以树的形以树的形式来表示生物之间的进化关系是非常自然的事式来表示生物之间的进化关系是非常自然的事.系统发生树是一种系统发生树是一种二叉树二叉树(每个节点最多有两个每个节点最多有两个子节点子节点),由一系列的节点由一系列的节点(nodes)和分支和分支(branches)组成组成,每个节点代表一个分类单元每个节点代表一个分类单元(物物种或序列种或序列),节点之间的连线表示物种之间的进节点之间的连线表示物种之间的进化关系化关系.枝长枝长branch length 通常代表在该分枝通常代表在该分枝中曾发生过的变化数中曾发生过的变化数.系统树可以是有根的系统树可以是有根的rooted 也可以是无根的也可以是无根的(unrooted).在有根树中存在一个被称为根特殊节点由此导向在有根树中存在一个被称为根特殊节点由此导向任何别的节点都只有唯一图任何别的节点都只有唯一图.每一途径中的方向每一途径中的方向与进化时间相对应与进化时间相对应.而根则是所有正被研究的的而根则是所有正被研究的的共同祖先共同祖先.无根树是一种只将各间的关系具体化无根树是一种只将各间的关系具体化而未定义进化途径的树图而未定义进化途径的树图.系统发生树性质:系统发生树性质:(1 1)如果是一棵有根树,则树根代表在进)如果是一棵有根树,则树根代表在进化历史上是最早的、并且与其它所有分类单化历史上是最早的、并且与其它所有分类单元都有联系的分类单元;元都有联系的分类单元;(2 2)如果找不到可以作为树根的单元,则)如果找不到可以作为树根的单元,则系统发生树是无根树;系统发生树是无根树;(3 3)从根节点出发到任何一个节点的路径)从根节点出发到任何一个节点的路径指明进化时间或者进化距离。指明进化时间或者进化距离。4直系同源直系同源(orthologsorthologs):):同源的基因是同源的基因是由于共同的祖先基因进化而产生的由于共同的祖先基因进化而产生的.4旁系同源旁系同源(paralogsparalogs):):同源的基因是由同源的基因是由于基因复制产生的于基因复制产生的.直系同源与旁系同源直系同源与旁系同源必须了解的概念必须了解的概念:paralogsorthologsparalogsorthologs思考思考:用于分子进化的序列必须是用于分子进化的序列必须是直系直系 or or 旁旁系系同源才能真实反映进化过程同源才能真实反映进化过程?Bacterium 1Bacterium 3Bacterium 2Eukaryote 1Eukaryote 4Eukaryote 3Eukaryote 2Bacterium 1Bacterium 3Bacterium 2Eukaryote 1Eukaryote 4Eukaryote 3Eukaryote 2Phylograms show branch order and branch lengths进化树,有分支和支长信息.进化分支图,进化树进化分支图,进化树Cladograms show branching order-branch lengths are meaningless进化分支图,只用分支信息,无支长信息。Rooted by outgrouparchaeaarchaeaarchaeaeukaryoteeukaryoteeukaryoteeukaryotebacteria outgrouprooteukaryoteeukaryoteeukaryoteeukaryote无根树无根树archaeaarchaeaarchaea有根树,无根树,外围群有根树,无根树,外围群有根树有根树外围群外围群第二节第二节 系统发生分析步骤系统发生分析步骤(1 1)序列比对)序列比对(2 2)确定替换模型)确定替换模型(3 3)构建系统发生树)构建系统发生树(4 4)评价所建立的树)评价所建立的树4两类数据:距离距离离散特征离散特征 离散特征数据可分为离散特征数据可分为 二态特征二态特征例如:例如:DNADNA序列上的某个位序列上的某个位置如果是剪切位点置如果是剪切位点 多态特征多态特征例如:某一位置可能的碱例如:某一位置可能的碱基有、或基有、或 4系统发生树的构建方法分为两大类:系统发生树的构建方法分为两大类:基于距离的构建方法基于距离的构建方法非加权组平均法非加权组平均法 邻近归并法邻近归并法 Fitch-MargoliashFitch-Margoliash法法 最小进化方法最小进化方法 基于离散特征的构建方法基于离散特征的构建方法最大简约法最大简约法 最大似然法最大似然法 进化简约法进化简约法 相容性方法相容性方法 1.最大简约法(最大简约法(MP)最大简约法最大简约法(maximum parsimony,MP)(maximum parsimony,MP)最最早源于形态性状研究,现在已经推广到分早源于形态性状研究,现在已经推广到分子序列的进化分析中。最大简约法的理论子序列的进化分析中。最大简约法的理论基础是奥卡姆(基础是奥卡姆(OckhamOckham)哲学原则,这个)哲学原则,这个原则认为:解释一个过程的最好理论是所原则认为:解释一个过程的最好理论是所需假设数目最少的那一个。需假设数目最少的那一个。对所有可能的对所有可能的拓扑结构进行计算,并计算出所需替代数拓扑结构进行计算,并计算出所需替代数最小的那个拓扑结构,作为最优树。最小的那个拓扑结构,作为最优树。最大简约法利用存在序列之间的差异的位点最大简约法利用存在序列之间的差异的位点,即即信息位点信息位点:由由位点产生的突变数目把一棵树与另一棵树区分开来的位点位点产生的突变数目把一棵树与另一棵树区分开来的位点.对于一个信息位点要求至少有两种不同的序列对于一个信息位点要求至少有两种不同的序列,而且每个序而且每个序列至少出现列至少出现2 2次次.最大简约法就是寻找长度最小最大简约法就是寻找长度最小,代价最小代价最小(替换的次替换的次数最少数最少)的树的树.我们只考虑信息位点我们只考虑信息位点.(以以5为例为例)try2.距离法距离法距离法又称距离矩阵法,首先通过各个距离法又称距离矩阵法,首先通过各个物种之间的比较,物种之间的比较,根据一定的假设(进化根据一定的假设(进化距离模型)推导得出分类群之间的进化距距离模型)推导得出分类群之间的进化距离,构建一个进化距离矩阵。离,构建一个进化距离矩阵。进化树的构进化树的构建则是基于这个矩阵中的进化距离关系建则是基于这个矩阵中的进化距离关系 。10条核酸序列的距离矩阵 例,如果有三个物种,例,如果有三个物种,其两两距离如下:其两两距离如下:dab=0.5 dac =0.9 dbc=0.9通过求解方程,得到通过求解方程,得到如图所示的一棵树。如图所示的一棵树。uvabc0.20.250.250.45一种简单的距离矩阵一种简单的距离矩阵由进化距离构建进化树的方法有很多,常见有:由进化距离构建进化树的方法有很多,常见有:1.Fitch-Margoliash Method(FM法)法)2.Neighbor-Joining Method(NJ法法/邻接法邻接法)3.Neighbors Relaton Method(邻居关系法邻居关系法)4.Unweighted Pair Group Method(UPGMA法法)通过矩阵建树的方法通过矩阵建树的方法2.1 2.1 非加权分组平均法非加权分组平均法(Unweighted Pair Group Method with Arithmetic mean,Unweighted Pair Group Method with Arithmetic mean,UPGMAUPGMA)在非加权分组平均法中,在计算新分类到其在非加权分组平均法中,在计算新分类到其它分类之间的平均距离时按照各分类中分类它分类之间的平均距离时按照各分类中分类单元的数目进行加权处理。单元的数目进行加权处理。UPGMA法d=e=10/2=5c=19/2=9.5g=c-d=9.5-5=4.5d(DE)A=(AE+AD)/2=(41+39)/2=40a=b=22/2=11AB(CDE)A-2239.5B-41.5(CDE)-d(CDE)A=(AE+AD+AC)/3=(41+39+39)/3=39.5(AB)(CDE)(AB)-40.5(CDE)-f1+a=f2+c=40.5/2=20.25f1=9.25,f2=11.75选择外类群(Outgroup)选择一个或多个已知与分析序列关系较选择一个或多个已知与分析序列关系较远的序列作为外类群远的序列作为外类群外类群可以辅助定位树根外类群可以辅助定位树根外类群序列必须与剩余序列关系较近,外类群序列必须与剩余序列关系较近,但外类群序列与其他序列间的差异必须比但外类群序列与其他序列间的差异必须比其他序列之间的差异更显著。其他序列之间的差异更显著。bacteria outgroupeukaryoteeukaryoteeukaryoteeukaryotearchaeaarchaeaarchaea外围群外围群可靠性分析可靠性分析自展法自展法 通过系统发生分析推断出来的树的不同部通过系统发生分析推断出来的树的不同部分可能有不同的置信度分可能有不同的置信度,造成统计误差的一个造成统计误差的一个原因是数据采样误差原因是数据采样误差.因此对分析的对象多次采因此对分析的对象多次采样样,比较不同样本得到的估计值比较不同样本得到的估计值.具体做法具体做法:从从原始数据中采集部分数据组新的数据集原始数据中采集部分数据组新的数据集,构建构建系统发生树系统发生树,重复该过程重复该过程,产生千百的重采样数产生千百的重采样数据集据集,并同时生成对应的自展树并同时生成对应的自展树,检验自展树对检验自展树对最终系统发生树各分支的支持率最终系统发生树各分支的支持率.最后计算出来最后计算出来的数值为自展值的数值为自展值(Bootstrap value).进化树的可靠性分析进化树的可靠性分析自展法(Bootstrap Method)将最终系统树与各个自展树进行比较将最终系统树与各个自展树进行比较,其中在各个其中在各个自展树中都出现或大量出现的那些部分将具有高自展树中都出现或大量出现的那些部分将具有高的置信度的置信度.比较耗时比较耗时.课堂练习:1)下列哪些位点是信息位点下列哪些位点是信息位点?位点1 2 3 4 5 6序列1 C A G G T A序列2 C A G A C A序列3 C G G C T A序列4 T G G T C G课堂练习:2)下列系统发生树建立的方法中下列系统发生树建立的方法中,基于序列特征基于序列特征分析的是分析的是?基于距离的是基于距离的是?A.neighbor-joining methodB.UPGMAC.Maximum parismonyD.Maximum likelihood课堂练习:3)给定一个距离距阵给定一个距离距阵,请用请用UPGMA法构建系统发法构建系统发生树生树.A B C D EA -8 4 6 8B -8 8 4C -6 8D -8 或者或者:假设序列假设序列A-E如下如下:A:aagcttactgaatgggcA:aagcttactgaatgggcB:aagcatactgaatcggcB:aagcatactgaatcggcC:aatcatactgaatgccgC:aatcatactgaatgccgD:aatcatactgtttgccgD:aatcatactgtttgccgE:tttcatagtcaatgccaE:tttcatagtcaatgcca 假设序列之间的距离为序列转换需要假设序列之间的距离为序列转换需要的碱基替换次数的碱基替换次数.试用试用UPGMAUPGMA法绘制树法绘制树.常用系统发生树软件常用系统发生树软件:ClustalW/X,Philip,MEGA,DNAstar查看软件查看软件:Treeview,MEGA专业软件专业软件1)流程流程:1)ClustalX多序列比较多序列比较;2)用用ClustalX程序直接绘制程序直接绘制NJ树树;3)用用Treeview程序打开程序打开.2)流程流程:1)ClustalX多序列比较多序列比较;2)用用MEGA程序转换格式程序转换格式;3)选择构建方法选择构建方法;4)MEGA查看查看.For sequences:OsSRZ1MNRKPGDWDCRACQHLNFSRRDLCQRCGGPRGAADRGSGGGGDYANFGGRGGSSFGGGFGTGSDVRPGDWYCNCGAHNFASRSSCFKCAAFKDDAAVNSGGAGAFDGGDMSRSRGYGFGSGAVRASRPGWKSGDWICTRSGCNEHNFASRMECFRCNAPRDSGTEVOsSRZ2MNIQRKPGDWNCKSCQHLNFSRRDYCQRCHTPRQDLPLGDGYVPGGVLSSLDIRPGDWYCNCGYHNFASRASCFKCGAIVKDLPAGQGGGVANGDFARALDSSAVRAGWKAGDWICTRPGCNVHNFASRIECYRCNAPREAGNVKOsSRZ3METKAAAMAMRKPGDWSCRSCQYVNFCKREACQRCGEAKLGVERTDYAAMGGGWEVKPGDWCCRCCAVNNYASRGSCFKCGAAKNDSAAAVAQGWGFSVASQAGWKNGDWICPRMECNVQNYANRTECFRCNFPRYYVDAtSRZ1MSRPGDWNCRSCSHLNFQRRDSCQRCGDSRSGPGGVGGLDFGNFGGRAMSVFGFTTGSDVRPGDWYCTVGNCGTHNFASRSTCFKCGTFKDETGAGGGGGGIGGPAMFDADIMRSRVPGNGGRSSWKSGDWICTRIGCNEHNFASRMECFRCNAPRDFSNRTSFAtSRZ2MNRPGDWNCRLCSHLNFQRRDSCQRCREPRPGGISTDLLSGFGGRPVSSSFGFNTGPDVRPGDWYCNLGDCGTHNFANRSSCFKCGAAKDEFSCSSAAATTGFMDMNVGPRRGLFGFGGSSSGGGGTGRSPWKSGDWICPRSGCNEHNFASRSECFRCNAPKELATEPPYAtSRZ3MSWTGGDWLCGACQHANFKKRESCQKCGYPKFGGVDVSTYLYNRTEVMAGDWYCGALNCGSHNYASRTSCYRCGMIKVEYTEQYYGAQMVAYGNDGAACPPGWKTGDWVCPRVGCGVHNYASRAECFKCKTTRDYGGVStep OK?Step OK?Step OK?生成.phb文件操作.Part II流程流程:1)ClustalX多序列比较多序列比较;2)用用MEGA程序转换格式程序转换格式;3)选择构建方法选择构建方法;4)MEGA查看查看.For example方法(2)仍然进行多序列比对,获得.aln文件方法(2)生成.MEG文件方法(2)方法(2)方法(2)方法(2)方法(2)26、要使整个人生都过得舒适、愉快,这是不可能的,因为人类必须具备一种能应付逆境的态度。卢梭27、只有把抱怨环境的心情,化为上进的力量,才是成功的保证。罗曼罗兰28、知之者不如好之者,好之者不如乐之者。孔子29、勇猛、大胆和坚定的决心能够抵得上武器的精良。达芬奇30、意志是一个强壮的盲人,倚靠在明眼的跛子肩上。叔本华谢谢!谢谢!62
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!