蛋白质序列分析课件

上传人:风*** 文档编号:242624625 上传时间:2024-08-29 格式:PPT 页数:71 大小:4.54MB
返回 下载 相关 举报
蛋白质序列分析课件_第1页
第1页 / 共71页
蛋白质序列分析课件_第2页
第2页 / 共71页
蛋白质序列分析课件_第3页
第3页 / 共71页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,二级,三级,四级,五级,*,蛋白质序列分析,2005 ,基因表达序列标签(,EST,)数据分析手册,第八,章,吴祖建等,2011 ,生物信息学分析实践,第五章,蛋白质序列分析2005 基因表达序列标签(EST)数据分析,1,蛋白质序列结构信息,蛋白质序列的基本性质分析,结构域分析及,motif,搜索,蛋白质二级结构,蛋白质三级结构,蛋白质序列分析,蛋白质序列分析,2,一 、蛋白质序列的基本性质分析,理化性质分析,疏水性分析,跨膜区分析,信号肽预测,Coil,区分析,亚细胞定位,蛋白质序列分析,一 、蛋白质序列的基本性质分析理化性质分析蛋白质序列分析,3,蛋白质理化性质分析,Protparam,工具,http:/,计算以下物理化学性质:,相对分子质量 理论,pI,值,氨基酸组成 原子组成,消光系数 半衰期,不稳定系数 脂肪系数,总平均亲水性,蛋白质序列分析,蛋白质理化性质分析Protparam 工具 蛋白质序列分析,4,主要选项,/,参数,序列在线提交形式:,如果分析,SWISS-PORT,和,TrEMBL,数据库中序列,直接填写,Swiss-Prot/TrEMBL AC,号,(accession number),如果分析新序列:,直接在搜索框中粘贴氨基酸序列,蛋白质序列分析,输入,Swiss-Prot/TrEMBL AC,号,打开,protein.txt,,,将一条蛋白质序列,粘贴在搜索框中,主要选项/参数序列在线提交形式:蛋白质序列分析输入Swiss,5,输入,Swiss-Prot/TrEMBL AC,号,分不同的功能域肽段,输出结果,功能域,用户自定义区段,蛋白质序列分析,输入Swiss-Prot/TrEMBL AC号分不同的功能,6,点击不同功能域或是以直接粘贴氨基酸序列的方式得到以下结果,蛋白质序列分析,氨基酸数目,相对分子质量,理论,pI,值,氨基酸组成,原子组成,分子式,总原子数,点击不同功能域或是以直接粘贴氨基酸序列的方式得到以下结果蛋白,7,消光系数,半衰期,不稳定系数,脂肪系数,总平均亲水性,蛋白质序列分析,消光系数半衰期不稳定系数脂肪系数总平均亲水性蛋白质序列分析,8,ProtScale,工具,http:/ca.expasy.org/tools/protscale.html,氨基酸标度,表示氨基酸在某种实验状态下相对其他氨基酸在某些性质的差异,如疏水性、亲水性等,收集,50,多个文献中提供的氨基酸标度,默认值为,Hphob. Kyte & Doolittle,,做疏水性分析,蛋白质疏水性分析,蛋白质序列分析,ProtScale工具蛋白质疏水性分析蛋白质序列分析,9,20,种氨基酸的疏水,K-D,标度,氨基酸,K-D,标度,氨基酸,K-D,标度,Ile (I),4.5,Trp (W),-0.9,Val (V),4.2,Tyr (Y),-1.3,Leu (L),3.8,Pro (P),-1.6,Phe (F),2.8,His (H),-3.2,Cys (C),2.5,Asn (N),-3.5,Met (M),1.9,Asp (D),-3.5,Ala (A),1.8,Gln (Q),-3.5,Gly (G),-0.4,Glu (E),-3.5,Thr (T),-0.7,Lys (K),-3.9,Ser (S),-0.8,Arg (R),-4.5,20种氨基酸的疏水K-D标度氨基酸K-D标度氨基酸K-D标度,10,主要选项,/,参数,序列在线提交形式:,如果分析,SWISS-PORT,和,TrEMBL,数据库中序列,直接填写,Swiss-Prot/TrEMBL AC,号,(accession number),如果分析新序列:,直接在搜索框中粘贴氨基酸序列,蛋白质序列分析,输入,Swiss-Prot/TrEMBL AC,号,氨基酸标度,打开,protein.txt,,,将一条蛋白质序列,粘贴在搜索框中,主要选项/参数蛋白质序列分析输入Swiss-Prot/TrE,11,计算窗口(,7-11,),相对权重值,权重值变化趋势,计算窗口(7-11)相对权重值 权重值变化趋势,12,输出结果,输入,Swiss-Prot/TrEMBL AC,号,分不同的功能域肽段,蛋白质序列分析,功能域,用户自定义区段,输出结果蛋白质序列分析功能域用户自定义区段,13,点击不同功能域或直接粘贴氨基酸序列的方式得到以下结果,蛋白质序列疏水区域分布预测图,蛋白质序列分析,图形结果,文本结果,序列,参数,每个位置的得分,点击不同功能域或直接粘贴氨基酸序列的方式得到以下结果蛋白质序,14,跨膜区分析,膜蛋白不溶于水,分离纯化困难,不容易生长晶体,很难确定其结构,膜蛋白跨膜区可能作为膜受体,也可能是定位在膜上的锚定蛋白或离子通道蛋白,预测跨膜螺旋主要基于已知的跨膜螺旋信息,应用统计模型或神经网络方法,使用单一的预测软件准确性不太高,综合不同的软件预测结果并结合疏水性图,可以获得较好的预测,对于跨膜螺旋和膜向性预测准确率达,80%95%,蛋白质序列分析,跨膜区分析膜蛋白不溶于水,分离纯化困难,不容易生长晶体,15,跨膜区在线分析工具,蛋白质序列分析,名称,网址,说明,TMHMM,http:/services/TMHMM/,判定是否是膜蛋白,Tmpred,http:/ch.embnet.org/software/TMPRED_form.html,预测跨膜片断,TMP,http:/,用多序列比对方法预测跨膜区,跨膜蛋白数据库,Tmbase,来源于,Swiss-Prot,数据库,提供如跨膜结构区的数量、位置及其侧翼序列等信息。,数据库下载地址:,跨膜区在线分析工具蛋白质序列分析名称网址说明TMHMMhtt,16,跨膜区实例分析,蛋白质序列分析,使用,TMHMM server 2.0,对水稻瘤矮病毒(,RGDV,)外层衣壳,P8,蛋白进行跨膜区分析,。,TMHMM,基于隐马尔可夫模型预测,综合了跨膜区疏水性、电荷偏倚、螺旋长度和膜蛋白拓扑学限制等性质,可对跨膜区及膜内外区进行整体预测。,TMHMM,在区分可溶性蛋白和膜蛋白方面尤为见长,常用于判定一个蛋白是否为膜蛋白。,跨膜区实例分析蛋白质序列分析使用TMHMM server,17,贴入,RGDVp8.txt,蛋白质序列,18,贴入RGDVp8.txt蛋白质序列18,P8,蛋白的,1405,位氨基酸位于细胞膜表面,406425,位氨基酸形成一个典型的跨膜螺旋区,19,P8蛋白的1405位氨基酸位于细胞膜表面19,信号肽预测,蛋白质合成后要运送到细胞中不同的部位,有的蛋白质要通过内质网膜进入内质网腔内,最终成为,分泌蛋白,。,分泌蛋白的,N,端都有一段约,1535,个氨基酸的疏水性肽段,其功能是引导蛋白质多肽链穿过内质网膜进入腔内,称为,信号肽,(,signal peptide,)。,按照氨基酸组成及其位置特征,可将信号肽分为,4,大类:,分泌信号肽,2.,脂蛋白信号肽,3.Pilin-like,信号肽,4.,细菌素和细菌素信号肽,蛋白质序列分析,信号肽预测蛋白质合成后要运送到细胞中不同的部位,有的蛋白质要,20,信号肽主要由三个,domain,组成:,N-region,、,H-regin,和,C-region.,N-region,为正电荷区域,至少含有一个精氨酸,(R),或赖氨酸,(K).,H-region,为疏水核,一般长为,1214,个氨基酸,.,C-region,包含信号肽酶,(SPase),的剪切位点,在剪切位点的,-1,位和,-3,位上多为中性的丙氨酸,该区域也称为富含丙氨酸区域,.,N H C,N,端,C,端,蛋白质序列分析,信号肽主要由三个domain组成:N-region、H-re,21,信号肽预测在线分析工具,蛋白质序列分析,名称,网址,说明,ChloroP,http:/,预测植物中叶绿体转运肽,LipoP,http:/,预测革兰氏菌中的信号肽酶,I,、,II,的剪切位点,NetNES,http:/,预测富含亮氨酸的核输出信号,SecretomeP,http:/,预测真核生物中非经典类型的和无导肽的分泌蛋白,SignalP,http:/,预测革兰氏阳性菌(,G,+,)、预测革兰氏阴性菌,(G,-,),、真核生物信号肽,MITOPROT,http:/ihg.gsf.de/ihg/mitoprot.html,预测线粒体、叶绿体信号肽,PlasMit,/,线粒体转运肽,信号肽预测在线分析工具蛋白质序列分析名称网址说明Chloro,22,水稻条文病毒,NSVc2,蛋白信号肽预测,蛋白质序列分析,SignalP 3.0,Server,主页,NSVc2,序列,输出结果,:,C score:,剪切位点分值,S score:,信号肽分值,Y score:,综合剪切位点分值,综合两种算法,,NSVc2,含有信号肽序列,为,MHFKSYFIYTTIFNMAWG,,说明,NSVc2,蛋白可能在跨膜运输中起信号识别作用,剪切位点位于第,1819,位氨基酸,表明成熟肽始于第,18,位氨基酸,水稻条文病毒NSVc2蛋白信号肽预测蛋白质序列分析Signa,23,Coil,区分析,卷曲螺旋,(coiled coil),是蛋白质中由,2,7,条,螺旋链缠绕成麻花状结构的总称。,卷曲螺旋是控制蛋白质寡聚化的元件,含有卷曲螺旋结构的蛋白质主要是一些转录因子、骨架蛋白、动力蛋白、膜蛋白、酶等,在机体内执行着分子识别、代谢调控、细胞分化、肌肉收缩、膜通道等生物学功能。,七肽重复区,(,heptad repeat, HR,)是典型的卷曲螺旋结构类型之一,由多个七肽单元连接而成的重复序列,每个重复序列中的,7,个氨基酸残基依次用,a-b-c-d-e-f-g,表示。,蛋白质序列分析,Coil区分析卷曲螺旋(coiled coil)是蛋白质中由,24,a,、,d,位多为非极性疏水氨基酸,位于卷曲螺旋结构的内侧;,e,、,g,多为极性带电氨基酸,与,a,、,d,位残基相互作用形成疏水核心的外侧。,a,、,d,、,e,、,g,位置上的氨基酸对于整个卷曲螺旋结构的稳定性及特异性具有重要作用。,COILS Server:,http:/,根据卷曲螺旋蛋白结构数据库和包含球状蛋白序列的,PDB,次级数据库,可计算出目的序列形成卷曲螺旋的概率。,使用,COILS Server,对,RGDV P2,蛋白卷曲螺旋预测分析。,蛋白质序列分析,a、d位多为非极性疏水氨基酸,位于卷曲螺旋结构的内侧;e、g,25,已有文献研究表明,,RDV,的,P2,蛋白含有一个,N,端的疏水肽、两个七肽重复区和一个跨膜区。,RGDV P2,蛋白与,RDV P2,蛋白在病毒粒体中位置相同、大小相似,具有高度保守的氨基酸序列和相似的一级结构,表明两者可能具有相似的结构。,使用,COILS Server,分析,RGDV P2,是否由七肽重复区。,COILS Server,网页,MTK:,根据肌球蛋白、原肌球蛋白和角蛋白得到的打分矩阵,MTIDK:,由肌球蛋白、原肌球蛋白、中间纤维类蛋白、桥立蛋白和角蛋白得到的打分矩阵,蛋白质序列分析,已有文献研究表明,RDV的P2蛋白含有一个 N 端的疏水肽、,26,COILS_20424_6595.txt,COILS_20424_6595.txt,27,亚细胞定位,亚细胞定位与蛋白质的功能存在着密切的联系,通过氨基酸组成进行亚细胞定位主要基于如下原理:,不同的细胞器多具不同的理化环境,根据蛋白质的结构及表面理化特征选择性容纳蛋白,蛋白质表面直接暴露于细胞器环境中,它由序列折叠过程决定,而后者取决于氨基酸组成,蛋白质序列分析,亚细胞定位亚细胞定位与蛋白质的功能存在着密切的联系蛋白质序列,28,亚细胞定位预测步骤:,抽取一个高质量的亚细胞定位数据集并分为训练集和测试集,从选取的蛋白质数据中抽取出特征信息,选择合适的算法预测,用测试数据集对预测结果进行评价,蛋白质序列分析,亚细胞定位预测步骤:蛋白质序列分析,29,常用的亚细胞定位在线工具,蛋白质序列分析,名称,网址,TargetP,http:/,PSORT II,http:/psort.nibb.ac.jp,SubLoc,http:/,MultiLoc,bs.informatik.uni-tuebingen.de/Services/MultiLoc/,GNBSL,常用的亚细胞定位在线工具蛋白质序列分析名称网址TargetP,30,使用TargetP对RSV,NSVc2,蛋白进行亚细胞定位,TargetP,是预测真核蛋白亚细胞定位软件,主要基于叶绿体转运肽(chloroplast transit peptide, cTP)、线粒体导肽(mitochondrial targeting peptide, mTP)及分泌通路信号肽(secretory pathway signal peptide, SP)的N端序列进行预测,预测结果,:蛋白NSvc2的分泌途径为“-”型,即定位到其他细胞器。,蛋白质序列分析,使用TargetP对RSV NSVc2蛋白进行亚细胞定位蛋白,31,二、蛋白质结构域及,motif,搜索,结构域分析,Motif,搜索,蛋白质序列分析,二、蛋白质结构域及motif搜索结构域分析蛋白质序列分析,32,结构域分析,结构域,(,structure domain,)是在蛋白质三级结构中介于二级和三级结构之间的可以明显区分但又相对独立的折叠单元,每个结构域自身形成紧实的三维结构,可以独立存在或折叠,但结构域与结构域之间关系较为松散。,结构域通常由,25300,个氨基酸组成,不同蛋白质结构域数目或同一蛋白质结构域相似度差异较大,蛋白质序列分析,结构域分析结构域(structure domain)是在蛋白,33,常见的结构域主要有,5,种:,全平行结构域,反平行结构域,+,结构域,/,结构域,其他折叠类型,结构域是蛋白质的功能、结构和进化单元,结构域分析对于蛋白质结构的分类和预测有着重要作用。,蛋白质序列分析,常见的结构域主要有5种:蛋白质序列分析,34,结构域分析工具及数据库,蛋白质序列分析,工具,网址,说明,InterProScan,http:/,蛋白质结构域和功能位点分析,SMART,/,蛋白质结构域分析,数据库,网址,说明,Pfam,http:/pfam.sanger.ac.uk/,蛋白质结构域数据库,ProDom,http:/prodom.prabi.fr/prodom/current/html/form.php,蛋白质结构域数据库,结构域分析工具及数据库蛋白质序列分析工具网址说明InterP,35,使用,SMART,(,Simple Molecular Architecture Research Tool,)分析,RGDV P8,蛋白的结构功能域。,两种搜索模式:,常规模式,和基因组模式,在常规模式下粘贴,RGDV P8,序列,选,PFAM domain,蛋白质序列分析,使用SMART(Simple Molecular Archi,36,预测结果:第,1426,位是个高度保守的结构功能域,Phytoero_P8,,该结构域由多个植物呼肠孤病毒属外层衣壳蛋白,P8,序列组成,具有结构分子活性,蛋白质序列分析,点击,预测结果:第1426位是个高度保守的结构功能域Phytoe,37,蛋白质序列分析课件,38,motif,搜索,motif(,模体,),是序列中局部的保守区域。,motif,通常由,2,、,3,个二级结构单位组成,二级结构一般为,螺旋、,折叠和环,(loop),motif,作为结构域中的亚单位,表现结构域的各种生物学功能。,有几十个,motif,类,详见:,http:/en.wikipedia.org/wiki/Category:Protein_structural_motifs/,蛋白质序列分析,motif搜索motif(模体)是序列中局部的保守区域。蛋白,39,几种,motif,空间结构图,蛋白质序列分析,亮氨酸拉链,(Leucine zipper),A leucine zipper, aka leucine scissors, is a common three-dimensional structural motif in proteins. These motifs are usually found as part of a DNA-binding domain in various transcription factors, and are therefore involved in regulating gene expression. Leucine zippers are found in both eukaryotic and prokaryotic regulatory proteins, but are mainly a feature of eukaryotes.,几种motif空间结构图蛋白质序列分析亮氨酸拉链(Leuci,40,几种,motif,空间结构图,蛋白质序列分析,螺旋,-,转角,-,螺旋,(,Helix-turn-helix),In proteins, the helix-turn-helix (HTH) is a major structural motif capable of binding DNA. It is composed of two helices joined by a short strand of amino acids and is found in many proteins that regulate gene expression,几种motif空间结构图蛋白质序列分析螺旋-转角-螺旋,41,几种,motif,空间结构图,蛋白质序列分析,锌指,(Zinc finger),Cartoon representation of the Cys2His2 zinc finger motif, consisting of an helix and an antiparallel sheet. The zinc ion (green) is coordinated by two histidine residues and two cysteine residues,几种motif空间结构图蛋白质序列分析锌指(Zinc fin,42,几种,motif,空间结构图,蛋白质序列分析,罗斯曼折叠,(Rossmann fold),The Rossmann fold is a protein structural motif found in proteins that bind nucleotides, especially the cofactor NAD. The structure with two repeats is composed of six parallel beta strands linked to two pairs of alpha helices in the topological order beta-alpha-beta-alpha-beta.,几种motif空间结构图蛋白质序列分析罗斯曼折叠(Rossm,43,常见的,motif,数据库,蛋白质序列分析,数据库,网址,说明,PROSITE,http:/,基于一般的正则表达式,PROFILE,http:/,bsm/dbbrowser/jj/pfscan2.html,基于序列谱的数据库,PRINTS,http:/,Dbbrowser/bioactivity/protein2frm.html,基于蛋白质指纹技术,BLOCKS,http:/blocks.fhcrc.org,基于蛋白质序列模块,Pfam,http:/,基于隐马尔可夫模型,常见的motif数据库蛋白质序列分析数据库网址说明PROSI,44,Motif,搜索方法有两种:序列模式(,Pattern),和序列特征谱(,Profile),序列模式方法直接搜索关键的几个保守残基,如,L-x(6)-L-x(6)-L-x(6)-L (x,表示任意的氨基酸,),序列特征谱搜索是基于蛋白质序列多重比对结果,考虑了保守氨基酸在相应位置上的权重,可以检测到进化距离较远蛋白质的,motif,。,使用,PROSITE,数据库对,RGDV P2,蛋白进行,motif,搜索,点击,ScanProsite,链接,进行高级搜索,蛋白质序列分析,Motif搜索方法有两种:序列模式(Pattern)和序列特,45,参数设置:,排除高频率出现的,motif:,选中后,,N-,糖基化位点、酪蛋白激酶,II,磷酸化位点等,33,种常见,motif,序列模式将被排除在外。,不进行序列特征谱搜索,搜索自定义的,motif,这里设置序列模式为,: RK-x(2,3)-DE-x(2,3)-Y,输出结果,:,RGDV P8,蛋白中有,1,处与指定的序列模式相匹配,为,142148,位的氨基酸序列:,KAYDIPY,蛋白质序列分析,参数设置:蛋白质序列分析,46,三、空间结构预测,蛋白质的二级结构预测,蛋白质的三级结构预测,蛋白质结构预测方法评价,蛋白质序列分析,三、空间结构预测蛋白质的二级结构预测蛋白质序列分析,47,蛋白质的二级结构预测,蛋白质的二级结构是指多肽链借助于氢键沿一维方向排列成具有周期性结构的构象,主要有,螺旋,折叠,转角,无规则卷曲,蛋白质序列分析,蛋白质的二级结构预测蛋白质的二级结构是指多肽链借助于氢键沿一,48,-螺旋,(1)螺旋走向,稳定以氢键连接,氢键与轴平行。,(2)侧基,R,伸向螺旋外侧。,(3)棒状结构,高度压缩,紧密排列。,(4)规律排列,(5)由1条充分伸展的肽链的肽键平面折叠成的右手螺旋。,(6)每隔3.6个氨基酸残基螺旋上升一圈,螺距0.54,nm。,(7)1,个螺圈内有13个原子。,Hydrogen bonds (yellow dots) stabilizing an alpha-helix,-螺旋(1)螺旋走向,稳定以氢键连接,氢键与轴平行,49,-,折叠,-折叠,50,两种,-,折叠方式,反平行:,肽链的,N,端不处于同一端,氢键与肽链走向垂直。如:丝心蛋白。,两种-折叠方式反平行:,51,平行:所有肽链的,N,端处于同一端,氢键不与肽链走向垂直。如:,-,角蛋白。,平行:所有肽链的N端处于同一端,氢键不与肽链走向垂直。如:,52,4,种二级结构,4种二级结构,53,蛋白质二级结构预测网络资源,蛋白质序列分析,名称,网址,APSSP,http:/imtech.res.in/raghava/apssp/,CDM,http:/gor.bb.iastate.edu/cdm/,PSIPRED,http:/bioinf.cs.ucl.ac.uk/psipred/psiform.html,FORTER,http:/distill.ucd.ie/porter/,Predictprotein,http:/,SSpro,http:/scratch.proteomics.ics.uci.edu/,蛋白质二级结构预测网络资源蛋白质序列分析名称网址APSSPh,54,使用,SSPro,服务器预测,RGDV Pns10,蛋白质二级结构,SSPro,使用神经网络和同源分析混合进行蛋白质二级结构预测,Email,接收的,预测结果,:,双行显示,上行为目的序列,下行为对应的二级结构,其中,C,表示,Coil(,无规则卷曲,), H,表示,Helix(,螺旋,),,,E,表示,Extented(,折叠),蛋白质序列分析,蛋白质二级结构预测实例,1,使用SSPro服务器预测RGDV Pns10蛋白质二级结构蛋,55,使用,PORTER,服务器预测,HCV E,蛋白质二级结构,由于膜蛋白难以纯化,丙型肝炎病毒膜蛋白的三维至今未知,预测其膜蛋白的二级结构有利于三级结构的模建和功能研究,本例使用丙型肝炎病毒中国湖北株,(GI: 149389442),Email,接收的,预测结果,:,双行显示,上行为目的序列,下行为对应的二级结构,其中,C,表示,Coil(,无规则卷曲,), H,表示,Helix(,螺旋,),,,E,表示,Extented(,折叠),蛋白质序列分析,蛋白质二级结构预测实例,2,使用PORTER服务器预测HCV E蛋白质二级结构蛋白质序列,56,蛋白质的三级结构预测,蛋白质的生物学功能很大程度取决于蛋白质的空间结构,通过,X,射线晶体衍射、,NMR,核磁共振等物理方法测定蛋白质的三级结构以及通过生化方法研究蛋白质的功能,成本高、速度慢、效率低,无法满足蛋白质序列飞速增长的需要,生物信息学方法可对一个未知结构的蛋白质序列作出分析,预测其空间结构,蛋白质三级结构预测方法:,同源模建、折叠识别和从头预测,蛋白质序列分析,蛋白质的三级结构预测蛋白质的生物学功能很大程度取决于蛋白质的,57,同源模建,同源模建(,homology modeling),是目前较为成功的而且比较实用的蛋白质结构预测方法,同源模建的前提是已知一个或多个同源蛋白质的结构。当两个蛋白质的序列相似性大于,35%,,一般认为它们具有相同的三维结构。,同源模建的四个步骤:,搜索与目的蛋白序列相匹配的模板,模建目的蛋白结构保守区的主链、结构变异区的主链,目的蛋白侧链的模建及其优化,对模建的结构进行优化和评估,蛋白质序列分析,同源模建同源模建(homology modeling)是目前,58,同源建模法分析步骤:,多序列比对,与已有晶体结构的蛋白质序列比对,确定是否有可以使用的模板,序列相似度,25%,序列相似度,25%,,结合功能,蛋白质一级序列、二级结构或结构域信息,构建三维模型,三维模型准确性检验,Whatcheck,程序,Ramachandran plot,计算检验,手工调整多序列比对,重新拟和,构建新的模型,*,蛋白质序列分析,同源建模法分析步骤:蛋白质序列分析,59,Ranmachandran Plots,是蛋白质主链,角和,角散点图,黄色区域为最理想的,蓝色区域外为不合理的区域。若有,90%,以上的残基位于黄色区域内,表明该蛋白质具有稳定的空间结构。,Ranmachandran Plots是蛋白质主链角和角,60,蛋白质三级结构预测网站,蛋白质序列分析,工具,网址,说明,SWISS-MODEL,http:/swissmodel.expasy.org/,同源模建,CPHmodels,http:/,基于神经网络的同源模建,PHYRE,http:/,折叠识别,CASP,http:/predictioncenter.gc.ucdavis.edu,预测方法评价,EVA,http:/cubic.bioc.columbia.edu/eva,预测方法评价,蛋白质三级结构预测网站蛋白质序列分析工具网址说明SWISS-,61,蛋白质序列分析课件,62,同源模建实例,1,使用,SWISS-MODEL,同源模建,RGDV P8,蛋白的三级结构,SWISS-MODE,工作模式:,Automated mode,、,Alignment mod,和,Project mode,点击,Automated mode,结果解读,:,本例的,RGDV P8,蛋白是基于,RDV,原子结构,1fu2R,的,P,链模建的,两者序列一致性达,50.35%,目的蛋白与模板的比对及二级结构信息,其中,h:,螺旋,,s:,折叠,蛋白质序列分析,同源模建实例1使用SWISS-MODEL同源模建RGDV P,63,同源模建实例,1,结果解读,:,SWISS-MODEL,提供了三种模建质量评价方法,分别是,Anolea,、,Gromos,和,QMEAN,。绿色区域表示合适的空间结构,红色区域表示不合适的空间结构。,Anolea,和,Gromos,分数越低越好。,模建日志和模板选择日志,可使用,SWISS-PDB Viewer,软件分析目的蛋白与模板结构,并根据模建质量评价,对目的蛋白结构进行优化调整。最后,使用,PyMOL,软件渲染输出。,蛋白质序列分析,同源模建实例1结果解读:蛋白质序列分析,64,SWISS-MODEL,同源模建的,RGDV P8,蛋白三级结构图,红色为,螺旋,黄色为,-,折叠,绿色为无规则卷曲,蓝色部分是跨膜区,SWISS-MODEL同源模建的RGDV P8蛋白三级结构图,65,蛋白质序列分析课件,66,同源模建实例,2,使用,CPHmodels,同源模建,RGDV P8,蛋白的二级结构,与,SWISS-MODEL,相比,,CPHmodels,简单易学,模建结果,蛋白质序列分析,同源模建实例2使用CPHmodels同源模建RGDV P8蛋,67,SWISS-PdbView,观察三维模型,SWISS-PdbView,工具,观察和修改分子的三维结构,蛋白质序列分析,SWISS-PdbView观察三维模型SWISS-PdbVi,68,菜单栏,/,工具栏,图层窗口,主窗口,序列联配窗口,控制面板,菜单栏/工具栏图层窗口主窗口 序列联配窗口控制面板,69,蛋白质序列分析课件,70,此课件下载可自行编辑修改,供参考!,感谢您的支持,我们努力做得更好!,此课件下载可自行编辑修改,供参考!,71,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!