约束蛋白质折叠路径的成核机制课件

上传人:仙*** 文档编号:241655537 上传时间:2024-07-13 格式:PPT 页数:34 大小:1.62MB
返回 下载 相关 举报
约束蛋白质折叠路径的成核机制课件_第1页
第1页 / 共34页
约束蛋白质折叠路径的成核机制课件_第2页
第2页 / 共34页
约束蛋白质折叠路径的成核机制课件_第3页
第3页 / 共34页
点击查看更多>>
资源描述
约束蛋白质折叠路径的成核机制约束蛋白质折叠路径的成核机制江凡(中科院物理所)江凡(中科院物理所)Phone:82649578,email:历史回顾历史回顾结构生物学是上个世纪八十年代末形成结构生物学是上个世纪八十年代末形成的新兴学科。早期测定生物大分子原子的新兴学科。早期测定生物大分子原子结构(包括蛋白质、结构(包括蛋白质、DNA和和RNA)的手的手段主要是段主要是X光晶体学。从事这方面研究的光晶体学。从事这方面研究的科学家大多是物理或化学背景。科学家大多是物理或化学背景。用于显示生物大分子三维结构的计算机用于显示生物大分子三维结构的计算机图形硬件和学术软件也刚刚开发出来。图形硬件和学术软件也刚刚开发出来。(Evans&Sutherland)其他领域的科学与技术的迅猛发展给结构生物其他领域的科学与技术的迅猛发展给结构生物学带来了强大的生命力,使它渗透到生命科学学带来了强大的生命力,使它渗透到生命科学研究的各个领域以及生物医药的研发产业。研究的各个领域以及生物医药的研发产业。因为实验测定生物大分子结构需要投入大量的因为实验测定生物大分子结构需要投入大量的人力和物力,人们很早就开始思考如何从已有人力和物力,人们很早就开始思考如何从已有的实验结构中总结出一些普遍规律。的实验结构中总结出一些普遍规律。蛋白质氨基酸序列是如何决定它的三维结构的蛋白质氨基酸序列是如何决定它的三维结构的?这些三维结构是否可以分类?有没有类似于?这些三维结构是否可以分类?有没有类似于基因编码的密码?结构与功能的关系有哪些规基因编码的密码?结构与功能的关系有哪些规律?蛋白质功能是否可以通过设计新的分子结律?蛋白质功能是否可以通过设计新的分子结构来改变?等等。构来改变?等等。随着人类基因组测序的工作顺利完成,我们进随着人类基因组测序的工作顺利完成,我们进入了后基因组时代,其中一个重要部分是结构基因入了后基因组时代,其中一个重要部分是结构基因组学研究。这项研究的目的与传统结构生物学相似,组学研究。这项研究的目的与传统结构生物学相似,但它的特点是投入前所未有的大量资金进行更大规但它的特点是投入前所未有的大量资金进行更大规模的结构测定。国际上的初步目标是确定上万个不模的结构测定。国际上的初步目标是确定上万个不同结构。大规模的投入为结构生物学提出了新的目同结构。大规模的投入为结构生物学提出了新的目的,可以归纳为以下三点:的,可以归纳为以下三点:1.确定与人类重大疾病相关的蛋白质结构。确定与人类重大疾病相关的蛋白质结构。2.测定尽可能多的序列不同源、折叠不同类的蛋白质测定尽可能多的序列不同源、折叠不同类的蛋白质结构,由此测绘蛋白质序列与结构的宇宙空间。为结构,由此测绘蛋白质序列与结构的宇宙空间。为生物信息研究提供最佳的蛋白质结构数据库。生物信息研究提供最佳的蛋白质结构数据库。3.测定一个或几个典型细胞中的所有蛋白质结构,以测定一个或几个典型细胞中的所有蛋白质结构,以研究它们是如何在细胞中工作的。从而在分子水平研究它们是如何在细胞中工作的。从而在分子水平上理解细胞的生命过程。上理解细胞的生命过程。测定蛋白质结构的方法主要有两个:测定蛋白质结构的方法主要有两个:X光晶体学和光晶体学和核磁共振。实验仪器都比较昂贵,需要专业人员操作。核磁共振。实验仪器都比较昂贵,需要专业人员操作。X光晶体学还可利用现代同步辐射光源获得更好的数据。光晶体学还可利用现代同步辐射光源获得更好的数据。实验过程都包括样品制备、数据收集、和数据分析(即实验过程都包括样品制备、数据收集、和数据分析(即结构解析)。结构解析)。具体地讲,以具体地讲,以X光晶体学为例,首先要生产足够量光晶体学为例,首先要生产足够量的高纯度的蛋白质,然后要生长出漂亮的可衍射到高分的高纯度的蛋白质,然后要生长出漂亮的可衍射到高分辨率的单晶,下一步是收集处理数据,最后要快速精确辨率的单晶,下一步是收集处理数据,最后要快速精确地计算出蛋白质的原子结构。地计算出蛋白质的原子结构。目前,结构基因组学的重要任务之一是发展一套流目前,结构基因组学的重要任务之一是发展一套流水线方法,使以上几个实验步骤全面自动化。比如开发水线方法,使以上几个实验步骤全面自动化。比如开发专用机器人。专用机器人。生物信息学概论生物信息学概论 随着物理学、化学、材料科学、和计算机科学与技术的发随着物理学、化学、材料科学、和计算机科学与技术的发展,人们已经积累了大量有关生物体系的数据,而且在继续地展,人们已经积累了大量有关生物体系的数据,而且在继续地呈指数型增加,形成了所谓海量数据。这些数据在被初步处理呈指数型增加,形成了所谓海量数据。这些数据在被初步处理之后,需要储存。为了有效的储存,需要对数据作必要的压缩。之后,需要储存。为了有效的储存,需要对数据作必要的压缩。进一步的工作可能是对各种数据作一定的抽象、简化、和整合。进一步的工作可能是对各种数据作一定的抽象、简化、和整合。这些工作的重要目的之一是对数据进行分析、研究、总结规律、这些工作的重要目的之一是对数据进行分析、研究、总结规律、构建模型、和发展理论等。这些工作是逐步深入的,而且在不构建模型、和发展理论等。这些工作是逐步深入的,而且在不同层次上都有一个基本问题,那就是研究人员之间的数据信息同层次上都有一个基本问题,那就是研究人员之间的数据信息交流的问题。交流的方式和语言与交流的内容是相互影响的,交流的问题。交流的方式和语言与交流的内容是相互影响的,两者不可能完全独立。但从科学的角度讲,这种影响是不利的,两者不可能完全独立。但从科学的角度讲,这种影响是不利的,容易产生先入为主的观点和假设。尤其在生物信息学这样的交容易产生先入为主的观点和假设。尤其在生物信息学这样的交叉领域,数据信息的交流是一个重要课题。叉领域,数据信息的交流是一个重要课题。生物信息学的特点可以用一个简单的暗箱模型来比喻。输生物信息学的特点可以用一个简单的暗箱模型来比喻。输入可以是一个分子信号或物理刺激,输出可以是细胞的反应或入可以是一个分子信号或物理刺激,输出可以是细胞的反应或对刺激的响应,从输入到输出,经过了复杂的物理化学、生物对刺激的响应,从输入到输出,经过了复杂的物理化学、生物化学和生物物理过程。这些过程的细节和机制目前还不清楚,化学和生物物理过程。这些过程的细节和机制目前还不清楚,或者是由于过于复杂而不能有效地跟踪和描述。根据暗箱操作或者是由于过于复杂而不能有效地跟踪和描述。根据暗箱操作者的不同背景,暗箱工具可以不同,可能是微分方程,神经网者的不同背景,暗箱工具可以不同,可能是微分方程,神经网络,隐马尔科夫链,支持向量机,团簇分类,统计分析,物理络,隐马尔科夫链,支持向量机,团簇分类,统计分析,物理模型,分子模型等。这些暗箱工具代表了我们对研究对象的抽模型,分子模型等。这些暗箱工具代表了我们对研究对象的抽象认识,因此,很多人认为生物信息学是生物加计算机,不无象认识,因此,很多人认为生物信息学是生物加计算机,不无道理。因为,上面提到的大多数数学模型要用计算机来实现。道理。因为,上面提到的大多数数学模型要用计算机来实现。但是物理学家(也包括化学家和生物学家)往往不满足于数学但是物理学家(也包括化学家和生物学家)往往不满足于数学符号和参数,而想要理解一个系统的分子机制,也就是想要知符号和参数,而想要理解一个系统的分子机制,也就是想要知道微观世界里的故事。道微观世界里的故事。内容提要内容提要Levinthals Paradox蛋白质二级结构预测的现状蛋白质二级结构预测的现状近邻法近邻法基于序列结构局域团簇的可靠度基于序列结构局域团簇的可靠度成核部分的可预测性成核部分的可预测性(80%)高于其他部分高于其他部分表面可及度分析证明成核部分相对稳定表面可及度分析证明成核部分相对稳定三维结构的启示三维结构的启示理论与实验的比较理论与实验的比较成核机制在折叠模型中的作用约束折叠路成核机制在折叠模型中的作用约束折叠路径的构象系综径的构象系综Levinthal推测了一个含有推测了一个含有100个氨基酸的多肽个氨基酸的多肽链在溶液中进行折叠所需要的时间。假设每个链在溶液中进行折叠所需要的时间。假设每个氨基酸有氨基酸有10个可能的构象,而对每个构象取样个可能的构象,而对每个构象取样需要需要10-13秒(即一个原子或分子热振动所需要秒(即一个原子或分子热振动所需要的时间),那么因为这个多肽链有的时间),那么因为这个多肽链有10100个不同个不同的构象,所以它需要的构象,所以它需要1077年才能遍历所有构象,年才能遍历所有构象,找到能量最低点,从而完成折叠。找到能量最低点,从而完成折叠。Anfinsen证明蛋白质可以证明蛋白质可以in vitro折叠和反折叠。折叠和反折叠。Levinthals ParadoxA short history of secondary structure prediction1.Chou&Fasman(1975):amino acid frequency table of helix,sheet,coil2.Garnier et al.(1986):nearest neighbor and information theory3.Bohr et al.(1988),Qian&Sejnowski(1988):neural network4.Rost&Sander(1993-2002):PHD(tandem neural networks)and PSI-Blast profile method5.Baldi et al.(1999):neural network and profiles6.Other machine learning methods:SVM(Hua&Sun),Hidden Markov Model,et al.ADGHEGHRGHRHSHGKIKRWHKLLTDMKVDSFSDKREIRRYMHRGHRHSHGKIKRWHKLLTDM102020000000002221111Store sequence segments with the same secondary structure as the center residue in one file.For helix(0),sheet(1),coil(2),there are a total of three files.aabb Similarity score between two seqence segments are calculated according to BLOSUM62.The highest Ntop(=80)scores are averaged to find m.Where i is 2nd structure code.Segment lengthNatopSigma_cutoff(s)%predictedcQ3dQhelixQstrandQcoil211N/Ab10048.0960.4641.4651.79212N/A10053.3361.1645.8754.66215N/A10058.1464.7549.2560.372110N/A10061.7367.1453.5363.572120N/A10065.6868.9157.9670.852140N/A10068.6271.4459.9474.442180N/A10068.5171.0561.2275.5321160N/A10068.3571.6660.5375.1321320N/A10068.1272.1658.3674.4221640N/A10067.5472.3258.1573.521180N/A10067.2972.7756.3272.77580N/A10062.1663.7656.1166.5321800.223.3585.6690.7983.8588.64Evaluation of secondary structure prediction using different parametersSegment lengthNatopSigma_cutoff(s)%predictedcQ3dQhelixQstrandQcoil2180N/Ab10063.6265.2754.4673.9721800.320.6982.5889.6981.8188.95Evaluation of full jack-knife test Comparison with other nearest neighbor methods1.68.5%Levin etal.1993(not Q3 and not jack-knife).2.72.2%Mehta etal.1995(not Q3 and not jack-knife).1.Most algorithms for protein secondary structure prediction currently in use are based on machine learning techniques.The current performance for predicting protein secondary structure has been approaching 80%.2.By realizing the fact that the difficulty in achieving accurate prediction,allowing reasonable inherent variation,lies with the difficulty in taking into account of the effect of long-range interactions in influencing the secondary structure formation,a brute-force algorithm(vs.learning)is proposed in the current work.3.This algorithm is intended to perform well for those secondary structures in a protein whose formation is dominated by short-range interactions and hence neighboring sequences.4.This algorithm performed very well and the z-score defined was indeed correlated with the reliability of prediction,reflecting the extent of local sequence clustering.Conclusions on secondary structure predictionAccessible surface areas of amino acids of correctly predicted residuesAmino acidaAverage area in folded proteinbAverage areac over three statesHelixcStrandcCoilcA31.521.7521.717.2139.07C13.911.8011.297.3121.90D60.973.4471.2837.1678.03E72.389.9187.7856.33116.04F28.721.1523.8017.6843.35G25.233.8717.723.3436.27H46.757.4864.1134.3069.09I23.015.3118.5612.3937.03K110.399.2497.2173.19119.09L29.020.4522.9414.1843.27M30.527.4529.0119.1958.46N62.271.5364.3932.7279.66P53.762.0350.7331.9163.52Q74.080.5080.6753.7197.47R93.896.7197.2469.85122.22S44.243.2340.1719.0655.33T46.043.2938.9032.6964.53V23.514.9019.0012.0038.38W41.736.0031.8733.7778.55Y59.139.5044.6933.6070.70Previously,we have been puzzled by the fact that hydrophobic amino acids appear both buried and exposed in proteins.This finding shows that the physico-chemical properties of amino acids are consistent with the buried and exposed classification of amino acids in proteins.-Fred RichardsImplication for protein foldingThe correctly predicted nucleation residues play an important role in stabilizing the protein structure.Furthermore,since the secondary structure of these residues are determined by the local,short-range interaction,they also play a role in protein folding.They form native-like secondary structures first as the nucleation residues for the folding of the tertiary structure.Therefore,these nucleation residues not only maintain the protein stability,but also drive the protein folding and determine the folding pathway.Protein nuclei are also the protein core(one and the same).There is the possibility that the protein folding code exists,so-called the second half of the genetic code.Revelation from the spatial arrangement of folding nucleusFersht proposed a nucleation-condensation mechanism in which the formation of secondary structure occurs in parallel with the formation of tertiary structure.Fershts pioneering experiment in charactering an intermediate in barnase using Phi-value analysisOther things being equal:folding pathway,transition state position,no new interactions made except missing a few owing to reduced side-chain,no structure/conformation reorganization.Our finding is consistent with both the diffusion-collision and nucleation-condensation mechanismsResidues with higher reliability scores correspond to more stable and more native-like secondary structures.Because the accessible surface areas are calculated using the native folded structures,the stability is most realized when the tertiary structure has been formed.Comparison between experiment and theoryPredicting 40%will get approximately 40%match by chance.If the predicted 40%is less than 100%correct,the match will be lower.Red regions are experimentally determined nucleation residues.Diffusion-collision vs.nucleation-condensationThree-state folders have higher match rate than two-state folders,excluding outliers and inaccurate predictions:53.3 vs.49.8All-beta proteins:40.1 for 5 proteins,50.7 if excluding src SH3 and a-spectrin SH3Beta strand conformation can form rapidly in unfolded state than helix.Intermediate of strands folding into sheet is hard to detect because they are not stable,owing to exposed hydrophobic core,until tertiary structure is formed.(e.g.TNfn3:1ten,TI I27:1tit).So even though they are two-state folders,they may use a mixed mechanism.PNAS,Ferhst and co-workers,(2003).New view combines energy landscape with classic framework mechanism to require an obligatory nucleus along the pathwaysEnergy landscapeComparison of 1.Experiment2.Nucleation residues from secondary structure prediction3.Effective contact-order,folding routes by local-loop-closure(topology)and consolidation of side-chain contact clusters(graph of contact map)
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!