资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第二章,蛋白质分子设计,Chapter two Protein Design,引言,在人体的进化过程中蛋白质执行了在人体及体外的许多,重要任务,:,酶是催化化学反应的蛋白质或者核酸分子;抗体起到防护的作用,;,从生态角度,蛋白质也是非常,理想的物质,:,生物合成不需要消耗很多能量,专一性很强,不产生副作用并且能很快降解,蛋白质没有像化学试剂那样被普遍应用,其原因,:,(1),蛋白质分子量非常大,(10 000-1 000,000,),,不能通过化学方法生产,;,(2),蛋白质的功能是在生理条件下挥发的,在其它条件下,(,如在有机溶剂中,),是不稳定的,;,(3),专一性致使其应用范围受到影响。,蛋白质应用受限的原因,蛋白质设计目前存在的问题,1,、,与天然的蛋白质比较,缺乏结构的独特性及明,显的功能优越性,2,、三级结构的确定性较差,计算机模拟,突变蛋白质产品,功能分析,基因构建,Pr,设计循环,第一节 蛋白质分子设计原理,蛋白质分子设计的流程,天然蛋白质,蛋白质结构预测,蛋白质晶体学,蛋白质三维结构,结,构与功能的关系,蛋白质突变体设计及结构预测,几何优化及蛋白质动力学研究,结果分析与原先的结构比较,蛋白质合成定位突变,分离、纯化及表征,新蛋白质,数据的输入,Pr,突变体设计的,3,个步骤,利用计算机模拟技术确定突变位点及替换的,aa,利用能量优化及动力学方法预测修饰后的蛋白质结构,预测的结构与原始的,Pr,结构比较,利用,Pr,结构,-,功能或结构,稳定相关知识及理论计算机预测新,Pr,可能具有的性质,在上述的设计工作完成后,要进行合成或突变实验并经分离、纯化及表征后得到所要求的新,Pr,;,Pr,设计的成功与否,必须要有,理论与实验的紧密相结合,在上述的设计工作完成后,要进行合成或突变实验并经分离、纯化及表征后得到所要求的新,Pr,;,Pr,设计的成功与否,必须要有,理论与实验的紧密相结合,一、蛋白质分子设计的分类,设计的目的主要有两个:,一是,为有目的的蛋白质工程改造提供设计方案和指导性信息,,如以此提高蛋白质的热、酸稳定性,增加活性,降低副作用,提高专一性等;,二是,探索蛋白质的折叠机理,,如简单蛋白质骨架的从头设计是研究蛋白质内相互作用力的类型及本质的很好途径,也为解决蛋白质折叠问题寻找定性和定量的规律。,(一)蛋白质分子设计的层次,分为两个层次:,一是,在蛋白质三维结构已知基础上的分子设计 ;,二是,在三维结构未知的情况下,借助一级结构序列信息及生物化学性质进行分子设计工作。,(二)蛋白质分子设计的分类,1,定点突变或化学修饰法,2,拼接组装设计法,3,从头设计全新蛋白质,二、蛋白质分子设计的原则,1,活性设计,2,对专一性的设计,3,Scaffold,设计,(,框架,),4,疏水基团与亲水基团需合理分布,5,最优的氨基酸侧链几何排列,蛋白质分子设计原理,内核假设,。,蛋白质的独特的折叠形式是由蛋白质内核中残基的相互作用决定。(内部十分保守的区域),Pr,内部都是密堆积,(很少有空穴大到水分子可以结合一个水分子或惰性气体),没有重叠,所有内部的氢键都是最大满足的,(主链和侧链)。蛋白质的氢键形成涉及一个交换反应,溶剂键被蛋白质键所取代,疏水及亲水基团需要合理的分布,在溶剂可及表面及不可及表面。分布代表疏水效应的主要驱动力,蛋白质分子设计原理,金属,Pr,中配位残基的替换要满足金属配位几何,。要求围绕金属中心放置合适数目的蛋白质侧链或溶剂分子,并符合正确的键长、键角以及整体的几何。,对于金属,Pr,,,围绕金属中心的第二壳层中的相互作用是重要的。,氢键的第二壳层通常涉及与蛋白质主链的相互作用。,最优的,aa,侧链几何排列,。,Pr,侧链构象由空间两个立体因素所决定,(,一是立体势垒,二是,aa,的位置,),结构及功能的专一性。,这是,Pr,设计最困难的问题,序列设计,设计,螺旋,时,应选择象,Leu,、,Glu,等易于形成,螺旋的残基;,设计,全,结构,时,应选择,Val,、,Ile,等易于形成,折叠片的残基;,而在设计,转角,时常选择,Pro-,Asn,残基对。,溶菌酶结构,例如,:,鸡卵清蛋白溶菌酶活性分子的设计,Cutte,成功设计了一个具有明显的核酸酶活性的,34,肽,该肽可水解下列底物,但活性依次降低:,polyC,、,polyA,、,polyU,、,polyG,。,其主要活性源于二聚体;而天然核酸酶仅消化,polyC,、,polyU,、,polyA,。,设计步骤,蛋白质分子设计步骤图,修正设计,获得目标蛋白质,序列合成,检测,结构信息分析,建立结构模型,设计目标,蛋白质数据库,第二节 基于天然蛋白质结构的分子设计,基于天然蛋白质结构的分子设计有两类 :,一是,进行蛋白质修饰或基因定位突变,即“小改”;,二是,进行蛋白质分子裁剪拼接,即“中改”。,一、定位突变,基于天然蛋白质结构的蛋白质分子“小改”是指对已知结构的蛋白质进行少数几个残基的修饰、替换或删除等,这是目前蛋白质工程中最广泛使用的方法,主要可分为,蛋白质修饰,和,基因定位突变,两类。,(一)定位突变的设计目标及解决方法,定位突变常见的设计,目标,是提高蛋白质的,热、酸稳定性、增加活性、降低副作用、提高专,一性,以及通过蛋白质工程手段进行结构,-,功能关,系的研究等。,Hartley,等于,1986,年完成了一个设计目标及解决的办法 :,热稳定性,对氧化的稳定性,对重金属的稳定性,pH,稳定性,提高酶学性质,引入二硫桥,增加内氢键数目,改善内疏水堆积,把,Cys,转换为,Ala,或,Ser,,把,Trp,转换为,Phe,或,Tyr,替代表面羧基,把,Met,转换为,Gln,、,Val,、,Ile,或,Leu,替换表面荷电基团,,His,、,Cys,以及,Tyr,的置换,专一性的改变,增加逆转数, 改变酸碱度,(二)定位突变的种类,要进行基因定位突变,改变,DNA,核苷酸序列,方法有很多种,如基因的化学合成、基因直接修饰法、盒式突变技术等。,根据基因突变的方式,分为以下,三类,:,插入,一个或多个氨基酸残基;,删除,一个或多个氨基酸残基;,替换,或取代一个或多个氨基酸残基。,要达到基因定位突变的目的,多采用体外重组,DNA,技术或,PCR,方法。,(三)定位突变的程序,1,建立所研究蛋白质的结构模型,可以通过,X,射线晶体学、二维核磁共振等测定结构,也可以根据类似物的结构或其他结构预测方法建立起结构模型。,2,找出对所要求的性质有重要影响的位置,在改造中如何恰当地选择,突变残基,是一个关键问题,这不仅需要分析残基的性质,同时还需要借助于已有的三维结构或分子模型。,3,预测突变体的结构,根据所选定的氨基酸残基位点及突变后的氨基酸种类,利用相关软件进行突变体的结构预测,将预测的结构与原始的蛋白质结构比较,4,构建突变体,获得突变体蛋白,依据所设计好的突变,利用化学合成或,PCR,等方法构建突变体。进行基因测序验证突变体后,将突变体进行表达,纯化蛋白质,获得所设计的新蛋白质。,5,突变体蛋白质的检验,测定新蛋白质的序列、三维结构、稳定性、催化活性等,,并与对应的天然蛋白质进行比较,检验突变设计的效果,,同时进一步修正设计方案。,蛋白质中功能,残基的鉴定,根据结构信息,确定残基的突变,突变方法鉴定突变,功能残基,利用蛋白质同源性,鉴定功能残基,(四)蛋白质中功能残基的鉴定,1,根据结构信息确定残基的突变,最有效最直接的方法,Alan,Fersht,和,GregWinter,等测定了酪氨酰,-,tRNA,合成酶突变体的三维结构,通过分析该酶的,Cys35,被结构相似的丝氨酸所取代后的结构,发现,Cys35,可能与酪氨酰腺苷酸中间体中的,3,羟基形成氢键,突变效应降低了酶的活性,证实了,Cys35,在结合腺苷酸部分的作用。,2,突变方法鉴定突变功能残基,通过引进另外一种突变来检测,随机突变技术,删除分析及连接片段扫描突变,3,利用蛋白质同源性鉴定突变功能残基,高度保守的残基与同源蛋白的共同功能以及维持结构有关 。,非保守残基是分析的靶位点,特别是对于专一性研究。,探测突变蛋白质的结构整体性质,以鉴定突变残基。,(五)定位突变的应用,RNase,T1,的结构改造是分于设计中的一个成功实例,T1,核糖核酸酶含有,104,个,aa,残基,天然酶有两对二硫键(,Cys2-Cys10,,,Cys6-Cys100,,,日本大阪大学的,Niskikawa,等人在,Tyr24,和,Asn84,位引入第三个二硫键,热稳定性增加。,T4,噬菌体溶菌酶,图,2-3 T4,溶菌酶的三维结构,(,Gassner, et al. 1996,),红色强调的为,螺旋结构域核心中被蛋氨酸置换的,10,个残基,T4,溶菌酶的三维结构,红色,强调的为,螺旋中被置换的残基,突变引入二硫键,去除,Gly,或引入,Pro,Ser38Asp,和,Asn144Asp,例:甲基对硫磷水解酶,(,Methyl parathion hydrolase, MPH,),结构和功能,的,研究,有机磷农药的长期广泛使用已经使很多水体及土壤被严重污染,而且直接影响到人们的身体健康。,有机磷水解酶,(,Organophosphorus Hydrolase,OPH),的改造:,提高对特定底物的催化效率,;,扩大底物范围,;,增加酶的稳定性,Dong Y J, 2005,目的和意义,通过对,MPH,的结晶和三维结构的测定,研究,MPH,活性中心的,结构,并通过定点突变及活性测定来验证,确定,MPH,的结构和功能的关系,为,MPH,的改性和利用,提供科学的依据和良好的材料。,OPH,是目前在各方面研究最为透彻的有机磷农药降解酶,同时也是应用最为广泛的农药降解酶,为此对甲基对硫磷水解酶的深入研究将有利于甲基对硫磷水解酶的广泛应用。,载体污染序列的分析,在进行序列分析时,首先需确定序列是否含有载体序列的污染,如果含有载体序列,需截去后再进行其他分析。,http:/,www.ncbi.nlm.nih,.,gov,/,VecScreen/,VecScreen.html,在线分析。,Match to Vector:,Strong,Moderate,Weak,Segment of suspect origin:,Segments matching vector,Strong match,:,1-113, 3838-4071,bp,。,真正的目标序列:,1143,837,bp,。,1 The nucleotide sequence including,mpd,from,Pseudomonas,sp.,WBC-3,2,Plesiomonas,sp.,M6,的甲基对硫磷水解酶基因,匹配区为,1341866,,,Identities=,1720,bp,1733 bp,(,99,),CDS: 331aa (398-1393bp),3 Pseudomonas,putida,的甲基对硫磷降解蛋白基因,匹配区为,1681393,,,Identities,=,1025,1026,(,99,),CDS: 341aa (368-1393bp),两个基因的,CDS,不一致,分别匹配于,MPH,的,398,,,368-1393bp,同源序列搜索(,Blastn,:114-3837,bp,),1,2,3,甲基对硫磷水解酶基因的分析,结论:,MPH,基因的,CDS: 3981393,(,331aa),以,1393,位的,TGA,结束的可能的,ORF,有八个,MW:34.4kD ATG:368,,,398,bp,典型的启动子序列结构,:TTGCAA-17,个氨基酸,-TATACT (320-365bp),典型的核糖体结合位点,:AGGA (381,bp,),MPH,与,OPH,的序列比对,二者同源性仅为,13.6%,,确定,MPH,是一个有别于,OPH,的蛋白质。,二者在功能上的相似性不能用蛋白的一级序列的相似性加以解释,推测二者功能上的相似性与其一级序列构成的高级结构中活性中心结构的相似性有关。,MPH,信号肽的分析预测:神经网算法,结论:信号肽(,1-35,氨基酸)。,C,值表示切割点的可能性,,,S,值表示具有信号肽的可能性,MPH,信号肽的分析预测:马尔可夫算法,信号肽的一般结构为:,正电荷的,n-region,;,疏水的,h-region,;,中性极性的,c-region,。,MPH,具有典型的信号肽的三部分结构,结论:可能的信号肽为,1-35,氨基酸。,ml,mAU,MPH,的凝胶过滤柱层析图,MPH,的,SDS-PAGE,分析,Buffer(ug,/ml),MPH (,ug,/ml),Ni,4.148,4.370,Mg,14.345,15.060,Mn,0.075,0.497,Fe,1.158,2.388,Co,0.050,0.040,Cu,10.812,9.296,Zn,0.201,272.122,MPH,中金属种类及含量的测定,MPH,的浓度:,0.217mg/ml ,结论:,MPH,中含锌离子,硒代蛋氨酸,MPH,的表达纯化,在诱导表达时添加高浓度的与蛋氨酸有共同的合成途径的终产物赖氨酸、苏氨酸、异亮氨酸,以及与赖氨酸具有相互协同作用的苯丙氨酸、亮氨酸、缬氨酸来抑制正常菌株中蛋氨酸的合成,迫使细菌利用培养基中外源添加的硒代蛋氨酸,合成硒代蛋氨酸,MPH,。,由于硒代蛋氨酸不稳定而易发生氧化,因此在纯化时需要加快速度,并在缓冲液中添加还原剂以保持还原性环境,如,5,mM,-,巯基乙醇,。,甲基对硫磷水解酶(,MPH,),P,1,晶型的晶体,甲基对硫磷水解酶(,MPH,),P,4,3,2,1,2,晶型的晶体,硒代蛋氨酸,MPH,的晶体,同源二聚体,每个亚基含有一个由两个二价金属离子组成的中心。,Ala 36,为,MPH,的,N,末端第一个氨基酸(不具有,1-35,个氨基酸序列的结构)。,甲基对硫磷水解酶(,MPH,),三维结构图,a,b,a: The binuclear metal center of the OPH;,b: The binuclear metal center of the MPH;,MPH,与,OPH,双核金属中心结构比较,a: The supposed leaving group,subsite,of the MPH;,b: The leaving group,subsite,of the OPH;,a,b,MPH,与,OPH,双核金属中心附近氨基酸比较,推测:,Trp,179,,,Phe,196,,,Phe,119,是,MPH,底物结合部位的氨基酸,甲基对硫磷水解酶中三个芳香族,氨基酸的功能研究,在,MPH,三维结构基础上可以看出,Trp,179,,,Phe,196,,,Phe,119,的芳香侧链伸向,MPH,双核金属中心的上方,处于活性中心的入口处,推测为底物结合部位的氨基酸。,通过定点突变将以上三个不同位点,突变成含有芳香环的类似氨基酸及不具芳香环侧链很小的丙氨酸,,从而获得了针对,Trp,179,,,Phe,196,和,Phe,119,三个位点的六个突变体,W179F,、,W179A,、,F196W,、,F196A,、,F119W,和,F119A,,,系统比较了突变体与野生酶的催化动力学特点,以确定三种氨基酸在,MPH,的结构和功能中的作用。,mpd,基因表达载体的构建,W179F,,,W179A,,,F196W,和,F196A,突变体基因的扩增,MPH,及其突变体的表达菌株诱导表达产物的,SDS-PAGE,分析,E.coli,BL21(DE3)/pET5a-,mpd,表达产物的,SDS-PAGE,分析,Enzyme,Specific activity,(,U/mg,),K,m,(,uM,),K,cat,(s,-1,),K,cat,/,K,m,(s,-1,mM,-1,),MPH,50.5,100%,37.4,100%,37.1,100%,993.3,100%,W179F,34.5,68.4%,48.4,129.6%,30.6,82.5%,632.6,63.7%,W179A,8.4,16.6%,74.6,199.6%,7.9,21.3%,106.1,10.7%,F196W,64.0,126.8%,50.0,133.7%,52.8,142.3%,1056.8,106.4%,F196A,4.8,9.6%,107.4,287.2%,5.0,13.5%,46.8,4.7%,F119W,29.2,57.8%,28.2,75.5%,20.8,56.1%,738.8,74.4%,F119A,32.0,63.3%,41.1,109.9%,23.8,63.9%,578.3,58.2,MPH,及其突变体的比活力及动力学参数,实验小结,利用生物信息学手段对,MPH,的结构基因的编码序列进行分析,确定,MPH,是一种结构未知的蛋白质,并在对其性质进行分析预测的基础上,通过对,MPH,的纯化、结晶获得,P,1,晶型和,P,4,3,2,1,2,晶型两种单晶以及硒标记,MPH,的晶体。通过合作利用,P,4,3,2,1,2,晶型的晶体解析了,MPH,的三维结构证实了,MPH,与,OPH,功能上的相似性可能与两种蛋白三维结构的相似性有关的推测。同时,在,MPH,三维结构的基础上,,推测,并通过定点突变及活性测定验证了,Trp,179,和,Phe,196,属于,MPH,活性中心的底物结合部位关键氨基酸,,Phe,119,在与底物结合中的作用不明显。,以上对于,MPH,的结构和功能的关系的研究,为,MPH,的改性和利用,提供科学的依据。,二、蛋白质分子拼接,例如,有一种和癌症的发病有关的癌胚抗原,CEA,(,Carcinoembryonic,antigen,),,是由七个大小和形状都非常相似的结构域拼接构成的,各结构域之间由柔韧性较大的“铰链”片段相连。研究发现,癌胚抗原的这种多结构域特征有利于它的细胞识别和粘合作用。,英国剑桥大学的,Winter,等人利用分子剪裁技术成功地在抗体分子上作了实验,(,人源化抗体,),单链抗体,scFv,结构, I,Sal,EcoRI,Xho,双酶切,different length,连接,技术路线,EcoRI,转 化,筛选、检测,蛋白质的诱导生成,表达载体构建,感受态细胞的制备,纯 化,亲和力初步测定,PCR,扩增重链、轻链策略,Linker,V,H,V,L,P3,P4,P5,P6,P7,P8,P1,P2,PCR,反应体系及反应条件,50,L,反应体系如下:,10Taq PCR Buffer 5 L,dNTP,(2.5,mM,) 3 L,Forward Primer (20,mM,) 1 L,Reverse Primer (20,mM,) 1 L,Temple 1 L,rTaq,0.3 L,Add ddH,2,O to a final volume of 50 L,PCR,循环条件为:,94 5 min,,,1,个循环;,94 45 s,,,58 30s,,,72 45 s,,,31,个循环;,72 40 s,,,25,个循环;,72 7 min,,,1,个循环。取,PCR,产物,5,L,,,1.0,的琼脂糖电泳检测。,V,H,和,V,L,的,PCR,扩增结果,7500,15000,10000,2500,100,250,500,750,1000,2000,1000,250,5000,菌落,PCR,重组子验证,1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7,2000,1000,750,500,250,100,2000,2000,1000,1000,750,750,500,500,250,250,100,改体抗体在大肠杆菌,BL21,中的表达及其纯化,1 2 3 4 5 6 7 8,97.4 KD,66.2 KD,42.7 KD,31 KD,改体抗体的,ELISA,初步测定,3,1,2,4,5,6,7,8,9,10,11,12,单链抗体,抗体:,是体液免疫应答的主要效应分子。,由两条相同的重链(,H,链)和两条相同的轻链(,L,链)组成。,双特异性单链抗体的构建与表达,单链抗体(,scFv,):,抗体可变区的重链(,V,H,),与轻链(,V,L,),通过一段多个氨基酸残基构成的弹性短肽(,Linker,),相连,融合表达出来的抗体片断。,双特异性单链抗体,能识别两种抗原并能与之结合的单链抗体(或抗体复合物)称为双特异性单链抗体。,本实验将能够各自产生抗,DON,毒素和抗,ZEN,毒素的单链抗体基因,连接融合,表达出能同时与,DON,和,ZEN,两种毒素抗原特异性结合的双特异性单链抗体。,ZEN :,玉米赤霉烯酮,DON:,小麦镰刀菌毒素,技术路线,DON,和,ZEN,抗体基因的提取 目的基因片段引物的设计,PCR,扩增目的片段,制备感受态细胞,酶切目的片段、载体,,linker,连接,转化连接产物,酶切验证重组子,表达、纯化蛋白,载体的构建,Anti-ZEN gene,Anti-DON gene,Xho,EcoR,Sal ,Nco,连 接,Linker,PCR,扩增,Anti-DON,基因,1 2 M,2000,1000,(,bp,),800,bp,750,250,100,500,PCR,扩增,Anti-ZEN,基因,M 1 2,2000,1000,750,500,250,100,(,bp,),750,bp,重组验证,PCR,验证,以重组质粒为模板,进行,Anti-DON,基因的,PCR,分析。,双特异性抗体的表达,我们知道,蛋白质的空间结构受其氨基酸序列控制,而功能又与结构密切相关。,如果能够找到构造蛋白质结构的方法,我们就能得到具有任意结构和功能的全新蛋白质,这就是蛋白质全新设计问题。,第三节 全新蛋白质设计,蛋白质从头设计概念,从头设计能够根据生物分子的活性位点特征产生,一系列的结构片段,,,通过连接这些结构片段可以构成一个,全新分子,;或者在结合腔内对一个已知的结构骨架进行化合物的衍生化。,从头设计方法可以生成全新的分子结构。,全新蛋白质设计包括,一、全新蛋白质设计方法,二、蛋白质结构的从头设计,全新蛋白质设计过程,设计目标,序列生成,结构预测,合成,构建模型,检测,(一)全新蛋白质设计程序,模拟,分析,设计,实验,一、全新蛋白质设计方法,PDA,循环,(,Protein Design Automation,),(二)全新蛋白质设计目标的选择,依据设计的目的可以分为 :,从头,结构,设计,从头,功能,设计,从头设计方法包含的步骤,1,、,活性位点分析:,对结合位点的具体的化学信息进行扫描、分析和归类。这些信息的三维空间相互关系都必须充分考虑。,2,、,配体分子构建:,采用不同的片段选择和分子构建方法,产生相应的分子结构。,3,、,评价:,使用特定的评分系统将构建的分子与活性位点的匹配性进行排序,可以选择其中优良的结果作为合成实验的对象,;,可将之做新一轮计算的起点进行优化。,二级模块单元的自组装,最简单、最直接的策略,合成单一,二级结构单元,优点,无论是从设计或合成看,是简单的;,容易合成。,缺点,涉及蛋白质的稳定性;结构的简单重复。,二、蛋白质结构的从头设计,(一)蛋白质结构的从头设计原则,1,二级结构的设计原则,螺旋,折叠片,转角,2,超二级结构和三级结构的设计原则,螺旋,(PHPPH),(,Leu,、,Glu,、,Met),C,端:,aa,+,N,端:,aa,-,N,帽,C,帽,折叠,(HPHPH或PHPHP,5-10aa),转角,(,Pro,、,Gly,中断,螺旋,,Glu,中断,折叠,),蛋白质的几种超二级结构,、,、,-,、,-,从头设计的三股式,折叠,从头设计的,20,个氨基酸残基的三股式,折叠(,Kortemme,T, et al. 1998,),(二)蛋白质结构的从头设计实例,结构骨架模板、分级迭代算法,1mg/110RMB,型异源四聚体的设计历程,结构域替换,寡聚化策略,异源专一性的计算机重新设计,23,个氨基酸自动折叠成的锌指结构(,5,),的核磁共振(,NMR,),结构,(Struthers et al., 1996, 1998),;,5,同源四聚体衍生物,T2,的,X-,射线结构(,Ali et al., 2004),;,T2,异源四聚体衍生物,hetT1,的,X-,射线结构,(Ali et al., 2005).,全新设计的,/,新蛋白,Top7,(,Brian Kuhlman,et al.,2003,),/-,筒状蛋白质的全新设计,(Offredi1, et al. 2003),(A) -sheet barrel (,红色,),(B),四周环绕,-helix barrel (,蓝色,),(C),二者由简单结构域,1,、,3,和,AB,(,灰色)连接,(D),全新,/-,筒状蛋白质。,216aa,74aa,Degrado,设计,四螺旋束,螺旋(,Helix,):,Gly,-,Glu,-,Leu,-Glu-Glu-,Leu-Leu-Leu,-,Lys,-Lys-,Leu,-Lys-Glu-,Leu-Leu,-Lys-,Gly,;,连接(,Loop,):,Pro-,Arg-Arg,;,肽链:,NH2-Met-Helix-Loop-Helix-Loop-Helix-Loop-Helix-COOH,四螺旋束,举例,Hodges,设计(周期性重复七肽),cis.poly.edu/jps/coilcoil.html,2,www.uic.edu/./phyb516/regulatoryproteinsu3.htm,3,ohioline.osu.edu/ sc172/sc172_4.html,coiled-coil,from:,www.uic.edu,/phvb516/regulatorvproteinsu3.htm,疏水性,aa,coiled-coil from:,cis.poly.edu/ips/coilcoil.html,国外的一些大型软件包主要有,SYBYL,、,BIOSYM,等。,国内的北京大学化学系(来鲁华课题组)有,PEPMODS,蛋白质分子设计系统,中国生物物理研究所(陈润生课题组),中国科学院上海生物化学研究所(丁达夫课题组)等设计有,PMODELING,程序包。,蛋白质全新设计的现状和前景,现状,蛋白质全新设计不仅使我们有可能得到,自然界不存在的具有全新结构和功能的蛋,白质,并且已经成为检验蛋白质折叠理论和,研究,蛋白质,质折叠规律的重要手段,。,由于,我们对蛋白质全新设计的理论基础即蛋白,质折叠规律的认识还不够,所以,蛋白质全,新设计,还处在探索阶段,。,前景,随着新实验技术的发展,蛋白质全新设计的速度和效率必将得到极大的提高。 如组合化学方法应用到蛋白质全新设计中必然能够大大地缩短设计的周期,并将彻底改变蛋白质全新设计的面貌,。,计算蛋白质设计包括能量表达、能量优化、侧链构象的离散化、残基分类(内核、表面、边界)、功能位点设计、专一性、稳定性及序列空间的稳健性预测、负设计等方面内容。,第四节计算蛋白质设计,一、能量表达,二、能量优化,三、序列优化,四、序列,-,结构专一性,五、底物专一性设计,六、金属结合位点的设计,第四节计算蛋白质设计,一、能量表达,蛋白质设计通过能量表达(函数)或力场计算给定序列的能量,决定系列序列的能量顺序,并了解蛋白质内的相互作用力。,能量的表达包括,内坐标项、范德华作用项、氢键项、静电相互作用项、溶剂效应项及熵效应项,等。项目的选择是根据提高实验与理论的相关性的要求进行的。改善的能量表达用于设计新的序列,完善这个循环。,在典型的分子力学力场中,,,共价键、键角、扭角,等是必须考虑的。在产生旋转构象集合(库)和修饰蛋白质主链时这些内坐标项都应该包括。通过蛋白质结构数据库的统计分析能产生很好的内坐标项。,内坐标项,第四节计算蛋白质设计,一、能量表达,范德华势涉及蛋白质内的堆积,堆积专一性对蛋白质设计非常重要。对于蛋白质内核的设计,堆积是非常关键的。,范德华势提供了侧链专一性堆积的物理基础,,据此可以设计很好折叠的蛋白质。,氢键对蛋白质设计也非常重要,特别是对,螺旋及全序列设计。在某些蛋白质设计中把氢键归入静电势中。,氢键项,范德华作用项,第四节计算蛋白质设计,一、能量表达,静电相互作用在蛋白质设计中是重要的,但静电对蛋白质稳定性的作用尚有争论。在温和的温度条件下,静电相互作用还不能补偿去溶剂能,但静电相互作用对确定专一性非常重要。在极端的条件下盐桥可以稳定蛋白质。,静电相互作用项,溶剂效应项,溶剂效应对蛋白质设计也非常重要。疏水效应是蛋白质折叠的驱动力,可以理解为暴露于水的非极性基团的能量损失依赖于表面积。计算蛋白质,-,溶剂相互作用非常费时,因此一些研究组发展了一些近似方法,利用辛醇,-,水以及气,-,水的自由能。结合自由能与分子的表面积有关,这些能量可以直接用于蛋白质内核残基,也可用于与蛋白质折叠相联系的溶剂暴露表面积相互作用的度量。,第四节计算蛋白质设计,一、能量表达,一个溶剂化的非折叠蛋白质转换一个侧链到一个折叠蛋白质,部分或完全去溶剂位置所要求的能量,与从水到气体或一个非极化溶剂是不同的。但是转化能与表面积的改变间近似的线性关系对这两种情况都应该是正确的。溶剂化能可以从溶剂可及表面的改变乘以原子的溶剂化参数得到。,在能量函数中加入溶剂化项将有助于提高蛋白质设计的理论预测与实验结果的相关性。,溶剂效应项,第四节计算蛋白质设计,一、能量表达,溶剂化与静电相互作用是紧密联系在一起的。,存在多种静电溶剂化模型:,(a),半经验模型,,依赖于溶剂化参数;,(b),最简单模型,,使用距离依赖介电常数,/,表面积计算静电相互作用。事实证明,距离依赖介电常数,/,表面积模型没有很好的相关性;近年来发展了一些新的模型,如,Karplus,于,1999,年提出的,(c),环境依赖模型、,(d),Poission-Boltzmann(PB,),连续介质模型,以及,(e) MM/PBSA,模型,等。,在蛋白质设计中有时把简单熵效应加到能量函数中。依赖于折叠的侧链熵的改变与可旋转键的数目的改变相关。这种简单的熵效应模型在蛋白质设计的实践中尚未取得成功。,熵效应项,第四节计算蛋白质设计,二、能量优化,蛋白质设计中最其挑战性的问题之一是如何从序列及结构无数可能的解中选择,最佳解。,1987,年,,Ponder,及,Richards,提出一个简化的方法:,固定主链而侧链采取统计的倾向性构象。,这种简化使搜索空间大大减小,提高了计算效率。但即使这样简化,序列结构空间仍然很大。,近年来发展的能量优化方法可分为两类,一类是,随机算法(蒙特卡罗方法和遗传算法),;,另一类是,序列结构空间半随机采样方法(死端消除法和平均值方法)。,第四节计算蛋白质设计,二、能量优化,随机方法,的优点是它们,能处理组合复杂的问题,,不要求彻底搜索,。,遗传算法,有移动的性质,它,特别适用于大序列空间的搜索并能克服势垒。,它的缺点是不能保证得到最低能量解。,自洽平均方法,(SCMF),采用侧链的多复制表达,,反复迭代直到构象的概率收敛,,这个方法也不能保证达到最低能量解。,死端消除方法,是一种组合搜索,它不断消除能量高的构象,,一般能达到全局能量最低点,,但对大的复杂体系它可能失败。近年来死端消除法有很大的发展,正在克服它的局限性,有望成为最有前景的方法。,目前能量优化方法还不能保证获得全局能量最低解,但近年来已取得很大的进展。,把随机方法与半随机,(,决定论方法,),方法结合起来可能是一种行之有效的解决间题的途径。,第四节计算蛋白质设计,三、序列优化,设计的序列必须稳定,对结构专一。蛋白质序列优化可以概括于图,2-28,。,找到序列,S,,它在室温成为构象,C,nat,的概率,P,的计算式如下:,公式中,,E,(,C,S,),为序列,S,采取构象,C,的能量;,T,是温度;,K,是玻耳兹曼常数;分母是配分函数,Z,。,要使,P,最大必须搜索整个序列空间和构象空间。,第四节计算蛋白质设计,三、序列优化,随机能量模型使问题的计算更方便。在计算中假设配分函数仅仅与序列的组成有关。从随机序列,S,0,开始,构筑结构模型,计算能量,E,0,;选择两个位置产生替换,产生新的序列,S,1,,建立,S,1,的模型,计算能量,E,1,。序列从,S,0,转换为,S,1,是接受或拒绝,应根据,Metropolis,蒙特卡罗概率,它可由公式,(2-9),得出。,T,MC,是蒙特卡罗模拟的温度参数。多次重复,直到体系达到平衡,能量保持稳定。,第四节计算蛋白质设计,四、序列,-,结构专一性,利用蛋白质折叠技术可以探测序列结构的专一性。,给定序列,S,的靶结构,X,是处于包括非自然折叠众多状态,C,之中,如果,E,(,S,X,)低于,E,(,S,C,),,则具有专一性。可以用一个,Z-,打分函数作为判据,,Z,应为负值,数据愈大愈好。,公式,(2-10),中,,代表所有构象,C,的能量平均值;,为相应的标准偏差。,第四节计算蛋白质设计,五、底物专一性设计,蛋白质工程的任务之一是,底物专一性的修饰,。一个例子是,-,溶胞蛋白酶底物专一性的修饰。肽的,P1,位置含有,Leu,或者,Ile,的蛋白具有差的底物专一性。使用上述的能量函数对结构进行优化,通过计算机筛选点突变的活性,并预测对,Leu,底物活性的改善。采用固定主链蛋白质模型,分离侧链的旋转异构体,对,1.4,10,6,序列旋转异构体构象空间进行搜索。结果表明设计酶的活性提高,200,倍。,第四节计算蛋白质设计,六、金属结合位点的设计,在蛋白质中引入一个新位点使其具有新功能是比较困难的任务。,一个方法是在已知能催化某一有兴趣的反应的蛋白质上鉴定功能基团,然后把这些功能基团转移到我们要研究的蛋白质的合适位置上。首先要确定一套残基和配体的几何形状,然后在天然蛋白质中寻找适合于结合侧链或配体的位置。,另一个方法是产生围绕活性位点的人工主链模板。,在天然蛋白质金属结合位点可以通过,n,个几何参数来描述,如配体螯合残基的位置、主链基团的取向及对称性等。这些参数可用于限制主链的位置及取向。,思考题,蛋白质分子设计的种类有哪些?各自特点?,蛋白质分子设计的原理?,蛋白质分子设计的程序?,实施蛋白质设计需遵循的原则?,Thanks for your,attention!,
展开阅读全文