资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,7.4 分子对接,分子对接方法在药物设计中取得巨大的成功,已经成为基于结构药物设计的最重要的方法之一,分子对接的最初思想起源于Fisher E提出的“锁和钥匙模型”。即受体与配体的相互识别首要条件是空间结构的匹配,配体 受体 复合物,受体配体的锁和钥匙模型,Oh boy!What a perfect match,这类方法首先要建立大量化合物(例如几十至上百万个化合物)的三维结构数据库,然后将库中的分子逐一与靶标分子进行“对接”(docking),通过不断优化小分子化合物的位置(取向)以及分子内部柔性键的二面角(构象),寻找小分子化合物与靶标大分子作用的最佳构象,计算其相互作用及结合能。在库中所有分子均完成了对接计算之后,即可从中找出与靶标分子结合的最佳分子(前50名或前100名),分子对接的基本原理,药物与受体的结合强度取决于结合的自由能变化,G,结合,=,H,结合,-,T,S,结合,=-,RT,ln,K,i,大部分的分子对接法忽略了全部的熵效应,而在焓效应也只考虑配体与受体的相互作用能,即:,E,interaction,=E,vdw,+E,electrostatic,+E,h-bond,7.4.1 分子对接的基本方法,(一)刚性的分子对接方法,这种方法是最初的分子对接的方法,在对接中,小分子和蛋白质两种都保持刚性。,(1)基于最大团搜索的方法,(Clique-Search Based Approaches),对接两个刚性分子可以理解为分子在空间的匹配问题,这种匹配可以是一种形状上的互补或相互作用。如氢键受体与氢键给体的互补。搜索在三维空间中有效的条件下的最大匹配,受体的活性位点,配体,有效匹配的距离图集,受体配体的示意图,字母代表特征部分如氢键等,相应的有效匹配的图集如右,三个环性顶点组织的三角形为这个图集的一个最大团(clique),Dock对接程序中刚性对接的算法就是基于这种思想,Dock利用球集来表示受体活性位点和配体的形状,一系列的球集填充在受体活性位点的表面,这些球集代表能被配体占据的体积。配体可以用球集表示或者用自己的原子表示,在Dock程序中,四个有效匹配的对应点被考虑,先考虑配体中第一个球集与活性位点的球集的匹配,第二个点则满足d ,其中d为第二个匹配点中配体和受体的球心与第一个点球心的距离,第三个点又必需满足与前两个球心的距离限制,以上过程一直进行到找不到更多匹配点为止。,(2)基于几何哈希技术“geometric hashing”的方法,第一部分中,几何哈希表从被对接的一个配体或一系列配体中构建。哈希矩阵含有配体名字和能调整配体在空间方向的参考框架。,第二部分即识别阶段,蛋白质的特征用来识别哈希矩阵,每一次匹配表示蛋白质的特征与哈希矩阵中已定义好方位的配体相匹配,具有大量匹配信息的哈希矩阵代表着具有几个吻合特征的配体和方位,(3)基于pose clustering的方法,这种方法与几何哈希的方法相类似,也是一种基于模式识别的方法。,在LUDI模型中,如图所示,对每一个作用基团,定义作用中心和作用表面。受体的作用表面近似地用离散的点表示,和对应的配体的中心目标点相匹配。,三个氢键受体的作用表面,Pose clustering 算法中的作用点,(二)柔性对接的方法,(1)构象的系综方法,Flexibase用来储存小分子库中每个分子的一系列不同构象,用距离几何和能量最小化的方法产生构象,每个分子根据rmsd的差异选择25个系列构象。每个构象采用FLOG刚性对接的方法进行对接。,(2)片段的方法,片断的方法是处理小分子柔性的最通用的方法,配体分割成一些小的片断,这些片断可以认为是刚性构象或一个小的构象系综。一般,有两种方法来处理:,第一种方法是把一个片段放入受体的作用位点,然后加上余下的片段,这种方法称为连续构建“incremental construction”.,第二种方法把所有或一部分片段独立地放入受体的作用位点,再重新连接至到构成一个完整的配体分子,这种策略称为“放置&加”“place&join”,第一个连续构建的算法是Kuntz发展的Dock程序,首先,一个单独的锚碎片通过手工选择对接进受体的活性结合位点,并且考虑了氢键的作用。其次这个锚的优势位置主要包含有有大量匹配氢键对,高打分值,和低相似性。接着,一种回溯的算法(backtracking algorithm)用来搜索整个配体在结合位点的非重叠放置空间,在当前位置加上一个碎片后,优化的方法用来减少立体的张力和改善氢键的几何构型。最后的位置通过过滤,优化和基于力场的方法来打分评价。FlexX也是一个基于连续构建算法的对接程序,(3)遗传算法和进化规划,遗传算法开始应用到分子对接技术,其特点为:,第一步,一个称为染色体的线性表示符能够描述构型的所有自由度,找到这个染色体描述符是算法中最困难的一步。第二步,确定一个一个类似如打分函数的目标函数。,著名的GOLD软件包括了这种算法,(4)基于分子模拟的方法,模拟退火的方法,,Autodock程序就采用了这种方法,分子动力学的方法,Monte Carlo模拟,,一种统计力学的方法,这种算法中最重要的两部分是自由度的描述和能量的评价,合适的自由度描述可以避免较高能量的构象,用键角、扭曲角等内座标来描述配体的柔性比用笛卡儿空间的三维座标描述要强,同样,能量的评价也是最耗时,这一步时间必须足够的长。,评价:打分函数,每一个对接的算术都会采用平衡了时效和精确度的简单自由能预测方法,现在的打分函数主要包括三种:基于经验的回归参数的方法;基于分子力场的方法和基于知识的方法、基于知识的打分函数。,(1)基于力场的方法,只考虑热焓对能量的贡献,不考虑熵的影响,一般情况下,采用标准力场的非键作用能如真空静电和范德华作用能用作打分函数,如DOCK程序中采用AMBER的能量函数:,(2)基于经验的打分函数,基于经验的打分函数用多元回归的方法拟合各种物理参数对结合自由能的贡献,如FlexX程序中采用下列函数,所采用的方程包括,配体旋转键的个数、氢键、离子键,疏水和芳香环的,堆积作用,以及亲水作用。这种方法能快速直接地估算结合自由能,,(3)基于知识的打分函数,最初应用于蛋白质结构预测,打分函数用统计力学的方法得自蛋白质配体的复合物结构,结合自由能用函数为分子间距离的平均能的加和来计算。基于知识的打分函数是一种比较有前途的方法,虚拟筛选的具体流程,包括4个步骤:受体模型的建立;小分子库的产生;计算机筛选和命中化合物的后处理。,第一步,受体模型的建立:,蛋白质结构的准备是虚拟筛选的重要一步。虚拟筛选的蛋白靶标的结构可以从PDB库(,http:/,)中直接下载使用,也可以通过和家族中同源蛋白的序列、结构信息比较,同源模建而得,1)大分子结构获取,2)接着是,结合位点,的描述,选择合适的配体结合口袋对分子对接至关重要,一种是直接从配体受体复合物结构中抽出;,选择口袋有两种方式:,如果没有复合物结构,则需要根据生物功能如结合、突变等实验信息来手动选择结合部位,第二步,建立小分子数据库,二维结构用结构转换程序如CORINA、CONCORD实现三维结构的转化。,建好的三维结构加氢加电荷后,便可以用于对接程序。,第三步,对接和打分,这一步是虚拟筛选的核心步骤。,对接操作就是把每个小分子放到受体蛋白的配体结合位点,优化配体构像和位置,使之与受体有最佳的结合作用,给最佳结合构象打分,对所有化合物根据打分排序,然后从化合物库中挑出打分最高的小分子。,最后一步是命中化合物的后处理,通过计算分子的类药性质ADME/T(吸收absorption、器官分布distribution、体内代谢metabolism、排泄excretion 和毒性toxicity)性质的估算,排除那些不具有类药性质的分子。,可以利用一些经验规则如“五规则”等,快速排除那些不适合进一步药物开发的分子。,通过以上四步处理,大部分分子从化合物库中剔除,形成一个合理大小的化合物库,仅对这些适合成药的化合物或购买、或合成、或分离得到,然后再进行实际的生物测试。,对接方法尚需解决的问题:,分子的柔性,溶剂化效应,打分函数,分子对接的应用,靶,标,靶标分类,靶标结构,小分子库大小,所用方法,抑制剂活性,M,实验数据,AmpC,-lactamse,Hydrolase,X-ray,200k,NWU DOCK,26,X-ray,复合物,BCR,ABL,Kinase,X-ray,200k,DOCK,25,细胞的抑制活性实验,Anthrax EF,Adenylyl cyclase,X-ray,200k,NWU DOCK,20,酶动力学实验,IMPDH,Dehydrogrnase,X-ray,3500k,FlexX,30,酶动力学实验,Casein kinase II,Kinase,Homology,400k,DOCK,0.08,抑制活性、构效关系,K,通道,Ion channel,Homology,50k,DOCK,10,细胞的抑制活性实验,Thyroid homone receptor,Nuclear receptor,Homology,250k,ICM,0,75,抑制活性实验,CDK2,Kinase,X-ray,50k,LIDAEUS,2,X-ray,复合物,TGF,RK,Kinase,X-ray,200k,Catalyst,0,005,X-ray,复合物,cyclophilin,Immunophilin,X-ray,Unity/FlexX,6,细胞的抑制活性实验,tRNA guanine transglycoslase,X-ray,800k,Unity/FlexX,0.25,酶动力学实验,PfDHFR,Reductase,Homology,230k,Catalyst/DOCK,0.9,酶动力学实验,-Amylase,Hydrolase,X-ray,200k,Unity/FlexX,NMR,SPR,层析,(一)配体对CDK2,CDK4激酶选择性的研究,细胞周期蛋白依赖性蛋白激酶(cyclin-dependent kinases,CDKs)是一类Ser/Thr 蛋白激酶,直接参与调控细胞分裂周期,顾名思义,CDK只在周期蛋白Cyclin活化下才能工作.现在已经发现了13种CDK蛋白激酶和25种周期蛋白Cyclin,但它们具体的生物功能还不十分明了。其中CDK2、CDK5、CDK6已经解析出晶体结构,但CDKs的一级序列存在高的同源性,它们之间一级序列的高同源性暗示了三维结构的相似性,CDK1、CDK2、CDK4、CDK6是基于CDKs结构化学治疗癌症的主要靶标。至今为止,文献报告的CDKs抑制剂有多种,尽管化合物结构各异,但所有CDKs的小分子抑制剂有一些共同的特点:,(1)一般小的分子量(autoMS protein.pdb ,(四)用sphgen产生表征口袋形状的球集,得到protein.sph文件,该文件即为球集文件。用showsphere程序由protein.sph生成sphere.pdb,用Sybyl或Weblab等程序观看球集的分布。,(五)用showbox产生一表征网格范围的文件box.pdb,(六)计算打分用的网格文件,首先建立grid4的输入文件grid.in,所需文件还有protein.mol2和box.pdb,然后用以下命名生成网格文件:,grid4 i grid.in,(七)建立dock的输入文件dock.in,所需文件还有protein.sph、database.mol2和网格文件,然后进行dock:,dock4 i dock.in,(八)Dock完毕后得到结果文件result.info和result.mol2,以及保留恢复文件result.rst。,(九)中途非正常退出,可以用如下命令继续:,dock4 i dock.in-r,
展开阅读全文