药物及生物活性小分子发现与分子设计

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,药物及生物活性小分子发现,与分子设计,3,1,2,4,SwissTargetPrediction,DDI-CPI,SEPPA 2.0,ProTox,5,总结与展望,SwissTargetPrediction,映射活性小分子的目标分子可以预测潜在,机理,和,副作用,用于生物活性小分子靶点预测,生物活性小分子连接到蛋白或者大尺寸目标分子来调节生物活性：,SwissTargetPrediction,用于生物活性小分子靶点预测,特点：,结合,2D,和,3D,相似性测量,；,预测,可针对,五个,不同生命体,；,数据集包括,280381,个小分子与,2686,个目标相互作用，其中,66,的目标是人类的；,3D,相似性计算：,18,维特征实数向量：,每个分子通过,ChemAxon molconvert,工具生成,20,个同分异构体；,超过,20,个时，选择能量最低的构象；不足,20,个时，则选择全部构象；,Manhattan,距离：,构象,x,和,y,特征的曼哈顿距离计算公式：,最终的,3D,相似值计算公式：,dij,是,2020,组里最小曼哈顿距离，所以,s,1,是其中最大值。,SwissTargetPrediction,用于生物活性小分子靶点预测,2D,相似性计算：,指纹描述分子：,分子指纹是一个多“位,(bit),”的编码，每一位代表着某种预定义的子结构；,如果该子结构在某分子中存在；其分子指纹的对应位就是,1,，否则就是,0,；,谷本,(Tanimoto),系数定量：,Tanimoto,系数介于,0, 1,之间；,如果,A,和,B,完全相同，交集等于并集，值为,1,；如果没有任何关联，交集为空，值为,0,；,对于分子指纹进行按位计算。,FP3,分子指纹,Tanimoto,系数公式,s,2,=,SwissTargetPrediction,用于生物活性小分子靶点预测,序号,结构,名称,7,(=S),thioaldehyde,8,C(=),thioketone,9,=N(),imine,10,C()=(),hydrazone,11,C()=()C(=)(),Semicarbazone,结合,3D,和,2D,相似性得到预测分数：,3D,相似阈值：,s,1,0.65 ;2D,相似阈值：,s,2,0.3,正则化：,s,1,=(,s,1,-0.65)/(1-0.65),，,s,2,=(,s,2,-0.3)/(1-0.3),靶点预测分数,(,逻辑回归,),：,f,(,s,1, s,2,),=,(,1+,exp,-a,0,-a,1,s,1,-a,2,s,2,),-1,SwissTargetPrediction,用于生物活性小分子靶点预测,Number of heavy atoms,a,0,a,1,a,2,=10,-3.262413174,6.322854779,6.568394002,11,-3.72535153,5.095483542,6.417589941,12,-3.837945832,4.912160662,6.662162587,13,-4.165145117,5.434698827,6.386047615,14,-4.098154884,5.071728873,5.880153979,15,-4.329105882,4.856611016,5.78062749,16,-4.315410702,4.48602273,5.757473315,17,-4.748260105,4.821008953,6.427766956,Precision(,精确度,)-,预测分数曲线：,该服务器中的所有分子根据分子尺寸进行分组，每组有一个随机组成的,1000,个分子的子集用来评价精确度；,采用留一交叉验证法：通过和其他配体分子比较，每个分子进行预测；,靶点的精确度曲线：真阳性个数,/,同一组所有分子的预测目标分子个数；,根据曲线将目标分数映射到可能性值。,可能性仅仅是基于交叉验证得到的结果，,并不代表真实的预测正确可能性,SwissTargetPrediction,用于生物活性小分子靶点预测,交叉验证：,在给定的建模样本中，拿出大部分样本进行建模型，留小部分样本用刚建立的模型进行预报，并求这小部分样本的预报误差；,K,折交叉验证：初始采样分割成,K,个子样本，一个单独的子样本被保留作为验证模型的数据，其他,K-1,个样本用来训练，交叉验证重复,K,次，,10,折交叉验证最为常用；,留一验证：只使用原本样本中的一项来当做验证资料，而剩余的则留下来当做训练资料,SwissTargetPrediction,用于生物活性小分子靶点预测,Prostaglandin G/H synthase,前列腺素合成酶,Estrogen receptor,雌激素接收体,Chlorotrianisene,妇女因雌激素缺乏所引起的症状,男性前列腺增生,抑制尿酸转运蛋白重吸收,Microtubule-associated protein tau,微管相关蛋白,Muscleblind-like protein,盲肌蛋白,Lesinurad,Selexipag,Cannabinoid receptor,大麻素受体,Adenosine receptor,腺苷受体,PGI2(,前列环素,),激动剂,目的：,药物,-,药物相互作用（,DDIs,）可能导致严重的副作用，一些,DDIs,和,药物,-,蛋白相互作用,有关,，,因此,分析药物,-,蛋白相互作用组（,CPI,）结构来预测,DDIs,是有价值的,；,创新点：,根据上传分子的,CPI,构象，预测,DDIs,；,不集中在单一药物,-,蛋白相互作用，,而是考虑,了对于,所,有,目标分子,优势：,同时预测,PK,(,药代动力学,),蛋白,和,PD,(,药效动力学,),蛋白导致,的,DDIs,；,预测模型的生物学原理简单,；,交叉验证和独立验证中预测精度高,，,AUC,达到,0.85,；,错误的配体,-,蛋白复合物偶联能被,该,预测,方法,最小化,；,根据药物,-,蛋白相互作用组预测药物联合作用,DDI-CPI,ROC,曲线和,P-R,曲线：,ROC,曲线：以真阳性率为纵坐标，假阳性率（,1-,特异度）为横坐标；,P-R,曲线：以精确度为纵坐标，召回率（真阳性率）为横坐标；,根据曲线位置或曲线下面积,(AUC),进行比较。,预测,1,0,合计,实际,1,True Positive（TP）,False Negative（FN）,Actual Positive(TP+FN),0,False Positive（FP),True Negative(TN),Actual Negative(FP+TN),合计,Predicted Positive(TP+FP),Predicted Negative(FN+TN),TP+FP+FN+TN,真阳性率（召回率）：,TPR=TP,/ (,TP,+,FN,),被正确判定的正例占总的正例的比重,假阳性率（,1-,特异度）：,FPR= FP / (FP + TN),被错误判定的负,例占总的负例的比重,真阴性率（特异度）：,TNR=TN,/ (,FP+TN,),衡量类别,0,的判定能力,精确度：,Precision= TP / (TP + FP),被判定的正例中真正的正例样本的比重,根据药物,-,蛋白相互作用组预测药物联合作用,DDI-CPI,逻辑回归模型：,根据药物,-,蛋白相互作用组预测药物联合作用,DDI-CPI,Sigmoid,函数,表示取,1,的概率,的求解理论依据：极大似然估计；方法：梯度下降法,三个步骤循环更新,Version 1.0,Version 2.0,改进：,采用,逻辑回归模型代替先前的简单相加模型,；,在集聚系数和倾向系数外，添加了,ASA (,可及表面积,),和综合氨基酸指数。,优点：,相较,SEPPA1.0,在灵敏度相同的情况下，,SEPPA2.0,假阳性率显著下降。,PEPITO,SEPPA 1.0, DiscoTope-2, B-pred,和,Bpredictor,五种服务器与,SEPPA2.0,进行比较，,SEPPA2.0,平衡精度最高，,AUC,值最高。,Bpredictor,和,Epitopa,只能在给定阈值显示最佳效果。,SEPPA2.0,在平衡灵敏度和特异性、降低假阳性率的同时保证较高的预测精度。,用于,蛋白抗原空间表位预测,SEPPA 2.0,(a).,抗原表位预测的结果页,(b).,抗原,残基,的抗原性预测,分数,(c).,比较,SEPPA,图解和相关表位区域,目的：,为了减少实验成本和之后药物开发失败的风险，使用计算机模拟药物毒性具有强大优势,；,创新点：,分析已知半数致死量,(LD50),化合物的,2D,相似性和有毒碎片识别,优势：,预测方法快速；,每个季度数据更新、服务器升级简单快速；,外部数据集检验表明,ProTox,比其它毒性预测性能更好,计算机模拟啮齿动物口服毒性,ProTox,用交叉验证检验,ProTox,相对,TOPKAT R,的性能。整体命中率和单独,ProTox,命中率毒性分类，,FP24(,橘色,),，,ECFP4,指纹,(,黄色,),和,TOPKAT R (,蓝色,),。对于,FP24,和,ECFP4,分别用,0.7,和,0.5,的,Tanimoto,相似性阈值,。,药物预测可以减少实验成本；,预测方法主要是相似性的识别，非常依赖于已知药物的特性，但是耗时非常短；,在预测非常新的药物时结果较差，可以结合分子动力学模拟进行预测，对于已知性质要求低，但运算速度非常慢。,总结与展望,谢谢,

展开阅读全文

药物及生物活性小分子发现与分子设计

最新文档