药物及生物活性小分子发现与分子设计

上传人:门**** 文档编号:243398151 上传时间:2024-09-22 格式:PPT 页数:23 大小:4.62MB
返回 下载 相关 举报
药物及生物活性小分子发现与分子设计_第1页
第1页 / 共23页
药物及生物活性小分子发现与分子设计_第2页
第2页 / 共23页
药物及生物活性小分子发现与分子设计_第3页
第3页 / 共23页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,药物及生物活性小分子发现,与分子设计,3,1,2,4,SwissTargetPrediction,DDI-CPI,SEPPA 2.0,ProTox,5,总结与展望,SwissTargetPrediction,映射活性小分子的目标分子可以预测潜在,机理,和,副作用,用于生物活性小分子靶点预测,生物活性小分子连接到蛋白或者大尺寸目标分子来调节生物活性:,SwissTargetPrediction,用于生物活性小分子靶点预测,特点:,结合,2D,和,3D,相似性测量,;,预测,可针对,五个,不同生命体,;,数据集包括,280381,个小分子与,2686,个目标相互作用,其中,66,的目标是人类的;,3D,相似性计算:,18,维特征实数向量:,每个分子通过,ChemAxon molconvert,工具生成,20,个同分异构体;,超过,20,个时,选择能量最低的构象;不足,20,个时,则选择全部构象;,Manhattan,距离:,构象,x,和,y,特征的曼哈顿距离计算公式:,最终的,3D,相似值计算公式:,dij,是,2020,组里最小曼哈顿距离,所以,s,1,是其中最大值。,SwissTargetPrediction,用于生物活性小分子靶点预测,2D,相似性计算:,指纹描述分子:,分子指纹是一个多“位,(bit),”的编码,每一位代表着某种预定义的子结构;,如果该子结构在某分子中存在;其分子指纹的对应位就是,1,,否则就是,0,;,谷本,(Tanimoto),系数定量:,Tanimoto,系数介于,0, 1,之间;,如果,A,和,B,完全相同,交集等于并集,值为,1,;如果没有任何关联,交集为空,值为,0,;,对于分子指纹进行按位计算。,FP3,分子指纹,Tanimoto,系数公式,s,2,=,SwissTargetPrediction,用于生物活性小分子靶点预测,序号,结构,名称,7,(=S),thioaldehyde,8,C(=),thioketone,9,=N(),imine,10,C()=(),hydrazone,11,C()=()C(=)(),Semicarbazone,结合,3D,和,2D,相似性得到预测分数:,3D,相似阈值:,s,1,0.65 ;2D,相似阈值:,s,2,0.3,正则化:,s,1,=(,s,1,-0.65)/(1-0.65),,,s,2,=(,s,2,-0.3)/(1-0.3),靶点预测分数,(,逻辑回归,),:,f,(,s,1, s,2,),=,(,1+,exp,-a,0,-a,1,s,1,-a,2,s,2,),-1,SwissTargetPrediction,用于生物活性小分子靶点预测,Number of heavy atoms,a,0,a,1,a,2,=10,-3.262413174,6.322854779,6.568394002,11,-3.72535153,5.095483542,6.417589941,12,-3.837945832,4.912160662,6.662162587,13,-4.165145117,5.434698827,6.386047615,14,-4.098154884,5.071728873,5.880153979,15,-4.329105882,4.856611016,5.78062749,16,-4.315410702,4.48602273,5.757473315,17,-4.748260105,4.821008953,6.427766956,Precision(,精确度,)-,预测分数曲线:,该服务器中的所有分子根据分子尺寸进行分组,每组有一个随机组成的,1000,个分子的子集用来评价精确度;,采用留一交叉验证法:通过和其他配体分子比较,每个分子进行预测;,靶点的精确度曲线:真阳性个数,/,同一组所有分子的预测目标分子个数;,根据曲线将目标分数映射到可能性值。,可能性仅仅是基于交叉验证得到的结果,,并不代表真实的预测正确可能性,SwissTargetPrediction,用于生物活性小分子靶点预测,交叉验证:,在给定的建模样本中,拿出大部分样本进行建模型,留小部分样本用刚建立的模型进行预报,并求这小部分样本的预报误差;,K,折交叉验证:初始采样分割成,K,个子样本,一个单独的子样本被保留作为验证模型的数据,其他,K-1,个样本用来训练,交叉验证重复,K,次,,10,折交叉验证最为常用;,留一验证:只使用原本样本中的一项来当做验证资料, 而剩余的则留下来当做训练资料,SwissTargetPrediction,用于生物活性小分子靶点预测,Prostaglandin G/H synthase,前列腺素合成酶,Estrogen receptor,雌激素接收体,Chlorotrianisene,妇女因雌激素缺乏所引起的症状,男性前列腺增生,抑制尿酸转运蛋白重吸收,Microtubule-associated protein tau,微管相关蛋白,Muscleblind-like protein,盲肌蛋白,Lesinurad,Selexipag,Cannabinoid receptor,大麻素受体,Adenosine receptor,腺苷受体,PGI2(,前列环素,),激动剂,目的:,药物,-,药物相互作用(,DDIs,)可能导致严重的副作用,一些,DDIs,和,药物,-,蛋白相互作用,有关,,,因此,分析药物,-,蛋白相互作用组(,CPI,)结构来预测,DDIs,是有价值的,;,创新点:,根据上传分子的,CPI,构象,预测,DDIs,;,不集中在单一药物,-,蛋白相互作用,,而是考虑,了对于,所,有,目标分子,优势:,同时预测,PK,(,药代动力学,),蛋白,和,PD,(,药效动力学,),蛋白导致,的,DDIs,;,预测模型的生物学原理简单,;,交叉验证和独立验证中预测精度高,,,AUC,达到,0.85,;,错误的配体,-,蛋白复合物偶联能被,该,预测,方法,最小化,;,根据药物,-,蛋白相互作用组预测药物联合作用,DDI-CPI,ROC,曲线和,P-R,曲线:,ROC,曲线:以真阳性率为纵坐标,假阳性率(,1-,特异度)为横坐标;,P-R,曲线:以精确度为纵坐标,召回率(真阳性率)为横坐标;,根据曲线位置或曲线下面积,(AUC),进行比较。,预测,1,0,合计,实际,1,True Positive(TP),False Negative(FN),Actual Positive(TP+FN),0,False Positive(FP),True Negative(TN),Actual Negative(FP+TN),合计,Predicted Positive(TP+FP),Predicted Negative(FN+TN),TP+FP+FN+TN,真阳性率(召回率):,TPR=TP,/ (,TP,+,FN,),被正确判定的正例占总的正例的比重,假阳性率(,1-,特异度):,FPR= FP / (FP + TN),被错误判定的负,例占总的负例的比重,真阴性率(特异度):,TNR=TN,/ (,FP+TN,),衡量类别,0,的判定能力,精确度:,Precision= TP / (TP + FP),被判定的正例中真正的正例样本的比重,根据药物,-,蛋白相互作用组预测药物联合作用,DDI-CPI,逻辑回归模型:,根据药物,-,蛋白相互作用组预测药物联合作用,DDI-CPI,Sigmoid,函数,表示取,1,的概率,的求解理论依据:极大似然估计;方法:梯度下降法,三个步骤循环更新,Version 1.0,Version 2.0,改进:,采用,逻辑回归模型代替先前的简单相加模型,;,在集聚系数和倾向系数外,添加了,ASA (,可及表面积,),和综合氨基酸指数。,优点:,相较,SEPPA1.0,在灵敏度相同的情况下,,SEPPA2.0,假阳性率显著下降。,PEPITO,SEPPA 1.0, DiscoTope-2, B-pred,和,Bpredictor,五种服务器与,SEPPA2.0,进行比较,,SEPPA2.0,平衡精度最高,,AUC,值最高。,Bpredictor,和,Epitopa,只能在给定阈值显示最佳效果。,SEPPA2.0,在平衡灵敏度和特异性、降低假阳性率的同时保证较高的预测精度。,用于,蛋白抗原空间表位预测,SEPPA 2.0,(a).,抗原表位预测的结果页,(b).,抗原,残基,的抗原性预测,分数,(c).,比较,SEPPA,图解和相关表位区域,目的:,为了减少实验成本和之后药物开发失败的风险,使用计算机模拟药物毒性具有强大优势,;,创新点:,分析已知半数致死量,(LD50),化合物的,2D,相似性和有毒碎片识别,优势:,预测方法快速;,每个季度数据更新、服务器升级简单快速;,外部数据集检验表明,ProTox,比其它毒性预测性能更好,计算机模拟啮齿动物口服毒性,ProTox,用交叉验证检验,ProTox,相对,TOPKAT R,的性能。整体命中率和单独,ProTox,命中率毒性分类,,FP24(,橘色,),,,ECFP4,指纹,(,黄色,),和,TOPKAT R (,蓝色,),。对于,FP24,和,ECFP4,分别用,0.7,和,0.5,的,Tanimoto,相似性阈值,。,药物预测可以减少实验成本;,预测方法主要是相似性的识别,非常依赖于已知药物的特性,但是耗时非常短;,在预测非常新的药物时结果较差,可以结合分子动力学模拟进行预测,对于已知性质要求低,但运算速度非常慢。,总结与展望,谢 谢,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 小学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!