结构生物信息学基础知识课件

上传人:文**** 文档编号:242187699 上传时间:2024-08-15 格式:PPT 页数:51 大小:5.02MB
返回 下载 相关 举报
结构生物信息学基础知识课件_第1页
第1页 / 共51页
结构生物信息学基础知识课件_第2页
第2页 / 共51页
结构生物信息学基础知识课件_第3页
第3页 / 共51页
点击查看更多>>
资源描述
生物信息学培训班,生物信息学培训班,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,构造生物信息学根底知识,构造生物信息学根底知识构造生物信息学根底知识Outline生物学根本知识,常用的生物数据及数据库处理,生物数据的根本处理方法,构造生物信息学根底知识构造生物信息学根底知识构造生物信息学根,1,Outline,生物学根本知识,常用的生物数据及数据库处理,生物数据的根本处理方法,Outline生物学根本知识,生物学两种主要信息载体,生物根底,核酸分子 与 蛋白质分子,生物学两种主要信息载体生物根底核酸分子 与 蛋白质分子,核酸分子,生物根底,核酸的根本单元式核苷酸。核苷酸有一个磷酸基团、一个糖基团和一个含有氮原子的碱基基团构成。,根据糖基不同,核苷酸可分为:,脱氧核糖核苷酸,核糖核苷酸,碱基,糖基,磷酸,DNA(,脱氧核糖核酸,),RNA(,核糖核酸,),核苷,+,磷酸,碱基,+,糖基,核苷酸,核酸,聚合,核酸分子生物根底核酸的根本单元式核苷酸。核苷酸有一个磷酸基团,核酸分子, DNA,和,RNA,生物根底,DNA的磷酸基团和糖基团都一样,碱基分为4种类型:,腺嘌呤 - A,鸟嘌呤 - G,胞嘧啶 - C,胸腺嘧啶 - T,A,只能与,T,配对,C,只能与,G,配对,A,C,G,T,核酸分子 DNA和RNA生物根底DNA的磷酸基团和糖基团,核酸分子, DNA,和,RNA,生物根底,多个脱氧核苷酸通过5和3形成磷酸二酯键连接而成的长DNA单链。,通过碱基互补配对形成互补链,两条相互平行的DNA单链形成双螺旋构造。,A - U,C - G,G - U,RNA通常是单链形式。,RNA只有尿嘧啶U而没有胸腺嘧啶T,DNA主要存在于细胞核内,RAN在细胞核外也存在。,配对原那么:,核酸分子 DNA和RNA生物根底多个脱氧核苷酸通过5和,蛋白质分子,生命活动的执行者,生物根底,蛋白质是由氨基酸通过肽键相链接形成的聚合物。,氨基酸-蛋白质的根本组成单位,存在自然界中的氨基酸有300余种,但组成人体蛋白质的氨基酸仅有20种。,氨基酸有一个位于中心的碳原子,(C,),以及用共价键相连的四个基团组成。,氨基酸的通式,R,C,氨基,羧基,侧链,甘氨酸,H,CH,3,丙氨酸,氨基酸之间的差异主要表达在侧链局部,蛋白质分子 生命活动的执行者生物根底蛋白质是由氨基酸通过,蛋白质分子,生命活动的执行者,生物根底,20,种标准氨基酸,氨基酸名称,英文缩写,简 写,氨基酸名称,英文缩写,简 写,甘氨酸,Gly,G,丝氨酸,Ser,S,丙氨酸,Ala,A,苏氨酸,Thr,T,缬氨酸,Val,V,天冬酰胺,Asn,N,异亮氨酸,Ile,I,谷酰胺,Gln,Q,亮氨酸,Leu,L,酪氨酸,Tyr,Y,苯丙氨酸,Phe,F,组氨酸,His,H,脯氨酸,Pro,P,天冬氨酸,Asp,D,甲硫氨酸,Met,M,谷氨酸,Glu,E,色氨酸,Trp,W,赖氨酸,Lys,K,半胱氨酸,Cys,C,精氨酸,Arg,R,蛋白质分子 生命活动的执行者生物根底20种标准氨基酸氨基,蛋白质分子,生命活动的执行者,生物根底,氨基酸之间的差异主要表达在侧链局部,氨基酸的侧链决定了不同氨基酸的物理化学性质,R,C,氨基,羧基,侧链,蛋白质分子 生命活动的执行者生物根底氨基酸之间的差异主要,蛋白质分子,生命活动的执行者,生物根底,氨基酸的分类,碱性氨基酸,酸性氨基酸,极性中性氨基酸,非极性疏水氨基酸,蛋白质分子 生命活动的执行者生物根底氨基酸的分类碱性氨基,蛋白质分子的构造,生物根底,蛋白质分子的构造生物根底,蛋白质分子的构造,生物根底,蛋白质的一级构造,定义:蛋白质的一级构造指多肽链中氨基酸的排列顺序。,主要化学键:肽键,一级构造是蛋白质空间构象和特异生物功能的根底。,胰岛素的一级构造,蛋白质分子的构造生物根底蛋白质的一级构造定义:蛋白质的一级构,蛋白质分子的构造,生物根底,蛋白质的二级构造,定义:蛋白质分子中某一段肽链的局部空间构造,即该段肽链主链骨架原子的相对空间位置,并不涉及氨基酸残基侧链的构象。,主要化学键:氢键,H,H,H,H,肽单元,(peptide unit),蛋白质分子的构造生物根底蛋白质的二级构造定义:蛋白质分子中某,蛋白质分子的构造,生物根底,肽平面及二面角,蛋白质分子的构造生物根底肽平面及二面角,蛋白质分子的构造,生物根底,二级构造主要有以下几种形式:,螺旋,(,-helix),折叠,(,-sheet),转角,(,-turn),无规卷曲,(coil),多肽链中有,60%,的区段为,螺旋和,折叠,蛋白质分子的构造生物根底二级构造主要有以下几种形式:螺旋,蛋白质分子的构造,生物根底,-,螺旋,多肽链主链围绕中心轴形成右手螺旋状构造,侧链伸向螺旋外侧,每个氨基酸残基第n个的羰基与多肽链 C 端方向的第4个残基第4+n个的酰胺氮形成氢键,蛋白质分子的构造生物根底-螺旋多肽链主链围绕中心轴形成右手,蛋白质分子的构造,生物根底,-,折叠,多肽链充分伸展,相邻肽单元之间折叠成锯齿状构造,侧链位于锯齿构造的上下方,两段以上的 -折叠构造平行排列 ,两链间可顺向平行,也可反向平行,两链间的肽键之间形成氢键,以稳固 -折叠构造。氢键与螺旋长轴垂直。,蛋白质分子的构造生物根底 -折叠多肽链充分伸展,相邻肽单元,蛋白质分子的构造,生物根底,-,转角,含4个氨基酸残基,第一个残基的 CO 基团和第四个残基的 NH基团之间形成氢键,使多肽链的方向发生“U形改变。,蛋白质分子的构造生物根底 -转角含4个氨基酸残基,第一个残,蛋白质分子的构造,生物根底,超二级构造,在蛋白质分子中,特别是球状蛋白质中,由假设干相邻的二级构造单元(即-螺旋、-折叠和-转角等)彼此相互作用组合在一起,形成有规那么、在空间上能识别的二级构造组合体,充当三级构造的构件单元,称超二级构造。,蛋白质分子的构造生物根底超二级构造在蛋白质分子中,特别是球状,蛋白质分子的构造,生物根底,蛋白质三级构造,在二级构造根底上的肽链再折叠形成的构象。,整条肽链中全部氨基酸残基的相对空间位置,即肽链中所有原子在三维空间的排布位置。,蛋白质分子的构造生物根底蛋白质三级构造在二级构造根底上的肽链,蛋白质分子的构造,生物根底,构造域domain,多肽链在超二级构造根底上进一步绕曲折叠而成的相对独立的三维实体称构造域,蛋白质构造中具有特异构造和独立功能的区域。,蛋白质分子的构造生物根底构造域domain多肽链在超二级,蛋白质分子的构造,生物根底,构造域domain,蛋白质分子的构造生物根底构造域domain,蛋白质分子的构造,生物根底,肌红蛋白的三级构造,分子中多肽主链由长短不等的8段直的螺旋组成,最大的螺旋含23个残基,最短的7个残基,分子中几乎80%的氨基酸残基都处于螺旋区中。,拐弯是由18个残基组成的无规那么卷曲。,蛋白质分子的构造生物根底肌红蛋白的三级构造分子中多肽主链由长,蛋白质分子的构造,生物根底,蛋白质四级构造,每条完整三级构造的多肽链,称为亚基 (subunit),蛋白质分子中各亚基的空间排布及亚基接触部位的布局和相互作用,称为蛋白质的四级构造。,蛋白质分子的构造生物根底蛋白质四级构造每条完整三级构造的多肽,Outline,生物学根本知识,常用的生物数据及数据库处理,生物数据的根本处理方法,Outline生物学根本知识,生物信息学数据库,Background,生物分子数据,高速增长,分子生物学,及相关领域研究人员,迅速获得最新实验数据,建立生物分子数据库,生物信息学数据库Background生物分子数据分子生物学建,生物信息学数据库,Background,应满足,5,个方面的主要需求:,1时间性,2注释,3支撑数据,4数据质量,5集成性,生物信息学数据库Background应满足5个方面的主要需求,生物信息学数据库,Background,生物信息数据库具备的几个明显特征:,数据库的更新速度不断加快,数据库使用频率增长更快,数据库的复杂程度不断增加,数据库网络化,面向应用,先进的软硬件配置,生物信息学数据库Background生物信息数据库具备的几个,蛋白质构造数据库,Background,PDB Protein Data Bank,是目前最主要的蛋白质分子构造数据库。,1970由美国Brookhaven国家实验室建立,1988年,由美国RCSB(research collaboratory for structural biology)管理;,含有通过实验X射线晶体衍射,核磁共振NMR,冷冻电子显微镜测定的生物大分子蛋白质、核酸、糖类、复合物的三维构造。,以文本格式存放数据,包括原子坐标、物种来源、测定方法、提交者信息、一级构造、二级构造等;,蛋白质构造数据库BackgroundPDB Protei,蛋白质构造数据库,Background,PDB Protein Data Bank,蛋白质构造数据库BackgroundPDB Protei,蛋白质构造数据库,Background,PDB Protein Data Bank,Jan 08, 2021,蛋白质构造数据库BackgroundPDB Protei,蛋白质构造数据库,Background,PDB,的文件格式,物种来源、测定方法、提交者信息、,蛋白质序列 一级构造,蛋白质二级构造,构成蛋白质的氨基酸的每个原子的三维坐标,蛋白质构造数据库BackgroundPDB的文件格式物种来源,蛋白质构造分类数据库,Background,SCOP (Structural Classification of Proteins),提供构造的蛋白质之间构造和进化关系的详细描述。,按构造和进化关系对蛋白质分类,分类结果是一个具有层次构造的树,其主要的层次是家族、超家族和折叠:,家族:具有明显的进化关系,超家族:具有远源进化关系,具有共同的进化源,折叠类:主要构造相似,ROOT(,根,),CLASS(,类,),FOLD(,折叠,),SUPERFAMILY (,超家族,),FAMILY(,家族,),PROTEIN(,蛋白,),SPECIES(,种,),蛋白质构造分类数据库BackgroundSCOP (Stru,蛋白质构造分类数据库,Background,SCOP (Structural Classification of Proteins),蛋白质构造分类数据库BackgroundSCOP (Stru,蛋白质构造分类数据库,Background,CATH (Class, Architecture, Topology, Homology),CATH数据库的分类根底是蛋白质构造域。,与SCOP不同的是,CATH把蛋白质分为4类,即a主类、b主类,a-b类a/b型和a+b型和低二级构造类。,:/ cathdb.info,类型(Clase):二级构造,构架(Architecture):超二级构造排列方式,拓扑构造(Topology):二级构造的形状和二级构造间的联系,同源性(Homology):序列同源性,蛋白质构造分类数据库BackgroundCATH (Clas,Outline,生物学根本知识,常用的生物数据及数据库处理,生物数据的根本处理方法,Outline生物学根本知识,生物数据的根本处理方法,Method,生物信息学所用的方法和技术:,数学统计方法,动态规划方法,机器学习与模式识别技术,数据库技术及数据挖掘,人工神经网络技术,分子模型化技术,量子力学和分子力学计算,生物分子的计算机模拟,因特网Internet技术,生物数据的根本处理方法Method生物信息学所用的方法和技术,生物数据的根本处理方法,数学统计方法:,生物活动常常以大量、重复的形式出现,既受到内在因素的制约,又受到外界环境的随机干扰。因此概率论和数学统计是现代生物学研究中一种常用的分析方法,数据统计、因素分析、多元回归分析是生物学研究必备的工具,隐马尔科夫模型Hidden Markov Models在序列分析方面有着重要的应用。与隐马尔科夫模型相关的技术是马尔科夫链Markov Chain数学统计方法,Method,生物数据的根本处理方法数学统计方法:生物活动常常以大量、重复,生物数据的根本处理方法,2.,动态规划方法 :,动态规划Dynamic Programming是一种解决多阶段决策过程的最优化方法或复杂空间的优化搜索方法,动态规划解决问题的根本过程是:将一个问题的全局解分解为局部解,逆序递推求出局部最优解,随着执行过程的推进,“局部逐渐接近“全局,最终获得全局最优解,Method,生物数据的根本处理方法2. 动态规划方法 :动态规划Dyn,生物数据的根本处理方法,3.,机器学习与模式识别技术 :,机器学习:模拟人类的学习过程,以计算机为工具获取知识、积累经历,遗传算法采用随机搜索方法,具有自适应能力和便于并行计算,神经网络的理论是基于人脑的构造,其目的是提醒一个系统是如何向环境学习的,这一种方法被称为联接主义,模式识别:机器学习的一个主要任务。模式是对感兴趣客体定量的或者构造的描述,而模式识别就是利用计算机对客体进展鉴别,将一样或者相似的客体归入同种类别中。模式识别主要有两种方法:,根据对象的统计特征进展识别,根据对象的构造特征进展识别,Method,生物数据的根本处理方法3. 机器学习与模式识别技术 :机器学,生物数据的根本处理方法,3.,机器学习与模式识别技术 :,环境,知识库,执行,反 馈,学习,Method,生物数据的根本处理方法3. 机器学习与模式识别技术 :环境知,生物数据的根本处理方法,4.,数据库技术及数据挖掘 :,数据库技术,数据仓库,虚拟数据库技术Virtual Database,简称 VDB,数据挖掘data mining,又称作数据库中的知识发现 (Knowledge Discovery in Database),它是从数据库或数据仓库中发现并提取隐藏在其中的信息的一种新技术,它能自动分析数据,对它们进展归纳性推理和联想,寻找数据间内在的某些关联,从中开掘出潜在的、对信息预测和决策行为起着十分重要作用的模式,数据挖掘过程一般分为4个根本步骤:数据选择、数据转换、数据挖掘和结果分析,Method,生物数据的根本处理方法4.数据库技术及数据挖掘 :数据库技术,生物数据的根本处理方法,5.,人工神经网络技术:,人工神经网络Artificial Neural Network, 简称ANN是通过模拟神经元的特性以及脑的大规模并行构造、信息的分布式和并行处理等机制建立的一种数学模型,在生物信息学中,使用得最多的是反向传播神经网络Back Propagation Neural Network,简称BP网。BP网被认为是稳定性和鲁棒性较强的人工神经网络之一,而且属于有监视学习的网络模型。标准的BP网由三层神经元组成:输入层、隐藏层和输出层,Method,生物数据的根本处理方法5.人工神经网络技术:人工神经网络A,生物数据的根本处理方法,5.,人工神经网络技术:,输入层,隐藏层,输,出,层,反向传播神经网络构造示意,Method,生物数据的根本处理方法5.人工神经网络技术:输入层隐藏层输反,生物数据的根本处理方法,6.,分子模型化技术:,分子模型化Molecular modeling是利用计算机模拟分子构造、研究分子之间相互作用的一种技术,分子模型化是进展分子设计的根底。分子图形学Molecular Graphics是进展分子模型化的一项重要技术,正是由于分子图形学和其它计算化学方法如分子力学、分子动力学的相互结合,才使得分子模型化方法取得成功,Method,生物数据的根本处理方法6.分子模型化技术:分子模型化Mol,生物数据的根本处理方法,7.,量子力学和分子力学计算:,量子力学主要研究原子、分子、凝聚态物质、以及原子核和根本粒子的构造、性质的根底理论,在化学等有关学科中得到了广泛的应用,分子力学Molecular Mechanics方法是一种非量子力学的计算分子构造、能量与性质的方法,该方法应用经历势能函数,即经历力场方法模拟分子的构造,计算分子的性质,在进展分子构造分析、构象优化、分子间相互作用研究及分子模拟时需要应用量子力学或分子力学,Method,生物数据的根本处理方法7.量子力学和分子力学计算:量子力学主,生物数据的根本处理方法,8.,生物分子的计算机模拟:,所谓生物分子的计算机模拟就是从分子或者原子水平上的相互作用出发,建立分子体系的数学模型,利用计算机进展模拟实验,预测生物分子的构造和功能,预测动力学及热力学等方面的性质,分子动力学和蒙特卡罗Monte Carlo方法是两种最常用的技术,另一种模拟方法是模拟退火方法,实 验,实验现象,数学,模型,计算机,模 拟,模拟结果分析,新的设想,反馈,改进模型,Method,生物数据的根本处理方法8.生物分子的计算机模拟:所谓生物分子,生物数据的根本处理方法,9.因特网Internet技术:,Internet已经成为生物学研究的平台,同时也成为分子生物学研究人员进展信息交流特别是生物分子数据的交流的场所,通过网络查询或搜索所需要的生物信息,使用分析工具,将所要处理的数据直接送到相应的网络效劳器上,效劳器承受你的处理请求,并将处理结果返回,Method,生物数据的根本处理方法9.因特网Internet技术:I,“Biology is an information science - Leroy Hood,Computing,Computing Comes to Life,“Biology is an information sci,THANKS,THANKS,谢谢,谢谢,51,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!