生物信息学基础课件

上传人:痛*** 文档编号:241622228 上传时间:2024-07-10 格式:PPT 页数:51 大小:2.92MB
返回 下载 相关 举报
生物信息学基础课件_第1页
第1页 / 共51页
生物信息学基础课件_第2页
第2页 / 共51页
生物信息学基础课件_第3页
第3页 / 共51页
点击查看更多>>
资源描述
生物信息学基础遗传学偏向于单个基因的研究,遗传学偏向于单个基因的研究,HGP是对整个基因组是对整个基因组的全部基因,从整体水平考虑基因的存在、基因的结的全部基因,从整体水平考虑基因的存在、基因的结构和功能、基因之间的相互关系等。构和功能、基因之间的相互关系等。HGP成为了生命科学领域第一大科学工程。成为了生命科学领域第一大科学工程。7.1.2 人类基因组计划的发展人类基因组计划的发展 1984年年 DOE 委托委托Alta,White R.,Mendelsonhm M 科学家科学家 专业会议;专业会议;1985年提出人类基因组计划的动议;年提出人类基因组计划的动议;1986年年McKusick V 称从整个基因组层次上研究遗传的科学为基因组学;称从整个基因组层次上研究遗传的科学为基因组学;1986年年Dulbecco R“Science”发表文章;发表文章;1986 Gilbert W&Berg P 主持人类基因组计划专家会议;主持人类基因组计划专家会议;1987年年DOE和和NIH下拨研究下拨研究经费;经费;1988年年NRC的专家发表的专家发表mapping and sequencing the human genome报告;报告;1988年成立了国家人类基因组研究中心。年成立了国家人类基因组研究中心。Watson 第一任主任。第一任主任。7.1.5 7.1.5 重要性和经济利益重要性和经济利益 1).1).土地土地的分割;的分割;“新大陆探险热新大陆探险热”;-弄清基因组结构和功能;弄清地球上的地理位置。弄清基因组结构和功能;弄清地球上的地理位置。2).遗传资源至关重要遗传资源至关重要7.1.6 7.1.6 人类基因组计划的延伸人类基因组计划的延伸 后基因组计划;功能基因组计划后基因组计划;功能基因组计划7.1.7 7.1.7 人类基因组计划实施(研究工作)的步骤人类基因组计划实施(研究工作)的步骤 1).1).基因组作图基因组作图 人类基因组人类基因组 DNA DNA序列分布于序列分布于2222条常染色体和条常染色体和2 2条性染色体,条性染色体,染色体不能直接测序,故染色体不能直接测序,故HGPHGP的第一阶段的任务是将基因组这一的第一阶段的任务是将基因组这一巨大的研究对象进行分解,使成为较容易操作的小的结构区域,巨大的研究对象进行分解,使成为较容易操作的小的结构区域,这一过程称为这一过程称为作图。作图。作图的类型:作图的类型:i i)遗传连锁图;)遗传连锁图;iiii)物理图物理图 i i 遗传连锁图,通过计算连锁的遗传标志之间的重组频率,遗传连锁图,通过计算连锁的遗传标志之间的重组频率,确定它们的相对距离确定它们的相对距离(cM)(cM)。遗传图的作出,需要应用多态性标志。遗传图的作出,需要应用多态性标志。80 80年代中期,标志是限制性酶切片段长度多态性年代中期,标志是限制性酶切片段长度多态性(RFLP);(RFLP);此类标志的数量较少,多态性信息也较低。此类标志的数量较少,多态性信息也较低。80 80年代中期,发展短串联重复序列标志年代中期,发展短串联重复序列标志(short tandem(short tandem repeat,STR;or microsatellite,MS)repeat,STR;or microsatellite,MS)。其信息含量优于。其信息含量优于RFLPRFLP。19941994年,法国和美国科学家共同努力,完成了由年,法国和美国科学家共同努力,完成了由RFLPRFLP和和MSMS组组成的包括成的包括58265826个标志、分辨率高达个标志、分辨率高达0.7cM0.7cM的的遗传图谱。遗传图谱。近来,第三代多态性标志,近来,第三代多态性标志,SNP(single nucleotide SNP(single nucleotide polymorphism)polymorphism)成为一种新型手段,其意义超出遗传图的范围。成为一种新型手段,其意义超出遗传图的范围。ii ii 物理图,确定各遗传标志之间的物理距离图谱(物理图,确定各遗传标志之间的物理距离图谱(bp,or kb,or kb,or Mb)or Mb)。物理图包含了二层意义物理图包含了二层意义:一是获得分布于整个基因组的序列标一是获得分布于整个基因组的序列标 签(签(sequence tagged site,STS),sequence tagged site,STS),每隔一定距离有一个标志;每隔一定距离有一个标志;二是构建覆盖每条染色体的大片段二是构建覆盖每条染色体的大片段DNADNA连续克连续克 系。系。2).2).基因组基因组DNADNA大规模测序大规模测序7.2.2 7.2.2 基因,基因组基因,基因组 Gene,Genome 1).基因的概念基因的概念 从分子生物学角度看,基因是负载特定遗传信息的从分子生物学角度看,基因是负载特定遗传信息的DNA分子分子片段,在一定条件下能表达这种遗传信息,产生特定的生理功片段,在一定条件下能表达这种遗传信息,产生特定的生理功能。能。2).基因的分类基因的分类 按基因功能分类:按基因功能分类:(1).结构基因结构基因 (2).调控基因调控基因 3).基因组:基因组:表示一个生物物种所有基因的总和,是指导一表示一个生物物种所有基因的总和,是指导一个物种的结构与功能的所有遗传信息的总和。个物种的结构与功能的所有遗传信息的总和。4).基因的结构基因的结构 ORF(open reading frame)人类结构人类结构基因的结构,基因的结构,包括包括4个区域个区域7.2.4 7.2.4 生物信息学生物信息学 一门新兴的交叉学科一门新兴的交叉学科 (1).新兴的交叉学科新兴的交叉学科 molecule biology;computer science;informatics science;mathematics,physics etc.(2).生物信息学和其它生物学科研究的关系生物信息学和其它生物学科研究的关系7.2.5 7.2.5 生物信息学的研究内容生物信息学的研究内容(1).(1).基因组信息学基因组信息学 1).基因组信息的收集、存储、管理与提供基因组信息的收集、存储、管理与提供 2).基因组序列信息的提取和分析基因组序列信息的提取和分析 基因的发现与鉴定;非编码区的信息结构分析;生物学基因的发现与鉴定;非编码区的信息结构分析;生物学 重大问题的研究。重大问题的研究。3).基因组信息分析方法与技术的研究基因组信息分析方法与技术的研究 4).应用与发展研究应用与发展研究(2).(2).蛋白质空间结构模拟与预测蛋白质空间结构模拟与预测 1).分子模拟技术分子模拟技术 2).蛋白质空间结构预测蛋白质空间结构预测(3).(3).药物分子设计药物分子设计7.3 7.3 生物信息学的几个重要研究课题生物信息学的几个重要研究课题 生物信息学最重要的任务,是从海量数据中提取新知识。这生物信息学最重要的任务,是从海量数据中提取新知识。这首先是从首先是从DNA序列中识别编码蛋白质的基因,以及调控基因序列中识别编码蛋白质的基因,以及调控基因表达的各种信号。其次,从基因组编码序列翻译出的蛋白质序表达的各种信号。其次,从基因组编码序列翻译出的蛋白质序列的数目急剧增加,根本不可能用实验方法一一确定它们的结列的数目急剧增加,根本不可能用实验方法一一确定它们的结构和功能。从已经积累的数据和知识出发,预测蛋白质的结构构和功能。从已经积累的数据和知识出发,预测蛋白质的结构和功能,成为常规的研究任务。和功能,成为常规的研究任务。7.3.1.7.3.1.比较基因组学比较基因组学 7.3.2 7.3.2 模式生物全基因组研究模式生物全基因组研究 模式生物基因组计划最初确定的模式生物有:模式生物基因组计划最初确定的模式生物有:7.3.3 7.3.3 基因区域的预测基因区域的预测 7.3.4 7.3.4 基因功能预测基因功能预测 更重要的是对这些模式生物体的功能基因的认识可以为认识人更重要的是对这些模式生物体的功能基因的认识可以为认识人类基因组的功能提供更多的帮助类基因组的功能提供更多的帮助7.3.5 7.3.5 分子进化的研究分子进化的研究 对于基因组研究来说,一个重要的研究方向就是分子序列的对于基因组研究来说,一个重要的研究方向就是分子序列的进化。通过比较不同生物基因组中各种结构成分的异同,可以进化。通过比较不同生物基因组中各种结构成分的异同,可以大大加深我们对生物进化的认识。这方面的研究已逐步形成一大大加深我们对生物进化的认识。这方面的研究已逐步形成一个称为比较基因组学(个称为比较基因组学(Comparative Genomics)的新学科。)的新学科。核酸、蛋白质序列的进化研究。核酸、蛋白质序列的进化研究。蛋白质分子结构的进化研究。蛋白质分子结构的进化研究。新的进化理论。新的进化理论。7.4 7.4 发展展望发展展望 生物信息学的发展将会对生命科学带来革命性的变生物信息学的发展将会对生命科学带来革命性的变革。它的成果不仅对相关基础学科起巨大的推动作用,革。它的成果不仅对相关基础学科起巨大的推动作用,而且还将对医药、卫生、食品、农业等产业产生巨大而且还将对医药、卫生、食品、农业等产业产生巨大的影响,甚至引发新的产业革命。的影响,甚至引发新的产业革命。7.4 7.4 生物信息学的发展生物信息学的发展7.4.1 7.4.1 生物信息学的知识结构体系生物信息学的知识结构体系7.4.2 7.4.2 药物分子设计与药物基因组学药物分子设计与药物基因组学 (1).(1).新的疾病靶分子的发现新的疾病靶分子的发现(2).2).药物基因组学药物基因组学(2)药物基因组学药物基因组学 1)问题的提出:问题的提出:不同的病人对同一种药物有不同的反应。不同的病人对同一种药物有不同的反应。药物基因组学可以运用大范围系统的基因组技术,找出与药药物基因组学可以运用大范围系统的基因组技术,找出与药物作用有关的基因。物作用有关的基因。在基因水平上设计,避免病人服用无效、在基因水平上设计,避免病人服用无效、低效的低效的药物,从而结束单一处方的时代。带来突破性的革命。药物,从而结束单一处方的时代。带来突破性的革命。2)药物基因组学与遗传多)药物基因组学与遗传多态性态性 药物基因组学正是从基因水平揭示这些药物基因组学正是从基因水平揭示这些差异的遗传特征,鉴差异的遗传特征,鉴别基因序列中的差异。用更科学的手段看病开药,即依照病人别基因序列中的差异。用更科学的手段看病开药,即依照病人的基因组特征优化药疗方案。的基因组特征优化药疗方案。药物基因组学需要检测基因序列中药物基因组学需要检测基因序列中差异的位置,碱基位置的差异的位置,碱基位置的置换,确定一个基因中多种差异的相对位置等。置换,确定一个基因中多种差异的相对位置等。3 3)药物基因组学与药物开发的未来药物基因组学与药物开发的未来 药物基因组学提供了能被检测的全新的基因范围药物基因组学提供了能被检测的全新的基因范围 药物应答药物应答基因,所以利用药物基因组学可以实现药物的目标化。基因,所以利用药物基因组学可以实现药物的目标化。例子:例子:Novatis公司的精神分裂症药公司的精神分裂症药-氯氮平,是治疗精神分裂症药的首氯氮平,是治疗精神分裂症药的首选药,但选药,但1%的病人服用后会得一种危及生命的病的病人服用后会得一种危及生命的病 粒细胞缺乏症。从而粒细胞缺乏症。从而大大影响了市场。如果通过药物基因组学的研究,检测出粒细胞缺乏症的大大影响了市场。如果通过药物基因组学的研究,检测出粒细胞缺乏症的药物应答基因,将大大拓宽市场。另外在药物进入临床时,清楚了相关的药物应答基因,将大大拓宽市场。另外在药物进入临床时,清楚了相关的药物应答基因,对受试人群进行基因分型,可以准确地知道该种药物适合药物应答基因,对受试人群进行基因分型,可以准确地知道该种药物适合哪些病人。哪些病人。有关药物作用的遗传影响与生物反应的变异性的信息将在新有关药物作用的遗传影响与生物反应的变异性的信息将在新药的设计、发现和成功开发方面起重要作用。药的设计、发现和成功开发方面起重要作用。美国美国NIH于于1998年计划建立一个药物基因组学数据库,搜集年计划建立一个药物基因组学数据库,搜集“个体个体”基因及其功能的资料,以便于药物的开发。基因及其功能的资料,以便于药物的开发。1997年以年以来,已经有几十家药物公司进入药物基因组学领域。有人估计,来,已经有几十家药物公司进入药物基因组学领域。有人估计,(3).药物分子设计药物分子设计 1).新药研制的四类方法新药研制的四类方法 2).基于作用机理(受体结构)的药物分子设计基于作用机理(受体结构)的药物分子设计 Structure based drug design(or Rational drug design)3).基于作用机理(受体结构)的药物分子设计的一基于作用机理(受体结构)的药物分子设计的一般步骤般步骤 7.4.4 序列比对序列比对7.4.4.1 序列比对的进化基础序列比对的进化基础 图7.1、保守位点通常在功能上极为重要。对老鼠的胰蛋白酶(Swiss-Prot P07146)和小龙虾的胰蛋白酶(Swiss-Prot P00765)作比对,相同的残基用下标线标出,在比对上方标出的是三个二硫键(-S-S),这些二硫键中的半胱氨酸残基极为保守,打星号的残基的侧链参与电荷传递系统,打菱形符号的活性位点的残基负责底物的特异性。Human-ZCr MATGQKLMRAVRVFEFGGPEVLKLRSDIAVPIPKDHQVLIKVHACGVNPVETYIRSGTYSHuman-ZCr MATGQKLMRAVRVFEFGGPEVLKLRSDIAVPIPKDHQVLIKVHACGVNPVETYIRSGTYSEcoli-QOR -MATRIEFHKHGGPEVLQA-VEFTPADPAENEIQVENKAIGINFIDTYIRSGLYPEcoli-QOR -MATRIEFHKHGGPEVLQA-VEFTPADPAENEIQVENKAIGINFIDTYIRSGLYP .*.*.*.*.*.*.*.*.*.*Human-ZCr RKPLLPYTPGSDVAGVIEAVGDNASAFKKGDRVFTSSTISGGYAEYALAADHTVYKLPEKHuman-ZCr RKPLLPYTPGSDVAGVIEAVGDNASAFKKGDRVFTSSTISGGYAEYALAADHTVYKLPEKEcoli-QOR -PPSLPSGLGTEAAGIVSKVGSGVKHIKAGDRVVYAQSALGAYSSVHNIIADKAAILPAAEcoli-QOR -PPSLPSGLGTEAAGIVSKVGSGVKHIKAGDRVVYAQSALGAYSSVHNIIADKAAILPAA *.*.*.*.*.*.*.*.*.*.*Human-ZCr LDFKQGAAIGIPYFTAYRALIHSACVKAGESVLVHGASGGVGLAACQIARAYGLKILGTAHuman-ZCr LDFKQGAAIGIPYFTAYRALIHSACVKAGESVLVHGASGGVGLAACQIARAYGLKILGTAEcoli-QOR ISFEQAAASFLKGLTVYYLLRKTYEIKPDEQFLFHAAAGGVGLIACQWAKALGAKLIGTVEcoli-QOR ISFEQAAASFLKGLTVYYLLRKTYEIKPDEQFLFHAAAGGVGLIACQWAKALGAKLIGTV .*.*.*.*.*.*.*.*.*.*.*.*Human-ZCr GTEEGQKIVLQNGAHEVFNHREVNYIDKIKKYVGEKGIDIIIEMLANVNLSKDLSLLSHGHuman-ZCr GTEEGQKIVLQNGAHEVFNHREVNYIDKIKKYVGEKGIDIIIEMLANVNLSKDLSLLSHGEcoli-QOR GTAQKAQSALKAGAWQVINYREEDLVERLKEITGGKKVRVVYDSVGRDTWERSLDCLQRREcoli-QOR GTAQKAQSALKAGAWQVINYREEDLVERLKEITGGKKVRVVYDSVGRDTWERSLDCLQRR *.*.*.*.*.*.*.*.*.*.*.*.Human-ZCr GRVIVVG-SRGTIEINPROTMAKES-SIIGVTLFSSTKEEFQQYAAALQAGMEIGWLHuman-ZCr GRVIVVG-SRGTIEINPROTMAKES-SIIGVTLFSSTKEEFQQYAAALQAGMEIGWLEcoli-QOR GLMVSFGNSSGAVTGVNLGILNQKGSLYVTRPSLQGYITTREELTEASNELFSLIASGVIEcoli-QOR GLMVSFGNSSGAVTGVNLGILNQKGSLYVTRPSLQGYITTREELTEASNELFSLIASGVI *.*.*.*.*.*.*.*.*.*.*.*.Human-ZCr KPVIGSQ-YPLEKVAEAHENIIHGSGATGKMILLLHuman-ZCr KPVIGSQ-YPLEKVAEAHENIIHGSGATGKMILLLEcoli-QOR KVDVAEQQKYPLKDAQRAHE-ILESRATQGSSLLIPEcoli-QOR KVDVAEQQKYPLKDAQRAHE-ILESRATQGSSLLIP *.*.*.*.*.*.*.*.图图7.2、最最佳佳全全局局比比对对:对对人人类类-晶晶状状物物(Swiss-Prot Q08257)和和E.coli苯苯醌醌氧氧化化还还原原酶酶(Swiss-Prot P28304)的的氨氨基基酸酸序序列列进进行行比比对对。这这是是一一个个由由CLUSTAL W程程序序(Higgins et al.,1996)得得到到的的最最佳佳全全局局比比对对结结果果。在在比比对对下下方方,星星号号表表示示残残基基相相同同,打点表示这个残基是保守的。打点表示这个残基是保守的。7.4.4.3 序列比对序列比对 (1).序列比对的分类序列比对的分类 按序列比对的范围按序列比对的范围 1).全局比对全局比对 2).局部比对局部比对 3).半半全局比对全局比对 按按比对序列的个数比对序列的个数 1).俩俩序列比对序列比对 2).多多序列比对序列比对 (2).序列比对的基本问题序列比对的基本问题 1).打分方案打分方案 2).优化算法优化算法 7.4.5 遗传算法遗传算法 Genetic Algorithm(GA)(1).遗传算法的起源和发展遗传算法的起源和发展 (2).遗传算法的基本原理遗传算法的基本原理 生物学问题生物学问题 寻优问题寻优问题 (3).求解求解优化问题步骤优化问题步骤 1).编码编码 基因码链基因码链 个体个体 可行可行解解 2).产生群体产生群体 P(t)可行可行解的集合解的集合 3).评价评价 适应度适应度 F 4).选择选择 优良个体优良个体 繁殖后代繁殖后代 5).交配交配 基因码链基因码链 交换交换 6).变异变异 模拟基因突变模拟基因突变(4).遗传算法在结构生物学已经中的应用遗传算法在结构生物学已经中的应用 进化模拟;进化模拟;折叠模拟;折叠模拟;蛋白质变异理论研究;蛋白质变异理论研究;蛋白质起源研究等。蛋白质起源研究等。7.4.6 人工神经网络方法人工神经网络方法 (1)神经元神经元7.4.7 7.4.7 发展展望发展展望 生物信息学的发展将会对生命科学带来革命性的变生物信息学的发展将会对生命科学带来革命性的变革。它的成果不仅对相关基础学科起巨大的推动作用,革。它的成果不仅对相关基础学科起巨大的推动作用,而且还将对医药、卫生、食品、农业等产业产生巨大而且还将对医药、卫生、食品、农业等产业产生巨大的影响,甚至引发新的产业革命。的影响,甚至引发新的产业革命。人类基因组图谱的诞生,将把人类引入一个以人类基因组图谱的诞生,将把人类引入一个以序列为基础,以生物信息学为主导的生物科学和生物序列为基础,以生物信息学为主导的生物科学和生物技术的新时代技术的新时代。(国家人类基因组中心主任扬焕明教授(国家人类基因组中心主任扬焕明教授“人人类基因组全序列终图将于类基因组全序列终图将于2001年年6月完成)。月完成)。生物信息学的最终目标是解读生命的密码。生物信息学的最终目标是解读生命的密码。生物信息学将在生命规律的新发现中发挥重要的作生物信息学将在生命规律的新发现中发挥重要的作用。用。
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!