资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,生物信息学,生物信息学,主讲教师:刘 吉 平,E-MAIL:,L,艺术设计学院蚕桑分子生物学研究室,亚太地区蚕桑培训中心,2003年2月,一、概述,二十一世纪是生命科学的时代,也是信息时代,近年来,随着现代分子生物学的发展,特别是人类基组计划的实施,不断产生出巨量的分子生物学数据,这些数据有着数量巨大、关系复杂,以至于不利用计算机根本无法实现数据的存储和分析。这样,生物信息学最终形成一门独立的学科并被推上了生物科学发展的最前沿。,Bioinformatics:科技界一颗耀眼的新星,在BIOINFORMATICS 没有诞生之前,一个新药的问世需要十年时间,数亿美元的R&D,而BIOINFORMATICS已将这个过程减少三分之二,R&D的费用也相应大大减少。许多中小BIOTECH 公司也看到了BIOINFORMATICS 的巨大作用和潜在的商机,纷纷投资BIOINFORMATICS研究项目。,美国电脑执照-高薪阶层,“BIOINFORMATICS CERTIFICATION”,这是目前最新的一门生物化学工程与电脑技术相结合的课程。,Visual Basic -$1195,Visual C+-$1295,BioInformatics -$2500,MIT(Massachusettes Institute of Technology),(美国)麻省理工学院:,Course:,20.01s,Date:,June 24-28,2002,Tuition:,$2,500,第二讲 生物信息学现状和研究方向,刘吉平,主要内容,1、背景,2、定义,3、现状,1)生物数据库的发展,2)人类基因组计划逐步完成,3)科研文献的增长,4、研究目标,一.什么是生物信息学?,Genome informatics is a scientific discipline that encompasses all aspects of genome information acquisition,processing,storage,distribution,analysis,and interpretation,.,它是一个学科领域,包含着基因组信息的获取、处理、存储、分配、分析和解释的所有方面,。,(The U.S.Human Genome Project:The First Five Years FY 1991-1995,by NIH and DOE),从美国的三个国家计划说起:曼哈顿计划;阿婆罗计划;人类基因组计划。,破译人类遗传密码就要读懂由30亿符号组成的100万页的“天书”,生物信息学的发展历程,生物信息学自诞生以来,经历了三个阶段:,基因组前期的生物信息学:主要是序列分析、数据库的查询、计算机操作和PC的应用;,基因组年代的生物信息学:主要是基因的寻找、数据与数据之间的比较、网络相互界面(Interface);,后基因组年代的生物信息学:主要是数据的挖掘、表达、数据多样性的分析、相互交叉数据分布的总结与分析。其研究的内容不仅包括基因的查寻和同源性分析;而且进一步到基因和基因组的功能分析,即所谓的功能基因组学研究。,二、生物信息学及其发展,生物信息学(Bioinformatics)-采用信息科学、计算机科学、生物数学、比较生物学等学科的观点和方法对生命的现象及其组成分子(核酸、蛋白等)进行研究。主要研究生命中物质的组成、进化、结构与功能的规律、以及这些物质在生命体中能量和信息的交换或传递。该学科以计算机和生物电子设备为工具,对生物信息进行提取、储存、加工和分析,用信息理论技术及生物数学的方法去理解和阐述生物大分子的存在和生命价值,最终对它们进行各种处理与应用。通过这些处理和应用,科学家不仅能理解已有的核酸和蛋白质序列及其功能,而且能更好地着手研究新的基因和蛋白序列及其功能。,计算机运算速度:18个月增长一倍;DNA序列数据:14个月增长一倍;,近年来GenBank中的DNA碱基数目呈指数增加,大约每14个月增加一倍。到1999年12月其数目已达30亿,它们来自47000种生物。2000年4月DNA碱基数目是60亿。现在,2001年初这一数目已达110亿。各种生物的EST序列已达600多万条,其中人类的EST序列已超过300万条,估计覆盖人类基因90以上;,自全长,1.8Mb,的嗜血流感杆菌(,Haemophilus influenzae,Rd,)基因组序列于,1995,年发表(,Fleischmann et al.,,,1995,)以来,,已有54个模式生物的完整基因组被测序完成,它们中有9个古细菌、31个原核真细菌、14个真核生物的完整基因组或它们的完整染色体,其中包括酿酒酵母和线虫。还有另外的,70,余个微生物基因组正在测试当中,。,美国的核酸数据库GenBank从1979年开始建设,1982年正式运行;,欧洲分子生物学实验室的EMBL数据库也于1982年开始服务;,日本于1984年开始建立国家级的核酸数据库DDBJ,并于1987年正式服务。从那个时候以来,DNA序列的数据已经从80年代初期的百把条序列,几十万碱基上升至现在的110亿碱基!这就是说,在短短的约18年间,数据量增长了近十万倍。,Dbcat统计的生物信息数据库的数目,分类 数据库数目分类 数据库数目,DNA 87RNA 30,蛋白质 94基因组 58,基因图谱30蛋白质结构 18,文献43其他,153,How many characters are in the“Heaven Book”?,3*10,9,10,000 books,1 book 100 pages,1 page 3,000 characters,CCGGTCTCCCCGCCCGCGCGCGAAGTAAAGGCCCAGCGCAGCCCGCGCTCCTGCCCTGGGGCCTCGTCTTTCTCCAGGAAAACGTGGACCGCTCTCCGCCGACAGTCTCTTCCACAGACCCCTGTCGCCTTCGCCCCCCGGTCTCTTCCGGTTCTGTCTTTTCGCTGGCTCGATACGAACAAGGAAGTCGCCCCCAGCGAGCCCCGGCTCCCCCAGGCAGAGGCGGCCCCGGGGGCGGAGTCAACGGCGGAGGCACGCCCTCTGTGAAAGGGCGGGGCATGCAAATTCGAAATGAAAGCCCGGGAACGCCGAAGAAGCACGGGTGTAAGATTTCCCTTTTCAAAGGCGGGAGAATAAGAAATCAGCCCGAGAGTGTAAGGGCGTCAATAGCGCTGTGGACGAGACAGAGGGAATGGGGCAAGGAGCGAGGCTGGGGCTCTCACCGCGACTTGAATGTGGATGAGAGTGGGACGGTGACGGCGGGCGCGAAGGCGAGCGCATCGCTTCTCGGCCTTTTGGCTAAGATCAAGTGTAGTATCTGTTCTTATCAGTTTAATATCTGATACGTCCTCTATCCGAGGACAATATATTAAATGGATTGATCAATCCGCTTCAGCCTCCCGAGTAGCTGGGACTACAGACGGTGCCATCACGCCCAGCTCATTGTTGATTCCCGCCCCCTTGGTAGAGACGGGATTCCGCTATATTGCCTGGGCTGGTGTCGAACTCATAGAACAAAGGATCCTCCCTCCTGGGCCTGGGCGTGGGCTCGCAAAACGCTGGGATTCCCGGATTACAGGCGGGCGCACCACACCAGGAGCAAACACTTCCGGTTTTAAAAATTCAGTTTGTGATTGGCTGTCATTCAGTATTATGCTAATTAAGCATGCCCGGTTTTAAACCTCTTAAAACAACTTTTAAAATTACCTTTCCACCTAAAACGTTAAAATTTGTCAAGTGATAATATTCGACAAGCTGTTATTGCCAAACTATTTTCCTATTTGTTTCCTAATGGCATCGGAACTAGCGAAAGTTTCTCGCCATCAGTTAAAAGTTTGCGGCAGATGTAGACCTAGCAGAGGTGTGCGAGGAGGCCGTTAAGACTATACTTTCAGGGATCATTTCTATAGTGTGTTACTAGAGAAGTTTCTCTGAACGTGTAGAGCACCGAAAACCACGAGGAAGAGAGGTAGCGTTTTCATCGGGTTACCTAAGTGCAGTGTCCCCCCTGGCGCGCAATTGGGAACCCCACACGCGGTGTAGAAATATATTTTAAGGGCGCG,(1250 characters),关键是先要从一个个序列片段中得到这本天书,已测序的重要模式生物:,人,家鼠,果蝇,线虫,拟南芥,水稻,大鼠,斑马鱼,酿酒酵母,番茄,玉米,布氏锥虫,菜豆,河豚,大肠杆菌,HIV,牛,疟,原虫,1、发展现状,生物信息学的发展将会对生命科学带来革命性的变革。它的成果不仅对相关基础学科起巨大的推动作用,而且还将对医药、卫生、食品、农业等产业产生巨大的影响,甚至引发新的产业革命。,生物医药工业推动生物信息学的发展,生物医药工业也是推动生物信息学发展的重要动力。HGP所推动的大规模DNA测序也为生物医药工业提供了大量可用于新药开发的原材料。有些基因产物可以直接作为药物,而有些基因则可以成为药物作用的对象。生物信息学为分子生物学家提供了大量对基因序列进行分析的工具,不但可以从资料的获取、基因功能的预测、药物筛选过程中的信息处理等方面大大加快新药开发的进程,而且可以大大加快传统的基因发现和研究,因而成为各赢利性研究机构和医药公司争夺基因专利的重要工具,这一竞争又反过来极大的刺激了生物信息学的发展。,2、国外发展现状,因此,各国政府和工业界对此极为重视,投入了大量资金。欧美各国及日本相继成立了生物信息中心,如美国的国家生物技术信息中心(National Center for Biotechnology Informatics,NCBI)、欧洲生物信息学研究所(European Bioinformatic Institute,EBI)、日本信息生物学中心(Center for Information Biology,CIB)等。NCBI、EBI和CIB相互合作,共同维护着GenBank、EMBL、DDBJ三大基因序列数据库。它们每天通过计算机网络互相交换数据,使得三个数据库能同时获得最新数据。此外,他们每年召开两个年会讨论合作事宜。,3、国内发展现状,在我国,生物信息学随着人类基因组研究的展开才刚刚起步,但已显露出蓬勃发展的势头。在政府的支持和科学家的呼吁下,国家级生物医学信息学中心正在筹建之中。,各地政府也给予了足够重视,北京市已经成立了北京生物工程学会生物信息学专业委员会(即北方生物信息学研究会),目的在于联合北方地区从事生物信息学的专家,加强合作,促进学科的发展,并为政府决策提供参考意见。,4、国内的一些科研单位,国内一些科研单位已经开始摸索着从事这方面的工作。清华大学在基因调控及基因功能分析、蛋白质二级结构预测方面、天津大学物理系和中科院理论物理所在相关算法方面、中科院生物物理所在基因组大规模测序数据的组装和标识方面、北京大学化学学院物理化学研究所在蛋白质分子设计方面、华大基因组研究中心(中科院遗传所人类基因组研究中心)在大规模测序数据处理自动化流程体系及数据库系统建立方面均已展开相关研究。复旦大学
展开阅读全文