山西师大郜刚生物信息学-01-1-生物信息学大众认识与专家谈

上传人:cel****303 文档编号:243293269 上传时间:2024-09-20 格式:PPTX 页数:68 大小:5.42MB
返回 下载 相关 举报
山西师大郜刚生物信息学-01-1-生物信息学大众认识与专家谈_第1页
第1页 / 共68页
山西师大郜刚生物信息学-01-1-生物信息学大众认识与专家谈_第2页
第2页 / 共68页
山西师大郜刚生物信息学-01-1-生物信息学大众认识与专家谈_第3页
第3页 / 共68页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,生物信息学,Go Gng,郜刚,山西师范大学生命科学学院,CCTV10_Bioinfomatics,生物信息学大众视频播放,生物信息身份证,视频播放,背景:,当前人类基因组研究已进入一个重要时期,,2000,年将获得人类基因组的全部序列,这是基因组研究的转折点和关键时刻,意味着人类基因组的研究将全面进入信息提取和数据分析阶段,即生物信息学发挥重要作用的阶段。,到,1999,年,12,月,15,日发布的第,115,版为止,,GenBank,中的,DNA,碱基数目已达,46,亿,5,千万,,DNA,序列数目达到,535,万;其中,EST,序列超过,339,万条;,UniGene,的数目已达到,7,万个;已有,25,个模式生物的完整基因组被测序完成,另外的,70,个模式生物基因组正在测序当中;,到,2000,年,1,月,28,日为止,人类基因组已有,16%,的序列完成测定,另外,37.7%,的序列已经初步完成;同时功能基因组和蛋白质组的大量数据已开始涌现。如何分析这些数据,从中获得生物结构、功能的相关信息是基因组研究取得成果的决定性步骤。,核心:,生物信息学是在此背景下发展起来的综合运用生物学、数学、物理学、信息科学以及计算机科学等诸多学科的理论方法的崭新交叉学科。生物信息学是内涵非常丰富的学科,其核心是基因组信息学,包括基因组信息的获取、处理、存储、分配和解释。,关键:,基因组信息学的关键是“读懂”基因组的核苷酸顺序,即全部基因在染色体上的确切位置以及各,DNA,片段的功能;同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测,然后依据特定蛋白质的功能进行药物设计。了解基因表达的调控机理也是生物信息学的重要内容,根据生物分子在基因调控中的作用,描述人类疾病的诊断、治疗内在规律。它的研究目标是揭示,基因组信息结构的复杂性及遗传语言的根本规律,,解释生命的遗传语言。生物信息学已成为整个生命科学发展的重要组成部分,成为生命科学研究的前沿。,研究内容:,从目前生物信息学的研究情况来看,国际上公认的生物信息学的研究内容,大致包括以下几个方面:,生物信息的收集、存储、管理与提供。包括建立国际基本生物信息库和生物信息传输的国际联网系统;建立生物信息数据质量的评估与检测系统;生物信息的在线服务;生物信息可视化和专家系统。,研究内容:,从目前生物信息学的研究情况来看,国际上公认的生物信息学的研究内容,大致包括以下几个方面:,生物信息的收集、存储、管理与提供。包括建立国际基本生物信息库和生物信息传输的国际联网系统;建立生物信息数据质量的评估与检测系统;生物信息的在线服务;生物信息可视化和专家系统。,基因组序列信息的提取和分析。包括基因的发现与鉴定,如利用国际,EST,数据库,(dbEST),和各自实验室测定的相应数据,经过大规模 并行计算发现新基因和新,SNPs,以及各种功能位点;基因组中非编码区的信息结构分析,提出理论模型,阐明该区域的重要生物学功能;进行模式生物完整基因组的信息结构分析和比较研究;利用生物信息研究遗传密码起源、基因组结构的演化、基因组空间结构与,DNA,折叠的关系以及基因组信息与生物进化关系等生物学的重大问题。,研究内容:,功能基因组相关信息分析。包括与大规模基因表达谱分析相关的算法、软件研究,基因表达调控网络的研究;与基因组信息相关的核酸、蛋白质空间结构的预测和模拟,以及蛋白质功能预测的研究。,生物大分子结构模拟和药物设计。包括,RNA(,核糖核酸,),的结构模拟和反义,RNA,的分子设计;蛋白质空间结构模拟和分子设计;具有不同功能域的复合蛋白质以及连接肽的设计;生物活性分子的电子结构计算和设计;纳米生物材料的模拟与设计;基于酶和功能蛋白质结构、细胞表面受体结构的药物设计;基于,DNA,结构的药物设计等。,研究内容:,生物信息分析的技术与方法研究。包括发展有效的能支持大尺度作图与测序需要的软件、数据库以及若干数据库工具,诸如电子网络等远程通讯工具;改进现有的理论分析方法,如统计方法、模式识别方法、隐马尔科夫过程方法、分维方法、神经网络方法、复杂性分析方法、密码学方法、多序列比较方法等;创建一切适用于基因组信息分析的新方法、新技术。包括引入复杂系统分析技术、信息系统分析技术等;建立严格的多序列比较方法;发展与应用密码学方法以及其他算法和分析技术,用于解释基因组的信息,探索,DNA,序列及其空间结构信息的新表征;发展研究基因组完整信息结构和信息网络的研究方法等;发展生物大分子空间结构模拟、电子结构模拟和药物设计的新方法与新技术。,研究内容:,应用与发展研究。汇集与疾病相关的人类基因信息,发展患者样品序列信息检测技术和基于序列信息选择表达载体、引物的技术,建立与动植物良种繁育相关的数据库以及与大分子设计和药物设计相关的数据库。,北京大学 生物信息学中心 罗静初教授,中国科学院院士,第三世界科学院院士,中国科学院理论物理研究所研究员,上海复旦大学理论生命科学研究中心主任郝柏林院士,中国科学院院士,郝柏林教授,郝柏林,1934,年,6,月生于北京市。,1959,年毕业于乌克兰国立哈尔科夫大学物理数学系。后在中国科学院物理研究所工作。,1978,年晋升为研究员、副所长。,1980,年,11,月当选为中国科学院院士。现任物理学系研究员、博士生导师。兼任中国博士后基金会副理事长、陈嘉庚国际学会常务董事。曾任中国科学院理论物理研究所副所长、所长。,主要从事理论物理、计算物理、非线性科学和理论生命科学的研究。涉及固体电子能谱和声子谱、金属红外性质、高分子半导体理论、统计物理模型、相变和临界现象、临界动力学、闭路格林函数方法、动力电网计算、天线计算、地震活动性统计分析、群论知识工程系统、计算机程序设计、混沌动力学和符号动力学、,DNA,序列分析等领域。,1997,年夏,在把英文专著,实用符号动力学与混沌,书稿送出之后,郝柏林着重转向理论生命科学领域研究。早在,1985,年,他就着手补充生物学知识。之后,又访问国际生物学数据库并下载软件。,1995,年与生物学部邹承鲁院士,共同组织香山会议,并主编出版,理论物理与生命科学,一书。,1999,年郝柏林在一份,院士建议,中提出,尽快建立国家级的生物医学信息中心,引起政府有关部门的重视。第二年,他与合作者共同撰写,生物信息学手册,。之后又在联合举办的研究生班系统讲课,批量培养年青一代生物信息学人才。,从学科交叉漫谈生物信息学,郝柏林,复旦大学理论生命科学研究中心,中国科学院理论物理研究所,科学、宗教与艺术,同源而殊途:同源于描述和解释自然、人类以及人和自然的关系。,数学是自然科学的“画笔”:定量而不仅是定性地掌握自然规律。,科学结论具有可以定量检验的预测能力。,“数学”和“定量”包括解析、数值、图形和其它主要由现代计算机提供的模拟手段。,物理学已经成为鼎立于实验、理论和计算三大支柱上的成熟的学科。生物是物,生物学也会受到物理学的启发。,生物是物,生物有理,天地有大美而不言,万物有成理而不说。夫圣人者原天地之美,而达万物之理。,庄子,,知北游,物含妙理总堪寻,(,北京颐和园铜亭出口处对联下联,),细推物理须行乐何用浮名绊此身 杜甫,耳目之察,不足以分物理。,淮南子。览冥训,需要仪器观测和理论思维,物理学与生物学的相互促进由来已久,电学和电生理学同时诞生,C. A. de Coulomb, 1785,L. Galvani, 1791,生物学为物理学启示过能量守恒,医生,R. J. Mayer (1842),:受动、静脉血色差别启发,第一个给出热功当量。,物理学家,J. P. Joule (1843),:热功当量。,现役军医,H. von Helmholtz (1847),:把能量守恒从机械运动推广到热、电、磁乃至生命现象。(,24,年后任物理教授),(感谢刘寄星博士核实姓名年代),物理学为生物学提供过大量工具,光学显微镜,(1590),:,细胞,(1665),细菌,(Antonie van Leeuwenhoek,1683),(Muller,确认细菌为一类生物, 1773),X,射线衍射晶体结构分析,DNA,双螺旋结构(,JD Watson,FHC Crick,1953,),肌红蛋白、血红蛋白晶体结构(,1957,1959,),电子显微镜、扫描电镜、隧道扫描电镜,物理学为生物学提供过大量工具,各种光谱方法、荧光标记,中子衍射,示踪原子、放射性标记,核磁共振波谱,质谱仪,“,化学,”,仪器:超速离心机、液相色谱分析、圆偏振二向色性分析、凝胶电泳,物理学为生物学提供了新思想,负熵,非周期晶体,对热涨落的担心,三联码(,George Gamow, 1954,),生物中的,“,标度,”,和,“,分形,”,Erwin Schrodinger, What is Life? The Physical Aspect of the Living Cell, 1944, ,Michael P. Murphy and Luke A. J. ONeill, eds. What is Life? The Next Fifty Years, Cambridge University Press, 1995, 1997.,数学是关于形和数的科学,分析,代数,几何,统计、概率和随机过程,离散数学:组合学、图论、语言学,生物有形生物有数,生物有形,人所共识。地球上自然之美,多数来自生物本身和它们的营造。生物有数,则经历了漫长的认识过程。,生物有形,HIV,病毒,粘菌,(Slime mold),:自组织现象的实例,“,数学的应用,:,生物学中的数学,=0.”,(恩格斯:,1885,),于光远等译,自然辩证法,人民出版社, 1984, 172,页,生物有数,生物多样性(宏观数据),现存物种知多少?,从,2,百万到,10,亿的种种估计,2003,年,11,月初,GenBank,核酸数据库中有,154 089,种生物至少有,1,条数据,其中只有约半数有某些分类学信息,目前地球上存活着约,5000,种哺乳动物,约,9000,种鸟类,细菌是地球上最成功的物种,然而我们不知道它们的数目有多少,生物数据的产量,中国科学院基因组学研究所(,“,华大基因,”,)每天的测序能力:,5000,万碱基对(,5*107,),一个人的基因组:,3.2*109,碱基对,籼稻基因组:,4.3*108,碱基对,全世界每年生物数据产出量:,1015,字节,英国,Sanger,中心今后,5,年每年新增硬盘:,80-100TB,,即,(0.81)*1014,字节,GenBank 138,版,(2003,年,10,月,15,日,),序列数,:,29 819 397 (2981,万,),核苷酸,(,字母,),数,:,35 599 621 471 (355,亿,),序列平均长度,: 1193,计算机:用火以来的最伟大发明,ENIAC,(,1944,):每秒,330,次乘法运算,神威计算机:每秒,3840,亿次浮点运算,曙光,3000,计算机:每秒,4000,亿次浮点运算,每秒,1,万亿次,=1012,次,/,秒,数学、物理和计算机科学大有可为,生物学引论,地球上的自然史,13 Bys:,大爆炸,4.9 Bys:,太阳系和地球诞生,3.8 Bys:,地球上出现原始生命,2.7 Bys:,细菌、光和作用,1.7 Bys:,多细胞生物,550 Mys:,寒武纪,(Cambrian),物种大爆发,425 Mys:,志留纪,(Silurian),物种爆发,65 Mys:,恐龙灭绝,3.5 Mys:,化石古猿科与人科分离,0.7 Mys:,人类与黑猩猩分离,0.5 Mys:,北京人,(Homo erectus),0.4 Mys:,智人,(Homo sapiens),100-20 Kys:,山顶洞人,221 BC, 2224,年前:秦始皇统一中国,模式生物,噬菌体,(Bacteriophage: lambda, T4, T7),病毒,(Viruses: SV40, HIV),大肠杆菌,(Escherichia coli),酵母,(Saccharomyces cerevisiae , yeast budding),线虫,(Caenorhabitidis elegans, nematode, worm),果蝇,(Drosophila melanogaster, fruitfly),拟南芥,(Arabidopsis thaliana),水稻,(Oryza sativa, rice),非洲爪蟾,(Xenopus laviae, African frog),斑马鱼,(Danio rerio, Zebra fish),小鼠,(Mus musculus, mouse),智人,(Homo sapiens),遗传物质,核酸,(DNA),:线性和环状,质粒,(Plasmids),:线性和环状,染色体:,DNA +,组蛋白,线粒体:有自己的,DNA,叶绿体:也有自己的,DNA,生命现象的众多层次,系统生物学、生物复杂性、生态系统,生物多样性、种群动力学,动物行为科学,个体、器官、组织,细胞及其通信、信号传导,免疫网络、调控网络、代谢网络,复制、转录、剪接、翻译、运输,生物大分子,:,蛋白质与核酸(,DNA,、,RNA,),小分子,(,糖、脂肪、核苷酸、氨基酸,),、金属离子、水,分子和原子的相互作用,来自我们工作的几个具体例子,完全基因组中的缺失和稀少字串:相关的组合学和语言学问题,籼稻基因组框架图:测序读出大量短串的拼接、重复序列带来的困难、长,DNA,链中寻找基因,细菌亲缘关系和分类学,细菌完全基因组中的缺失和稀少短核苷酸串,以大肠杆菌为例:,一个,DNA,环:,4 639 221,个,a,c,g,t,字母,长度为,8,的短串共有种,65536,种,同长随机序列中平均每种串出现,71,次,实际情形如何?,seeDNA,程序演示,C,语言,+ Xlib + Xtoolkit,UNIX,或,LINUX,平台,由,GenBank,取得基因组数据,背后的组合学和语言学问题,水稻叶绿体基因组,可能曾经是一种光合细菌,全部由,a,、,c,、,g,、,t,四种核苷酸组成的序列,粳稻(日本,1989,):,134525,个字母籼稻(中国,2001,):,134559,个字母,cccaatatcttgcttcagcaagatattgggtatttctagctttcctttcttcaaaaattgctatatgttagcagaaaagccttatccattaagagatggaacttcaagagcagctaggtctagagggaagttgtgagcattacgttcgtgcattacttccataccaagattagcacggttgatgatatcagcccaagtattaataacgcgaccttggctatcaactacagattggttgaaattgaatccgtttagattgaaagccatagtactaatacctaaagcagtgaaccaaatccctactacaggccaagcagccaagaagaagtgtaaagaacgagagttgttaaaactagcatattggaagattaatcggccaaaataaccatgagcggccacaatattataagtttcttcctcttgaccaaatctgtaaccctcattagcagattcgttttcagtggtttccctgatcaaactagaggttaccaaggaaccatgcatagcactgaatagggaaccgccgaatacaccagctacacctaacatgtgaaatggatgcataaggatgttatgctctgcctggaatacaatcataaagttgaaagtaccagatattcctaaaggcataccatcagagaaacttccttgaccaatagggtaaatcaagaaaacagcagtagcagctgcaacaggagctgaatatgcaacagcaatccaaggacgcatacccagacggaaactcagttcccactcacgacccatataacaagctacaccaagtaagaagtgtagaacaattagctcataaggaccaccattgtataaccactcatcaacagatgcagcttcccaaattgggtaaaagtgcaatccgatcgccgcagaagtaggaataatggcaccagagataatattgtttccgtaaagtaaagaaccagaaacaggctcacgaataccatcaatatctactggaggggcagcgatgaaggcgataataaatacagaagttgcggtcaataaggtagggatcatcaaaacaccgaaccatccgatgtaaagacggttttcggtgctagttatccagttgcagaagcgaccccacaggcttgtactttcgcgtctctctaaaattgcagtcatggtaagatcttggtttattcaaattgcaaggactcccaagcacacgtattaactagaaagataatagaaggcttgttatttaacagtataatatagactatataccaatgtcaaccaagccagccccgacagttgtatatccatacaacaaaatttaccaaaccaaaaaattttgtaaatgaagtgagtgaaaaatcaaaactcagattgctcctttctagtttccatatgggttgcccgggactcgaacccggaactagtcggatggagtagataattattccttgttacaatagagaaaaaacctctccccaaatcgtgcttgcatttttcattgcacacgactttccctatgtagaaataggctatttctattccgaagaggaagtctactaatttttttagtagtaagttgattcacttactatttattatagtacagagaacatttcagaatggaaactgtgaaagttttaccttgatcatttatcaatcatttctagtttattagttttgtttaatgattaattaagaggattcaccagatcattgatacggagaatatccaaataccaaatacgctcactgtgcgatccacggaaagaaaagtaagttgttttggcgaacatcaaagaaaaaacttgctcttcttccgtaaaaaattcttctaaaaataccgaacccaaccattgcataaaagctcgtaccgtgcttttatgtttacgagctaaagttctagcgcatgaaagtcgaagtatatactttagtcgatacaaagtcttcttttttgaagatccactgtgataatgaaaaagatttctacatatccgaccaaaccgatcaagaatatcccaatccgataaatcggtccaaattggtttactaataggatgccccgatccagtacaaaattgggcttttgctaaagatccaatgagaggagtaacagggactttggtatcgaattttttcatttgagtatctattagaaatgaattctccagcatttgattccttactaacaaagaatttattggtacacttgaaaagtaccccagaaaatcgaagcaagagttttctaattggtttagatggatcctttgcggttgagtccaaaaagagaaagaatattgccacaaacggacaaggtaacatttccatttcttcttcaaaagaagagttccttttgatgcaagaattgcctttccttgatatcgaacataatgcataaggggatccataacgaaccatatggttttccgaaaaaaagcagggtacattaacccaaaatgttccatcttcctagaaaagatgattcgttccagaaaggttccggaagaagttaatcgcaagcaagaagattgtttacgaagaaacaacaagaaaaattcatattctgatacataagagttatataggaaccgaaatagtcttttattttcttttttcaaaataaaaatggatttcattgaagtaataaaactattccaattcgagtagtagttgagaaagaatcgcaataaatgcaaggatggaacatcttggatccggtattgaaggagttgaagcaagatatccaaatggataggatagggtatttctatatgtgctagataatgtaagtgcaaaaatttgtcttctaaaaaaggaaatattgaatgaatagatcgtaaattctgaaactttggtatttctttttcttccggacaagactgttctcgtagcgagaatgggatttctacaacgatcgcaaacccctcagatagaatctgagaataaaactcagaataaaaaaaattgttgtaatccaataatcgatcttggttaggatgattaaccaaattaatccaaaaattctgctgatacattcgaatcattaaccgtttcacaagtagtgaactaaatttcttgttattagaaccaataatttcgacaagttcggaaccatttaatccataatcatgggcaaacacataaatgtactcctgaaagagtagtgggtagacgaaatattgtctaggaaatttaagtttttctgaataaccctcgaatttttccatttgtatttctacttgaatcagagagagagaaatatttctcggtttatcaaatggtgatacatagtacaatatggtcagaacagggtgttgcattttttaatacaaacccctggggaagaaaaggagtctaatccacggatctttttccgctccttttctatccaatttgtttatgtttgttctaattacaaaagagaacaaatcctttatttttgcaggccaattgctcttttgactttgggatacagtctctttatcaatatactgcttcttttacacattcaatccataacatccttttcaatccaaaatcaagaataattaggatttctaaaaaaaaaagaaaaaatcaaaggtctactcataggaaaaccagcttttccctacatcaggcactaatctatttttaacgtctaattagatcagggagttcttccaattaagaagttaagctcgttgctttttgttttaccagaattggagccaggctctatccatttattcattagacccagaaaatcagaatttttttattccattccaaaaatccaaaataagaaattgattttattacgacatgctattttttccattcattacccttgaggatcagtcgcggtcttatagactctaccaagagtctggacgaattttttgcttcatccaaatgtgtaaaagatcatagtcgcacttaaaagccgagtactctaccattgagttagcaacccagataaactaggatcttagatacgatcgaaatccaaaaatcaatggaattacaccgcacacccctgtcaaaatcttaaaatagcaagacattaaaagaaagattttatcaccattgaaaacactcagataccaaaaggaacgggtctggttaaatttcactaaggttaaaagtggcaccaatcacgatcgtaaaattgtcatttttttagcatttttatttaaataaataaataaatcttgtatgagagtacaaacaagagggacaaccctaccatttgagcaaagtgtaggcaaaaaacctaatagggagtgaggataaagagacttatccatctacaaattctagatgttcaatggacctttgtcaatggaaatacaatggtaagaaaaaaattagatagaaaaactcaaaaaaataaaggcttatgttggattggcacgacataaatccagtcaaaaataggattaagaaagaggcaaattatttctaaatagttagacaacaagggatactagtgagcctctcctagttttttattcatttagttcttcaattaactcaaagttctttctttttctttaaagaattccgccttccttaaaatatcagaaacggttcttgtaggttgagcacctttttcaaggaaatagagaatagctggaacatttaaacaagtttgattctttatcggatcataaaaacctacttttcgaagatctcttccttctcttcgagatcgaacatcaattgcaacgattcgatagacagcttattgggatagatgtagataaataaagccccccctagaaacgtataggaggttttctcctcatacggctcgagaatatgacttgcattaatttccgtacagaaaaaacaaatttcatttatactcatgactcaagttgactaattttgattgacagacttgaaagaaaaaaatcctttgaaattttttgagtcgtctctaaactcttttctttgcctcatctcgaacaaattcacttttattccttattccggtccaattctattgttgagacagttgaaaatcgtgtttacttgttcgggaatcctttatctttgatttgtgaaatccttgggtttaaacattacttcgggaattcttattcttttttctttcaaaagagtagcaacatacccttttttcttatttccttcgataaagcatttccctcttctatagaaatcgaatatgagcgattgattctgatagactttaatcaaaagagttttcccatatcttccaaaattggactttcttcttattttaaccttttgatttctatattatttcgatttctatattaagggtagaatgacaaagttggcctaatttattagttttcactaaccctagattctttcccttgataaaaaataaattctgtcctctcgagctccatcgtgtactatttacttagcttacttacaaacaacccagcgaaaattcggttcgggacgaatagaacagactatgtcgagccaagagcattttcattactatggaaaatggtggatagcaaaatccacaatcgatcgtgtccttcaagtcgcacgttgctttctaccacatcgttttaaacgaagttttaacataacattcctctaatttcattgcaaagtgttatagggaattgatccaatatggatggaatcatgaatagtcattagtttcgttttttgtatactaattcaaacttgctttgctatctatggagaaatatgaataaaagaaattaagtatttatcgggaaagactccgcaaagagccaatttatttaaacccatattctatcatatgaatgaaatatagttcgaaaaaagggaataaacaagtttgcttaagacttatttattatggaatttccatcctcaacagaggactcgagatgatcaatccaatcctgaaatgataagagaagaattgactcttctccaacaaataaactatcaacctcccgtttaattaatttaattaatatattagattagcaatctatttttccataccatttttccgtaacaaaactaattaactattaactagttaaactattgcaatgaaaagaaagttttttggtagttatagaattctcgtatttcttcgactcgaataccaaaagaaagaaaaaaatgaagtaaaaaaaacgcatttcctgtaaagtaaaattaaggtctttgcttttacttattttttcttttacctaaaagaagcaactccaaatcaaaattgaatccattctatctaacgagcagttcttatcttatctttaccgggatggatcattctggatatttaaaaaatcgcggatcgagatcgtttttgcttaaccaaagaaagaaaaagaagaaggaaccttttttactaataaaatactataaaaaaaatttatctctatcataaatctatctctaccataaaggaataggtctcgttttttatacaatgttctacgtcaagtttaaaattttttcatgaaaaaaagattttcaatttgactggacttgacactggattatgttttctgagacagaaaatgaacgcattaggactgcatcgaatctaagagtttataagagaaaaaaattctctttaataaactttatgtctcgtgcagaatacaatacgatttcatctttcgtttcatcagaaaaaatctgggacggaaggattcgaacctccgagtaacgggaccaaaacccgctgccttaccacttggccacgccccatttcgggttttatgcgacactaataaacagtattatgtttatttcttattcgtcaatcctacttcaattacataaaaatggggggtattctcttggtaggattctagacatgcgaataatatagaatccaaaaaatgcattgatcattacatggaattctattaagatattatatgaaagtcgaatttcttccactctcatttgagagtgcgaatacaaggaggtattttgtgtttgggaaagtccgaagaaaaaaggattttgaatcctccttttcctttttcccttagaaaaataactcaatcaaaatccaattatctactctacaagaacgaaacgcttgttatgcctaatatacttagtttaacctgtatttgttttaattctgttatttatccgactagttttttcttcgccaaattgcccgaagcttatgccattttcaatccaatcgtggattttatgcctgtcatacctgtactcttttttctattagcctttgtttggcaagctgctgtaagttttcgatgaaatctttactactctgtctgccaaattgaatcatgtattcattctaaaaaaattcgaaaaatggataagagccgagaagtcttatattatgaaccttcgattctaaaattcaaattcttctacattgaatgtatagctgcagcaataaatttggatcagcctttctactccctgcatctacgttgagcaggtatctttaggtaaccgcacaatacctaacctaatttattgataagagtgcttattataaatcaattcttgcaatttttttcaaaaattgatttttgcatttttaggtgtcaaaataaacaaaacccatcctagtggatttgtgtggtaaggaaaaacgggtaatctattccttaaaaaaaaatcttggagattatgtaatgcttactctcaaactttttgtttatacagtagtgatattctttgtttccctctttatctttggattcttatctaatgatccaggacgtaatcctgggcgtgacgagtaaaaatccaaaattttttcttacaaattggatttgtttcatacatttatctacgagaaaatccgggggtcagaattccttccaattcgaaagtcccaaacgatccgagggggcggaaagagagggattcgaaccctcggtacaaaaaaattgtacaacggattagcaatccgccgctttagtccactcagccatctctccccgttccaaatcgaaaggtttccgtgatatgacagaggcaagaaataacgattgcaaaaaatccttcctttttctttcaaaagttcaaaaaaattatattgccaattccattttagttatattcttttttcttaatgttaataaaaaaaagaagaaaattcttcttttttctttctaattctaaaattggatattggctaaaagacaatcagatagattttctcttcagcaggcatttccatataggacttgttataataaaacaagcaggttatagaaaaaaactcttttttttattatttatcaacaaagcaaaaaggggtcttatcaaaccaacccaccccataaaattggaaagaaagataaagtaagtggacctgactccttgaatgaggcctctatccgctattctgatatataaattcgatgtagatgaaattgtataagtggatttttttgtatttccttagacttagaccacgcaaggcaagaatttctcgctatttactatttcatattcttgttactagatgttctataggaataagaagaaatcgcaacccctttccgctacacataaaaatggatttcgaaagtcaatttttcttttcaatatctttactttttttcagaatcctatttttgttcttatacccatgcaatagagagcgagtgggaaaagggaggttactttttttcattttttccttaaaaaataggctttcttggaaataggaatcatggaataatctgaattccaatgtttatttctatagtataagaaaaactaattgaatcaaattcatggatttaccacgacctcggctgtgaccccatagataaaaatgcaaaatttctatcttcgagaccattgaaaaaaggcattgaacgagaaaaaatcgtccacagataatctatcgtatgccttggaagtgatataaggtgctcggaaatggttgaagtaattgaataggaggatcactatgactatagcccttggtagagttactaaagaagaaaatgatttatttgatattatggacgactggttacgaagggaccgttttgtttttgtaggatggtctggcctattgctttttccttgtgcttatttcgctttaggaggttggtttacagggacaacttttgtaacttcttggtatacccatggattggcgagttcctatttggaaggttgcaatttcttaaccgcagcagtttccacccctgccaatagtttagcacactctttgttgctactatggggcccggaagcacaaggggattttactcgttggtgtcaattaggtggtctgtggacttttgttgctctccatggggcttttgcactaataggtttcatgttacgtcaatttgaacttgctcggtctgttcaattgcggccttataatgcaatttcattctctggcccaatcgctgtttttgtttccgtattcctgatttatccactggggcaatccggttggttctttgcgccgagttttggcgtagcagcgatatttcgattcatcctcttcttccaaggatttcataattggacgttgaacccatttcatatgatgggagttgccggagtattaggcgcggctctgctatgcgctattcatggggcaaccgtgga,寻找基因,生物知识体现为基因模型,基因模型的数学实现,马可夫、半马可夫和隐马可夫链,动态规划算法,语言学模型:生成语法,各种数学模型和算法,独立随机模型,马可夫、隐马可夫、半隐马可夫模型,聚类分析,判别分析(,discriminance analysis,),动态规划算法,形式语言学方法,细菌分类,难处:形态性状少,形状:杆、球(单、双、链、葡萄)、,分枝、弯曲,着色:革兰氏阳性和阴性,生化:厌氧、固氮、脱硫,进展:,16S rRNA,序列、三界论,(Carl Woese),困惑:完全基因组带来问题,基因横向传递?,基因树不等于物种树,基于组分矢量的构树方法,基于,K-,肽计数的代表矢量,20K,维空间中的距离,用,K-2,阶马可夫链扣除随机背景,基于,132,个完全基因组的亲缘树,(K=6),16,个古细菌,110,个真细菌,6,个真核生物,Towards a Paradigm Shift in BiologyWalter Gilbert, Nature 349 (1991),The new paradigm, now emerging, is that all “genes” will be known (in the sense of being resident in databases available electronically), and that the starting point of a biological investigation will be theoretical. An individual scientist will begin with a theoretical conjecture, only then turning to experiments to follow or to test that hypothesis.,为新世纪培养“广谱”科学人才,数、理、化基础,生物知识,计算机和网络技能,从那门学科开始并不重要,要兼容并蓄而不排它,不为自己设限,大科学需要团队精神,做好自己的工作、尊重别人的工作;适应不同的思维方式和研究风格,学术界互相支持而不彼此拆台,适应不同的思维方法:因果论和“目的论”,任何科学都来自对客观世界的反映,数理科学:“放之宇宙而皆准”的普遍原理、逻辑和演绎的方法,生命科学:小小地球上一定历史时期、一定空间和温度范围内的极其特殊的现象、归纳为主的方法,唯其特殊、所以复杂,不同的语言:因果和“目的”,汤佩松、王竹溪,60,多年前的贡献,J. Phys. Chem. 45 (1941) 443 (1940,年,8,月,9,日收到寄自昆明西南联大的文稿,),孤立细胞中水关系的热力学描述,使用化,学势,不同于当时的渗透压理论,1950,年代国内的争论:汤王,“,败阵,”,1960,年代国外回到热力学理论,1980,年代以后国际上注意到汤王早期工作,(,感谢刘寄星博士提供素材,),参考书,1,。郝柏林、刘寄星主编,,理论物理与生命科学,,上海科学技术出版社,,1997,,,1999,。,2,。邹承鲁,,生物学在召唤,,上海科技教育出版社,,1999,。,3,。郝柏林、张淑誉,,生物信息学手册,,上海科学技术出版社,,2000,,,2002,。,4,。郝柏林,,生物信息学浅说,,上海科技教育出版社,,2003,。,5,。,“,GOOGLE,大学,”,:,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 压缩资料 > 基础医学


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!