生物信息学第一章绪论课件

上传人:无*** 文档编号:241596648 上传时间:2024-07-08 格式:PPT 页数:76 大小:15.29MB
返回 下载 相关 举报
生物信息学第一章绪论课件_第1页
第1页 / 共76页
生物信息学第一章绪论课件_第2页
第2页 / 共76页
生物信息学第一章绪论课件_第3页
第3页 / 共76页
点击查看更多>>
资源描述
生生 物物 信信 息息 学学山西农业大学动物科技学院山西农业大学动物科技学院General Informationl课程名称:生物信息学课程名称:生物信息学 Bioinformaticsl学学 时:时:28(课堂教学)(课堂教学)12(实验教学)(实验教学)l教教 师师:梁梁 琛琛(Liang Chen)l联系方式:联系方式: 6287208Textbookl lTextbookTextbook 生物信息学,萧浪涛主编,中国农业出版社生物信息学,萧浪涛主编,中国农业出版社生物信息学,萧浪涛主编,中国农业出版社生物信息学,萧浪涛主编,中国农业出版社l lAdditional ReadingAdditional Reading1.巴恩斯(英)著巴恩斯(英)著,丁卫丁卫,李慎涛李慎涛,瘳晓萍译瘳晓萍译.2009.遗传学工作遗传学工作者的生物信息学者的生物信息学.科学出版社科学出版社.2.薛庆中等薛庆中等,2010.DNA和蛋白质序列数据分析工具和蛋白质序列数据分析工具.科学出科学出版社版社.3.吴祖建等吴祖建等,2010.生物信息学分析实践生物信息学分析实践.科学出版社科学出版社.4.New Developments in Biostatistics and Bioinformatics.2009.World Scientific Publishing Company.5.罗静初罗静初,2002.生物信息学概论生物信息学概论.北京大学出版社北京大学出版社.6.赵国屏赵国屏,2002.生物信息学生物信息学(863高科技丛书高科技丛书).科学出版社。科学出版社。7.张成岗张成岗,贺福初贺福初,2002.生物信息学方法与实践生物信息学方法与实践.科学出版社科学出版社.8.钟杨钟杨,张亮张亮,赵琼赵琼,2001.简明生物信息学,高等教育出版简明生物信息学,高等教育出版社社.Accomplishment rateFinal Exam 60%Experiments 20%Homework 10%Participation rate 10%How to Succeed in Classl lIn In case case you you miss miss a a class,class,read read the the chapter chapter corresponding to that class.corresponding to that class.l lConsult the instructor if you have questions.Consult the instructor if you have questions.l lExams Exams should should not not be be a a problem problem if if you you have have been been following following the the classes classes and and reading reading the the textbook.textbook.l lFamiliarize Familiarize with with the the software software and and tools;tools;think think what what aspect aspect of of bioinformatics bioinformatics learning learning you you like the most.like the most.ProblemsGeneFunctionStructureProtein structureDNA sequenceData base 1 2 3 4 5 6 7 8 9 10第一章 绪 论一、什么是生物信息学?一、什么是生物信息学?研究材料(研究什么?)研究材料(研究什么?)研究方法(如何研究?)研究方法(如何研究?)生物学数据海生物学数据海量、复杂,在质和量、复杂,在质和量两个方面都提出量两个方面都提出了严峻的挑战。了严峻的挑战。计算机处理能力计算机处理能力提高,计算方法的创提高,计算方法的创新和发展,使海量、新和发展,使海量、复杂的数据得以有效复杂的数据得以有效的管理和运行。的管理和运行。生物信息学生物信息学生物信息学的诞生生物信息学的诞生DNA双螺旋结构的阐明开创了分子生物学时代。双螺旋结构的阐明开创了分子生物学时代。分子生物学和遗传学等分子生物学和遗传学等相关领域的文献数量飞相关领域的文献数量飞速增长,更为大量的数速增长,更为大量的数据不再以传统的文献形据不再以传统的文献形式发表,最典型的是式发表,最典型的是DNA序列数据。序列数据。1 tagaattctt ttcatttgtg aactcgtgct tttcatggaa ccgcaccatt cagcaaaaag 61 gacagggccc aaatggcttc aggagggcag tcctctattg cccttctggc tgaggcccct 121 actttgcccc tgattgagga gctgctagaa gaatcccctg gcgaacagcc aaggaagccc 181 cggctcctag ggcattcact gcggtacatg ctggagttgt accggcgttc agctgactcg 241 catgggcacc ctagagagaa ccgcaccatt ggggccacca tgccgtagat ggtgaagccc 301 ttgaccaatg tggcaaggcc tcacccaggt acctggctta tacagatcct gggctttcct 361 ctcagaccaa accgaggact ataccaacta gttagagcca ctgtggttta ccgccatcat 421 ctccaactaa ctcgcttcaa tctctcctgc catgtggagc aggtcgtgca gaaaaaccca 481 accaaccact tcccttcctc agaaggagat tcctcaaaac cttccctgat gtctaacgct 541 tggaaagaga tggatatcac acaacttgtt cagcaaaggt tctggaataa caagggacac 601 aggatcctac gactccgttt tatgtgtcag cagcaaaaag atagtggtgg tcttgagctc 661 tggcatggca cttcatcctt ggacattgcc ttgctgttat tctatttcaa gaatactcat 721 aaaagcattc ggaaggctaa atttcttccc aggggcatgg aggagttcat ggaaagggaa 781 tctcttcaag ggagaacccg acactcagat ggtatctcag ctgaggttac tgcctcttcc 841 tcaaaacata gcttccctga aaataaccag tgttccctcc accctttcca aatcagcttc 901 cgccagctgg gttgggatca ctggatcatt gctccccctt tttacacccc aaactactgt 961 aaaggaactt gtctccgagt actacgcgat ggtctcaatt cccccaatca cgccattatt 1021 cagaacctta tcaatcagtt ggtcaaccag agtgtccccc ggccctcctg tgtcccgtat 1081 aagtatgttc caattagtgt ccttatgatt gaggcaaatg ggagtatttt gtacaaggag 1141 tatgagggta tgattgctga gtcttgtaca tgcagatgaBMP15人类基因组计划人类基因组计划(Human Genome Project,HGP)HGP是是由由美美国国能能源源部部和和美美国国国国立立卫卫生生研研究究院院(NIH)提提出出并并资资助助,其其目目标标是是提提供供公公开开、完完全全、高高质质量量的的人人类类基基因因组组全全序列。序列。人类基因组测序中心人类基因组测序中心HGP is a“Moon-landing Project”in life sciences.Genomics:A science cultivated by the HGP.The genomic era is characterized by using genome data in every bio lab in the world.“Whats Human Genome Project?”“One base One dollar!”by a taxi driver(and a tax payer)人类基因组测序十周年人类基因组测序十周年l2000年年6月月26日,中、美、英、日、德、日,中、美、英、日、德、法六国宣布人类基因组工作草图绘制完法六国宣布人类基因组工作草图绘制完成。成。l人们对这张基因蓝图寄予厚望,认为人人们对这张基因蓝图寄予厚望,认为人类基因组测序的完成是一个里程碑式的类基因组测序的完成是一个里程碑式的成就,它将把我们带入一个分子医学的成就,它将把我们带入一个分子医学的新纪元,将为预防、诊断和治疗疾病带新纪元,将为预防、诊断和治疗疾病带来新的方法。来新的方法。l自然自然(Nature)做了专题)做了专题人类基因组十人类基因组十周年志(周年志(The human genome at ten)。国际人类基因组单倍型图计划国际人类基因组单倍型图计划The genetic markerssaturating the whole genomemake GWAS possible.Canada 10%China 10%(BGI 6%)Japan 25%UK 25%USA 30%(PGP)随随着着人人类类基基因因计计划划过过程程中中出出现现的的爆爆炸炸性性增增长长的的序序列列信信息息加加速速了了生生物物信信息息学学的的发发展展,促促进进了了生生物物信信息息学学这这一一门门学科的发展。学科的发展。DNA数据的增长数据的增长 2006年已有相当于年已有相当于50个人类基因组的序列。个人类基因组的序列。l电子计算机芯片的数字处理能力电子计算机芯片的数字处理能力l大型计算机的数据处理能力大型计算机的数据处理能力生物学相关信息量的革生物学相关信息量的革命性爆炸命性爆炸需要处理海量、复需要处理海量、复杂的生物学数据杂的生物学数据计算机技术的计算机技术的革命性发展革命性发展有能力处理如此纷有能力处理如此纷繁复杂的数据繁复杂的数据 生物信息学在综合计算生物信息学的研究生物信息学在综合计算生物信息学的研究和生物信息学的计算机处理的基础上迅速而成和生物信息学的计算机处理的基础上迅速而成功地发展起来了。功地发展起来了。生物信息学的诞生生物信息学的诞生19561956年年,美美国国召召开开过过首首次次“生生物物学学中中的的信信息息理理论讨论会论讨论会”一一门门相相当当年年轻轻的的学学科科,继继2020余余年年的的沉沉默默之之后后,伴伴随随着着上上世世纪纪八八九九十十年年代代计计算算机机技技术术的的迅迅猛猛发发展,才得以获得大发展。展,才得以获得大发展。生生物物信信息息学学的的实实质质就就是是利利用用计计算算机机科科学学和和网网络络技术来解决生物学问题。技术来解决生物学问题。已已经经悄悄然然渗渗透透到到生生物物科科学学的的每每一一个个角角落落,人人们们在意识到它的存在之前就已经离不开它了!在意识到它的存在之前就已经离不开它了!研究材料研究材料(研究什么?)(研究什么?)研究方法研究方法(如何研究?)(如何研究?)生物学数据生物学数据各种计算技术各种计算技术和网络技术和网络技术BiologyMedicineMaths&PhysicsComputer ScienceBioinformatics生物信息学是多学科交叉产生的一门新兴学科生物信息学是多学科交叉产生的一门新兴学科 广义上,广义上,生物信息学生物信息学(Bioinformatics)包含了对生物信息的获包含了对生物信息的获取、加工、储存、分析和解释等,并综合运取、加工、储存、分析和解释等,并综合运用数学、计算机科学和生物学的各种工具,用数学、计算机科学和生物学的各种工具,来阐明大量生物学数据所包含的生物学意义。来阐明大量生物学数据所包含的生物学意义。生物信息学的定义“The precise sequence of the bases is the code which carries the genetic information.”Watson&Crick,May 30,1953“GENETIC IMPLICATIONS OF THE STRU-CTURE OF DEOXYRIBONUCLEIC ACIDS”“Life is of sequence”“Life is digital”John Sulston2002年,诺贝尔医年,诺贝尔医学奖获得者学奖获得者 生物信息学研究的具体内容生物信息学研究的具体内容 把把基基因因组组 DNA序序列列信信息息分分析析作作为为源源头头,找找到到基基因因组组中中代代表表蛋蛋白白质质和和 RNA基基因因的的编编码码区区,阐阐明明非非编编码码区区的的信信息息实实质质,破破译译隐隐藏藏 在在 DNA序序列列中中的的语语文文规规律律;同同时时,归归纳纳、整整理理与与基基因因组组遗遗传传语语文文信信息息释释放放及及其其调调控控相相关关的的转转录录谱谱和和蛋蛋白白质质谱谱数数据据,从从而而认认识识代代 谢谢、发发 育育、分分 化化、进进 化化 的的 规规 律律。生物信息学具有三个方面的科学基础发达的、复杂的、可以相互交流的数据发达的、复杂的、可以相互交流的数据库系统库系统强有力的创新算法和软件强有力的创新算法和软件自动化、大规模、高通量的生物学研究自动化、大规模、高通量的生物学研究方法与平台技术方法与平台技术基因组信息学基因组信息学生物信息学包含三个层次上的内容生物信息学包含三个层次上的内容蛋白质结构的计算与模拟蛋白质结构的计算与模拟分子与药物设计分子与药物设计第一章第一章 绪论绪论 什么是生物信息学什么是生物信息学?第二章第二章 生物学基础知识生物学基础知识第三章第三章 分子生物信息数据库分子生物信息数据库第四章第四章 核酸序列分析和比对核酸序列分析和比对第五章第五章 分子系统发育和分子进化分析分子系统发育和分子进化分析第六章第六章 基因组分析基因组分析第七章第七章 蛋白质组分析蛋白质组分析第八章第八章 蛋白质结构预测的原理和方法蛋白质结构预测的原理和方法Fields of StudyAims and Demands 了解生物信息学这门新兴学科的主要了解生物信息学这门新兴学科的主要研究内容研究内容和研究方法和研究方法,以及与其他学科间的关系和发展,以及与其他学科间的关系和发展前景。前景。掌握掌握分子生物数据库分子生物数据库的特点、功能以及数据库的特点、功能以及数据库检索的方法,能够熟练的进行检索的方法,能够熟练的进行核酸序列分析核酸序列分析,以及蛋白质结构分析和预测以及蛋白质结构分析和预测。二、生物信息学的生物学内涵二、生物信息学的生物学内涵(一)基因与基因组的信息学(一)基因与基因组的信息学1.大规模基因组测序中的信息分析大规模基因组测序中的信息分析 2.新基因和新新基因和新SNP的发现与鉴定的发现与鉴定 3.非编码区信息结构分析非编码区信息结构分析 4.遗传密码起源和生物进化的研究遗传密码起源和生物进化的研究 5.完整基因组的比较完整基因组的比较 humanArabidopsis拟南芥拟南芥Escherichia coli大肠杆菌大肠杆菌Buchnerasp.APSRickettsia prowazekiiUreaplasma urealyticumBacillus subtilisDrosophila melanogasterThermoplasma acidophilumPlasmodium falciparummouseCaenorhabitis elegansratBorrelia burgorferiAquifex aeolicusNeisseria meningitidisMycobacterium tuberculosis Borrelia burgorferiThermotoga maritimaHelicobacter pylori 已完成基因组测序的物种已完成基因组测序的物种2、新基因和新、新基因和新SNP的发现与鉴定的发现与鉴定A.利用利用 EST 数据库发现新基因和新数据库发现新基因和新 SNPB.从基因组从基因组DNA序列中预测新序列中预测新 ORFC.建立整合基因索引及与之相关的整合建立整合基因索引及与之相关的整合蛋白索引蛋白索引EST(Expressed Sequence tags)表达序列标签表达序列标签 此此技技术术以以大大规规模模cDNA测测序序为为基基础础,即即提提取取生生物物体体的的mRNA,进进一一步步获获得得cDNA文文库库,挑挑选选其其中中300-500bp的的部部分分(即即EST序序列列)进进行行序序列列测测定定,然然后后通通过过生生物物信信息息学学手手段段得得到到全全长长的的基基因因序序列列。通通常常EST序序列列位位于于一一段段cDNA的的3 端端非非翻翻译译区区,也也可可以以在在该该cDNA中中随随机机选选取取。利利用用EST技技术术克克隆隆基基因因及及功功能能分分析析,使使克克隆和定位新基因的策略发生了巨大变革。隆和定位新基因的策略发生了巨大变革。SNP(Single nucleotide polymorphisms)单核苷酸多态性单核苷酸多态性 SNP是基因组水平上单个核苷酸变异是基因组水平上单个核苷酸变异所引起的所引起的DNA序列多态性。序列多态性。1-4:CC型;型;5-6:CD型;型;7-8:DD型型ORF(open reading frame)开放阅读框开放阅读框 基基因因序序列列的的一一部部分分,包包括括一一段段可可以以编编码码蛋蛋白白质质的的碱碱基基序序列列,不不能能被被终终止止子子打打断断,当当一一个个新新基基因因被被识识别别时时,无无法法搞搞清清楚楚其其序序列列。因因为为在在没没有有其其他他信信息息的的前前提提下下,DNA序序列列可可以以按按6种种框框架阅读和翻译。架阅读和翻译。3、非编码区信息结构分析、非编码区信息结构分析 在高等生物和人的基因组中,非编码区占在高等生物和人的基因组中,非编码区占基因组序列的绝大部分。从生物进化的观点来基因组序列的绝大部分。从生物进化的观点来看,随着生物体功能的完善和复杂化,非编码看,随着生物体功能的完善和复杂化,非编码区序列呈增加的趋势表明:这部分序列区序列呈增加的趋势表明:这部分序列必定有必定有重要的生物学功能重要的生物学功能。现在认为,。现在认为,它们与基因的它们与基因的表达调控有关表达调控有关。这部分内容也是未来相当长时。这部分内容也是未来相当长时间内的热点课题。间内的热点课题。4、遗传密码起源和生物进化的研究、遗传密码起源和生物进化的研究 随随着着分分子子生生物物学学不不断断发发展展,进进化化论论的的研研究究也也进进入入了了分分子子水水平平,并并建建立立了了一一套套依依赖赖于于核核酸酸、蛋蛋白白质质序序列列信信息息的的理理论论方方法法,步步骤骤如如下下:序列相似性比较序列相似性比较序列同源性分析序列同源性分析构建系统进化树构建系统进化树稳定性检验稳定性检验相似性(相似性(similarity):只反映序列类似,):只反映序列类似,并不包含任何与进化相关的暗示。并不包含任何与进化相关的暗示。同源性(同源性(homology):指与共同祖先序列):指与共同祖先序列的相似性。的相似性。5、完整基因组的比较、完整基因组的比较 比较基因组学(比较基因组学(comparative genomics)将全部基因按照功)将全部基因按照功能和系统发生分为若干类,包括能和系统发生分为若干类,包括与复制、转录、翻译、分子伴侣、与复制、转录、翻译、分子伴侣、能量产生、离子运转、各种代谢能量产生、离子运转、各种代谢相关的基因。相关的基因。核心:获得基因的功能表达谱核心:获得基因的功能表达谱在核酸和蛋白质两个层次上都发展了在核酸和蛋白质两个层次上都发展了新技术:新技术:1、DNA芯片技术芯片技术 2、大规模蛋白质分离、序列鉴定技术(二维、大规模蛋白质分离、序列鉴定技术(二维凝胶电泳和测序质谱相结合)凝胶电泳和测序质谱相结合)(二)基因表达的信息学:(二)基因表达的信息学:大规模基因功能表达谱的分析大规模基因功能表达谱的分析基基因因芯芯片片1.Affimatrix2.NimbleGene3.Agilant4.deCODE5.Illumina6.博奥博奥(Beijing)1.1.等电聚焦电泳系统等电聚焦电泳系统2.2.聚丙烯酰胺凝胶电泳预试验装置聚丙烯酰胺凝胶电泳预试验装置3.3.聚丙烯酰胺凝胶电泳系统聚丙烯酰胺凝胶电泳系统132透射扫描仪透射扫描仪(三)生物大分子的三维结构信息学(三)生物大分子的三维结构信息学1.蛋白质组计算机图像数据处理;蛋白质组计算机图像数据处理;2.构建蛋白质数据库,相关软件的开发和应用;构建蛋白质数据库,相关软件的开发和应用;3.新型蛋白质结构、功能预测;新型蛋白质结构、功能预测;4.蛋白质组功能系统,即蛋白质连锁图。蛋白质组功能系统,即蛋白质连锁图。(四)代谢和疾病发生途径的信息(四)代谢和疾病发生途径的信息基因组时代基因组时代/测序基因组时代测序基因组时代(sequencing genome era)后基因组时代后基因组时代(post-genome era)功能基因组时代功能基因组时代(functional genome)结构基因组时代结构基因组时代(structural genome)药物基因组时代药物基因组时代(pharmaceutical genome)通通过过了了解解疾疾病病和和代代谢谢各各途途径径中中相相关关生生物物分分子子的的结结构构、功功能能以以及及它它们们之之间间的的作作用用,结结合合研研究究蛋蛋白白质质相相互互作作用用、核核酸酸和和蛋蛋白白质质相相互互作作用用的的实实验验技技术术(如如酵酵母母双双杂杂交交和和反反义义 RNA等等技技术术),发发现现新新的的生生物物分分子子间间的的作作用用及及其其对对功功能能的的影影响响。三、生物信息学的信息学内涵三、生物信息学的信息学内涵1、生物信息数据库一级数据库一级数据库二级数据库二级数据库专家库专家库整合数据库整合数据库2、分析工具的发展建立快速、严格的多序列比较方法建立快速、严格的多序列比较方法发展能有效支持基因组大尺度作图和功发展能有效支持基因组大尺度作图和功能基因组分析及复杂遗传性状的分型分能基因组分析及复杂遗传性状的分型分析需要的分析方法析需要的分析方法四、生物信息学的应用与发展研究四、生物信息学的应用与发展研究(一一)与疾病相关的基因信息及相关算法和与疾病相关的基因信息及相关算法和 软件的开发软件的开发了解人类全部基因在染色体上的位置、它们的了解人类全部基因在染色体上的位置、它们的序列特征、表达规律和产物序列特征、表达规律和产物有效地判断各种疾患的分子机制,发展合适的有效地判断各种疾患的分子机制,发展合适的诊断和治疗手段诊断和治疗手段(二)建立与动、植物良种繁育相关的基因组(二)建立与动、植物良种繁育相关的基因组 数据库,发展分子标记辅助育种技术数据库,发展分子标记辅助育种技术找到与经济性状相关的基因找到与经济性状相关的基因认识这些基因表达的途径和机制认识这些基因表达的途径和机制利用分子遗传标记,加快育种速度利用分子遗传标记,加快育种速度(三)研究与发展药物设计软件和基于生物(三)研究与发展药物设计软件和基于生物 信息的分子生物学技术信息的分子生物学技术l候选基因候选基因l分子生物学技术分子生物学技术五、生物信息学研究和发展中的交叉五、生物信息学研究和发展中的交叉 学科和大科学的特点学科和大科学的特点l实验生物学家和计算生物学家实验生物学家和计算生物学家l多种科学文化的融合多种科学文化的融合l跨越整个生命科学的大学科跨越整个生命科学的大学科 思考题思考题1、什什么么是是生生物物信信息息学学?(从从产产生生背背景景、研研究究内内容、研究方法和研究动态等方面阐述)容、研究方法和研究动态等方面阐述)2、基基本本概概念念:基基因因组组、基基因因组组学学、人人类类基基因因组组计计划划、EST、SNP、ORF、蛋蛋白白质质组组、后后基基因因组时代、比较基因组学、双向电泳、组时代、比较基因组学、双向电泳、DNA芯片芯片3、生物信息学的生物学内涵包括哪些内容?、生物信息学的生物学内涵包括哪些内容?4、生物信息学在你的专业领域有哪些应用?、生物信息学在你的专业领域有哪些应用?Supercomputers at BGICPUs:300 in supercomputers 800 in CP clusters 8000 available Programers 150SGISUNIBMDowning2000Downing 2000Downing 3000 BioinformaticsDates to RememberSeptember 12 Submit homework 1 12 Submit homework 1September 19 Submit homework 2 19 Submit homework 2September 26 26 Submit homework 3 Submit homework 3OctoberOctober?Submit project reportSubmit project report Final exams Final examsProject&HomeworkHomework Homework will will include include mainly mainly exercises exercises from from the textbook.the textbook.The The project project will will be be a a report report on on some some area area in in bioinformatics learning you find most interesting.bioinformatics learning you find most interesting.The The project project and and homework homework requires requires the the use use of of a a PC and PC and the Internet.the Internet.
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!