资源描述
第十三章第十三章 基因组学基因组学 第一节第一节 基因组学概述基因组学概述 基因组学基因组学(Genomics)(Genomics)是遗传学研究进入分子是遗传学研究进入分子水平后发展起来的一个分支,主要研究生物水平后发展起来的一个分支,主要研究生物体全基因组体全基因组(genome)(genome)的分子特征。的分子特征。基因组学基因组学强调的是以基因组为单位,而不是以单个基强调的是以基因组为单位,而不是以单个基因为单位作为研究对象因为单位作为研究对象。v基因组学:基因组学:对生物体所有基因进行基因组作对生物体所有基因进行基因组作图图(包括包括遗传图谱遗传图谱、物理图谱物理图谱、转录图谱转录图谱)、核、核苷酸序列分析、基因定位和基因功能分析的一苷酸序列分析、基因定位和基因功能分析的一门科学。门科学。v基因组学的研究目标基因组学的研究目标:获得生物体全部基因组序列获得生物体全部基因组序列注解基因组所含的全部基因注解基因组所含的全部基因鉴定所有基因的功能及基因间相互作用关系鉴定所有基因的功能及基因间相互作用关系阐明基因组的复制及进化规律阐明基因组的复制及进化规律 不同生物基因不同生物基因组组大小大小生物生物基因基因组组大小(大小(bp)T4噬菌体噬菌体 T4 phage2.0105大大肠肠杆菌杆菌 Escherichia coli4.2106酵母酵母 Sccharomyces cereviside1.5107拟拟南芥南芥 Arabidopsis thaliana1.0108线线虫虫 Caenorhbditis elegans1.0108果果蝇蝇 Drosophila melanogaster1.65108水稻水稻 Oryza sativa4.3108小鼠小鼠 Mus musculus3.0109人人类类Homo sapiens3.3109玉米玉米 Zea mays5.4109小麦小麦Triticum aestivum1.61010v 19861986年年首次提出基因组学首次提出基因组学(Genomics)(Genomics)的概念。的概念。v 基因组计划研究开始于基因组计划研究开始于19901990年年,美国卫生部美国卫生部(NIH)NIH)和能源部和能源部(DOE)DOE)联合启动了被誉为联合启动了被誉为“人体阿人体阿波罗计划波罗计划”的的 “人类基因组计划人类基因组计划”(human human genome projectgenome project,HGP)HGP)。基因组学发展简介基因组学发展简介:“曼哈顿曼哈顿”原子原子 计划计划“阿波罗阿波罗”登月计划登月计划“人体阿波罗人体阿波罗”计划计划v 美国提出人类基因组计划后,英、法、日、美国提出人类基因组计划后,英、法、日、前苏联、中国等,也相继启动了类似项目前苏联、中国等,也相继启动了类似项目v 20002000年年6 6月月2626日,各国科学家公布了人类基日,各国科学家公布了人类基因组工作草图因组工作草图。v 20032003年年,6 6国科学家宣布人类基因组序列图国科学家宣布人类基因组序列图绘制成功,绘制成功,HGPHGP的所有目标全部实现的所有目标全部实现,覆盖人覆盖人类基因组所含基因区域的类基因组所含基因区域的99%99%,精确率达到,精确率达到99.99%99.99%,比原计划提前两年多,耗资,比原计划提前两年多,耗资2727亿美元。亿美元。(一)人类基因组学(一)人类基因组学v1.1.原核生物基因组原核生物基因组v2.2.真核生物基因组真核生物基因组(二)其他生物基因组(二)其他生物基因组 19921992年年8 8月,中国根据国情正式宣布实施自己月,中国根据国情正式宣布实施自己的的“水稻基因组研究计划水稻基因组研究计划”,已完成水稻基因组,已完成水稻基因组物理图谱的构建物理图谱的构建 20022002年年4 4月月5 5日,日,ScienceScience以以1414页的篇幅刊页的篇幅刊登和宣布中国科学家独立绘制完成的水稻基因组登和宣布中国科学家独立绘制完成的水稻基因组草图序列草图序列水稻全基因组物理图水稻全基因组物理图中国中国“水稻基因组研究计划水稻基因组研究计划”:(三)(三)C C值值 和和C C值悖理值悖理C C值值 (C value)(C value):一个单倍体基因组中一个单倍体基因组中DNADNA的总的总量。一个特定的种属具有特定的量。一个特定的种属具有特定的C C值值 C C值悖理值悖理(C value C value paradoxparadox):物种的物种的C C值和值和它的它的进化复杂性进化复杂性之间无之间无严格对应关系的现象。严格对应关系的现象。N N值:值:生物体所含有的基因数目。生物体所含有的基因数目。N N值悖理:值悖理:复杂性不同的生物种属所具有的基复杂性不同的生物种属所具有的基因数目与其因数目与其生物结构的复杂性生物结构的复杂性不成比例的现象。不成比例的现象。例如例如:水稻基因数约水稻基因数约4 4万个万个,人类基因总数约人类基因总数约3 3万个万个。二、基因组学的研究内容二、基因组学的研究内容:v 结结构构基基因因组组学学(structural(structural genomics)genomics):通通过过基基因因作作图图、核核苷苷酸酸序序列列分分析析确确定定基基因因组组成成、进进行行基基因因定位的科学。定位的科学。v 功功能能基基因因组组学学(functional(functional genomics)genomics):利利用用结结构构基基因因组组所所提提供供的的信信息息和和产产物物,研研究究基基因因组组功功能能表表达达的的一一门门分分支支学学科科。基基因因的的识识别别、鉴鉴定定和和克克隆隆,基基因因结构与功能及其相互关系,基因表达调控结构与功能及其相互关系,基因表达调控。v 蛋蛋白白质质组组学学(proteomics)(proteomics):研研究究细细胞胞内内蛋蛋白白质质组组成成及及其其活活动动规规律律的的新新兴兴学学科科。鉴鉴定定蛋蛋白白质质表表达达、存存在方式、结构、功能和相互作用方式等在方式、结构、功能和相互作用方式等。基基因因组组学学的的重重要要组组成成部部分分是是“基基因因组组计计划划”,如如人人类类、水水稻稻基基因因组组计计划划,其其大大体体可可分为分为:1 1、构建基因组的遗传图谱构建基因组的遗传图谱2 2、构建基因组的物理图谱、构建基因组的物理图谱3 3、测定基因组、测定基因组DNADNA的全部序列的全部序列4 4、构建基因组的转录本图谱、构建基因组的转录本图谱5 5、分析基因组的功能、分析基因组的功能第二节 基因组图谱的构建 在进行大规模序列测定之前,在进行大规模序列测定之前,构建基因组构建基因组图谱图谱是测定基因组全部核苷酸序列的重要一环。是测定基因组全部核苷酸序列的重要一环。基因组图谱可作为序列测定中制定测序方案的基因组图谱可作为序列测定中制定测序方案的依据,以便先重后轻地分析基因,锚定测知的依据,以便先重后轻地分析基因,锚定测知的核酸序列在染色体上的位置核酸序列在染色体上的位置 在在“人类基因组计划人类基因组计划”实施过程中,首先实施过程中,首先用了用了6 6年年时间构建高密度的基因组图谱,然后才时间构建高密度的基因组图谱,然后才进入测序工作。进入测序工作。一、遗传图谱遗传图谱(Genetic mapGenetic map)构建构建 遗传作图遗传作图:采用遗传学分析方法将基因或其他采用遗传学分析方法将基因或其他DNADNA顺序标定在染色体上构建连锁图顺序标定在染色体上构建连锁图。(一)图谱标记一)图谱标记 形态标记:形态标记:主要指可以观察到的一些性状主要指可以观察到的一些性状,如种如种皮颜色、眼色、株高等皮颜色、眼色、株高等。细胞学标记:细胞学标记:能明确显示遗传多态性的细胞学能明确显示遗传多态性的细胞学特征。特征。染色体的结构特征染色体的结构特征和和数量特征数量特征是常见的细是常见的细胞学标记胞学标记。生化标记:生化标记:主要是同工酶及种子贮藏蛋白主要是同工酶及种子贮藏蛋白,有时有时又称又称蛋白质标记蛋白质标记。分子标记:分子标记:主要指主要指DNADNA水平上的标记。水平上的标记。RFLP,RFLP,RAPD,SSR,STS,AFLP,CAPS,SNPRAPD,SSR,STS,AFLP,CAPS,SNP。(二)遗传图谱的构建(二)遗传图谱的构建 1.1.植物基因组遗传图谱的构建植物基因组遗传图谱的构建:选选择亲本择亲本 产生构图群体产生构图群体 遗传标记的染色体定位遗传标记的染色体定位标记间的连锁分析标记间的连锁分析 19941994年绘制的第一张水稻年绘制的第一张水稻高高密密度度遗遗传传图图谱谱仅仅有有927927个个位位点点,含含有有13831383个个标标记记;19981998年年将将22752275标标记记定定位位到到11571157个个位位点点上上;20002000年年最最终终的的水水稻稻高高密密度度遗遗传传图图标标记记为为32673267个个,用于指导水稻基因组测序用于指导水稻基因组测序。2.2.人类基因组遗传图谱的构建人类基因组遗传图谱的构建:人人类类的的遗遗传传图图谱谱是是利利用用家家系系分分析析法法,在在对对8 8个个家家系系的的134134个个成成员员的的分分析析中中,主主要要根根据据52645264个个STRSTR标标记记绘绘制制而而成成的的。利利用用这这些些家家系系的的资资料料绘绘制制第第1 1至至2222号号染染色色体体图图谱谱。对对于于X X染染色色体体图图谱谱,还还利利用用了了来来自自另另外外1212个个家家系系,170170个个成成员员的的资资料料绘制而成。绘制而成。将将52645264个标记定位在个标记定位在23352335个位点,据此构建个位点,据此构建的人类基因组遗传图谱的密度为每个标记的人类基因组遗传图谱的密度为每个标记599 599 kbkb。二、物理图谱二、物理图谱 由于遗传图谱的分辨率有限、精确性不由于遗传图谱的分辨率有限、精确性不高,所以还要构建物理图谱高,所以还要构建物理图谱 基因组物理图谱的构建基因组物理图谱的构建:主要有主要有4 4种途径:种途径:限制酶作图:限制酶作图:比较不同比较不同限制酶产生的限制酶产生的DNADNA片段的大小片段的大小酵母第酵母第3染色体遗传图(染色体遗传图(A)与物理图(与物理图(B)基于克隆的基因组作图:基于克隆的基因组作图:根据克隆的根据克隆的DNADNA片段片段之间的重叠顺序构建重叠群之间的重叠顺序构建重叠群 (contigous DNA contigous DNA clones,contigsclones,contigs),),绘制物理连锁图。绘制物理连锁图。重叠群重叠群(contigscontigs):相互重叠的相互重叠的DNADNA片段组成的片段组成的物理图。克隆重叠群的组建采用染色体步移法物理图。克隆重叠群的组建采用染色体步移法(chromosome walkingchromosome walking)。区域作图区域作图 Regional mapping区域作图区域作图 Regional mappingMinimal tiling path selected for sequencing.区域作图区域作图 Regional mapping荧光原位杂交(荧光原位杂交(fluorescent in situ fluorescent in situ hybridization,FISHhybridization,FISH)基因组原位杂交(基因组原位杂交(genome in situ genome in situ hybridization,GISHhybridization,GISH )荧光标记原位杂交荧光标记原位杂交(FISH)(FISH):Banana chromosomes coloured by fluorescent in situ hybridization(FISH).将荧光标记的探针与染色体杂交确定分子标将荧光标记的探针与染色体杂交确定分子标记所在位置记所在位置序列标签位点序列标签位点(STS)(STS):如表达的序列标签如表达的序列标签(EST)(EST),来自,来自cDNA cDNA 要将一组要将一组STSSTS作图定位,必需收集来自作图定位,必需收集来自同一染色体或整个基因组随机断裂的同一染色体或整个基因组随机断裂的DNADNA片片段。不同段。不同DNADNA片段之间有各种可能的重叠,片段之间有各种可能的重叠,可以覆盖整个作图区段。依次采用单个可以覆盖整个作图区段。依次采用单个STSSTS挑出它们所在的挑出它们所在的DNADNA片段,根据它们彼此的片段,根据它们彼此的重叠关系可以逐段绘重叠关系可以逐段绘DNADNA物理图。物理图。三、基因组测序策略三、基因组测序策略 鸟枪法测序:鸟枪法测序:利用限制酶或超声波处理待利用限制酶或超声波处理待测序基因组,构建适合大规模测序的基因组测序基因组,构建适合大规模测序的基因组文库,并对克文库,并对克隆进行隆进行随机序随机序列测定列测定,然后,然后根据序列间的根据序列间的重叠构建重叠重叠构建重叠群,不同重叠群,不同重叠群进行染色体群进行染色体组装组装。克隆重叠群法:克隆重叠群法:将基因组切割成长度为将基因组切割成长度为0.1-1Mb0.1-1Mb的大片段,构建的大片段,构建BACBAC文库文库,利用,利用STS-PCRSTS-PCR反应池方案筛选反应池方案筛选种子克隆种子克隆,利用,利用指纹图谱法或末端序列步行法对指纹图谱法或末端序列步行法对种子克隆进种子克隆进行延伸行延伸,根据相互的位置关系及,根据相互的位置关系及STSSTS路标的路标的顺序关系有序地将种子克隆及延伸克隆绘制顺序关系有序地将种子克隆及延伸克隆绘制到基因组的相应区域上,形成高覆盖度的、到基因组的相应区域上,形成高覆盖度的、较为连续的大的重叠克隆群,最后应用鸟枪较为连续的大的重叠克隆群,最后应用鸟枪法分别将每个克隆测序,并组装到染色体上法分别将每个克隆测序,并组装到染色体上。四、基因组图谱的应用四、基因组图谱的应用1 1、基因组序列测定、基因组序列测定2 2、基因定位、基因定位 3 3、基因的克隆与分离、基因的克隆与分离4 4、分子标记辅助选择、分子标记辅助选择5 5、比较基因组研究、比较基因组研究Derivation of genome trees from comparative analyses of complete genomes 第三节第三节 生物信息学生物信息学 1 1、生物信息学、生物信息学 (Bioinformatics)(Bioinformatics)采用计算机技术和信息论方法对采用计算机技术和信息论方法对蛋蛋白质白质及其及其核酸序列核酸序列等多种生物信息等多种生物信息采集、加工、储存、传递、检索、采集、加工、储存、传递、检索、分析和解读,旨在掌握复杂生命现分析和解读,旨在掌握复杂生命现象的形成模式和演化规律的科学象的形成模式和演化规律的科学。2 2、基因芯片、基因芯片(gene chip),(gene chip),又称又称DNADNA微阵列微阵列(microarray)(microarray)基因芯片基因芯片是由大量是由大量DNADNA或寡核苷酸探或寡核苷酸探针密集排列所形成针密集排列所形成的探针阵列的探针阵列,其基本其基本原理是通过杂交检原理是通过杂交检测信息。利用基因测信息。利用基因芯片芯片,可以实现基因可以实现基因信息的大规模检测。信息的大规模检测。3 3、生物信息学的应用、生物信息学的应用(1)(1)、发现新基因和新的单核苷酸多态性、发现新基因和新的单核苷酸多态性 (2)(2)、分析基因组中非编码蛋白质区域功能、分析基因组中非编码蛋白质区域功能 (3)(3)、在基因组水平上研究生物进化、在基因组水平上研究生物进化 (4)(4)、完整基因组比较研究、完整基因组比较研究 第十三章第十三章 基因组学基因组学 第一节第一节 基因组学概述基因组学概述第二节 基因组图谱的构建 第三节第三节 生物信息学生物信息学 1 1、遗传图谱、遗传图谱2 2、物理图谱、物理图谱3 3、基因组测序策略、基因组测序策略4 4、基因组图谱的应用、基因组图谱的应用第四节第四节 蛋白质组学蛋白质组学 (proteomics)(proteomics)1 1、蛋白质组学的概念及研究内容、蛋白质组学的概念及研究内容:所谓所谓蛋白质组蛋白质组就是就是细胞细胞、器官器官或或组织组织的蛋白质的蛋白质成分的总称成分的总称,而而蛋白质组学蛋白质组学是研究这些成分在指是研究这些成分在指定的时间或特定的环境条件下的表达定的时间或特定的环境条件下的表达。2 2、蛋白质的分离、蛋白质的分离蛋蛋白白质质组组学学研研究究的的第第一一步步就就是是蛋蛋白白质质的的分分离离。双相凝胶电泳双相凝胶电泳是蛋白质组研是蛋白质组研究中的首选分究中的首选分离技术离技术。3 3、蛋白质的鉴定、蛋白质的鉴定鉴鉴定定蛋蛋白白质质组组份份的的性性质质、结结构构和和功功能能及及其其各各蛋蛋白白质质间间的的相相互互作作用用关关系系,从从而而最最终终实实现现蛋蛋白白质质组组表达模式和功能模式的研究表达模式和功能模式的研究。目目前前,蛋蛋白白质质表表达达模模式式的的鉴鉴定定技技术术主主要要有有以以质质谱谱为为核核心心的的技技术术、蛋蛋白白质质微微测测序序、氨氨基基酸酸组组成分析成分析以及以及蛋白质芯片分析蛋白质芯片分析等等。4 4、蛋白质间的相互作用、蛋白质间的相互作用 目目前前的的研研究究方方法法主主要要有有酵酵母母双双杂杂交交系系统统、表表面面等离子共振技术等离子共振技术等等。自自从从19961996年年酵酵母母菌菌基基因因组组全全序序列列测测定定以以来来,在在4 4年年多多时时间间里里,全全世世界界已已有有10001000多多个个实实验验室室,50005000多多名名科科学学家家从从事事酵酵母母菌菌后后基基因因组组学学的的研研究究,共共发发表表论论文文70007000多多篇篇,鉴鉴定定10601060个个新新基基因因的的功功能能,但但仍仍然然还还有有约约16001600个个阅阅读读框框架架的的功功能能不不清清楚楚。这这些些结结果果充充分分说说明明后后基基因因组组学学研研究究的的复复杂杂性。性。Long way to go Post-Genomics!Long way to go Post-Genomics!PubMedEntrezBLASTOMIMBooksTaxBrowserStructureSite MapGuide to NCBI resourcesAbout NCBIAn introduction for researchers,educators and the publicGenBankSequence submission support and softwareLiterature databasesPubMed,OMIM,Books,and PubMed Central Molecular databasesSequences,structures,and taxonomy Genomic biologyThe human genome,whole genomes,and related resourcesToolsData miningResearch at NCBIPeople,projects,and seminarsSoftware engineeringTools,R&D,and databasesEducationTeaching resources and on-line tutorialsFTP siteDownload data and softwareContact informationHow to reach ushttp:/www.ncbi.nlm.nih.gov/本章重点本章重点基本概念基本概念基因组图谱绘制基因组图谱绘制基因组测序原理和序列组装策略基因组测序原理和序列组装策略作业作业复习题复习题1.真核生物与原核生物基因组的特点有何真核生物与原核生物基因组的特点有何差异?无差异?无2.常用的分子标记有哪几种常用的分子标记有哪几种?各有什么特各有什么特点点?无无3.什么是基因组物理图什么是基因组物理图?有;物理图与遗有;物理图与遗传图有何不同传图有何不同?无无4.基因组学的主要研究内容有哪些?基因组学的主要研究内容有哪些?5.基因组图谱有哪些作用?基因组图谱有哪些作用?
展开阅读全文