资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,目录,目录,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第三篇,基因信息的传递,FLOW OF GENETIC INFORMATION,第三篇,真核基因与基因组,DNA,的生物合成,DNA,的损伤和修复,RNA,的生物合成,蛋白质的生物合成,基因表达调控,细胞信号转导,本篇重点学习内容,真核基因与基因组本篇重点学习内容,1.,本部分主要讨论生物遗传信息传递的,具体机制及特征,。通过学习和讨论,掌握遗传信息的,稳定性,与,不稳定性,(,产生变异与进化,),的矛盾统一。,2.,遗传信息的基本单位是,基因,(,gene,),。,所谓基因,是指,DNA(,在极少的情况下,如某些病毒是,RNA),上为生物活性产物编码的,功能片断,,它们编码的信息用于产生特定的功能产物,(,蛋白质或,RNA,),。,1. 本部分主要讨论生物遗传信息传递的具体机制及特征。通过学,The central dogma of molecular biology,.,It shows the general pathways of information flow via replication, transcription, and translation. The term “dogma” is a misnomer. Introduced by Francis Crick at a time when little evidence supported these ideas, the dogma has become a well-established principle.,The central dogma of molecular,3.,中心法则,(The central dogma),明确了遗传信息传递的基本规律,即,DNA, RNA ,蛋白质。中心法则的三个基本过程为:,复制、转录、翻译,。,复制,(replication),:从母代,DNA,拷贝产生序列相同的子代,DNA,。,(dsDNA, dsDNA,),转录,(transcription),:,DNA,的编码信息抄录至,RNA,分子上的过程。,(dsDNA,ssRNA,),翻译,(translation),:在核糖体上,以,mRNA,上的编码信息为指导合成特定序列的多肽链,(,蛋白质,),。,(mRNA, polypeptide,),3. 中心法则(The central dogma)明确了遗,生物体内的遗传信息传递遵循中心法则,DNA,以半保留复制的方式将亲代细胞的遗传物质高度忠实地传递给子代。,以,DNA,为模板转录生成的,mRNA,作为信使,其核苷酸序列构成的密码子在合成蛋白质时被翻译为肽链中氨基酸的排列顺序。,细胞内所有蛋白质一级结构的信息全部来源于,DNA,序列。,生物体内的遗传信息传递遵循中心法则DNA以半保留复制的方式将,NOTE,:,The central dogma is broadly correct, although a number of examples are known which contradict parts of it. Retroviruses,reverse transcribe(,逆转录,),RNA into DNA, a number of viruses are able to replicate RNA directly into an RNA copy, and a number of organisms can,edit a messenger RNA,(mRNA,的编辑,),sequence so that the protein coding sequence is not directly specified by DNA sequence.,NOTE:,逆转录病毒,以及,逆转录酶,的发现,补充完善了中心法则,。,Howard Temin,在,1962,年最早推断在逆转录病毒中必然存在一种逆催化逆转录的酶。,Temin,和,David Baltimore,于,1970,年分别在各自的实验室内分离得到逆转录酶,。,逆转录病毒以及逆转录酶的发现,补充完善了中心法则。,真核基因与基因组课件,Contributions of David Baltimore,1982,:,The founding director of MITs,Whitehead Institute,1986,:,The discovery of the key transcription factor,NF-B,1987,:,The creation of,transgenic mice,as a model for the study of disease.,1989,:,The,recombination activating genes,RAG-1 and RAG-2a,1990: Bcr-abl is sufficient to stimulate cell growth and cause chronic myelogenous leukemia (CML). anti-cancer drug,Imatinib,(Gleevec),Contributions of David Baltimo,中心法则,(,The Central Dogma,),转 录,翻 译,逆转录,复 制,DNA,RNA,蛋白质,中心法则 (The Central Dogma)转 录,真核基因与基因组,第十三章,Eukaryote Gene and Genome,真核基因与基因组 第十三章Eukaryote Gene an,除了某些以,RNA,为基因组的,RNA,病毒外,基因通常是指染色体或基因组的一段,DNA,序列。,基因包括,编码序列,(外显子)、,调控序列,和,间隔序列,(内含子),。,基因(,gene,):,编码蛋白质或,RNA,等具有特定功能产物的、负载遗传信息的基本单位。,The fundamental unit of information in living systems is the,gene,除了某些以RNA为基因组的RNA病毒外,基因通常是指染色体或,基因组(,genome,):,一个生物体内所有遗传信息的总和。,(1920,年,,H. Winkles,提出),人类基因组包含了细胞,核染色体,DNA,(常染色体和性染色体)及,线粒体,DNA,所携带的所有遗传物质。,基因组(genome):一个生物体内所有遗传信息的总和。(1,真核基因的结构与功能,第一节,The Structure and Function of Eukaryote Gene,真核基因的结构与功能 第一节The Structure an,利用碱基的不同排列荷载遗传信息。,通过复制将遗传信息稳定、忠实地遗传给子代细胞,在这一过程中为适应环境变化,可能会发生基因突变。,作为基因表达(,gene expression,)的模板,使其所携带的遗传信息通过各种,RNA,和蛋白质在细胞内有序合成而表现出来。,基因的功能,利用碱基的不同排列荷载遗传信息。 基因的功能,单个基因的组成结构及一个完整的生物体内基因的组织排列方式统称为,基因组构,(,gene organization,)。,与基因功能相关的结构,编码区序列(,coding region sequence,),非编码序列(,non-coding sequence,),基因表达需要的调控区(,regulatory region,)序列,包括启动子(,promoter,)、增强子(,enhancer,)等。,在细胞内表达为蛋白质或功能,RNA,的,DNA,序列,单个基因的组成结构及一个完整的生物体内基因的组织排列方式统称,一、真核基因的基本结构,编码蛋白质或,RNA,的,编码序列,。,非编码序列,,包括编码区两侧的调控序列和编码序列间的间隔序列。,一、真核基因的基本结构编码蛋白质或RNA的编码序列。非编码序,真核基因结构不连续,为断裂基因(,split gene,)。,真核基因结构,外显子,(,exon,);在基因序列中,出现在成熟,mRNA,分子上的序列。,内含子,(,intron,):外显子之间、与,mRNA,剪接过程中被删除部分相对应的间隔序列。,真核基因结构不连续,为断裂基因(split gene)。真核,真核生物结构基因,由若干个编码区和非编码区互相间隔开但又连续镶嵌而成,去除非编码区再连接后,可翻译出由连续氨基酸组成的完整蛋白质,这些基因称为断裂基因。,断裂基因,(split gene),C,A,B,D,编码区,A,、,B,、,C,、,D,非编码区,真核生物结构基因,由若干个编码区和非编码区互相间隔开但又连续,周芷(,Louise T. Chow,),1977,年,细胞,杂志第,11,卷第,4,期,周芷(Louise T. Chow),真核生物绝大部分编码蛋白质的基因都有内含子。编码,rRNA,和一些,tRNA,的基因也都有内含子。,内含子的数量和大小决定了真核基因的大小。不同种属中,外显子序列通常比较保守,而内含子序列则变异较大。,外显子与内含子接头处有一段高度保守的序列(,大多数内含子以,GT,为,5,端开始,末端为,AG-OH-3,),这一共有序列是真核基因中,RNA,剪接的识别信号。,真核生物绝大部分编码蛋白质的基因都有内含子。编码rRNA和一,基因的,5,端称之为上游,,3,端称为下游,基因序列中开始,RNA,链合成的第一个核苷酸所对应的碱基记为,+1,,此碱基上游的序列记为负数,下游的序列记为正数。,基因的5端称之为上游,3端称为下游,二、基因编码区编码多肽链和特定的,RNA,分子,基因的编码序列决定其编码产物的序列和功能。,编码序列中一个碱基的改变或突变,可能使基因功能发生重要的变化。,相同的,DNA,序列因起始位点的变化或不同的剪接方式而编码不同的蛋白质多肽链。,基因编码区中的,DNA,碱基序列,决定特定的成熟,RNA,分子的序列,即,DNA,的一级结构决定着其转录产物,RNA,分子的一级结构。,二、基因编码区编码多肽链和特定的RNA分子 基因的编码序列决,三、调控序列参与真核基因表达调控,位于基因转录区前后,对基因表达起调控作用的区域,因其是紧邻的,DNA,序列,又称旁侧序列,(flanking sequence),。,基因的调控区(顺式作用元件),三、调控序列参与真核基因表达调控 位于基因转录区前后,对基因,转录起始点,TATA,盒,CAAT,盒,GC,盒,增强子,AATAAA,剪接加尾,转录终止点,修饰点,外显子,翻译起始点,内含子,OCT-1,OCT-1,:,ATTTGCAT,八聚体,+1,结构基因,启动子,上游启动子元件,转录起始点TATA盒CAAT盒GC盒增强子AATAAA剪接加,启动子,上游调控元件,增强子,加尾信号,细胞信号反应元件,顺式作用元件,(cis-acting elements),启动子顺式作用元件(cis-acting elements),1.,启动子提供转录起始信号,启动子,是,DNA,分子上能够介导,RNA,聚合酶结合并形成转录起始复合体的序列。,多数启动子位于真核细胞基因转录起点的上游,启动子本身通常不被转录。,少数启动子(如编码,tRNA,基因的启动子)位于转录起始点的下游,这些,DNA,序列可以被转录。,1. 启动子提供转录起始信号 启动子是DNA分子上能够介导R,真核生物有,3,类启动子,分别对应于细胞内存在的三种不同的,RNA,聚合酶和相关蛋白质。,rRNA,mRNA,5S rRNA, tRNA,真核生物有3类启动子,分别对应于细胞内存在的三种不同的RNA,能够在相对于启动子的任何方向和位置(上游或者下游)上发挥这种增强作用,大部分位于上游。,增强子序列距离所调控基因距离近者几十个碱基对,远的可达几千个碱基对。,通常数个增强子序列形成一簇。,有时增强子序列也可位于内含子之中。,不同的增强子序列结合不同的调节蛋白。,2.,增强子增强邻近基因的转录,增强子,是增强真核基因启动子工作效率的顺式作用元件,是真核基因中最重要的调控序列,决定着每一个基因在细胞内的表达水平。,能够在相对于启动子的任何方向和位置(上游或者下游)上发挥这种,沉默子,(,silencer,)是抑制基因转录的特定,DNA,序列,当其结合一些反式作用因子,(,repressors,),时对基因的转录起阻遏作用,使基因沉默。,REST/NSRF-RE-1/NRSE,: silencing of neuronal genes,3.,沉默子是负调节元件,沉默子(silencer)是抑制基因转录的特定DNA序列,当,4.,绝缘子是异染色质扩散的屏障,绝缘子(,insulator,)是具有独立调节作用的染色质结构,可位于增强子或沉默子与启动子之间,阻止其对启动子的增强或抑制作用(,enhancer-blocking insulators,),;,位于活化基因与异染色质之间,阻止异染色质扩展对活化基因造成的抑制作用(,barrier insulators,),4. 绝缘子是异染色质扩散的屏障绝缘子(insulator),Enhancer-blocking insulators,Barrier insulators,Enhancer-blocking insulatorsBa,The chicken,-,globin locus,The chicken -globin locus,真核基因组的结构与功能,第二节,The Structure and Function of Eukaryote Genome,真核基因组的结构与功能 第二节The Structure a,基因组,:细胞或生物体的一套完整单倍体遗传物质的总和。,基因组:细胞或生物体的一套完整单倍体遗传物质的总和。,一、真核基因组具有独特的结构,基因的编码序列所占比例远小于非编码序列。,高等真核生物基因组含有大量的重复序列,,真核基因组中存在多基因家族和假基因。,大多基因具有可变剪接,,80%,的可变剪接会使蛋白质的序列发生改变。,基因组,DNA,与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞的基因组为二倍体。,结构特点:,一、真核基因组具有独特的结构基因的编码序列所占比例远小于非编,二、真核基因组中存在大量重复序列,高度重复序列,(,highly repetitive sequence,),中度重复序列,(,moderately repetitive sequence,),单拷贝序列,(,single copy sequence,),或低度重复序列,二、真核基因组中存在大量重复序列 高度重复序列(highly,(一)高度重复序列,主要存在于染色体的着丝粒区域,重复单位一般由,2,10 bp,组成,成串排列,在人基因组中约占,5%,6%,。,重复频率可达,10,3,以上,不编码蛋白质或,RNA,。,反向重复序列,(,inverted repeat sequence,),卫星,DNA,(,satellite DNA,),两个相同顺序的互补拷贝在同一,DNA,链上反向排列而成,重复单位长度约,300 bp,,多数散在于基因组中 。,分类:,(一)高度重复序列主要存在于染色体的着丝粒区域,重复单位一般,参与复制水平的调节,存在于,DNA,复制起点区的附近,是一些蛋白质(包括酶)的结合位点。,参与基因表达的调控,可以转录到核内不均一,RNA,分子中,有些反向重复序列可以形成发夹结构,有助于稳定,RNA,分子。,参与染色体配对,如,卫星,DNA,成簇样分布在染色体着丝粒附近,可能与染色体减数分裂时染色体配对有关。,功能:,参与复制水平的调节功能:,(二)中度重复序列,重复数十至数千次,大多数与单拷贝基因间隔排列。,短分散重复片段,(short interspersed repeat sequences ,SINEs),长分散重复,片段,(long interspersed repeat sequences , LINEs),平均长度约,300 bp,500 bp,,与长度约为,1000 bp,的单拷贝序列间隔排列。拷贝数可达数十万。如,Alu,家族、,KpnI,家族、,Hinf,家族。,平均长度为,3500 bp,5000,bp,,与长度约为,13000bp,的单拷贝序列间隔排列。,(二)中度重复序列重复数十至数千次,大多数与单拷贝基因间隔排,每个成员的长度约,300 bp,。,每个单位长度中一个限制性内切酶,Alu,的切点(,AGCT,),将其切成长,130bp,和,170bp,的两段。,Alu,家族,仅次于,Alu,家族的第二大家族,,重复序列中含有限制性内切酶,Kpn,的位点,呈散在分布,拷贝数约为,3000,4800,个,KpnI,家族,以,319bp,长度的串联重复存在于人基因组中,重复序列中含有限制性内切酶,Hinf,I,的位点。,Hinf,家族,短分散重复片段,每个成员的长度约300 bp。Alu家族仅次于Alu家族的第,Karyotype from a female human lymphocyte (46, XX). Chromosomes were hybridized with a probe for Alu elements (green) and counterstained with TOPRO-3 (red).,The members of the Alu family, may be mobile elements, capable of jumping into and out of various sites within the genome,The insertion of Alu sequences into a gene causes,neurofibromatosis, which is an,autosomal dominant,disorder.,The nerve tissue grows,tumors,(,neurofibromas,) that may be,benign,and may cause serious damage by compressing nerves and other tissues,Karyotype from a female human,rRNA,基因重复序列属于中度重复序列,各重复单位中的,rRNA,基因都是相同的。,rRNA,基因集中成簇存在,这样的区域称为,rDNA,区。,人类的,rRNA,基因位于,13,、,14,、,15,、,21,和,22,号染色体的核仁组织区,每个核仁组织区平均含有,50,个,rRNA,基因的重复单位。,5SrRNA,基因全部位于,1,号染色体,每个单倍体基因组约有,1000,个,5SrRNA,基因。,rRNA基因重复序列属于中度重复序列各重复单位中的rRNA基,Microsatellite Repeat Sequences,One category of repeat sequences:,microsatellite sequences,consist of 26 bp repeated up to 50 times,AC(most commonly), CG, AT, and CA,The,AC repeat,sequences occur,at 50,000100,000 locations,in the genome,This is a heritable trait and useful in constructing genetic linkage maps,Microsatellite Repeat Sequence,Trinucleotide sequences,that increase in number (micro-satellite instability) can cause disease.,Unstable,p(CGG),n,repeat sequence is associated with the fragile X syndrome,Other trinucleotide repeats that undergo dynamic mutation (,usually an increase,) are associated with Huntingtons chorea (,CAG,), myotonic dystrophy (,CTG,), spinobulbar muscular atrophy (,CAG,).,Trinucleotide sequences that i,Fragile X syndrome is associated with the expansion of the CGG,trinucleotide repeat,affecting the,Fragile X mental retardation 1,(,FMR1,) gene on the,X chromosome, resulting in a failure to express the,fragile X mental retardation protein,(FMRP), which is required for normal neural development.,Physical characteristics :,an elongated face, large or protruding ears, and large testes,Behavioral characteristics :,stereotypic movements,(e.g. hand-flapping), and social anxiety,Fragile X syndrome is associat,Myotonic dystrophy is a chronic, slowly progressing, highly variable, inherited multisystemic disease.,The affected gene is called,DMPK, which codes for,myotonic dystrophy protein kinase, a protein expressed predominantly in skeletal muscle. The gene is located on the long arm of,chromosome 19,.,there is an expansion of the,cytosine,-,thymine,-,guanine,(CTG) triplet repeat in the,DMPK,gene.,40-year-old patient with myotonic dystrophy presenting with bilateral cataracts and complete heart block.,Myotonic dystrophy is a chroni,在单倍体基因组中只出现一次或数次,大多数为蛋白质编码的基因。,(三)单拷贝序列(低度重复序列),在单倍体基因组中只出现一次或数次,大多数为蛋白质编码的基因。,三、真核基因组中存在大量的多基因家族与假基因,多基因家族,是指由某一祖先基因经过重复和变异所产生的一组在结构上相似、功能相关的基因。,基因家族成簇地分布在某一条染色体上,同时发挥作用,合成某些蛋白质。如组蛋白基因家族。,基因家族的不同成员成簇地分布于不同染色体上,编码一组功能上紧密相关的蛋白质。如球蛋白基因家族(,11,,,16,号染色体)。,三、真核基因组中存在大量的多基因家族与假基因多基因家族是指由,DNA,序列相似,但功能不一定相关的若干个单拷贝基因或若干组基因家族总称。,(,免疫球蛋白超家族基因),超家族基因,(,superfamily gene,),基因组中存在的一段与正常基因非常相似但不能表达的,DNA,序列。以,来表示。,假基因(,psuedogene,),DNA序列相似,但功能不一定相关的若干个单拷贝基因或若干组基,An illustration of the mutations that can cause pseudogenes.,The human sequence is of a pseudogene in the olfactory gene family. The chimpanzee sequence is the functional ortholog.,These psuedogenes consist,of DNA sequences identical or nearly identical to those of the messenger RNA,for the appropriate gene product. the 5-nontranslated region, the coding region without,intron representation, and the 3 poly(A) tail are all present contiguously.,This particular DNA sequence arrangement must have resulted,from the reverse transcription of an appropriately processed messenger RNA molecule,from which the intron regions had been removed and the poly(A) tail added.,They contain,nonsense codons,that preclude their ability to encode a functional, intact protein .,An illustration of the mutatio,四、线粒体,DNA,结构有别于染色体,DNA,线粒体,DNA,(,mitochondrial DNA,,,mtDNA,),是核外遗传物质,能独立编码线粒体中的一些蛋白质。,mtDNA,的结构为环状分子,与原核生物的,DNA,类似,结构特点也与原核生物相似。,四、线粒体DNA结构有别于染色体DNA线粒体DNA(mito,人的线粒体基因组,线粒体基因组编码,37,个基因,包括,13,个编码呼吸链多酶体系的一些多肽的基因、,22,个编码,mt-tRNA,的基因、,2,个编码,mt-rRNA,(,16S,和,12S,)的基因。,人的线粒体基因组线粒体基因组编码37个基因,包括13个编码呼,物种,基因组大小,(,Mb,),基因数,染色体数*,支原体,M. genitalium,0.58,470,无,流感嗜血杆菌,H. influrnzae,1.83,1743,无,枯草芽孢桿菌,B. subtilis,4.20,4100,无,大肠杆菌,E. coli,4.60,4288,无,酿酒酵母,S. cerevisiae,13.50,6034,16,裂殖酵母,S. pombe,12.50,4929,16,燕麦,O. sativa,466,30000,21,果蝇,D. melanogaster,165,13601,4,秀丽隐杆线虫,C. elegans,97,18424,6,小鼠,mouse,2700,30000,20,人,H. sapiens,3000,25000,23,不同生物体基因组的比较,五、人基因组中有两万多个基因,物种基因组大小(Mb)基因数染色体数*支原体 M. geni,基因组大小和基因数量在生物进化中可能并不具有特别重要的意义,人类的基因较其他生物体可能更为,“,有效,”,,其发挥功能的方式与其他生物不同。,基因组大小和基因数量在生物进化中可能并不具有特别重要的意义,,六、人的基因在染色体上的分布特征,人类基因组的染色体,DNA,六、人的基因在染色体上的分布特征人类基因组的染色体DNA,最长的染色体:1号染色体,250kb,含3000多个基因,最小的染色体:21号染色体,约47kb,含300-400个基因,肌萎缩性侧索硬化症,SOD1 mutation,唐氏综合症,,21-三体综合征Down syndrome,最长的染色体:1号染色体,250kb,含3000多个基因肌萎,基因在染色体上并不是均匀分布。基因密度最大的是第,19,号染色体,密度最小的是第,13,号和,Y,染色体。,染色体上存在着无基因的,“,沙漠区,”,,即在,500kb,区域内,没有任何基因的编码序列。,基因在染色体上的分布特征,基因在染色体上并不是均匀分布。基因密度最大的是第19号染色体,小 结,基因:能够编码蛋白质或,RNA,等具有特定功能产物的、负载遗传信息的基本单位,通常是指染色体或基因组的一段,DNA,序列,基因基本结构包含编码蛋白质或,RNA,的编码序列及其与之相关的非编码序列。,基因组是指一个生物体内所有遗传信息的总和。,线粒体,DNA,是核外遗传物质,可以独立编码线粒体中的一些蛋白质。人类线粒体基因组全长,16569bp,, 共编码,37,个基因。,人类基因组有,2,万多个基因。,小 结基因:能够编码蛋白质或RNA等具有特定功能产物的、,
展开阅读全文