资源描述
会计学1绪论基因基因组复习要点级研究生绪论基因基因组复习要点级研究生2分子生物学定义:是从分子水平研究生命现象、生命本质、生命活动及其规律的科学。研究对象主要是生物大分子。分子水平生命活动主要是通过核酸和蛋白质这两类生物大分子的活动来实现的。第1页/共110页3医学分子生物学(medical molecular biology):是从分子水平研究人体和疾病相关生物在正常和疾病状态下生命活动及其规律、从分子水平开展人类疾病的预防、诊断和治疗研究的科学。第2页/共110页4 分子生物学的研究目的是以生物大分子的结构和功能为基础研究生命活动的本质与规律。分子水平生命活动主要是通过核酸和蛋白质这两类生物大分子的活动来实现的。第3页/共110页5v 从核酸和蛋白质的结构与功能、基因组的结构与功能到基因的复制、表达、调控及生物学效应;v 从生物大分子之间的相互作用到这些相互作用构成的细胞间通讯和细胞内信号转导;v 从对基因的结构、功能、表达调控的分析到基因的制备、改造、调控、应用所需的各种技术体系现代分子生物学研究主要涉及三个领域第4页/共110页61、人体某种细胞内的基因发生异常改变2、外源基因进入人体引起疾病3、疾病易感基因使机体对致病因素更加敏感基因与疾病的关系大致包括三种类型第5页/共110页7调控网络细胞间通讯网络细胞内信号转导途径是体内细胞功能调控的分子基础第6页/共110页8基因诊断:主要是应用分子生物学技术,检测人体某些基因结构和表达的变化,或者检测病原体基因组在人体内的存在,从而达到诊断疾病或监控疾病治疗效果的目的。基因治疗:通过特定的分子生物学技术关闭或降低异常表达基因,或将正常的外源基因导入体内特定的靶细胞以弥补缺陷基因,或将某种特定基因导入体细胞以表达特定的蛋白质因子,实现对疾病的治疗。第7页/共110页9基因治疗总体上分为两大方面:1.纠正异常基因(异常表达或缺陷)2.利用特定基因在体内表达特定的蛋 白质因子以实现对疾病的治疗作用第8页/共110页10生物化学与分子生物学教研室第二章基因的结构与功能P2第9页/共110页11基因是编码RNA或多肽链的核酸片段v Beadle和Tatum提出“一个基因一种酶”假说 为此获得1958年诺贝尔生理学和医学奖v 人们对上述学说进行修正,提出“一个基因一 条多肽链”的概念基因定义:基因是负责编码RNA或一条多肽链的DNA片段,包括编码序列、编码序列外的侧翼序列及插入序列。P3第10页/共110页12基因:是核酸分子中贮存遗传信息的遗传单位,是指贮存RNA序列信息及表达这些信息所必需的全部核苷酸序列。其中贮存RNA序列信息的DNA区段称为结构基因,结构基因上游和下游控制转录的序列即为基因的调控序列。RNA的碱基序列直接来源于结构基因,其中mRNA的序列中又贮存有蛋白质多肽链的氨基酸序列信息。P1第11页/共110页13 mRNA分子上从53方向,由起始密码子AUG开始,每3个核苷酸组成的三联体,决定肽链上某一个氨基酸或蛋白质合成的起始、终止信号,称为三联体密码,也叫密码子(codon)。从mRNA 5端起始密码子AUG到3端终止密码子之间的核苷酸序列,各个三联体密码连续排列编码一个蛋白质多肽链,称为。第12页/共110页14结构基因(structure gene):是指基因中编码RNA或蛋白质的DNA序列。第13页/共110页15第14页/共110页16RNA新链合成的方向:5 3。文献上刊出的DNA单链,一般均指编码链。第15页/共110页17 v原核生物结构基因是连续的编码序列,其RNA合成后不需剪接加工。v真核生物的结构基因,有若干个编码区被非编码区相互间隔开但又连续镶嵌而成,称为断裂基因(split gene,discontinuous gene,interrupted gene)。它为一个由连续氨基酸组成的完整蛋白质编码。P12第16页/共110页18断基因的线性表达而在剪接过程中被除去的非编码核苷酸序列。P12第17页/共110页19同一段DNA序列能够编码两种甚至三种蛋白质分子第18页/共110页20 真核生物基因的外显子和内含子接头处 都 有 一 段 高 度 保 守 的 一 致 序 列:内含子5端大多数以 GT 开始,3端大多数以 AG 结束,称为GT-AG法则,可作为真核基因中RNA剪接和识别信号。P13第19页/共110页21基因中含有与转录调控相关的序列(1)编码蛋白质肽链或RNA的序列(2)保证转录所必需的调控序列(3)位于编码区5端上游的非编码序列(4)内含子(5)位于编码区3端下游的非编码序列一个基因应包含下列序列第20页/共110页22基因序列示意图调控序列5端非编码序列结构基因3端非编码序列原核:操纵子调控模式真核:顺式作用元件(包括启动子和上游启动子元件、增强子、反应元件、poly(A)加尾信号)原核:SD序列真核:DNA元件编码蛋白质肽链或RNA序列内含子(结构基因中非编码序列)原核:多顺反子真核:单顺反子DNA模板靠近终止区,转录终止的修饰点侧翼序列,不被翻译的DNA片段,包括前导序列。即第一个外显子的上游和最后一个外显子的下游。第21页/共110页23真核生物基因中的调控序列1.启动子(promoter)和启动子上游序列 一般位于基因转录起始点上游100 200 碱基对范围,是能够被RNA聚合酶识别并与其结合并起始转录的核苷酸序列,包括一组转录调控序列:P13第22页/共110页24TATA boxCAAT box 人类许多基因的转录起始点上游2530bp的位置有一段高度保守序列。由7个碱基组成,TATAAAA或TATATAT。是转录因子TFD的结合位点,TFD再与RNA聚合酶形成复合物,启动基因转录,这一类启动子又称为类启动子。位于转录起始点上游7080bp的位置一段保守序列,由9个碱基组成,GGNCAATCT,其中N为C或T。CAAT盒与转录因子CTF结合,决定启动子转录的效率。GC box 有些基因没有TATA box和CAAT box,但在转录起始点上游35bp的位置具有富含GC的核苷酸序列(GGCGG),GC box能与转录因子Sp1结合,促进转录的过程。第23页/共110页25 典型的启动子通常含有TATA box 以及上游的启动子元件CAAT box 和GC box。这类启动子一般具有一个转录起始点及较高的转录活性。仅有TATA box 和转录因子也可构成最简单的启动子。有许多启动子不含TATA box,分为两类:富含GC的启动子,一些管家基因,该类基因一般含有数个分离的转录起始点。既无TATA box,也没有GC富含区,可有一个或数个转录起始点。大多数转录活性很低或没有转录活性,只是在胚胎发育、组织分化和再生过程中受到调节。第24页/共110页26类启动子 能够被RNA聚合酶和转录因子识别和结合的启动子。主要见于rRNA基因。类启动子 能够被RNA聚合酶和转录因子识别和结合的启动子。主要包括5SrRNA、tRNA、snRNA等的编码基因。第25页/共110页272.增强子(enhancer)增强子是一段短的DNA序列,含有多个作用元件,可以特异性与转录因子结合,增强基因的转录活性。与启动子不同,它可以位于基因的任何位置。尽管通常处于转录起始点上游100 300 bp 处,但在内含子中也发现有增强子存在。增强子的功能与其位置和方向无关。1986年,Maniatis等在研究干扰素-基因转录时发现增强子内含有负调控序列,称为负增强子,又称为沉默子(silencer)。因此有人建议用调变子(modulator)取代增强子概念。P14第26页/共110页283.Poly(A)加尾信号 含有类启动子的基因除了具有上述调控序列外,在基因的末端往往还有一段特定的加尾信号,是一个保守的AATAAA序列,其下游有一段GT或T丰富区,共同构成Poly(A)加尾信号(转录终止修饰点)。mRNA转录到此,产生AAUAAA和随后的GU或U丰富区,被与RNA聚合酶结合的延长因子识别并结合,终止RNA转录合成,并在AAUAAA下游1030碱基的位置切断RNA。在polyA聚合酶催化下,在3端加上约200个腺苷酸,构成polyA尾。P14第27页/共110页29原核生物结构基因多转录为多顺反子mRNA 5PPP3蛋白质mRNA多顺反子mRNA(polycistronic mRNA):中数个结构基因常串联为一个转录单位,利用共同的启动子和终止信号,组成“”的基因表达调控单元,转录生成的一条mRNA链可编码几种功能相关的蛋白质,称为多顺反子mRNA。非编码区非编码区第28页/共110页30真核生物结构基因转录为单顺反子 mRNA并需要转录后加工非编码序列核蛋白体结合位点起始密码子终止密码子编码序列蛋白质mRNAA(n)35 m7G-PPP单顺反子mRNA(monocistronic mRNA):中一个结构基因转录生成的一个mRNA分子,经翻译生成一条多肽链,基本上没有操纵子结构。称为单顺反子mRNA。第29页/共110页31(1)5-端加帽:m7GpppG。(2)3-端加上聚腺苷酸尾巴:polyA。(3)剪接:切除内含子,拼接外显子。加工修饰得多。第30页/共110页32生物化学与分子生物学教研室第三章基 因 组 P22第31页/共110页33基因组定义:含有一种生物的一整套遗传信息的遗传物质,称为基因组。它泛指一个细胞或病毒的全部遗传信息。|真核生物中,基因组是指一套完整单倍体DNA(染色体DNA)和线粒体DNA的全部序列,既包括编码序列,也包括大量存在的非编码序列。P22第32页/共110页34 如:人类基因组包含22条染色体和X、Y两条性染色体上的全部遗传物质(核基因组)以及胞浆线粒体上的遗传物质(线粒体基因组)。22常+X,Y,+线粒体基因组第33页/共110页35不同生物基因组蕴含的遗传信息量 有着巨大的差别C值(C-value):单倍体基因组中全部的DNA量称为C值。|不同生物的基因组大小差异很大。一般来说,基因组大小和DNA含量随着生物进化复杂程度的增加以及生物结构和功能复杂程度的增加而逐步上升。P22第34页/共110页36(1)并非生物越高等,基因组一定就越大 某些植物和两栖类的DNA含量是人的几 十乃至上百倍。如人类C值约为109bp,而肺鱼的C值为1011bp。C值悖理(2)同一类复杂性差不多,形态也相似的生 物,其基因组可相差十倍以上。(3)基因组的大小与基因的数目并没有直接 的线性关系。应 注 意P23第35页/共110页37病毒基因组第36页/共110页38不同生物基因组的结构与组织形式不同 病毒基因组的大小和结构有较大的差异乙肝病毒DNA:3kb,编码4种蛋白质痘病毒基因组:300kb,编码几百种蛋白质 不同病毒基因组可以是不同结构的核酸有的病毒基因组是DNA,有的是RNA;有的为双链,有的为单链。第37页/共110页39 有些病毒基因组很小,又需要装入尽可能多的基因,因此在进化过程中形成了基因重叠现象。基因重叠定义:同一段DNA或RNA序列可以编码2种或2种以上的蛋白质。第38页/共110页40 基因重叠的意义:使较小的基因组携带较多的遗传信息。重叠程度有大、有小。重叠基因虽然共用一段核酸序列,由于基因表达时的阅读框架不同,产生的蛋白质分子也不同。第39页/共110页41病毒基因组可以由DNA或RNA组成 病毒是一类小的非细胞寄生物,缺乏内源性代谢,依赖宿主细胞提供原始材料和酶来满足其复制、转录和蛋白质合成的需要。|病毒基因组由双链或单链的DNA或RNA 组成|病毒基因组复制所需的复制酶 有的病毒自身带有其基因组复制所需的部分酶 有的完全依赖宿主细胞第40页/共110页42孤病毒外)|衣壳(Capsid):蛋白质外衣第41页/共110页43|囊膜(Envelope):衣壳外包绕着一层含糖(脂)蛋白的外膜,其中蛋白质具有病毒特异性,能选择性地与宿主细胞受体结合,促使病毒囊膜与宿主细胞膜融合,感染性核衣壳进入胞内而导致感染。失去囊膜后便丧失了感染性。|触须样纤维(Fiber):腺病毒 是唯一具有触须样纤维的病毒|病毒携带的酶:催化病毒核酸 合成的酶 第42页/共110页4444第43页/共110页45|RNA病毒所携带的遗传信息一般都在同一条链上,因而病毒RNA链有正、负之分。正链RNA病毒:基因组RNA序列与mRNA相同 可以作为mRNA模板,指导蛋白质合成。正链RNA病毒能够直接感染宿主细胞,合 成病毒核酸和外壳蛋白,组装成病毒体。负链RNA病毒:基因组RNA序列与mRNA互补 负链RNA病毒没有感染性,需要转录mRNA 以后才具有感染性。第44页/共110页46单股正链RNA病毒基因组可以 作为mRNA行使模板功能 基因组复制和基因转录特点:|病毒颗粒中RNA进入宿主细胞后,直接作为mRNA翻译出其特有蛋白,包括衣壳蛋白和病毒的RNA聚合酶。|在病毒RNA聚合酶催化下以基因组RNA为模板合成出负链,再以该负链为模板复制正链RNA。即通过RNA复制过程完成基因组核酸的复制。以复制的病毒RNA和衣壳蛋白装配成新的病毒颗粒。|如某些RNA噬菌体、脊髓灰质炎病毒、HAV(甲肝)、HCV(丙肝)、HEV(戊肝)等第45页/共110页47单股负链RNA病毒需要先合成与其互补的mRNA 基因组复制和基因转录特点:|基因组RNA进入宿主细胞后,病毒颗粒含有的RNA聚合酶(RNA转录酶),可催化合成互补链,既没有5帽,也没有3尾的正股RNA。然后以该正股RNA为模板,复制出负股RNA,即为病毒基因组RNA。|这种RNA聚合酶(RNA转录酶),还可以基因组负股RNA为模板转录出带有5帽和3poly(A)尾的mRNA,翻译病毒蛋白。|如滤泡性口腔炎病毒、流感病毒、副流感病毒等第46页/共110页48双链RNA病毒基因组含有正、负两条RNA链 基因组复制和基因转录特点:|基因组RNA进入宿主细胞后,正、负两条RNA链都有经复制产生互补链的功能,即通过RNA复制完成基因组核酸的复制。|其正链RNA具有编码能力,可作为mRNA指导蛋白质合成|双链RNA病毒都是1012个节段的线性RNA分子,每段RNA分子编码一种蛋白质。如呼肠孤病毒、轮状病毒等第47页/共110页49部分RNA病毒基因组可以被反转录为DNA 逆转录病毒(retrovirus),是一类特殊的单股正链RNA病毒,通常能引起人和动物的肿瘤。病毒颗粒中带有依赖RNA的DNA聚合酶(逆转录酶)。如(human immunodeficiency virus,HIV)人类免疫缺陷病毒、(leukemia virus)白血病病毒、(sarcoma virus)肉瘤病毒等。P67-68第48页/共110页50|基因组RNA进入宿主细胞后,通过DNA中间体完成病毒基因组复制。以依赖RNA的DNA聚合酶,将基因组RNA反转录成双链DNA,整合于宿主细胞基因组中成为,转录出正股RNA,即为病毒基因组核酸。|从前病毒基因组转录出的RNA,既是病毒基因组RNA,又是mRNA。第49页/共110页51逆转录酶(Reverse transcriptase)是多功能酶:(1)依赖RNA的DNA聚合酶活性 (RDDP)(2)核糖核酸酶H活性(RNase H)(3)DNA聚合酶活性(DDDP)(4)5末端位点特异性RNA切割酶活性P67第50页/共110页52第51页/共110页53逆转录病毒基因组的一般特征5帽-R-U5-PB-SD-gag-pol-SA-env-(onc)-C-PB+-U3-R-poly(A)n逆转录病毒颗粒携带两条完全相同的正股 RNA,以及两条来自宿主细胞的tRNA。4条链以氢键结合在一起。5端有甲基化帽子结构,3端有poly(A)尾第52页/共110页54(3)编码区:结构基因一些逆转录病毒带有癌基因、pX基因等。gag:编码病毒核心(衣壳)蛋白,其产物与病毒基因组RNA共同组装成核心和衣壳,并将衣壳与病毒包膜相连,决定了病毒的完整性。pol:编码病毒复制所需的各种酶。如肽链内切酶、逆转录酶、与前病毒整合相关的酶env:编码包膜蛋白。介导病毒对宿主细胞的吸附和穿入。5帽-R-U5-PB-SD-gag-pol-SA-env-(onc)-C-PB+-U3-R-poly(A)n第53页/共110页551)R区:病毒基因组两端是完全相同的一段同向 重复序列,2080nt,该区在逆转录合成 cDNA过程中起重要作用。2)引物结合区(PB):PB:位于5端的引物结合区,可与宿主细胞 某种tRNA的3 端互补,tRNA作为负链 cDNA合成的引物。PB+:位于3端的引物结合区,引导正链cDNA 的合成。(4)非编码区:与基因组复制及基因表达有关5帽-R-U5-PB-SD-gag-pol-SA-env-(onc)-C-PB+-U3-R-poly(A)n第54页/共110页565帽-R-U5-PB-SD-gag-pol-SA-env-(onc)-C-PB+-U3-R-poly(A)n3)U区:位于R区与PB区之间 U5:80100nt,转录终止及加polyA U3:2001000nt,含强启动子,起始转录RNA4)SD、SA和C区:SD:剪接给体位点 :包装信号,使RNA包入病毒颗粒 SA:剪接受体位点 C:调控区第55页/共110页57前病毒(provirus):逆转录病毒基因组的复制和转录都需要经过DNA中间体才能完成,这种DNA中间体称为前病毒。前病毒基因组的转录和翻译第56页/共110页58 (long terminal repeat,LTR):逆转录病毒基因组经过逆转录所形成的cDNA(前病毒基因组)在末端形成了新的重复序列(U3-R-U5),称为长末端重复序列。U3-R-U5-PB-SD-gag-pol-SA-env-(onc)-C-PB+-U3-R-U5 这是逆转录病毒DNA形式的特有结构,在其RNA基因组中是不存在的。长末端重复序列5帽-R-U5-PB-SD-gag-pol-SA-env-(onc)-C-PB+-U3-R-poly(A)n第57页/共110页59U3-R-U5-PB-SD-gag-pol-SA-env-(onc)-C-PB+-U3-R-U5 病毒RNA携带的遗传信息通过逆转录过程传递到DNA分子中,形成的双链DNA可随机整合到宿主细胞染色体中,成为前病毒。由于U3区有启动子,故从前病毒基因组可以转录出从5 R区至3 R的RNA,既是mRNA,又是病毒基因组RNA。前病毒基因组宿主基因组第58页/共110页60DNA病毒基因组有环状DNA分子和线状DNA分子 DNA病毒基因组也有单、双链和正、负股之分,由于单链DNA在转录前都要合成互补DNA,因此正股、负股DNA的区别并没有真正显示出来。第59页/共110页61|双链DNA病毒:基因转录方式类似细胞基因,每种病毒依赖宿主细胞代谢系统的程度有所不同,基因组DNA的复制特点也不同。大部分通过DNA复制过程完成基因组复制。需要先转录出一个RNA中间体(前基因组),再通过逆转录过程完成基因组复制。如乙肝病毒。基因组复制和基因转录特点第60页/共110页62|单链正股DNA病毒:进入宿主细胞后形成双链,其基因转录方式类似细胞基因。通过DNA复制过程完成基因组复制 包括自主微小病毒、依赖微小病毒、M13噬菌体等,其基因组小,无能力编码调控蛋白,因此严格寄生并利用宿主细胞正常功能表达与复制。依赖微小病毒尚需依靠辅助病毒(腺病毒等)重复感染方能完成自己的复制。第61页/共110页63病毒基因组结构与功能特点1.不同病毒基因组大小差别较大。与细菌或真核细胞相比,病毒的基因组很小。2.不同病毒基因组可以是不同结构的核酸。可以由DNA组成,也可以由RNA组成;可以是单链,也可以是双链;可以是闭环分子,也可以是线性分子。3.病毒基因组有连续的,也有不连续的。多数RNA病毒的基因组是由连续的核糖核酸链组成,但也有些病毒的基因组RNA由不连续的几条核酸链组成如流感病毒的基因组RNA分子是节段性的,目前,还没有发现有节段性的DNA分子构成的病毒基因组。第62页/共110页64病毒基因组结构与功能特点4.病毒基因组的编码序列大于90%。病毒基因组的大部分用来编码蛋白质,只有非常小的一部分不被翻译。5.除了逆转录病毒外(两个拷贝),所有病毒基因组都是单倍体。6.基因有连续的、有间断的(有的基因含有内含子)。噬菌体的基因是连续的,真核细胞病毒的基因是不连续的,具有内含子。除了正链RNA病毒外,真核细胞病毒的基因都是先转录成mRNA前体,再经加工切除内含子才能成为成熟的mRNA。有些真核病毒某个基因的内含子或其中的一部分,对另一个基因却是外显子。如SV40和多瘤病毒的早期基因。第63页/共110页65病毒基因组结构与功能特点7.相关基因丛集。病毒基因组DNA序列中功能上相关的蛋白质的基因或rRNA的基因往往丛集在基因组的一个或几个特定的部位,形成一个功能单位或转录单元。它们可被一起转录为多顺反子mRNA,然后再加工成各种蛋白质的模板mRNA。8.有基因重叠现象。这种结构使病毒较小的基因组能够携带较多的遗传信息。9.病毒基因组含有不规则结构基因。2#第64页/共110页66 定义:朊病毒是一类能侵染动物并在宿主细胞内复制的小分子无免疫性疏水蛋白质。只含有蛋白质而不含核酸的生物分子,并且只能在寄生宿主细胞内生存。朊病毒蛋白质侵染因子 P328第65页/共110页67蛋白质错误折叠引起疾病蛋白质构象疾病(蛋白质错折叠病,蛋白粒子病)若蛋白质的折叠发生错误,使蛋白质的构象发生改变,尽管其一级结构不变,仍可影响其功能,严重时可导致疾病发生。P328机理:有些蛋白质错误折叠后相互聚集,常形成抗蛋白水解酶的淀粉样纤维沉淀,产生毒性而致病。包括:人纹状体脊髓变性病、老年痴呆症、亨廷顿舞蹈病、等。第66页/共110页68P328(1)无法折叠为正常功能产物 有些蛋白质由于某种因素导致其折叠错误并不影响其合成,转运和定位基本正常,但丧失正常功能,从而引发疾病。如肌萎缩性侧索硬化症等。蛋白质错误折叠疾病根据其分子机制可分为第67页/共110页69P328(2)错折叠引起错误定位 有些蛋白质由于折叠发生错误后,主要影响正确转运,发生错误定位,从而引发疾病。如家族性高胆固醇血症的LDL受体蛋白发生错误折叠,不能转运定位于细胞膜表面而失去识别和结合LDL的功能,使血浆LDL水平明显升高。第68页/共110页70P328(3)毒性折叠产物 有些蛋白质错误折叠后相互聚集,常形成抗蛋白水解酶的淀粉样纤维沉淀,产生毒性而致病。如老年性痴呆症、疯牛病等。第69页/共110页71朊病毒蛋白(prion protein,Prp)是引起一组人和动物神经退行性病变的病原体,具有传染性、遗传性、散在发病的特点。在动物间的传播是由传染性颗粒朊病毒完成的。朊病毒不含核酸成分,仅由修饰后的PrP同一蛋白PrpSc组成。因此也称蛋白粒子病。P329第70页/共110页72 朊病毒蛋白是人和动物正常细胞基因的编码产物(人类该基因位于20号染色体短臂),是3335KD的水溶性和对蛋白酶敏感的蛋白质,称为Prpc(细胞型、正常型)。而致病的朊病毒蛋白是不溶性的、对蛋白酶有抗性作用的2730KD的蛋白质,是Prpc基因的核心序列,称为Prp2730或PrpSc(搔痒型、致病型)。P329第71页/共110页734.致病机制 1982年,Prusiner提出了朊病毒致病的“蛋白质构象致病假说”,要点如下:1)朊病毒蛋白有两种构象:PrPc和PrPSc2)PrPsc可胁迫PrPc转化为PrPsc,实现自我复制,并产生病理效应。3)基因突变可导致细胞型PrPc中螺旋结构不稳定,至一定量时产生自发性转化,片层增加,最终变为PrPsc型,并通过多米诺效应倍增致病。P331第72页/共110页74原核生物基因组第73页/共110页75一、原核生物基因组通常由环状双链DNA组成 原核生物基因组通常仅由一条环状DNA分子组成,在细胞中与蛋白质结合成复合体形式存在。细菌染色体DNA形成较致密的区域类核结构。中央:RNA和支架蛋白,占20%外围:双链闭环超螺旋DNA,占80%,花瓣状结构第74页/共110页76二、操纵子结构是原核生物基因组的结构特点之一操纵子(operon)定义:原核生物的绝大多数结构基因按功能相关性成簇串联排列于染色体上,连同其上游的调控区(包括启动子和操纵元件)以及下游的转录终止信号共同组成一个基因表达单位,即操纵子结构。第75页/共110页77 操纵元件(operator)是一段能够被不同基因表达调控蛋白识别和结合的DNA序列,是决定基因表达效率的关键元件。一个操纵子只含一个启动序列及数个可转录的结构基因。在同一启动序列控制下,转录出多顺反子mRNA。第76页/共110页78Promoter(启动子):是RNA聚合酶结合的区域,也是控制转录的关键部位,也称启动序列。基因开放时,几个基因转录在一条mRNA链上,分别翻译合成各自的蛋白肽链。操纵子的末端具有特殊的终止序列。原核生物大多数基因表达调控是通过操纵子机制实现的。第77页/共110页79操纵子(operon)的结构与功能Inhibitor genePS1S2S3启动子结构基因1,2,3.O操纵基因PromoterOperator geneStructure gene调控区结构基因 操纵子表达阻遏蛋白 转录起始部位 结合RNA聚合酶转录出mRNA、表达功能蛋白?I阻遏物基因信息区控制区管理操纵结构基因的“开放”与“关闭”,可结合阻遏蛋白第78页/共110页80三、原核生物基因组还具有一些结构上的特点 1.原核生物基因组中的基因密度非常高,基因 组序列中编码区所占的比例较大(约为50%左右)。2.基因组相对较小,只有一个DNA复制启始位 点(OriC)。3.结构基因无重叠现象,基因组中任何一段 DNA不会用于编码2种蛋白质。4.结构基因是连续的,没有内含子第79页/共110页815.编码蛋白质的结构基因常为单拷贝(占99.7%),但编码rRNA的基因往往是多拷贝的。这有利于核糖体的快速组装。6.基因组中重复序列很少。7.具有编码同工酶的基因。这是一类结构不完全相同,而功能相同的基因。如E.coli含有2个编码乙酸乳酸合成酶的基因和2个编码分支酸变位酶同工酶的基因。8.不同的原核生物基因组中的GC含量变化很大,其范围从25%75%。因此测量基因组的GC含量可以用来识别细菌种类。第80页/共110页82四、在原核生物基因组的非编码区内 主要是一些调控序列 原核生物基因组DNA序列中有多个具有各种功能的识别区域,如复制起始区OriC,复制终止区TerC,转录启动区和终止区等。这些区域往往具有特殊序列,并且含有反向重复序列。大肠杆菌色氨酸操纵子:3端含有40bp的GC 丰富区,其后紧跟一个AT丰富区,此为转录终止子结构。第81页/共110页83强终止子:含有反向重复序列,可形成茎环结构,其后面有poly(T)结构,不需终止蛋白因子参与即可使转录终止。弱终止子:尽管也含有反向重复序列,但无poly(T)结构,需要有终止蛋白因子参与才能使转录终止。第82页/共110页84五、细菌基因组中的可移动成分能产生转座现象(transposition)是指位于基因组某处的一个或一组基因复制出一个新拷贝转移到基因组的另一个位置上去。(transposable element)能够在一个DNA 分子内部或两个DNA分子之间移动的DNA 片段。目前已发现多种转座因子,最简单的仍是最初发现的插入序列。P75第83页/共110页85(一)原核生物转座因子类别1.插入序列(insertion sequence,IS):长度在2000bp以内,是较小的转座因子,除了带有与转座作用有关的基因(转位酶基因)外不带任何基因。只有当它们转座到受体某一基因中使该基因失活和产生极性效应时才会被发现。有很多种:如IS1(768bp)、IS2(1327bp)、IS4(1428bp)、IS5(1195bp)等。P75第84页/共110页862.转座子(transposon,Tn):长度在2000 20 000bp之间的较大的转座因子,除了带有与转座作用有关的基因外,还带有其它基因。如Tn903、Tn5带有卡那霉素抗药基因(kanR),Tn10带有四环素抗药基因(terR)。转座子的共同结构特点是它们的两个末端具有反向重复序列,即一个末端序列为AGCT,那么另一个末端序列则为TCGA。若缺失任何一端,都会妨碍转座功能。P76第85页/共110页873.Mu噬菌体(Mu):是一种大肠杆菌的温和型噬菌体,它在溶原化细菌内能像转座子那样在细胞内DNA上不同位置间转移,没有一定的整合位置。Mu噬菌体因整合到寄主基因组内引起突变,所以用诱变者(mutator)的头两个字母命名。它具有20多个基因,只有其中的A、B基因与转座有关。P76第86页/共110页88(二)转座因子的几个遗传效应1.转座因子的转座不是本身的移动,而是由转座因子复制出一个新拷贝转移到基因组的新位置上去,原来的转座因子仍留在原来的位置上。2.新的转座因子转到靶点后,靶点序列会倍增成为两个靶点序列,并分别排列在转座因子的两侧,形成同向重复序列。这是转座因子转座后的一个重要标志。只要在一个DNA序列两侧有同向重复序列,就可以断定它是转座因子。3.在转座过程中能够形成共合体。P78第87页/共110页894.转座因子转座后能促使染色体畸变。5.转座因子可以从原来位置上切除,称为切离(excision)。切离与转座是两个不同的过程。转座因子转座后,原来位置上的转座因子并不消失。转座和切离过程对外界条件的反应不同6.转座可引起插入突变。7.由于携带标志基因(ampR、terR、smR),转座因子插入到受体基因组内,给受体基因组增添了新的基因。第88页/共110页90六、质粒DNA是具有自主复制能力的双链环状DNA质粒(plasmid)的概念:是存在于细菌染色体外的,具有自主复制能力的核酸分子,属染色体外基因组。由于质粒带有某些特殊遗传信息,在宿主细胞内能自主复制,并在细胞分裂时恒定传给子代细胞,故能赋予宿主细胞一些新的遗传性状,可用于重组细菌的筛选和鉴定。第89页/共110页91原核生物基因组结构与功能特点1.基因组通常仅由一条环状双链DNA分子组成,具有类核结构。2.基因组相对较小,通常只有一个DNA复制启始 位点(OriC)。3.具有操纵子结构(原核生物的一个基因表达单 位),其转录产物为多顺反子mRNA。4.结构基因编码序列无重叠现象5.基因组中存在着可移动的DNA序列:包括插入 序列、转座子等。第90页/共110页926.原核生物基因组中的基因密度非常高,基因 组序列中编码区所占的比例较大(约为50%左右),非编码区内主要是一些调控序列。7.结构基因是连续的,没有内含子8.基因组中重复序列很少。编码蛋白质的结构 基因常为单拷贝(占99.7%),但编码rRNA 的 基因往往是多拷贝的。9.具有编码同工酶的同基因10.不同的原核生物基因组中的GC含量变化很 大,其范围从25%75%。因此测量基因组 的GC含量可以用来识别细菌种类。第91页/共110页93真核生物基因组第92页/共110页94一、真核生物基因组远大于原核生物基因组真核生物基因组复杂性体现在两个方面:v 具有复杂多样的结构形式 v 具有复杂精细的基因表达调控机制 真核生物基因组结构庞大,人类单倍体基因组DNA约3.3109 bp,约有33.5万个基因。大肠杆菌基因组只有4.6106 bp。第93页/共110页95二、真核生物基因组由染色体DNA 和染色体外DNA组成真核生物基因组染色体DNA染色体外DNA(线粒体DNA)染色体DNA位于细胞核内,为线状,与组蛋白、非组蛋白结合成染色质,染色质组装在核内,外有核膜包裹,因此基因组的转录和翻译不能在同一空间进行,转录在细胞核,翻译在胞浆。第94页/共110页96三、真核生物基因组中非编码序列 多于编码序列 真核基因组中非编码序列(non-coding sequence,NCS)占90%以上。人类基因组中,编码序列仅占3%左右。这是真核生物与细菌、病毒的重要区别,在一定程度上也是生物进化的标尺。非编码序列基因的内含子、调控序列等重复序列约占DNA总量50%90%第95页/共110页97重复序列编码序列:rRNA、tRNA、组蛋白、免疫球蛋白的结构基因 非编码序列:与基因组稳定性、组织 形式、基因表达调控有关 P16第96页/共110页98根据重复序列出现的频率不同:重复序列高重复序列:(105次)卫星DNA、反向重 复序列中重复序列:(10105次)散在分布于基因组中,约占基因组DNA总量的35%,常与单拷贝基因间隔排列。其产物是细胞大量需要的。rRNA、tRNA、组蛋白、免疫球蛋白的结构基因;基因调控;Alu家族等。单拷贝序列或低重复序列:在整个基因组中仅出现一次或少数几次,大部分为编码蛋白质的结构基因P17第97页/共110页99重复序列反向重复序列:两个顺序相同的拷贝在DNA链上呈反向排列。两个反向排列的拷贝之间隔着一段间隔序列;两个拷贝反向串联在一起,中间没有间隔序列,又称为回文结构。串联重复序列:散在重复序列:编码区串联重复:人类5种组蛋白基因密集在7.0kb的重复单位上,具有高度序列一致性。非编码区串联重复:通常存在于间隔DNA和内含子内。可以从2个碱基起,长短不等;重复次数可以从几次到数百次、甚至几十万次。是形成卫星DNA的基础。P17第98页/共110页100卫星DNA(satellite DNA):是出现在非编码区的串联重复序列,具有固定的重复单位,该重复单位首尾相连形成重复序列片断,通常存在于间隔DNA和内含子中。卫星DNA根据核心顺序的长短可分为三类,大卫星DNA、小卫星DNA和微卫星DNA。P16第99页/共110页101重复序列的多态性限制性片段长度多态性的概念 (restriction fragment length polymorphism,RFLP)用同一种限制性内切酶消化不同个体的同一段DNA时,由于碱基组成的变化而改变限制性内切酶识别位点,从而产生长度不同的DNA片段。这种方法称为限制性片段长度多态性技术(RFLP技术)。P44第100页/共110页102四、多基因家族和假基因的存在 是真核基因组的另一特点(一)多基因家族 多基因家族(multigene family):是指核苷酸序列或编码产物的结构具有一定程度同源性的一组基因,其编码产物常具有相似的功能。是真核生物基因组中最显著的特征之一。多基因家族属中度重复序列,是一组来源相同、结构相似、功能相关的基因,由同一祖先基因经过重复和变异所产生的一组基因,有的编码RNA,有的编码蛋白质。多基因家族按基因的终产物分为两类:一类编码RNA,一类编码蛋白质。P14第101页/共110页1031.核酸序列相同 实际上是一个基因的多次拷贝,成簇地排列在同一条染色体上,形成一个基因簇。包括rRNA基因家族、tRNA基因家族、组蛋白基因家族等。P15第102页/共110页1042.核酸序列高度同源 多数成员的同源性非常高。-珠蛋白基因家族由高度同源的几个基因成簇排列在同一条染色体上。人的生长激素基因家族:生长激素(GH)绒毛膜生长催乳激素(CS)催乳素(PRL)氨基酸序列同源性:85%mRNA序列同源性:92%氨基酸序列同源性:50%mRNA序列同源性:很低P15第103页/共110页1053.编码产物的功能或功能区同源 在某些基因家族的成员之间,基因全长序列的相似性可能较低,但其编码产物具有高度保守的功能区。src癌基因家族:基因结构无明显同源性,但每个基因产物都含有250AA序列的同源蛋白激酶结构域。DEAD盒基因家族:家族中含有几个不同的基因,其产物都有解旋酶的功能,结构特征是8个氨基酸的保守序列,内含DEAD盒序列:Asp-Glu-Ala-Asp第104页/共110页1064.基因超家族基因超家族(gene superfamily)也称超基因家族(super gene family)。由多基因家族及单基因组成的更大的基因家族。它们的结构有程度不等的同源性,但它们的功能并不一定相同,这是与多基因家族的差别所在。这些基因在进化上也有亲缘关系,但较远,故将其称为基因超家族。最经典的是免疫球蛋白基因超家族(Ig超家族)。P15第105页/共110页107(二)假基因假基因(pseudogene,):与某些有功能的基因结构相似,但不能表达基因产物的基因(序列与有功能的基因相似,但或者不能转录,或者转录后生成无功能的基因产物)。假基因原来也可能是有功能的基因,其形成的原因可能是基因在进化过程中,发生突变所致(如缺失、倒位、点突变等)。P16第106页/共110页108真核生物基因组结构与功能特点1.每一种真核生物都有一定的染色体数目,除配子为单倍体外,体细胞一般为双倍体,即含两份同源的基因组。2.真核生物基因组远大于原核生物基因组,结构复杂,基因数庞大,具有许多复制起始点,每个复制子大小不一。3.真核生物基因组由染色体DNA和染色体外DNA组成。4.真核基因组都由一个结构基因与相关的调控区组成,转录产物为单顺反子。第107页/共110页1095.真核基因组中含有大量重复顺序。6.真核基因组中非编码序列(non-coding sequence,NCS)占90%以上。7.真核生物的结构基因是断裂基因(split gene)。8.真核生物基因组中有假基因存在。9.功能相关的基因构成各种基因家族,它们可串联在一起,也可相距很远(分散在不同染色体上),即使串联在一起的基因也是分别转录的。第108页/共110页110基因组在进化过程中发生了各种 形式的变异SNP(single nucleotide polymorphism)定义:是指单个核苷酸变异而形成DNA分子多态即单核苷酸多态性P43第109页/共110页
展开阅读全文