资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,生物化学与分子生物学教研室,第一章,绪 论,1,分子生物学定义,:,是从分子水平研究生命现象、生命本质、生命活动及其规律的科学。研究对象主要是,生物大分子 。,分子水平生命活动主要是通过,核酸,和,蛋白质,这两类生物大分子的活动来实现的,。,2,医学分子生物学(,medical molecular biology,),:,是从分子水平研究人体和疾病相关生,物在正常和疾病状态下生命活动及其规律、,从分子水平开展人类疾病的预防、诊断和,治疗研究的科学。,3,分子生物学的研究目的是,以生物大分子的结构和功能为基础研究生命活动的本质与规律,。,分子水平生命活动主要是通过,核酸,和,蛋白质,这两类生物大分子的活动来实现的。,4,从核酸和蛋白质的结构与功能、基因组的结构与功能到基因的复制、表达、调控及生物学效应;,从生物大分子之间的相互作用到这些相互作用构成的细胞间通讯和细胞内信号转导;,从对基因的结构、功能、表达调控的分析到基因的制备、改造、调控、应用所需的各种技术体系,现代分子生物学研究主要涉及三个领域,5,1,、人体某种细胞内的基因发生异常改变,2,、外源基因进入人体引起疾病,3,、疾病易感基因使机体对致病因素更加敏感,基因与疾病的关系大致包括三种类型,6,调控网络,细胞间通讯网络,细胞内信号转导途径,是体内细胞功能调控的分子基础,7,基因诊断,:,主要是应用分子生物学技术,检测人体某些基因结构和表达的变化,或者检测病原体基因组在人体内的存在,从而达到诊断疾病或监控疾病治疗效果的目的,。,基因治疗,:,通过特定的分子生物学技术关闭或降低异常表达基因,或将正常的外源基因导入体内特定的靶细胞以弥补缺陷基因,或将某种特定基因导入体细胞以表达特定的蛋白质因子,实现对疾病的治疗。,8,基因治疗总体上分为两大方面,:,1.,纠正异常基因(异常表达或缺陷),2.,利用特定基因在体内表达特定的蛋,白质因子以实现对疾病的治疗作用,9,生物化学与分子生物学教研室,第二章,基因的结构与功能,P,2,10,基因是编码,RNA,或多肽链的核酸片段,Beadle,和,Tatum,提出,“一个基因一种酶”假说,为此获得,1958,年诺贝尔生理学和医学奖,人们对上述学说进行修正,提出“一个基因一,条多肽链,”,的概念,基因定义,:,基因是负责编码,RNA,或一条多肽链的,DNA,片段,包括编码序列、编码序列外的侧翼序列及插入序列,。,P,3,11,基因,:,是核酸分子中贮存遗传信息的遗传单位,是指贮存,RNA,序列信息及表达这些信息所必需的全部核苷酸序列。,其中贮存,RNA,序列信息的,DNA,区段称为结构基因,结构基因上游和下游控制转录的序列即为基因的调控序列。,RNA,的碱基序列直接来源于结构基因,其中,mRNA,的序列中又贮存有蛋白质多肽链的氨基酸序列信息。,P,1,12,遗传密码,(,genetic code,),:,mRNA,分子上从,5,3,方向,由,起始密码子,AUG,开始,每,3,个,核苷酸,组成的三联体,,决定肽链上某一个氨基酸或蛋白质合成的起始、终止信号,,称为,三联体,密码,也叫密码子(,codon,),。,开放阅读框架,(open reading frame, ORF),。,从,mRNA 5,端起始密码子,AUG,到,3,端终止密码子之间的核苷酸序列,各个三联体密码连续排列编码一个蛋白质多肽链,称为,开放阅读框架,。,13,结构基因(,structure gene,),:,是指基因中编码,RNA,或蛋白质的,DNA,序列。,原始模板和直接模板,:,DNA,分子上决定蛋白质氨基酸序列的遗传信息称为蛋白质合成的,原始模板,。指导蛋白质生物合成的,mRNA,称为蛋白质合成的,直接模板,。,14,模板链,(template strand),和编码链,(,coding,strand),:,DNA,双链中按碱基配对规律,能指导转录生成,RNA,的一股链成为,模板链,(,也称作,反意义链,antisense strand,或,Watson,链,),。,与,模板链对应不,能指导转录生成,RNA,的另一股链称为,编码链,(,也称为,有义链,sense strand,或信息链、,Crick,链,),,它与转录出的RNA碱基序列比较,除了,U,代替,T,外,其余都是一致的。,15,不对称转录的含义,(,1,),DNA,分子上,模板链,指导,RNA,转录,,编码链,不转录。,(,2,),在一个多基因的,DNA,双链分子中,,模板链并非都在同一,DNA,单链上。,RNA,新链合成的方向:,5, ,3,。,文献上刊出的,DNA,单链,一般均指,编码链。,16,原核生物结构基因是连续的编码序列,其,RNA,合成后不需剪接加工。,真核生物的结构基因,有若干个编码区被非编码区相互间隔开但又连续镶嵌而成,,称为,断裂基因,(,split gene,,,discontinuous gene, interrupted gene,)。它为一个由连续氨基酸组成的完整蛋白质编码。,P,12,17,外显子(,exon,)和内含子(,intron,),外显子,:,即编码序列,,在基因转录后经过剪接连在一起,形成成熟的,mRNA,,最终参与指导多肽链合成的核苷酸序列。,内含子,:,与外显子相对应的割断基因的线性表达而在剪接过程中被除去的非编码核苷酸序列。,P,12,18,同一段,DNA,序列能够编码两种,甚至三种蛋白质分子,起始或终止点不同、阅读框架不同、剪接形式不同,可以在同一段,DNA,上形成不同的基因。还有些基因的内含子中包含其它基因的编码序列,即,基因内基因,。,19,真核生物基因的外显子和内含子接头处都有一段高度保守的一致序列: 内含子,5,端大多数以,GT,开始,,3,端大多数以,AG,结束,称为,GT-AG,法则,,可作为真核基因中,RNA,剪接和识别信号。,P,13,20,基因中含有与转录调控相关的序列,(,1,)编码蛋白质肽链或,RNA,的序列,(,2,)保证转录所必需的调控序列,(,3,)位于编码区,5,端上游的非编码序列,(,4,)内含子,(,5,),位于编码区,3,端下游的非编码序列,一个基因应包含下列序列,21,基因序列示意图,调控序列,5,端非编码序列,结构基因,3,端非编码序列,原核:操纵子调控模式,真核:顺式作用元件(包括启动子和上游启动子元件、增强子、,反应元件、,poly(A,),加尾信号),原核:,SD,序列,真核:,DNA,元件,编码蛋白质肽链或,RNA,序列,内含子(结构基因中非编码序列),原核:多顺反子,真核:单顺反子,DNA,模板靠近终止区,转录终止的修饰点,侧翼序列,不被翻译的,DNA,片段,包括前导序列。即第一个外显子的上游和最后一个外显子的下游。,22,真核生物基因中的调控序列,1.,启动子(,promoter,)和启动子上游序列,一般位于基因转录起始点上游,100 ,200,碱基对范围,是能够被,RNA,聚合酶识别并与其结合并起始转录的核苷酸序列,包括一组转录调控序列:,P,13,23,TATA box,CAAT box,人类许多基因的转录起始点上游,25,30bp,的位置有一段高度保守序列。由,7,个碱基组成,,TATAAAA,或,TATATAT,。是转录因子,TFD,的结合位点,,TFD,再与,RNA,聚合酶,形成复合物,启动基因转录,这一类启动子又称为,类启动子,。,位于转录起始点上游,70,80bp,的位置一段保守序列,由,9,个碱基组成,,GGNCA,ATCT,,其中,N,为,C,或,T,。,CAAT,盒与转录因子,CTF,结合,决定启动子转录的效率。,GC box,有些基因没有,TATA box,和,CAAT box,,但在转录起始点上游,35bp,的位置具有富含,GC,的核苷酸序列(,GGCGG,),,GC box,能与转录因子,Sp1,结合,促进转录的过程。,24,典型的启动子通常含有,TATA box,以及上游的启动子元件,CAAT box,和,GC box,。这类启动子一般具有一个转录起始点及较高的转录活性。,仅有,TATA box,和转录因子也可构成最简单的启动子。,有许多启动子不含,TATA box,,分为两类:,富含,GC,的启动子,,,一些管家基因,该类基因一般含有数个分离的转录起始点。,既无,TATA box,,也没有,GC,富含区,,,可有一个或数个转录起始点。大多数转录活性很低或没有转录活性,只是在胚胎发育、组织分化和再生过程中受到调节。,25,类启动子,能够被,RNA,聚合酶,和转录因子,识别和结合的启动子。主要见于,rRNA,基因。,类启动子,能够被,RNA,聚合酶,和转录因子,识别和结合的启动子。主要包括,5SrRNA,、,tRNA,、,snRNA,等的编码基因。,26,2.,增强子(,enhancer,),增强子是一段短的,DNA,序列,含有多个作用元件,可以特异性与转录因子结合,增强基因的转录活性。,与启动子不同,它可以位于基因的任何位置。尽管通常处于转录起始点上游,100 ,300,bp,处,但在内含子中也发现有增强子存在。,增强子的功能与其位置和方向无关,。,1986,年,,Maniatis,等在研究干扰素,-,基因转录时发现增强子内含有负调控序列,称为,负增强子,,又称为,沉默子(,silencer,),。因此有人建议用调变子(,modulator,)取代增强子概念。,P,14,27,3. Poly,(,A,)加尾信号,含有,类启动子的基因除了具有上述调控序列外,在基因的末端往往还有一段特定的加尾信号,是一个保守的,AATAAA,序列,其下游有一段,GT,或,T,丰富区,,共同构成,Poly,(,A,)加尾信号(,转录终止修饰点,)。,mRNA,转录到此,产生,AAUAAA,和随后的,GU,或,U,丰富区,,被与,RNA,聚合酶结合的延长因子识别并结合,终止,RNA,转录合成,并在,AAUAAA,下游,1030,碱基的位置切断,RNA,。在,polyA,聚合酶催化下,在,3,端加上约,200,个腺苷酸,构成,polyA,尾。,P,14,28,原核生物结构基因多转录为多顺反子,mRNA,5,PPP,3,蛋白质,mRNA,多顺反子,mRNA,(,polycistronic,mRNA),:,原核细胞,中数个结构基因常串联为一个转录单位,利用共同的启动子和终止信号,组成“,操纵子,”的基因表达调控单元,转录生成的,一条,mRNA,链可编码,几种,功能相关的,蛋白质,,,称为多顺反子,mRNA,。,非编码区,非编码区,29,真核生物结构基因转录为单顺反子,mRNA,并需要转录后加工,非编码序列,核蛋白体结合位点,起始密码子,终止密码子,编码序列,蛋白质,mRNA,A(n) 3,5,m,7,G-PPP,单顺反子,mRNA,(,monocistronic,mRNA),:,真核细胞,中一个结构基因转录生成的,一个,mRNA,分子,经翻译生成,一条多肽链,,基本上没有操纵子结构。,称为单顺反子,mRNA,。,30,真核生物,mRNA,的转录后加工,(,1,),5,-,端加帽:,m,7,Gpp,pG,。,(,2,),3,-,端加上聚腺苷酸尾巴:,polyA,。,(,3,),剪接,:切除内含子,拼接外显子。,加工,修饰,对于一些由几条相同或不同多肽链组成的具有四级结构的蛋白质来说,存在着,多个基因协调表达,的问题。真核生物基因协调表达要比原核生物复杂得多。,31,生物化学与分子生物学教研室,第三章,基 因 组,(,genome,),P,22,32,基因组定义,:,含有一种生物的一整套遗传信息的遗传物质,称为基因组。它泛指一个细胞或病毒的全部遗传信息。,真核生物中,基因组是指一套完整单倍体,DNA,(染色体,DNA,)和线粒体,DNA,的全部序列,既包括编码序列,也包括大量存在的非编码序列。,P,22,33,如:人类基因组包含,22,条染色体和,X,、,Y,两条性染色体上的全部遗传物质(核基因组)以及胞浆线粒体上的遗传物质(线粒体基因组)。,22,常,+ X,,,Y,,,+,线粒体基因组,34,不同生物基因组蕴含的遗传信息量,有着巨大的差别,C,值(,C-value,),:,单倍体基因组中全部的,DNA,量称为,C,值。,不同生物的基因组大小差异很大。一般来说,基因组大小和,DNA,含量随着生物进化复杂程度的增加以及生物结构和功能复杂程度的增加而逐步上升。,P,22,35,(,1,),并非生物越高等,基因组一定就越大,某些植物和两栖类的,DNA,含量是人的几,十乃至上百倍。,如人类,C,值约为,10,9,bp,,,而肺鱼的,C,值为,10,11,bp,。,C,值悖理,(,2,)同一类复杂性差不多,形态也相似的生,物,其基因组可相差十倍以上。,(,3,)基因组的大小与基因的数目并没有直接,的线性关系。,应 注 意,P,23,36,病毒基因组,37,不同生物基因组的结构与组织形式不同,病毒基因组的大小和结构有较大的差异,乙肝病毒,DNA,:,3kb,,编码,4,种蛋白质,痘病毒基因组:,300kb,,编码几百种蛋白质,不同病毒基因组可以是不同结构的核酸,有的病毒基因组是,DNA,,有的是,RNA,;有的为双链,有的为单链。,38,有些病毒基因组很小,又需要装入尽可能多的基因,因此在进化过程中形成了基因重叠现象。,基因重叠定义,:,同一段,DNA,或,RNA,序列可以编码,2,种或,2,种以上的蛋白质。,39,基因重叠的意义:,使较小的基因组携带较多的遗传信息。,重叠程度有大、有小。,重叠基因虽然共用一段核酸序列,,由于基因表达时的阅读框架不同,产生的蛋白质分子也不同。,40,病毒基因组可以由,DNA,或,RNA,组成,病毒是一类小的非细胞寄生物,缺乏内源性代谢,依赖宿主细胞提供原始材料和酶来满足其复制、转录和蛋白质合成的需要。,病毒基因组由双链或单链的,DNA,或,RNA,组成,病毒基因组复制所需的复制酶,有的病毒自身带有其基因组复制所需的部分酶,有的完全依赖宿主细胞,41,基本结构:为所有病毒所必备,核酸(,Nucleic acid,),:病毒核酸也称基因,组,3-4,个基因数百个基因,DNA,病毒,:多为双股(除微小病毒外),RNA,病毒,:多为单股(除呼肠孤病毒外),衣壳(,Capsid,):,蛋白质外衣,42,辅助结构:为某些病毒所特有,囊膜(,Envelope,),:衣壳外包绕着一层含糖,(,脂,),蛋白的外膜,其中蛋白质具有病毒特异性,能选择性地与宿主细胞受体结合,促使病毒囊膜与宿主细胞膜融合,感染性核衣壳进入胞内而导致感染。失去囊膜后便丧失了感染性 。,触须样纤维,(Fiber),:腺病毒,是唯一具有触须样纤维的病毒,病毒携带的酶 :,催化病毒核酸,合成的酶,43,病毒颗粒的组成,44,44,RNA,病毒所携带的遗传信息一般都在同一条链上,因而病毒,RNA,链有正、负之分。,正链,RNA,病毒,:,基因组,RNA,序列与,mRNA,相同,可以作为,mRNA,模板,指导蛋白质合成。,正链,RNA,病毒能够直接感染宿主细胞,合,成病毒核酸和外壳蛋白,组装成病毒体。,负链,RNA,病毒,:,基因组,RNA,序列与,mRNA,互补,负链,RNA,病毒没有感染性,需要转录,mRNA,以后才具有感染性。,45,单股正链,RNA,病毒基因组可以,作为,mRNA,行使模板功能,基因组复制和基因转录特点 :,病毒颗粒中,RNA,进入宿主细胞后,直接作为,mRNA,翻译出其特有蛋白,包括衣壳蛋白和病毒的,RNA,聚合酶。,在病毒,RNA,聚合酶催化下以基因组,RNA,为模板合成出负链,再以该负链为模板复制正链,RNA,。即通过,RNA,复制过程完成基因组核酸的复制。 以复制的病毒,RNA,和衣壳蛋白装配成新的病毒颗粒。,如某些,RNA,噬菌体、脊髓灰质炎病毒、,HAV,(,甲肝)、,HCV,(,丙肝)、,HEV,(,戊肝)等,46,单股负链,RNA,病毒需要先合成,与其互补的,mRNA,基因组复制和基因转录特点:,基因组,RNA,进入宿主细胞后,病毒颗粒含有的,RNA,聚合酶(,RNA,转录酶),可催化合成互补链,既没有,5,帽,也没有,3,尾的正股,RNA,。然后以该正股,RNA,为模板,复制出负股,RNA,,即为病毒基因组,RNA,。,这种,RNA,聚合酶(,RNA,转录酶),还可以基因组负股,RNA,为模板转录出带有,5,帽和,3poly(A),尾的,mRNA,,翻译病毒蛋白。,如滤泡性口腔炎病毒、流感病毒、副流感病毒等,47,双链,RNA,病毒基因组含有,正、负两条,RNA,链,基因组复制和基因转录特点 :,基因组,RNA,进入宿主细胞后,正、负两条,RNA,链都有经复制产生互补链的功能,即通过,RNA,复制完成基因组核酸的复制。,其正链,RNA,具有编码能力,可作为,mRNA,指导蛋白质合成,双链,RNA,病毒都是,1012,个节段的线性,RNA,分子,每段,RNA,分子编码一种蛋白质。如呼肠孤病毒、轮状病毒等,48,部分,RNA,病毒基因组可以被,反转录为,DNA,逆转录病毒(,retrovirus,),是一类,特殊的单股正链,RNA,病毒,,通常能引起人和动物的肿瘤。病毒颗粒中带有,依赖,RNA,的,DNA,聚合酶(逆转录酶)。,如,(,human immunodeficiency,virus,HIV,),人类免疫缺陷病毒、,(,leukemia virus,),白血病病毒、(,sarcoma virus,)肉瘤病毒等。,P,67-68,49,基因组复制和基因转录特点 :,基因组,RNA,进入宿主细胞后,通过,DNA,中间体完成病毒基因组复制。以依赖,RNA,的,DNA,聚合酶,将基因组,RNA,反转录成双链,DNA,,整合于宿主细胞基因组中成为,前病毒,,转录出正股,RNA,,即为病毒基因组核酸。,从前病毒基因组转录出,的,RNA,,既是病毒基因组,RNA,,又是,mRNA,。,50,逆转录酶,(,Reverse transcriptase,),是多功能酶,:,(,1,)依赖,RNA,的,DNA,聚合酶活性,(,RDDP,),(,2,),核糖核酸酶,H,活性(,RNase,H,),(,3,),DNA,聚合酶活性(,DDDP,),(,4,),5,末端位点特异性,RNA,切割酶活性,P,67,51,52,逆转录病毒基因组的一般特征,5,帽,-R-U5-PB,-SD-,-,gag,-,pol,-,SA,-,env,-(onc)-C-PB,+,-U3-R-,poly(A)n,逆转录病毒颗粒携带,两条完全相同的正股,RNA,,以及两条来自宿主细胞的,tRNA,。,4,条链以氢键结合在一起。,5,端有甲基化帽子结构,,3,端有,poly(A,),尾,53,(3),编码区:,结构,基因,一些逆转录病毒带有癌基因、,pX,基因等。,gag,:,编码病毒核心(,衣壳,)蛋白,其产物与病毒基因组,RNA,共同组装成核心和衣壳,并将衣壳与病毒包膜相连,决定了病毒的完整性。,pol,:,编码病毒复制所需的各种酶。,如肽链内切酶、,逆转录酶,、与前病毒整合相关的酶,env,:,编码包膜蛋白。,介导病毒对宿主细胞的吸附和穿入。,5,帽,-R-U5-PB,-SD-,-,gag,-,pol,-,SA,-,env,-(onc)-C-PB,+,-U3-R-,poly(A)n,54,1,),R,区:病毒基因组两端是完全相同的一段同向,重复序列,,2080nt,,该区在逆转录合成,cDNA,过程中起重要作用。,2,)引物结合区,(PB):,PB,:,位于,5,端的引物结合区,可与宿主细胞,某种,tRNA,的,3,端互补,,tRNA,作为负链,cDNA,合成的引物。,PB,+,:,位于,3,端的引物结合区,引导正链,cDNA,的合成。,(4),非编码区:,与基因组复制及基因表达有关,5,帽,-,R,-U5-,PB,-SD-,-,gag,-,pol,-,SA,-,env,-(onc)-C-,PB,+,-U3-,R,-,poly(A)n,55,5,帽,-,R,-U5-,PB,-SD-,-,gag,-,pol,-,SA-,env,-(onc)-,C,-PB,+,-U3-,R-,poly(A)n,3,),U,区:,位于,R,区与,PB,区之间,U5,:,80100nt,,转录终止及加,polyA,U3,:,2001000nt,,含强启动子,起始转录,RNA,4,),SD,、,、,SA,和,C,区:,SD,:剪接给体位点,:,包装信号,使,RNA,包入病毒颗粒,SA,:剪接受体位点,C,:调控区,56,前病毒,(,provirus,):,逆转录病毒基因组的复制和转录都需要经过,DNA,中间体才能完成,这种,DNA,中间体称为前病毒。,前病毒基因组的转录和翻译,57,(long terminal repeat,,,LTR):,逆转录病毒基因组经过逆转录所形成的,cDNA,(前病毒基因组)在末端形成了新的重复序列(,U3-R-U5,),称为长末端重复序列。,U3-R-U5,-PB,-SD-,-,gag,-,pol,-SA-,env,-(onc)-C-PB,+,-,U3-R-U5,这是逆转录病毒,DNA,形式的特有结构,在其,RNA,基因组,中是不存在的。,长末端重复序列,5,帽,-,R,-U5-,PB,-SD-,-,gag,-,pol,-,SA-,env,-(onc)-,C,-PB,+,-U3-,R-,poly(A)n,58,U3-R-U5,-PB,-SD-,-,gag,-,pol,-SA-,env,-(onc)-C-PB,+,-,U3-R-U5,病毒,RNA,携带的遗传信息通过逆转录过程传递到,DNA,分子中,形成的双链,DNA,可随机整合到宿主细胞染色体中,成为前病毒。由于,U3,区有启动子,故,从前病毒基因组可以转录出从,5, R,区至,3, R,的,RNA,,既是,mRNA,,又是病毒基因组,RNA,。,前病毒基因组,宿主基因组,59,DNA,病毒基因组有环状,DNA,分子,和线状,DNA,分子,DNA,病毒基因组也有单、双链和正、负股之分,由于单链,DNA,在转录前都要合成互补,DNA,,因此正股、负股,DNA,的区别并没有真正显示出来。,60,双链,DNA,病毒,:,基因转录方式类似细胞基因,每种病毒依赖宿主细胞代谢系统的程度有所不同,基因组,DNA,的复制特点也不同。,大部分通过,DNA,复制过程完成基因组复制。,需要先转录出一个,RNA,中间体(前基因组),,再通过逆转录过程完成基因组复制。,如乙肝病毒。,基因组复制和基因转录特点,61,单链正股,DNA,病毒,:,进入宿主细胞后形成双链,其基因转录方式类,似细胞基因。通过,DNA,复制过程完成基因组复制,包括自主微小病毒、依赖微小病毒、,M13,噬菌,体等,其基因组小,无能力编码调控蛋白,因此严,格寄生并利用宿主细胞正常功能表达与复制。依赖,微小病毒尚需依靠辅助病毒(腺病毒等)重复感染,方能完成自己的复制。,62,病毒基因组结构与功能特点,1.,不同病毒基因组大小差别较大。,与细菌或真核细胞相比,病毒的基因组很小 。,2.,不同病毒基因组可以是不同结构的核酸。,可以由,DNA,组成,也可以由,RNA,组成;可以是单链,也可以是双链;可以是闭环分子,也可以是线性分子。,3.,病毒基因组有连续的,也有不连续的。,多数,RNA,病毒的基因组是由连续的核糖核酸链组成,但也有些病毒的基因组,RNA,由不连续的几条核酸链组成如流感病毒的基因组,RNA,分子是节段性的,目前,还没有发现有节段性的,DNA,分子构成的病毒基因组。,63,病毒基因组结构与功能特点,4.,病毒基因组的编码序列大于,90%,。,病毒基因组的大部分用来编码蛋白质,只有非常小的一部分不被翻译。,5.,除了逆转录病毒外(两个拷贝),所有病毒基因组都是单倍体,。,6.,基因有连续的、有间断的(有的基因含有内含子)。,噬菌体的基因是连续的,真核细胞病毒的基因是不连续的,具有内含子。除了正链,RNA,病毒外,真核细胞病毒的基因都是先转录成,mRNA,前体,再经加工切除内含子才能成为成熟的,mRNA,。有些真核病毒某个基因的内含子或其中的一部分,对另一个基因却是外显子。如,SV40,和多瘤病毒的早期基因。,64,病毒基因组结构与功能特点,7.,相关基因丛集。,病毒基因组,DNA,序列中功能上相关的蛋白质的基因或,rRNA,的基因往往丛集在基因组的一个或几个特定的部位,形成一个功能单位或转录单元。它们可被一起转录为多顺反子,mRNA,,然后再加工成各种蛋白质的模板,mRNA,。,8.,有基因重叠现象。,这种结构使病毒较小的基因组能够携带较多的遗传信息。,9.,病毒基因组含有不规则结构基因。,2#,65,定义,:朊病毒是一类能侵染动物并在宿主细胞内复制的小分子无免疫性疏水蛋白质。只含有蛋白质而不含核酸的生物分子,并且只能在寄生宿主细胞内生存。,朊病毒,蛋白质侵染因子,P,328,66,蛋白质错误折叠引起疾病,蛋白质构象疾病(蛋白质错折叠病,蛋白粒子病),若蛋白质的折叠发生错误,使蛋白质的构象发生改变,尽管其一级结构不变,仍可影响其功能,严重时可导致疾病发生。,P,328,机理:,有些蛋白质错误折叠后相互聚集,常形成,抗蛋白水解酶的淀粉样纤维沉淀,,产生毒性而致病。,包括:,人纹状体脊髓变性病、老年痴呆症、亨廷顿舞蹈病、,疯牛病,等。,67,P,328,(,1,)无法折叠为正常功能产物,有些蛋白质由于某种因素导致其折叠错误并不影响其合成,转运和定位基本正常,但丧失正常功能,从而引发疾病。如肌萎缩性侧索硬化症等。,蛋白质错误折叠疾病根据其分子机制可分为,68,P,328,(,2,)错折叠引起错误定位,有些蛋白质由于折叠发生错误后,主要影响正确转运,发生错误定位,从而引发疾病。如家族性高胆固醇血症的,LDL,受体蛋白发生错误折叠,不能转运定位于细胞膜表面而失去识别和结合,LDL,的功能,使血浆,LDL,水平明显升高。,69,P,328,(,3,)毒性折叠产物,有些蛋白质错误折叠后相互聚集,常形成抗蛋白水解酶的淀粉样纤维沉淀,产生毒性而致病。如老年性痴呆症、疯牛病等。,70,朊病毒蛋白(,prion,protein,Prp,),是引起一组人和动物神经退行性病变的病原体,具有,传染性、遗传性、散在发病,的特点。在动物间的传播是由传染性颗粒,朊病毒,完成的。朊病毒不含核酸成分,仅由修饰后的,PrP,同一蛋白,Prp,Sc,组成。因此也称蛋白粒子病。,P,329,71,朊病毒蛋白是人和动物正常细胞基因的编码产物(人类该基因位于,20,号染色体短臂),是,3335KD,的水溶性和对蛋白酶敏感的蛋白质,称为,Prp,c,(细胞型、正常型)。而致病的朊病毒蛋白是不溶性的、对蛋白酶有抗性作用的,2730KD,的蛋白质,是,Prp,c,基因的核心序列,称为,Prp2730,或,Prp,Sc,(搔痒型、致病型)。,P,329,72,4.,致病机制,1982,年,,Prusiner,提出了朊病毒致病的“,蛋白质构象致病假说,”,要点如下:,1,)朊病毒蛋白有两种构象:,PrP,c,和,PrP,Sc,2,),PrPsc,可胁迫,PrPc,转化为,PrPsc,,实现自我复制,并产生病理效应。,3,)基因突变可导致细胞型,PrPc,中,螺旋结构不稳定,至一定量时产生自发性转化,,片层增加,最终变为,PrPsc,型,并通过多米诺效应倍增致病。,P,331,73,原核生物基因组,74,一、原核生物基因组通常由环状双链,DNA,组成,原核生物基因组通常仅由,一条环状,DNA,分子组成,在细胞中与蛋白质结合成复合体形式存在。细菌染色体,DNA,形成较致密的区域,类核结构。,中央:,RNA,和支架蛋白,占,20%,外围:双链闭环超螺旋,DNA,,占,80%,,花瓣状结构,75,二、操纵子结构是原核生物基因组的结构特点之一,操纵子,(,operon,),定义,:,原核生物的绝大多数,结构基因按功能相关性成簇串联,排列于染色体上,连同其上游的调控区(包括启动子和操纵元件)以及下游的转录终止信号共同组成一个,基因表达单位,,即操纵子结构。,76,操纵元件,(,operator,)是一段能够被不同基因表达调控蛋白识别和结合的,DNA,序列,是决定基因表达效率的关键元件。,一个操纵子只含一个启动序列及数个可转录的结构基因。在同一启动序列控制下,转录出多顺反子,mRNA,。,77,Promoter,(启动子):,是,RNA,聚合酶结合的区域,也是控制转录的关键部位,也称启动序列。,基因开放时,几个基因转录在一条,mRNA,链上,分别翻译合成各自的蛋白肽链。操纵子的末端具有特殊的终止序列。,原核生物大多数基因表达调控是通过操纵子机制实现的。,78,操纵子,(,operon,),的结构与功能,I,nhibitor gene,P,S1,S2,S3,启动子,结构基因,1,,,2,,,3.,O,操纵基因,P,romoter,O,perator gene,S,tructure gene,调控区,结构基因,操纵子,表达,阻遏蛋白,转录起始,部位,结合,RNA,聚合酶,转录出,mRNA,、,表达,功能蛋白,?,I,阻遏物,基因,信息区,控制区,管理操纵结构基因的“开放”与“关闭”,可结合,阻遏蛋白,79,三、原核生物基因组还具有一些结构上的特点,1.,原核生物基因组中的基因密度非常高,基因,组序列中编码区所占的比例较大(约为,50%,左右)。,2.,基因组相对较小,只有一个,DNA,复制启始位,点(,OriC,),。,3.,结构基因无重叠现象,,基因组中任何一段,DNA,不会用于编码,2,种蛋白质。,4.,结构基因是连续的,没有内含子,80,5.,编码蛋白质的结构基因常为单拷贝,(,占,99.7%),,但编码,rRNA,的基因往往是多拷贝的。,这有利于核糖体的快速组装。,6.,基因组中重复序列很少,。,7.,具有编码同工酶的基因。,这是一类结构不完全相同,而功能相同的基因。如,E.coli,含有,2,个编码乙酸乳酸合成酶的基因和,2,个编码分支酸变位酶同工酶的基因。,8.,不同的原核生物基因组中的,GC,含量变化很大,,其范围从,25%75%,。因此测量基因组的,GC,含量可以用来识别细菌种类。,81,四、在原核生物基因组的非编码区内,主要是一些调控序列,原核生物基因组,DNA,序列中有多个具有各种功能的识别区域,如复制起始区,OriC,,复制终止区,TerC,,转录启动区和终止区等。这些区域往往具有特殊序列,并且含有反向重复序列。,大肠杆菌色氨酸操纵子:,3,端含有,40bp,的,GC,丰富区,其后紧跟一个,AT,丰富区,此为转录终止子结构。,82,强终止子,:,含有反向重复序列,可形成茎环结构,其后面有,poly,(,T,)结构,不需终止蛋白,因子参与即可使转录终止。,弱终止子,:,尽管也含有反向重复序列,但无,poly,(,T,)结构,需要有终止蛋白,因子参与才能使转录终止。,83,五、细菌基因组中的可移动成分能产生转座现象,转座,(,transposition),是指位于基因组某处的一个或一组基因复制出一个新拷贝转移到基因组的另一个位置上去。,转座因子,(,transposable element,),能够在一个,DNA,分子内部或两个,DNA,分子之间移动的,DNA,片段。,目前已发现多种转座因子,最简单的仍是最初发现的插入序列。,P,75,84,(一)原核生物转座因子类别,1.,插入序列,(,insertion sequence,,,IS,),:,长度在,2000bp,以内,,是较小的转座因子,除了带有与转座作用有关的基因,(转位酶基因),外不带任何基因。只有当它们转座到受体某一基因中使该基因失活和产生极性效应时才会被发现。有很多种:如,IS1,(,768,bp,)、,IS2,(,1327,bp,),、,IS4,(,1428,bp,)、,IS5,(,1195,bp,)等。,P,75,85,2.,转座子,(,transposon,,,Tn,),:,长度在,2000 20 000bp,之间的较大,的转座因子,除了带有与转座作用有关的基因外,还带有其它基因。如,Tn903,、,Tn5,带有卡那霉素抗药基因(,kanR,),,,Tn10,带有四环素抗药基因(,terR,),。,转座子的共同结构特点是它们的,两个末端具有反向重复序列,,即一个末端序列为,AGCT,,那么另一个末端序列则为,TCGA,。若缺失任何一端,都会妨碍转座功能。,P,76,86,3. Mu,噬菌体,(,Mu,),:,是一种大肠杆菌的温和型噬菌体,它在溶原化细菌内能像转座子那样在细胞内,DNA,上不同位置间转移,没有一定的整合位置。,Mu,噬菌体因整合到寄主基因组内引起突变,所以用诱变者(,mutator,)的头两个字母命名。它具有,20,多个基因,只有其中的,A,、,B,基因与转座有关。,P,76,87,(二)转座因子的几个遗传效应,1.,转座因子的转座不是本身的移动,而是由转座因子复制出一个新拷贝转移到基因组的新位置上去,原来的转座因子仍留在原来的位置上。,2.,新的转座因子转到靶点后,靶点序列会倍增成为两个靶点序列,并分别排列在转座因子的两侧,形成同向重复序列。这是转座因子转座后的一个重要标志。只要在一个,DNA,序列两侧有同向重复序列,就可以断定它是转座因子。,3,.,在,转座过程中能够形成共合体。,P,78,88,4.,转座因子转座后能促使染色体畸变。,5.,转座因子可以从原来位置上切除,称为切离(,excision,)。切离与转座是两个不同的过程。,转座因子转座后,原来位置上的转座因子并不消失。,转座和切离过程对外界条件的反应不同,6,.,转座可引起插入突变。,7,.,由于携带标志基因(,ampR,、,terR,、,smR,),转座因子插入到受体基因组内,给受体基因组增添了新的基因。,89,六、质粒,DNA,是具有自主复制能力的双链环状,DNA,质粒(,plasmid,)的概念,:,是存在于细菌染色体外的,具有自主复制能力的核酸分子,属染色体外基因组。,由于质粒带有某些特殊遗传信息,在宿主细胞内能自主复制,并在细胞分裂时恒定传给子代细胞,故能赋予宿主细胞一些新的遗传性状,可用于重组细菌的筛选和鉴定。,90,原核生物基因组结构与功能特点,1.,基因组通常仅由一条环状双链,DNA,分子组成,,具有类核结构。,2.,基因组相对较小,通常只有一个,DNA,复制启始,位点(,OriC,),。,3.,具有操纵子结构(原核生物的一个基因表达单,位),其转录产物为多顺反子,mRNA,。,4.,结构基因编码序列无重叠现象,5.,基因组中存在着可移动的,DNA,序列:包括插入,序列、转座子等。,91,6.,原核生物基因组中的基因密度非常高,基因,组序列中编码区所占的比例较大(约为,50%,左右),非编码区内主要是一些调控序列。,7.,结构基因是连续的,没有内含子,8.,基因组中重复序列很少。编码蛋白质的结构,基因常为单拷贝,(,占,99.7%),,但编码,rRNA,的,基因往往是多拷贝的。,9.,具有编码同工酶的同基因,10.,不同的原核生物基因组中的,GC,含量变化很,大,其范围从,25%75%,。因此测量基因组,的,GC,含量可以用来识别细菌种类。,92,真核生物基因组,93,一、真核生物基因组远大于原核生物基因组,真核生物基因组复杂性体现在两个方面,:,具有复杂多样的结构形式,具有复杂精细的基因表达调控机制,真核生物基因组结构庞大,人类单倍体基因组,DNA,约,3.3,10,9,bp,,,约有,33.5,万个基因。大肠杆菌基因组只有,4.6,10,6,bp,。,94,二、真核生物基因组由染色体,DNA,和染色体外,DNA,组成,真核生物基因组,染色体,DNA,染色体外,DNA,(,线粒体,DNA,),染色体,DNA,位于细胞核内,为线状,与组蛋白、非组蛋白结合成染色质,染色质组装在核内,外有核膜包裹,因此基因组的转录和翻译不能在同一空间进行,转录在细胞核,翻译在胞浆。,95,三、真核生物基因组中非编码序列,多于编码序列,真核基因组中,非编码序列,(non-coding sequence,,,NCS),占,90%,以上,。人类基因组中,编码序列仅占,3%,左右。这是真核生物与细菌、病毒的重要区别,在一定程度上也是生物进化的标尺。,非编码序列,基因的内含子、调控序列等,重复序列,约占,DNA,总量,50%,90%,96,重复序列,编码序列:,rRNA,、,tRNA,、组蛋白、,免疫球蛋白的结构基因,非编码序列:,与基因组稳定性、组织,形式、基因表达调控有关,P,16,97,根据重复序列出现的频率不同,:,重复序列,高重复序列:,(,10,5,次)卫星,DNA,、反向重,复序列,中重复序列:,(,1010,5,次),散在分布于基因组中,,约占基因组,DNA,总量的,35%,,常与单拷贝基因间隔排列。,其产物是细胞大量需要的。,rRNA,、,tRNA,、组蛋白、免疫球蛋白的结构基因;基因调控;,Alu,家族等。,单拷贝序列或低重复序列:,在整个基因组中仅出现一次或少数几次,大部分为编码蛋白质的结构基因,P,17,98,重复序列,反向重复序列:,两个顺序相同的拷贝在,DNA,链上呈反向排列。两个反向排列的拷贝之间隔着一段间隔序列;两个拷贝反向串联在一起,中间没有间隔序列,又称为回文结构。,串联重复序列:,散在重复序列:,编码区串联重复:,人类,5,种组蛋白基因密集在,7.0kb,的重复单位上,具有高度序列一致性。,非编码区串联重复:,通常存在于间隔,DNA,和内含子内。可以从,2,个碱基起,长短不等;重复次数可以从几次到数百次、甚至几十万次。是形成,卫星,DNA,的基础。,P,17,99,卫星,DNA,(,satellite DNA,),:,是出现在非编码区的,串联重复序列,,具有固定的重复单位,该重复单位首尾相连形成重复序列片断,通常存在于间隔,DNA,和内含子中。,卫星,DNA,根据核心顺序的长短可分为三类,,大卫星,DNA,、小卫星,DNA,和微卫星,DNA,。,P,16,100,重复序列的多态性,限制性片段长度多态性的概念,(,restriction fragment length polymorphism,,,RFLP,),用同一种限制性内切酶消化不同个体的同一段,DNA,时,由于碱基组成的变化而改变限制性内切酶识别位点,从而产生长度不同的,DNA,片段。这种方法称为限制性片段长度多态性技术(,RFLP,技术)。,P,44,101,四、多基因家族和假基因的存在,是真核基因组的另一特点,(一)多基因家族,多基因家族(,multigene,family,),:,是指核苷酸序列或编码产物的结构具有一定程度同源性的一组基因,其编码产物常具有相似的功能。,是真核生物基因组中最显著的特征之一。多基因家族属中度重复序列,是一组来源相同、结构相似、功能相关的基因,由同一祖先基因经过重复和变异所产生的一组基因,有的编码,RNA,,有的编码蛋白质。多基因家族按基因的终产物分为两类:一类编码,RNA,,一类编码蛋白质。,P,14,102,1.,核酸序列相同,实际上是一个基因的多次拷贝,成簇地排列在同一条染色体上,形成一个基因簇。,包括,rRNA,基因家族、,tRNA,基因家族、组蛋白基因家族等。,P,15,103,2.,核酸序列高度同源,多数成员的同源性非常高。,-,珠蛋白基因家族由高度同源的几个基因成簇排列在同一条染色体上。,人的生长激素基因家族:,生长激素(,GH,),绒毛膜生长催乳激素(,CS,),催乳素(,PRL,),氨基酸序列同源性:,85%,mRNA,序列同源性:,92%,氨基酸序列同源性:,50%,mRNA,序列同源性:很低,P,15,104,3.,编码产物的功能或功能区同源,在某些基因家族的成员之间,基因全长序列的相似性可能较低,但其编码产物具有高度保守的功能区。,。,src,癌基因家族:,基因结构无明显同源性,但每个基因产物都含有,250AA,序列的,同源蛋白激酶结构域,。,DEAD,盒基因家族:,家族中含有几个不同的基因,其产物都有解旋酶的功能,结构特征是,8,个氨基酸的保守序列,内含,DEAD,盒序列:,Asp-,Glu,-Ala-Asp,105,4.,基因超家族,基因超家族(,gene,superfamily,),也称超基因家族(,super gene family),。由多基因家族及单基因组成的更大的基因家族。它们的结构有程度不等的同源性,但它们的功能并不一定相同,这是与多基因家族的差别所在。,这些基因在进化上也有亲缘关系,但较远,故将其称为基因超家族。,最经典的是免疫球蛋白基因超家族(,Ig,超家族)。,P,15,106,(二)假基因,假基因(,pseudogene,,,),:,与某些有功能的基因结构相似,但不能表达基因产物的基因(序列与有功能的基因相似,但或者不能转录,或者转录后生成无功能的基因产物)。,假基因原来也可能是有功能的基因,其形成的原因可能是基因在进化过程中,发生突变所致(如缺失、倒位、点突变等)。,P,16,107,真核生物基因组结构与功能特点,1.,每一种真核生物都有一定的染色体数目,除配子为单倍体外,体细胞一般为双倍体,即含两份同源的基因组。,2.,真核生物基因组远大于原核生物基因组,结构复杂,基因数庞大,具有许多复制起始点,每个复制子大小不一。,3.,真核生物基因组由染色体,DNA,和染色体外,DNA,组成。,4.,真核基因组都由一个结构基因与相关的调控区组成,转录产物为单顺反子。,108,5.,真核基因组中含有大量重复顺序。,6.,真核基因组中非编码序列(,non-coding sequence, NCS),占,90%,以上。,7.,真核生物的结构基因是断裂基因,(split gene),。,8.,真核生物基因组中有假基因存在。,9.,功能相关的基因构成各种基因家族,它们可串联在一起,也可相距很远(分散在不同染色体上),即使串联在一起的基因也是分别转录的。,109,基因组在进化过程中发生了各种,形式的变异,SNP,(,single nucleotide polymorphism,),定义,:,是指单个核苷酸变异而形成,DNA,分子多态,即单核苷酸多态性,P,43,110,
展开阅读全文