资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第三章 基因及基因组结构,一、基因,(gene),(一)定义,生物学定义:,具有遗传功能的DNA片段。,分子生物学定义:,DNA分子中含有特定遗传信息的核苷酸序列,是遗传物质的最小功能单位。合成有功能的多肽链或RNA所必需的全部核酸序列(通常是DNA序列)。,(二)基因的组成,一个基因应包含不仅是编码蛋白质肽链或RNA的核酸序列,还包括为保证转录所必需的调控序列、5非翻译序列、内含子以及3非翻译序列等所有的核酸序列(蛋白质基因和RNA基因)。,(三),基因分类,第一类是编码蛋白质的基因,,它具有转录和翻译功能,,包括编码酶和结构蛋白的结构基因以及编码阻遏蛋白的调节基因,第二类是只有转录功能而没有翻译功能的基因,,包括tRNA基因和rRNA基因,第三类是不转录的基因,,它对基因表达起调节控制作用,,包括启动基因和操纵基因,二、基因组(genome),(一)定义,生物学定义:,细胞内所携带的全部遗传信息DNA的总和;对多倍体生物指单倍体DNA的总和。,分子生物学定义:,携带生物体全部遗传信息的核酸量。,编码蛋白的结构基因,基因组DNA,复制转录的调控序列,功能尚不清楚的区域,不同生物体中具有不同的基因组大小,对人类而言:,22+X+Y+mtDNA。,viruses,plasmids,bacteria,fungi,plants,algae,insects,mollusks,reptiles,birds,mammals,Genome sizes in nucleotide pairs (base-pairs),10,4,10,8,10,5,10,6,10,7,10,11,10,10,10,9,The size of the human,genome is 3 X 10,9,bp;,almost all of its complexity,is in single-copy DNA.,The human genome is thought,to contain 30,000 to 40,000 genes,.,bony fish,amphibians,(二)遗传物质组成,病毒基因组,核基因组,原核生物基因组,真核生物基因组,线粒体DNA,核外遗传物质,叶粒体DNA,质粒DNA,非独立的基因组:,转位因子,-,能在基因组DNA中移动的DNA序列,不能独立存在,需插入核或核外DNA中。,(三),基因组结构与进化的关系:,1.基因组的物质组成从多样 单一;,DNA、RNA分工明确,单链、双链,线状、环状 双链线状,2. 基因组由小 大;,3. DNA的利用率越来越低;(多拷贝、非编码,区、基因不连续),4. 调控序列增多,调控方式更复杂。,第一节 病毒基因组的结构,(一)病毒的基本结构,外壳蛋白,: 识别、侵袭特定的宿主细,胞,并保护基因组不被,核酸酶破坏;,DNA(RNA):,编码结构蛋白和少量,调控蛋白。,不能独立复制,必需进入宿主细胞,借助细胞内一些酶类和细胞器才能得以复制。,(二)病毒基因组的结构特点:,1.基因组较小,大小差异较大;,CAV DNA 2.3kb,编码3种蛋白质,乙肝病毒RNA 3kb,编码4种蛋白质,痘病毒DNA 300kb,编码几百种蛋白,基因组越小,编码蛋白越少,对寄主依赖性越大。,2.化学组成多样,DNA病毒、RNA病毒,单链、双链,线状、环状,分节段、不分节段,单链环状DNA,基因组共,5386,个核苷酸,构成,3个,转录单元,共编码,11个,蛋白质,,总分子量为,25万,左右,相当于,6078个,核苷酸所容纳的信息量。,其中非编码序列只有,217/5386,不足5%。,3.基因重叠现象普遍存在,重叠基因,定义:,核苷酸序列彼此重叠的2个基因为重叠基因overlapping genes,或称嵌套基因nested genes。,类型:,一个基因的核苷酸序列完全包含在另一个基因中;,两个基因的核苷酸序列部分重叠;, 两个基因只有一个碱基重叠。,一个基因终止密码子的最后一个碱基是另一个基因起始密码子的第一个碱基。,5GCTGGTGGAAAATGAGGAAATTCAAT3,DNA序列,Leu Val Glu Asn Glu Glu Ile Gln,K蛋白,Ala Gly Gly Lys Ter,A蛋白,FMetArg Lys Phe Asn,C蛋白,噬菌体G4一段DNA序列内A、C、K基因三重重叠,基因,读框相同,,只是起始部位不同,重叠基因,实质:,两个基因虽共用一段核苷酸序列,但其读码结构互不相同,编码不同的蛋白质。,意义:,使DNA的利用率提高,是基因表达调控的方式之一。,目前,在少数原核生物(大肠杆菌、病毒)中发现,在少数真核生物中也发现了类似的基因重叠现象(果蝇)。,4.结构简练,大部分可编码蛋白质,只有非常小的一部份不编码蛋白质(通常是基因表达的控制序列),(非编码序列较少);,X174 DNA中不翻译的部份只占 217/5375,G4 DNA中不翻译的部份占282/5577,乳头瘤病毒基因组中不翻译的部份占1.0/8.0 Kb,5. 基因组中功能基因丛集成一个或几个特定区域,形成一个功能单位或转录单元,即形成,多顺反子结构(polycistronie)。,多顺反子mRNA:可编码两条或两条以上蛋白质分子的mRNA的分子,。,6. 除反转录病毒外,病毒基因组只有一个拷贝;,7.有的病毒基因组中具有宿主细胞基因组的结构特点;,比如:某些病毒基因组中的原癌基因与宿主细胞具有类似结构。,第二节 原核生物基因组结构,(一)细菌基因组的结构特点:,1. 拟核(类核)结构;,2. 存在,多顺反子结构;,3. 除RNA基因外,基本是单拷贝的;,利于核糖体的快速组装,短时间内合成大量核糖体。,4. 非编码序列相对较少;,(相对于真核生物),5. 基因多是连续的;,6. 存在不同的功能识别区,复制起始区、复制终止区等,大肠杆菌的类核结构,核中央由支架蛋白和RNA组成,环状双链DNA绕在支架蛋白的外围,只有一个复制起点,DNA与细胞膜粘在一起DNA上有结合蛋白。,(二),大肠杆菌基因组结构:,1. 基因组DNA在4000kb,估计有3500个基因,已确定的基因有900个,已确定有260个基因具有操纵子结构(75个操纵子中),每个基因平均长度1000bp;,2. 已确定的基因中,多数是与代谢有关的酶、核糖体蛋白;,3. 大多数基因是随机分布的,两条单链作为模板的概率基本相等;,4. 多数基因都是单拷贝。,第三节 真核生物核基因组,(一)真核生物核基因组特点,1.基因组较大;,低等真核生物:10,7,-10,8,bp,较原核生物大10倍;,高等真核生物:5X10,8,-10,10,bp,某些植物和两栖生物可达10,11,bp,;,哺乳类生物大于2X10,9,它们可编码100万个基因。,Nucleosome structure,Nucleosome core (left),146 bp DNA; 1 3/4 turns of DNA,DNA is negatively supercoiled,two each: H2A, H2B, H3, H4 (histone octomer),Nucleosome (right),200 bp DNA; 2 turns of DNA plus spacer,also includes H1 histone,2.真核生物核,DNA,与蛋白质结合,,形成核小体,再缠绕成染色质(染色体);,Nucleofilament structure,3. 基因组一般为双倍体(diploid);,4. 基因为单顺反子。,单顺反子:一个基因单独转录,一个基因一条mRNA,翻译成一条多肽链;,5. 存在大量重复序列,,重复次数可高达百万倍;,6. 基因组中非编码序列多于编码序列,有大量的冗余DNA;,7. 大部分基因有内含子,因此基因不连续;,8.,具有多个复制起点,而每个复制子的长度较小。,真核生物基因组的突出特点:,重复性、基因家族、不连续性。,Properties of the human genome,Nuclear,the haploid human genome has,3 X 10,9,bp of DNA,single-copy DNA comprises,75%,of the human genome,the human genome contains,30,000 to 40,000,genes,most genes are,single-copy,in the haploid genome,genes are composed of from,1 to 75 exons,genes vary in length from,2,300,000,bp,Alu sequences are present throughout the genome,Mitochondrial,circular genome of 17,000 bp,contains 40 genes,Type of DNA % of Genome Features,Single-copy (unique)75% Includes most genes,1,Repetitive,Interspersed15% Interspersed throughout genome between,and within genes; includes,Alu sequences,2,and VNTRs or mini (micro) satellites,Satellite (tandem)10% Highly repeated, low complexity sequences,usually located in centromeres,and telomeres,1,Some genes are repeated a few times to thousands-fold and thus would be in,the repetitive DNA fraction。,2,Alu sequences,are,about 300 bp in length,and are repeated about,300,000 times in the,genome. They can be,found adjacent to or,within genes in introns,or nontranslated regions.,50,100,0,I I I I I I I I I,fast,10%,intermediate,15%,slow (single-copy),75%,Classes of repetitive DNA,Interspersed (dispersed) repeats,(e.g., Alu sequences),TTAGGG,TTAGGG,TTAGGG,TTAGGG,Tandem repeats,(e.g., microsatellites),GCTGAGG,GCTGAGG,GCTGAGG,间隔重复序列,串联重复序列,(二),重复性(重复序列),复杂度,(,X,)是指在基因组DNA分子中无重复核苷酸序列的最大长度。例如,(ATAT)n的复杂度为2,(ATGC)n的复杂度为4,噬菌体T4是由210,5,不重复核苷酸对的DNA分子组成,其复杂度为210,5,。,C0t1/2值是复性反应进行到一半时,单链DNA初始浓度和所需时间的乘积,C0t1/2值越大表明复性反应越慢,重复序列少,所以C0t与DNA中非重复序列的核苷酸数量成正比。,来自不同生物的DNA,如果反应条件和DNA片段大小相同,则复杂度越大,复性速度就越慢,而,C,0,t,12 值就越大。也就是说,基因组的复杂度与其,C,0,t,12值成正比,即:,x,=,C,0,t,12,基因的重复次数=实际长度 / DNA复杂度,真核生物DNA复性的各项参数,序列种类,占基因组DNA的比例,C,0,t,12,值,复杂度(X),重复频率(f),高度重复,25%,0.0013,340bp,500000,中度重复,30%,1.9,6.010,5,bp,350,单一序列,45%,630,3.010,8,bp,1,据基因组重复次数高低:,单拷贝序列,轻度重复序列,2 10,1,重复序列,中度重复序列,10 10,2,高度重复序列,10,2 ,10,6,1. 单拷贝序列:,只有一个拷贝,,占基因组的,40-70%. 主要是功能基因。,单拷贝序列又称为非重复序列,,在一个基因组中只有一个拷贝,,在DNA复性曲线中,它是最慢速复性的部分,。大多数结构基因都属于这一类型,但单拷贝序列并不都执行遗传功能。,真核生物的单拷贝基因是分散分布于整条染色体或不同染色体之中的。一个蛋白质基因也常分成几段相隔排列。由几个肽段的基因组成一个蛋白质的全部基因,有些肽段的基因仅由内含子隔开,而另一些肽段的基因则分布于几条染色体上。,例如,珠蛋白有2条链和2条链,在人类中,链基因位于16号染色体上,链基因则位于11号染色体上。在链基因中,又由几个内含子隔开,串联在11号染色体上。单拷贝基因的另一个特点是普遍存在着内含子。,2. 轻度重复序列,基因组中有,2-10个,拷贝,是慢速复性的一部分。 主要是组蛋白和rRNA基因、 tRNA基因等。,几个基因都有功能, 编码同一个蛋白质或tRNA;,分两种,几个拷贝中有的有功能,有的无功能(假基因),假基因,结构与功能基因相同,但不表达。,原因:,突变失活,启动子缺陷。,3.中度重复序列,中度重复序列对应于中速复性的部分,在基因组中有数十至数百万个拷贝,分散在整个基因组中。,一般无RNA转录产物(非编码序列),,,一般认为与基因的表达调控有关,(,包括转录调控序列,,,复制控制序列,,,转录后的加工等,)。,在基因组中有数千种中度重复序列,其中有一些构成序列家族。各家族成员有的重复串联在一起,有的分散于非重复序列中相间排列。,这类序列的平均长度是,300bp,左右,。,长周期分散的重复序列 5000bp,分两种,短周期分散的重复序列 100 300bp,主要存在于人、爪蟾、海胆等生物中,例如,Alu家族等。,4. 高度重复序列,高度重复序列对应于快速复性部分。在基因组中有几百到几百万个拷贝(重复次数,10,2,10,6 ),,,它们的长度差异很大,短的只有几个bp,长的有几十个到几百个bp或更长。这些序列一般不分散,主要集中在异染色质中,特别在端粒和中心粒的附近,由短序列重复多次串联成长长的一大簇,,高度重复序列富含A、T碱基,因序列简单,缺乏转录必要的启动子而不具转录能力,其功能至今尚不清楚。,在多数真核生物的基因组DNA中,都含有20%以上的高度重复序列,其特征之一是两条链的不对称性,它们构成卫星DNA。,卫星DNA(satellite DNA),卫星DNA(satelliteDNA)是一类高度重复序列,这类重复顺序的重复单位一般由2-10bp组成,成串排列。由于这类序列的碱基组成不同于其他部份,(一般富含A/T片断,浮密度较小),,可用等密度梯度离心法将其与主体DNA分开,因而称为卫星DNA或随体DNA。,卫星DNA通常是串联重复序列,由各种不同的重复序列家族组成。,重复单位常存在序列变异,反映卫星DNA可能在经过串联重复后发生突变、重复和缺失而得以进化。,在真核生物之间, satellite DNA 总量在2%5%,甚至在亲缘关系密切相关的两个物种之间, satellite DNA也会有悬殊的差别。,分类,卫星DNA按重复单元核苷酸的多少,可分为两类:,小卫星DNA(minisatellite DNA ),,,由几百个核苷酸对的单元重复组成。,微卫星DNA(microsatellite DNA ),,由2-20个左右的核苷酸对的单元重复组成。,(占主体),应用:,1. 生物进化,2. DNA指纹图谱(亲子鉴定),3. RFLP分析,检测基因缺失、突变、扩增,(三),基因家族 gene family,1.概念,在真核生物基因组中来源相同、结构相似、功能相关的一组成串排列在一起的基因,称,为基因家族(,gene family,)。,一些基因彼此靠近,成串地排列在一起,这种基因排列结构叫基因簇(,gene cluster,),。,在基因家族结构中经常会看到基因簇结构。,基因簇多顺反子结构,2、,分类:,串联重复多基因家族,组蛋白、tRNA、rRNA,分散重复多基因家族,Alu 家族,不同组织、细胞类型、发育时期表达的多基因家族,同工酶(珠蛋白),3、真核生物中重要的基因家族,(1) Alu基因家族,分散重复序列,在单倍体人基因组中有5X10,5,个拷贝,约占人基因组的3-6%。每个重复单元的长度为300bp,含一个Alu酶切位点,因而得名。酶切后生成130bp和170bp两个片段,每个Alu片段两侧有6-20bp的同向重复序列,存在于间隔区(space)和内含子中。,功能:可能与基因转录、调控、加工有关。,LDL receptor gene,Alu repeats present within introns,Alu repeats in exons,4,4,4,5,5,5,6,6,6,Alu,Alu,Alu,Alu,X,4,6,Alu,unequal,crossing over,one product has a,deleted exon 5,(the other product is not shown),(2) rRNA基因家族,串联重复,有转录活性。,大多数真核生物rRNA基因家族 集中分布在一条或几条染色体上,以核仁区含量最高。,通常编码区较为保守,内间区具有种间特异性,常被用作物种种类鉴定及进化分析。,rRNA基因家族(gene cluster),5S rRNA 基因家族,在所有染色体上都有,分布频率较高。,一般由,120bp,组成每个重复单元由,5sRNA,基因和和转录区前的非转录区组成,重复串联形成基因簇。,非洲爪蟾卵母细胞的,5sRNA,基因:富含,A-T,的序列,由不同的,15bp,序列重复而成,(,CAAAGTTTGAGTTTT,)这段序列的串连数不同,非转录的间隔区的长度会有所改变。,不同生物rRNA和tRNA基因的拷贝数,物种,18S和28S基因,5S基因,tRNA基因,大肠杆菌,7,7,60,酵 母,140,140,250,果 蝇,150(),250(),165,850,非洲爪蟾,450,24000,1150,人 类,280,2000,1300,(3)tRNA基因家族,tRNA基因平均长度约140bp,是一类小分子的基因,在基因组中的拷贝数可达10个至数百个。,基因之间串联重复排列;,多个不同的tRNA基因组成一个串联重复,各重复单元中tRNA基因可以不相同,并单独转录。,(4)组蛋白基因家族,与细胞DNA复制有关,中度重复序列(几十几百个重复),不含内含子,无需转录后加工,mRNA产物无3polyA,基因家族,与DNA复制无关的组蛋白,组织特异性表达的组蛋白,单拷贝,在高等真核生物中,含有3类组蛋白基因:,H2a、H2b、H3、H4和H1基因,,这些基因在细胞分裂的S期中表达,与DNA和染色体的复制有关;,与DNA和染色体的复制无关的组蛋白基因,,主要存在于不分裂的、已完成分化的细胞或组织中;,组织专一性的组蛋白基因,,例如,红细胞中专一的H5组蛋白基因。后两种组蛋白基因是单拷贝的,mRNA有3-poly A。,组蛋白基因家族是指第一类的组蛋白基因。,Nucleosome structure,Nucleosome core (left),146 bp DNA; 1 3/4 turns of DNA,DNA is negatively supercoiled,two each: H2A, H2B, H3, H4 (histone octomer),Nucleosome (right),200 bp DNA; 2 turns of DNA plus spacer,also includes H1 histone,特点:,一是组蛋白基因,缺乏内含子,;,二是组蛋白基因的mRNA,没有3poly A尾巴,。,这两个特点使组蛋白基因能很快地转录,并将产物运输到细胞质中。,组蛋白基因家族是重复序列中,唯一已知具有蛋白质编码功能的基因,。,(5)珠蛋白基因家族,珠蛋白基因家族是最早发现和研究得最多的基因家族之一。动物中的血红蛋白分子是珠蛋白的四聚体,由2个亚基和2个亚基组成。 亚基基因在16号染色体上, 亚基基因在11号染色体上,珠蛋白基因以基因家族的形式排列。,(四)基因的不连续性真核基因的重要特征,发现:,1977年研究病毒mRNA 时发现,随后在,珠蛋白基因、卵清蛋白基因中证实了断裂基因的存在。,证据:,1. R环结构,2. 限制性内切酶分析,(exon-intron-exon),n,structure of various genes,b,-globin,HGPRT,(HPRT),total = 1,660 bp; exons = 990 bp,histone,factor VIII,total = 400 bp; exon = 400 bp,total = 42,830 bp; exons = 1263 bp,total = 186,000 bp; exons = 9,000 bp,鸡的卵清蛋白基因用EcoR和Hind两种酶切,可得到3或4个片段,把该基因的mRNA逆转录产物cDNA(双链)用以上两种酶切,发现cDNA不能被这两种酶切。,mRNA,cDNA,酶切,(不能被酶切),DNA,DNA中有的序列在mRNA中丢失, 且丢失部分不影响基因功能, 酶切位点在内含子中,。,酶切,1、,内含子的概念,外显子extron,:成熟的mRNA或蛋白质中存在的序列。(在DNA或mRNA中都存在的序列),内含子intron,:在DNA上存在,而在mRNA(或cDNA)中不存在的序列,初级转录产物加工成成熟mRNA时被切除的间隔序列。,5,3,promoter,region,exons (filled and unfilled boxed regions),introns (between exons),transcribed region,translated region,mRNA structure,+1,Gene structure (一个完整的具有转录功能的单元),(exon-intron-exon),n,structure of various genes,b,-globin,HGPRT,(HPRT),total = 1,660 bp; exons = 990 bp,histone,factor VIII,total = 400 bp; exon = 400 bp,total = 42,830 bp; exons = 1263 bp,total = 186,000 bp; exons = 9,000 bp,2、基因内含子的特点:,1.内含子是真核生物独有的,但并不是所有真核基因一定有内含子;(组蛋白基因家族),2.内含子的数量和长度对不同的基因不同,一般基因越长,内含子越多;,3. 在同一基因家族中,编码序列在进化过程中一直比较保守,而内含子变化迅速,差异较大;,(内含子变异较外显子大),4.内含子与外显子间的连接处有特殊的序列(序列GTAG)。,高度保守序列 不连续基因剪接成mRNA可能遵照一种通用机制。,5. 一个基因的内含子可以是另一个基因的外显子。 (阅读框和剪切方式不同),3、,内含子可能的功能:,1.调控转录速度;,通过与启动子、起始位点的精确碱基配对,阻止或增强RNA聚合酶的活性,从而调控转录。,2. 内含子具有各种,剪接信号,,使用不同的剪接方式形成不同的成熟mRNA ;,第四节核外遗传物质的结构及功能,一、质粒DNA,Plasmid,1. 存在于原核生物、真菌和少数植物细胞中,是,一种核外遗传物质,,但不是细胞生存所必需的;,2. 有自己的复制起始序列,独立于核DNA进行复制;(,有独立的复制系统,),3. 质粒DNA含有少量编码蛋白的基因,这些基因对宿主细胞的生存影响不大,但能改变细胞的某些性状,如抗性、降解有机物的酶等;,4. 质粒是分子生物学中最常见的克隆载体。,(二)几种常见的质粒,1. 细菌质粒,F质粒,(又称F-因子或性质粒sex plasmid),高频重组质粒,具可转移性和整合性,拷贝数低;,R质粒,抗性质粒,含抗药、分解有毒物质等的基因;,Col质粒,(大肠杆菌素因子),含有编码控制,大肠杆菌素,合成的基因,,(一种可以使不带Col质粒的细菌菌株致死的蛋白)。,Ti质粒,一种常用的基因工程载体,土壤中有一种叫根癌农杆菌(,Agrobacterium tumerfaciens,)的一种土壤微生物,它能感染90个科的双子叶植物的受伤组织。当这种土壤杆菌侵入受伤组织后,受伤组织便不断增生成为冠瘿瘤(craw gall tumor)。这种瘤的产生是由于根癌农杆菌细胞中存在的一种质粒引起的,这种质粒简称为Ti(tumor inducing)质粒。植物受伤组织细胞所发生的一系列变化就是由于Ti质粒中的一段称为T-DNA的片段插入植物细胞染色体后所引起的。,2. 酵母质粒,2u 质粒 双链环状DNA,周长2um,6318bp,3u 质粒 环状DNA,周长3um,线状杀伤质粒 RNA质粒,线状,能分泌一种杀伤因子,对其他酵母有杀伤作用,以保护自身。,3. 真菌质粒,有线状,也有环状,有的能整合到线粒体中,有的与菌丝的衰老有关。,4. 植物中的质粒,类似于真菌,有线状,也有环状,有的能整合到线粒体中。,二、线粒体DNA mitochondrion DNA(mtDNA),(一)线粒体DNA的结构特点,1.化学结构,cccDNA,covalently closed and circular DNA,少数线状(存在于原核生物:草履虫、四膜虫等),2.大小,16 300kb,植物线粒体DNA较大,动物较小;,3. 复制方式:,半保留复制,,型、 D-环、滚环复制。,母性遗传,,常用于动物进化研究,;,母性遗传:,由于父本线粒体DNA不进入子代DNA中。,Y-染色体 父性遗传,常染色体 双性遗传群体家系,X-染色体、线粒体DNA 母性遗传,4. 动物线粒体基因组中不存在内含子,甚至还有基因重叠现象。,(二)线粒体DNA上的基因分三类,蛋白质合成需要的RNA基因,(tRNA rRNA),编码蛋白质的基因,(与呼吸相关的酶基因),抗性基因,1.蛋白质合成需要的RNA基因,tRNA基因,啤酒酵母中mtDNA上有24个tRNA基因,粗链孢酶中有40个,人和爪蟾中有22个,rRNA基因,啤酒酵母中有1S和21S rRNA,人类细胞中有12S和16S rRNA,真核:28S 18S 5.8S 5S,原核:23S 16S 5S,2. 编码蛋白质的基因,(与呼吸相关的酶基因),细胞色素氧化酶基因 7个亚基中3个由mtDNA编码,NAD,FMN CoQ Cytb CC1.ca3 O2,细胞色素还原酶,细胞色素氧化酶,细胞色素还原酶基因 7个亚基中1个由mtDNA编码,ATP酶基因 10 个亚基中4个由mtDNA编码,3,3,.,OSCP,3. 抗性基因,主要在真菌中发现,如抗氯霉素、抗红霉素、抗寡酶素基因等,但不是每个mtDNA上均有抗性基因。,小结:,1.线粒体中可以合成蛋白;,2.线粒体中合成蛋白所需的基因有的可能来自核DNA;,3.mtDNA的结构类似原核生物;,4.质粒、原核DNA、mtDNA有结构的相似性。,(三)线粒体密码子的特殊性:,在mtDNA中,大部分密码子与核DNA相同,但少部分有所不同。,密码子 UGA AUA AGG/AGA,线粒体 终止 Ile Arg,核基因 Try Met 终止,线粒体遗传性状的双重控制,线粒体的性状由核基因和线粒体基因双重控制;,线粒体的组分一方面由线粒编码,另一些组分由核基因编码。,第五节 转位因子 Transposable element,一、定义:,能够进行复制并将一个拷贝插入新位点的DNA序列。(,能在基因组中移动的,DNA,序列叫转位因子,),由于它可以从染色体基因组上的一个位置转移到另一个位置,甚至在不同的染色体之间跃迁所以又称跳跃基因(jump-gene)。,基因组中的一个独立单位,在基因组中可移动,是一个更小,更低级的结构单位。DNA的流动性,存在:,原核生物、植物中广泛存在,少数存在于动物中。,发现,最早于20世纪40年代由美国冷泉港实验室B.Mc Clintock发现玉米的颜色变化与某些基因的关启有关,而这些基因的关启可能与某些因子的控制有关,而这些因子在基因组中是可以移动的控制因子。当时这一发现并没有引起人们的注意;,直到70年代Shapiro发现大肠杆菌的乳糖操纵子的突变是由于插入了一段序列,后来又发现了其它转位因子后,McClintock的发现才被重视;,1983年Clintock荣获诺贝尔生物学医学奖。,:,二、转位因子的结构特点:,1. 两端存在末端重复序列(TIR),是转位过程中至关重要的结构;,2.绝大多数的转位因子含有开放阅读框,(ORF),编码一个转位酶,促进转位因子的转位;,3.受体DNA在接受插入DNA后,在插入序列的两侧形成同向重复序列;,4.,受体(靶序列)没有确定的特异性,但趋向于一个,“热点”区域,即所谓“区域性优先”。,取决于DNA双螺旋状态,或DNA-PRO结合状态。,三、转位机制:,转座子的复制;,靶序列的断裂及倍生同向重复序列,转位是一种复制过程。,四、原核生物的转位因子:,IS因子 insert sequence,转位子Tn(,Transposon,)复合转座子,Mu-噬菌体 Mutation-phage,1. IS因子 insert sequence,最简单的转位因子,含有末端,反向重复序列,和,转位酶基因,15-25bp ,控制转位频率,IS因子插入后,受体两端产生同向重复序列,长度不一,几百-一千个碱基,2. 转位子 Tn Transposon,长度比IS序列大,5-20Kb。,两端有反向重复序列,有的就是,IS,因子,也有的不是,IS,序列。,除含有转位酶基因外,还可能含有其他结构基因,如抗性基因、抗重金属离子基因等(,Tn1-ampR;Tn3,AmpR;Tn5,和,Tn6,KanaR),。,Tn3,是一个典型的,Tn,因子,3. Mu-噬菌体 Mutation-phage,一种以大肠杆菌为寄主的温和噬菌体,以裂解生长和,溶源生长,两种方式之一繁衍自己。,噬菌体存在于大肠杆菌细胞质中,通过整合到寄主染色体上成为溶源噬菌体状态,并与寄主DNA一起复制,这一现象称溶源化。,裂解生长,Mu-噬菌体,Mu DNA为线状分子,整合到宿主核基因组中去,会引起染色体上许多位点的突变,故也叫突变因子(Mutator),Mu插入有两种途径:,溶源生长时,Mu插入寄主DNA的任意部位,噬菌体两侧各有5bp靶序列重复;,裂解生长时, Mu随机插入寄主DNA中,一旦插入便很少切除。,C-转位相关基因,A-20KD蛋白基因,,B-复制相关基因,四、真核生物的转位因子,1.酵母中的Ty因子:,是一种分散重复序列,每个Ty因子全长6.3Kb,两端各有一段334bp的同向重复序列,称序列,富含AT,可翻译成42个残基的氨基酸,每个酵母细胞基因组中有3035个拷贝。,2.果蝇中的转位因子,果蝇中的Copia基因有几种顺序上不相关,但结构和行为相似的因子,统称“类Copia因子”。它们的一般特征如下,:,拷贝数,长度,末端同相重复,末端反相,重复,Copia,2060,5000,276,10,FB,30,5005000,0,2501250,P,50,5002900,0,31,两端有276bp的LTR,具有很高的转录活性,产生poly(A)的mRNA,转录产物大多被限制在细胞核中。,FB因子:,末端反向重复序列长度不同,同一个FB成分的两个LTR也不完全相同,转座时靶点序列产生9bp的倍增,有时两个不同的FB因子共同引起一大段DNA的转移。,P因子,具有不一定的长度,完整的P成份有2900bp,含有四个阅读框,它们是转座所必需的,因此只有完整的P成分才具有转座功能。,共同特点:,两端都有31bp的反向重复序列。,P因子能引起果蝇不育,在果蝇中,P品系雄性与M品系雌性杂交后代产生劣生,而M品系作雄性和P品系作雌性的杂交都不产生劣生后代。,P + P ,M + M 正常,M + P ,P + M 不育,原因是雌性P品系细胞质中有P因子的阻遏蛋白抑制P因子中的转位酶的表达;而雄性M品系没有P因子或P因子不完整,因而不能转位引起劣生后代,。,逆转位因子 Retroposion,遗传信息的流动:DNA DNA,逆转位因子介导的转位作用:,DNA RNA DNA,转位时,RNA cDNA 基因组,逆转位因子逆转录病毒,无膜蛋白包裹,不能形成病毒颗粒,逆转录酶,小结:,转位因子的发生证明基因具有流动性;,转位时不依赖于序列的同源性,在原位点上这种序列不丢失,只是它的一个新的拷贝插入到靶位点上,同时引起靶序列的断裂和倍增转位是一种复制过程。,作用:转位后可引起基因失活或改变基因表达活性,是一种基因表达调控的方式。,
展开阅读全文