基因和基因组ppt课件

上传人:94****0 文档编号:244663899 上传时间:2024-10-05 格式:PPT 页数:203 大小:2.95MB
返回 下载 相关 举报
基因和基因组ppt课件_第1页
第1页 / 共203页
基因和基因组ppt课件_第2页
第2页 / 共203页
基因和基因组ppt课件_第3页
第3页 / 共203页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第4章,基因和基因组的结构和功能,钟喜寥茸彪贩补蓄佃氧列拄种沈描淘垃隶叁狈笨萧盟系战沙吵固酋柜乡郴4基因和基因组4基因和基因组,4.1 基因的概念,基因的概念有一个发展过程,1866,年,Mendel,发表了植物杂交实验的论文,提出遗传因子(genetic factor)的概念,1903年Sutton和Boveri提出遗传因子位于染色体上,1907年Johannsen提出基因的概念,1926年Morgan出版了基因论。1941年,Beadlr和Tatum,提出一个基因一个酶的学说,,1955年Benzer用T4噬菌体为材料,提出顺反子的概念。1961年Jacob和Moned提出操纵子学说,提出结构基因、调节基因、操纵基因等概念,1977年Sanger测定了,X174的序列,发现了重叠基因,同年,Jacp发现了假基因,Sharp和Robert发现了断裂基因。现时可将,基因,定义为DNA分子中最小的功能单位,为RNA或蛋白质编码的基因称,结构基因,,只有调节功能,不转录生成RNA的称,调节基因。,4.2 基因的命名,基因的命名在不同的生物有不同的规则。,搏拌讲柿振选职竖誉茄许擅狸毕瘸梆遥饱论减垄雷窝咯蛛乱辉胃棉皆弹替4基因和基因组4基因和基因组,顺反子通过,顺反试验,确定,如两个位点可以互补,则不属于一个顺反子;如两个位点不可以互补,则属于同一个顺反子。,上图为突变发生在相同基因无互补,下图为突变发生在不同基因,图中蓝条表示基因,红点表示突变位点。,染遗骇甜寥蒂必蜗灸仲约穿拖妖纯逐羊遏逝喀刘迈状劈焉卢励揪搁书规瞳4基因和基因组4基因和基因组,4.3 基因组,4.3.1 基因组的概念,某生物体所含的全部遗传物质称该生物体的,基因组,。,“真核生物基因组”这个词是一个有多重含义的概念。众多的不同基因存在于构成细胞核基因组的各种类型的DNA序列中,也存在于细胞器所含相对较少的DNA序列中。广义的基因组包含细胞器的DNA序列,但由于真核生物最本质的特征是由分隔在细胞核内的核基因组决定的,通常说的基因组指的是核基因组,细胞器中的DNA可分别称作线粒体基因组和叶绿体基因组。某条染色体的基因的总和可称作某染色体基因组。,礼憾促有虫瞥坯桥宠涣逞律们直包谊谷簿摔蛋馈恃手乳肄圈艰囚宽外射锚4基因和基因组4基因和基因组,4.3.2 基因组的大小和C值矛盾,1.基因组的大小,怒棘廉霍锌块驳镣瓶涣儒禽掖寡苦敢诛搬纽前嘘敖碳从闸钵潍奠凄憾娱矛4基因和基因组4基因和基因组,2. 基因组的大小和C值矛盾,某生物单倍体的DNA总量称C值,C值与生物的进化程度不完全对应。,瘩械歌招铜棚袒罩淬颇犬物舜刁新海霍否敏讲痴捷平澈歪闯斧狞除宁丧膛4基因和基因组4基因和基因组,4.4 病毒基因组,4.4.1 病毒基因组的特点,1.病毒核酸大小差别很大,310,3,310,6,bp.,2.病毒基因组可以由DNA或RNA组成,但每种病毒只含有一种核酸。,3.除逆转录病毒外,病毒基因都是单拷贝的,基因组的大部分序列是用来编码蛋白质的,基因之间的间隔序列很短。,4.功能相关的基因常串联在一起,由共同的调控原件调控,并转录成同一mRNA分子,可指导多种蛋白质的合成。,5.真核病毒基因有内含子,而噬菌体(感染细菌的病毒)基因中无内含子。,6.有重叠基因,即一段核酸序列可以编码多个肽链,这样现象在噬菌体中较普遍。80年代中期之前,普遍认为重叠基因主要存在于病毒,但以后的研究发现,重叠基因在生物界是普遍存在的,在包括人类在内的脊椎动物中,重叠基因可能超过基因总量的10%。重叠基因的生物学意义有待深入研究。,已祈畅车磕互蝎浩瘩惮恭邪康蜗纠皮淫膝位份酋酗型谍态予宰鹅膛馏劫靴4基因和基因组4基因和基因组,4.4.2 病毒的核酸,病毒的核酸可以是单链或双链,闭合环状或线状分子。,病毒的DNA多数是双链分子,少数为单链分子。线状DNA有末端重复序列,复制时可以环化。,不少病毒以RNA为遗传物质,称作RNA病毒,可分为,正链病毒,(positive strand virus) 、,负链病毒,(negative strand virus)、,双链病毒,(double-strand virus)、,逆转录病毒,(reverse transcription virus)4类,。,泄敷降娠讼爬糊仅查胃领祷宵矫呀箭遍罢缓市楼橙鳖配庇姓沿洽钓陈液酌4基因和基因组4基因和基因组,儡猪渊吝彻亥宝酣圣万狠闹塑睫堡剥忠轧里坝恍疵盐过横华痞舞磁岛烷圈4基因和基因组4基因和基因组,歌册汕凳膘巾逼趁袒娜蒲挫蜂责簿糊旨梢旧逢胳芥很拂择彰覆拟珊啮幕惧4基因和基因组4基因和基因组,HIV的结构及其与宿主细胞的附着,勺劲络撩药捞甲牲烃踏酒郝蓄炽戊愚扣斩鸦嘱陶攫簧错防姑咆炼浸篙输颧4基因和基因组4基因和基因组,4.4.3 噬菌体基因组,1. 噬菌体,噬菌体的基因组长达50 Kb,共61个基因,其中38个较重要。当细菌处于溶原化状态时,细胞质中有一些 CI基因的产物CI蛋白, 阻止左、右两个早期启动子的转录,使之不能产生一些用于复制及细胞裂解的蛋白,的DNA随着宿主的染色体复制而复制。但在UV诱导下Rec蛋白可降解CI蛋白,诱导90的细胞裂解。有时也可自发地从宿主的染色体上游离出来,进行复制,最终导致宿主细胞的裂解。游离在细胞质中的可以进行滚环复制,产生多个拷贝,并合成头部和尾部蛋白,包装成完整的噬菌体,使细胞裂解,释放出噬菌体再感染新的细胞。在噬菌体DNA两端各有一条由12个核苷酸组成的互补粘性末端。当进入寄主细胞后,线性DNA分子通过粘性末端的碱基配对而结合,形成环状DNA分子。这种由粘性末端结合形成的双链区段为cos位点(,cohesive-end site),。,1951年J. Lederberg的妻子Esther Lederberg证明了J. Lederberg和Tatum用来杂交的K12中有原噬菌体,并命名为,经10年的研究搞清了溶原化的实质。,尤恋滑尚梅钨膘论猫涝遮旷量掷鞘旬识幽奉庄霍强陕述蠕冻扫殴庇晰都榨4基因和基因组4基因和基因组,噬菌体的50个基因组成4个操纵子,即阻遏蛋白操纵子,左右两个早期操纵子和晚期操纵子,左向转录的为L链,右向转录的为R链,当噬菌体侵入宿主细胞后,,前早期和后早期的基因首先表达,,随后,,若晚期基因表达,噬菌体进入裂解循环,若合成阻遏蛋白,则进入溶原状态,。右早期操纵子的调节基因,cro,可抑制溶原型阻遏蛋白,cI,的合成,使噬菌体进入裂解循环,左早期操纵子的,调节基因N,的表达产物为,抗终止子,,使前早期基因的转录越过终止信号进入后早期基因,后早期基因包括左右早期操纵子的3个调节基因,c/c与建立溶原状态的阻遏蛋白的合成有关,,Q调节基因,的产物亦为,抗终止子,,使晚期基因表达,噬菌体进入裂解循环。,译脂押衰森诈淫西媳济卷猛驯则际泥恼婶刃宰种涟行彼岔蕴阔挺纪贿绢筒4基因和基因组4基因和基因组,Figure shows that there are two immediate early genes, N and cro, which are transcribed by host RNA polymerase. N is transcribed toward the left, and cro toward the right. Each transcript is terminated at the end of the gene. pN is the regulator that allows transcription to continue into the delayed early genes. It is an antitermination factor that suppresses use of the terminators tL and tR. In the presence of pN, transcription continues to the left of N into the recombination genes, and to the right of cro into the replication genes.,焊承祷孙背氰女统缆柯王刘委尧体涎鹰醋夸妖八材芒过渗夷竟济胁妄擂稻4基因和基因组4基因和基因组,2. X174的基因组,1977年Sanger测定了噬菌体,X174的序列,5386nt,含11个基因,3个转录单位,由3个启动子(pA,pB,pD)启动。,X174含有的5386nt最多能编码1795个氨基酸,若每个氨基酸的平均相对分子质量为110,则总的蛋白质相对分子量质为197,000D,但实际蛋白质总相对分子质量却为262,000D。将全部DNA顺序和蛋白质的氨基酸顺序进行比较,发现了重叠基因,。,暮之潍廊架遵眼损载椒屠底驱歧故永频瞪耙糕譬颇虹堂棉箱杨罕得脐呸夫4基因和基因组4基因和基因组,E基因全部包括在D基因内,B基因则全部包括在A基因内。,吩晃蛛呻垂掀蹄果淋骄苗端丁聊督沙扁瓜脓畏寓林谐簧虱辗蔗尤匡贱靖身4基因和基因组4基因和基因组,4.4.4 几种病毒的基因组,1. SV40基因组,猴空泡病毒40(simian vacuolating virus 40,SV40)载体基因组只有5243bp,序列已确定,基因组为共价闭合环DNA(cccDNA),酶切图谱及各种功能的基因定位均已详细了解。病毒DNA较易制备,但是,用SV40重组病毒转染细胞时,随着病毒的繁殖,细胞会裂解,这对基因工程中的应用是很不理想的。SV40 DNA分子小,插入的DNA不能大于2500bp。SV40 DNA的早期功能区插入外源DNA,存在致癌的隐患,为此,人们对病毒载体进行了改造,同时插入tk, dhfr,neo, cat等标记基因,构成了适用于不同目的的表达载体。pSV 载体就是以SV40为基础构建的一群载体的总称。,喀椅卑厢那郊薛犁蒸鹃胰递玩未竹锹界灼垫瘴挡饮裕盆巍惭宦慢远谓镭踢4基因和基因组4基因和基因组,敷植刽颠桩殴舜压缀恳追焊孕烯役诧关秘兹械箱可壳币摊研虫进茹烘肠心4基因和基因组4基因和基因组,蛋白质,合成时间,功能,T抗原,早期,启动DNA复制,t抗原,早期,未知,VP1,晚期,主要的病毒外壳蛋白,VP2,晚期,次要的病毒外壳蛋白,VP3,晚期,次要的病毒外壳蛋白,炽矮谭涸帽秃绎倚潞库现托拐坠锭靛浴距亏刑咏蚌拽查谚侯尸切中野糊壳4基因和基因组4基因和基因组,雹狂貌丛瞒型棚陌么燎芯碴鲤挑草铬遮引舜晦输剧棘脂邹圣披儒仲淋玫渺4基因和基因组4基因和基因组,录伟硫邀昨二训承煮滇荫流酿唆哇砚读菱旅劈窍滴蚊慢石新铅官佯首儿鼓4基因和基因组4基因和基因组,2.腺病毒基因组,腺病毒(adenovirus,Ad,)是一种没有,包膜,的直径为70,90 nm的颗粒,由252个壳粒呈廿面体排列构成。每个壳粒的直径为7,9 nm。其病毒壳体含有三种主要的蛋白:240个六邻体(II),12个五邻体基底(III)和纤突(IV),还有多种其他的辅助蛋白VI,VIII,IX,IIIa和Iva2。衣壳里是线状双链,DNA,分子,约含35 000 bp,两端各有长约100 bp的反向重复序列。由于每条DNA链的5端同相对分子质量为5510,3,Da的蛋白质分子共价结合,可以出现双链DNA的环状结构。人体腺病毒已知有33种,分别命名为adl,ad33,研究得最详细是ad2。,迢砒忠录躁惟战录迂勇庄钧爱豹无肥刚逼皮锻改佃秆限弹昔辑言曝灶媚殴4基因和基因组4基因和基因组,腺病毒基因组是一个线性的双链DNA,其5端与一种末端蛋白(TP)共价结合,5端上还具有末端反向重复序列(LTRs)。病毒DNA与核心蛋白VII和一个称为mu的小肽紧密结合。另一种蛋白V包被在DNA-蛋白复合物上,并且通过蛋白VI为DNA-蛋白复合物和病毒壳体间提供了结构上的联系。病毒含有一种病毒自身编码的蛋白酶,这种蛋白酶对于加工某些结构蛋白从而产生成熟的具有感染性的病毒是必需的。,腺病毒易于培养纯化,其基因组为线性双链DNA,可插入较大的外源DNA片段,最大的可达约7kb,且可在宿主细胞内大量扩增,宿主细胞范围广泛,可用于基因工程和基因治疗。不足之处是Ad在细胞内复制时可大量释出壳体蛋白,容易引起宿主细胞介导的免疫反应,使转导的细胞遭到免疫攻击而被破坏。,瑶蜘场炔蒸蛇撇弯羹咙惜阐箕明宗苍贸戴彩碎莉婆碗伶盲慈舵议轧熄尼方4基因和基因组4基因和基因组,3.逆转录病毒基因组,种群特异性抗原,屏溢卧盎村歌访旁劈沾眶祥嚣萤怨击临拂鲜睹肄和宙幕望恳桨竭屁诸述攫4基因和基因组4基因和基因组,LTR:长末端重复序列;,gag:种群特异性抗原(group specific antigen);,pol:聚合酶(polymerase);,env:被膜蛋白(envelope);,是逆转录RNA包装为病毒所必需的。,录截粉为兄惧山肖临钧隅枪挂姐吕所磺班厉传坊涕雄焙击卡破肘抬睫沪晌4基因和基因组4基因和基因组,4.5 细菌基因组,4.5.1 细菌基因组的特点,1.细菌的“染色体”通常有一个环状或线型DNA分子组成,只有一个复制起点。不少细菌含有若干个小的环状DNA,被称作,质粒,(plasmid)。有些质粒可以从一个细菌转移到另一个细菌,不少经过改造的质粒在基因工程中被用作基因转移的载体。,2.编码蛋白质的基因为单拷贝的,但rRNA基因一般是多拷贝的。,3.基因组中有多种调控区,和少量重复序列,调控原件比病毒复杂,但比真核生物简单,重复序列比真核生物少得多。,4.,功能相关的几个结构基因往往串联在一起,受它们上游的共同调控区控制,形成操纵子结构,。,5.基因组中存在与真核生物类似的可移动DNA序列(转座子)。,早苗诫砒装难生薪寨惋戎似陕啃羡价棍绥漏彻远柑拘屯甭眶债剂勃袋坤德4基因和基因组4基因和基因组,DNA from a lysed,E. coli,cell.,In this electron micrograph several small, circular plasmid DNAs are indicated by white arrows. The black spots and white specks are artifacts of the preparation.,阴诲害疡蚕彰镜碍撒率干栓橇寺赚羊仇韧浮羹脑咽跟醉滁窖氢等复调课吟4基因和基因组4基因和基因组,些访岔疏监气绵剐畦历呸跨铰爪哨轰斯戚圈酸苛赐儿悍谓逆悍伟松便匈粹4基因和基因组4基因和基因组,尹而第霉肃搽昆酋窥蓬涛平宏旗昏谓贿碗咎致即掩名讶彩恫甚懊礼柿贬左4基因和基因组4基因和基因组,蛋白,结构,功能,含量/每细胞,相当于核蛋白,基因,HU,和亚基,每个9KD,使DNA压缩、类核凝聚,刺激复制,和1HF有关,4万个二聚体,H2B,hupA.B,H,两个相同亚基,各28KD,促使双链的互补、复性,3万个二聚体,H2A,?,IHF,10.5KD,9.5KD,有助于att位点配对重组,?,?,himA.D.,H1(H-NS),15KD,亚基,和DNA结合,与DNA拓扑结构有关,1万,?,osZ,bglY,pilG,HLP1,17KD,单体,?,2万,?,firA,P,3KD,亚基,?,?,鱼精蛋白(DNA结合蛋白),?,E.coli,含有的各种DNA结合蛋白,裙墙惑蓟烘狸烤士锻邢纽黄胸钱腹腑逊旁藻侗嫩高帖塔悬聂案收装勉及猖4基因和基因组4基因和基因组,4.6 真核生物基因组,4.6 .1 真核生物基因组的特点,(1)基因组较大,核基因由多条线状的染色体构成,每条染色体有一个线状的DNA分子,每个DNA分子有多个复制起点。线粒体和叶绿体等细胞器中含有环状的DNA分子,其结构与原核生物的DNA相似。,(2)不存在操纵子结构,功能上密切相关的基因可以排列在一起,组成基因簇(gene cluster),也可以相距较远,甚至位于不同的染色体。即使同一个基因簇的基因,也不会像原核生物的操纵子结构那样,转录到同一个mRNA上。基因的协调表达,是通过多种调控因子构成的复杂系统完成的。,(3)有重复序列,重复率达10,6,以上的称高度重复序列,有数十至数十万个拷贝的序列,称中度重复序列,。,(4)有断裂基因,不少基因含有称作内含子的非编码区,编码区称作外显子,有些基因可含有几十个内含子。,底拥灰寅伴迟颤躁果筏揣媒降甩姓幼掉芥挂过耀浚兄某斯瓤伎搂粗应鸯邓4基因和基因组4基因和基因组,4.6.2 真核生物基因组的结构,1. 真核生物的断裂基因,Many, if not most, eukaryotic genes have a,distinctive and puzzling structural feature,: their nucleotide sequences contain one or more intervening segments of DNA that do not code for the amino acid sequence of the polypeptide product. These nontranslated inserts interrupt the otherwise colinear relationship between the nucleotide sequence of the gene and the amino acid sequence of the polypeptide it encodes. Such nontranslated DNA segments in genes are called,intervening sequences,or,introns,and the coding segments are called,exons,.,无拒煤涯拒溯午硷撼鹤砂腻蛀惠质饿糟荣咯哟腥酱囤琅卞穆口肛盾恃妆厉4基因和基因组4基因和基因组,In higher eukaryotes, the typical gene has much more intron sequence than sequences devoted to exons. For example, in the gene coding for the single polypeptide chain of the avian egg protein ovalbumin, the introns are much longer than the exons; altogether, seven introns make up 85% of the genes,DNA. In the gene for the,subunit of hemoglobin, a single intron contains more than half of the genes DNA. The gene for the muscle protein,titin,(肌联蛋白)is the intron champion, with,178,introns. Genes for histones appear to have no introns.,In most cases the function of introns is not clear.,In total, only about,1.5%,of human DNA is “coding” or exon DNA, carrying information for protein or RNA products. However, when the much larger introns are included in the count, as much as,30%,of the human genome consists of genes.,描艇典帘鸡味屑屏鹏欠针偶茫妈滥杠吧团伊嚎焕部瑶务部知前纵顾仟横西4基因和基因组4基因和基因组,Exon,is any segment of an interrupted gene that is represented in the mature RNA product.,Intron,is a segment of DNA that is transcribed, but removed from within the transcript by splicing together the sequences (exons) on either side of it.,RNA splicing,is the process of excising the sequences in RNA that correspond to introns, so that the sequences corresponding to exons are connected into a continuous mRNA.,Structural gene,codes for any RNA or protein product other than a regulator.,Transcript,is the RNA product produced by copying one strand of DNA. It may require processing to generate mature RNAs.,狰它乞梁君灵瑞苯璃鹤缺肺啸德喝喻校傣铣赔有符节园戮佐标氰痛缎通傍4基因和基因组4基因和基因组,Introns in two eukaryotic genes.,The gene for ovalbumin has seven introns (A to G), splitting the coding sequences into eight exons (L, and 1 to 7). The gene for the,subunit of hemoglobin has two introns and three exons, including one intron that alone contains more than half the base pairs of the gene.,循概撇贸珊重统镣嘿拴拉别沥肚委操乾娩夏惑验戮盖栅矮堰总你趁忠暴镣4基因和基因组4基因和基因组,Most genes are uninterrupted in yeast, but most genes are interrupted in flies and mammals. (Uninterrupted genes have only 1 exon, and are totaled in the leftmost column.),在,s.cerevsiae,中,大部分基因(96%)是连续的,几乎没有一种,s.cerevsiae,的基因含4以上外显子。在昆虫和哺乳动物中,情况恰好相反,只有很小部分的基因是连续的(哺乳动物中有6%),昆虫基因含有很少的外显子,一般少于10个,哺乳动物的基因断裂成许多片段,有些会有几十个外显子。一般来说,外显子较短,内含子较长。有些特殊基因外显子的数量和长度均较大,如肌养蛋白基因(与杜氏肌营养不良相关)长2000kb,含60多个外显子,其mRNA约14kb。肌联蛋白(约27000个氨基酸)有178个外显子,其中最长的外显子1.7kb。,臃屿耿麻虹姑洛祁输郧尧莆渍牺墩笆午狠蚤韭厨衙寻脂右亦烈绑饲休固肉4基因和基因组4基因和基因组,Yeast genes are small, but genes in flies and mammals have a dispersed distribution extending to very large sizes.,碗肉脉泽秸槛烦曙奢摧丝岸团中皱篡疆趣殴庶三襟釜滔吸柏钧叭吓支制在4基因和基因组4基因和基因组,2. 外显子和内含子的相互关系,(1)内含子在转录后被切除,通过mRNA与DNA之间的分子杂交,可以分析内含子的数量。,嘎佰体梭碱狠输散船哭寂撒入扇犁焰烬答靠郊利警莉泵往瘤岁额瞳蚌澈抡4基因和基因组4基因和基因组,Comparison of the restriction maps of cDNA and genomic DNA for mouse,-globin shows that the gene has two introns that are not present in the cDNA. The exons can be aligned exactly between cDNA and gene.,通过比较cDNA与基因组DNA的限制性核酸内切酶图谱,也可以分析内含子的数量。,面隐弯术粒允挤甚焕丹波由啥技终催乓摆裂财嗅砂禹勤菊酞处徘焉窖棵阵4基因和基因组4基因和基因组,The ovalbumin gene, shown here, has introns A to G and exons 1 to 7 and L (L encodes a signal peptide sequence that targets the protein for export from the cell). About three-quarters of the RNA is removed during processing. Pol II extends the primary transcript well beyond the cleavage and polyadenylation site (“extra RNA”) before terminating transcription. Termination signals for Pol II have not yet been defined.,Overview of the processing of a eukaryotic mRNA,紫监入申溪沽碧面喂送进痹谢醇既樊秒遏泼往驾簇祁匣裙讹渠攻麻伊死履4基因和基因组4基因和基因组,An intron is a sequence present in the gene but absent from the mRNA (here shown in terms of the cDNA sequence). The reading frame is indicated by the alternating open and shaded blocks; note that all three possible reading frames are blocked by termination codons in the intron.,牛少际吗坍锚涪犁碾逸赢睫菲裤孤絮抵革辊频秧雇喂材等郝弹酒塔丽茶嚷4基因和基因组4基因和基因组,(2) 外显子和内含子的连接位点,冤逊悔放溺夺刑住妙甩郝菩片狸那狐锋颂衷住酬硷言埂橡荫是丛帕税菲耀4基因和基因组4基因和基因组,(3) 外显子和内含子的进化关系,外显子的差异主要由于碱基替代造成的,在被翻译的序列内,若突变会引起AA序列的改变,则相应的生物可能在进化中被淘汰。许多保留下来的变化并未影响密码子的含义,因为这些发生变化的碱基常是密码子的第三个碱基,或在非翻译序列(如5,端和3,端序列)中。,而在内含子中,序列变化多是由于碱基插入或缺失或替换造成的。内含子演化的速度比外显子快得多,不同物种相同基因相比较,有时发现外显子是同源的,而内含子却有很大差异。,在内含子、外显子中突变速率是相同的,但外显子通过自然选择不易保留突变,而内含子由于不编码AA,可以自由地发生突变,通过不断积累最终导致巨大差别,这种差异也说明了内含子不具备序列特异性这个特征,人们一直未弄清内含子的存在对基因功能是否是必须的。,绣剔虚甘是过脸哲硬逊例汇雁雷磅相宴晒恼瞄隋螟另再醒竭者钻窿歇聚犁4基因和基因组4基因和基因组,The sequences of the mouse,maj,and,min,globin genes are closely related in coding regions, but differ in the flanking regions and large intron.,两个基因的亲缘关系可以用限制性片段杂交点阵绘图的方法来描述,如果两个基因完全相同,那么所有点将组成一条倾斜角45度的直线。这条直线会因为两序列缺乏相同性而断断续续,也可能因为相对于另一个序列有缺失或插入而水平或垂直移位。当小鼠的两个-珠蛋白基因相比时,这条直线延伸穿过了三个外显子和一个小的内含子,但在侧翼序列和大的内含子部分却消失了,由此可以看出,编码序列是相关的,且这种亲缘关系可以保留在外显子-内含子边界处,但在较长的内含子和基因端部序列,不存在这种相关性。,戎夺凄纯甩赔寐虎响蜗骗童坞岩团括兼简煞碑溃烛祷建天贾吟竿小蚤炎墙4基因和基因组4基因和基因组,DHFR(二氢叶酸还原酶)有一个较大的基因,由6个外显子组成,相对应mRNA长度为2000bp,但是它的DNA序列却十分长,这是由于它的内含子非常长的缘故,在三种哺乳动物中,外显子基本保持一样,内含子的相对位置也不改变,但长度变化却非常大,这就导致了基因长度范围为25,31kp。,Mammalian genes for DHFR have the same relative organization of rather short exons and very long introns, but vary extensively in the lengths of corresponding introns.,截洲凶馁馆楔域御肌穷呈忘缝蹈妮胆铬当蝗普赞葱郊捻刺千逢乎瑶隆粮簇4基因和基因组4基因和基因组,Immunoglobulin light chains and heavy chains are coded by genes whose structures (in their expressed forms) correspond with the distinct domains in the protein. Each protein domain corresponds to an exon; introns are numbered 1-5.,如果现在的蛋白是由早期分离的蛋白组合演化而来,一段时间增添一个外显子,则在现存的基因结构中,每个外显子会编码一个有功能的结构域。免疫球蛋白是两条轻链、两条重链组成的四聚体,每类基因都有一系列外显子相应于蛋白不同的结构域。,抱蓉颂扮怎奉淹酣讨光淹屋噶酗滦撵存钉终嫌甲耳歇粮重靳持淘见纠拾黄4基因和基因组4基因和基因组,The LDL receptor gene consists of 18 exons, some of which are related to EGF precursor and some to the C9 blood complement gene. Triangles mark the positions of introns. Only some of the introns in the region related to EGF precursor are identical in position to those in the EGF gene.,LDL(低密度脂蛋白)受体基因的中心部分的一系列外显子和EGF(表皮生长因子)前体基因同源,在其N端的外显子序列和血蛋白补充因子C9的基因同源,这说明LDL基因中一系列不同功能的组份组合而具备了新的功能,而这些组份也存在于别的蛋白中。,颗墙栽萍拓烁徒抓椅岳脯拭神狈氨期僧纫铂脾蹬怀凑滴拙僵摇蘸痰师睦赫4基因和基因组4基因和基因组,Some interrupted genes possess only one or a few introns. The globin genes provide an extensively studied example. The two general types of globin gene,and, share a common type of structure. The consistency of the organization of mammalian globin genes is evident from the structure of the generic globin gene summarized in figure. All functional globin genes have an interrupted structure with three exons. The lengths indicated in the figure apply to the mammalian -globin genes.,珠蛋白的基因包含三个外显子,两个内含子总是存在于相对于编码区很一致的位置上,中间的外显子代表了珠蛋白链中结合血红素的结构域。活性蛋白是由2个珠蛋白链和2个珠蛋白链组成的四聚体。,训忠骨讨痊奎烤矩敬银标因盆透悍郝阁讫落讳硼虏惫烂贤交攻亥惊姿侍慌4基因和基因组4基因和基因组,外显子和蛋白结构域之间并非总是简单的对应关系,有迹象表明,在演化中,外显子的复制和合并也起了相当重要的作用。有一些学者认为最初的蛋白质是相当小的,通过不断的复制、变化、重组而产生了现在各种蛋白质。,颗酞嫉疮毋竞检勋哉因吨陶壁烃诽盈婚迫览甄貌菲肥貉倒廓既鬼水测毛纸4基因和基因组4基因和基因组,The exon structure of globin genes corresponds with protein function, but leghemoglobin has an extra intron in the central domain.,遥窝湍递寨砍监押矫蚂狱幢妊嚷挽报譬肌孽扇解京失歪轰到淄敏灾远伍袁4基因和基因组4基因和基因组,血红蛋白是动物体内结合氧的单聚体蛋白,豆血红蛋白是豆类植物中结合氧的蛋白,它们和别的血红素结合蛋白有着共同的祖先。肌红蛋白,血红蛋白和豆血红蛋白共同组成了球蛋白超家族,它们的基因组成是一个基因家族,也是由共同祖先演化而来的。,血红蛋白是由人类基因组中一个基因所编码的,它和肌红蛋白基因基本上一样,三个外显子结构说明由于基因的演化形成了血红蛋白和球蛋白功能的分离。,豆血红蛋白的基因含有三个内含子,第1个和第3个的位置和球蛋白2个内含子所处位置是相同的。这种惊人的相似说明很多血红素结合蛋白都是通过基因割裂而来的。,在豆血红蛋白中,中心的内含子将相应的球白中心外显子序列分割成两部分,是肌红蛋白的中心外显子由古代的两个外显子合并而来,还是在单一的中心外显子中插入了一段内含子而形成了豆血红蛋白呢?这一问题还有待研究。,侍胯鼻驹污逞扼毕络哮诧概篷陛焦活拎皋灾本凌蟹厌践秩缉陷鬼哈共句感4基因和基因组4基因和基因组,The rat insulin gene with one intron evolved by losing an intron from an ancestor with two interruptions.,哺乳动物(除了啮齿类)和鸟类编码胰岛素的基因是由同一基因演化分离而来的。鸡的胰岛素基因有2个内含子,大鼠的其中一个基因与之有相同的结构。这个共同性说明胰岛素最初有2个内含子,而大鼠的另一个基因只含有1个内含子,说明它在演化过程中首先进行复制,然后从一个拷贝中精确地移去了一个内含子。,唇傻绢紊庭鲁龋脑哮场舒肠侨躇捌手隙琢姥绞帚弃奔呼擦令缩旅肛萨皖亮4基因和基因组4基因和基因组,Actin genes vary widely in their organization. The sites of introns are indicated in purple; the number identifies the codon interrupted by the intron.,眶琅悲倒禽阐翻熬洞愚逐郁羡碉悠态捍钱芋氧覆袱盐法凭嫌贞坑把壬凹境4基因和基因组4基因和基因组,一些基因结构在不同物种中显示了巨大的差异,这些物种在基因演化中一定进行了大量的基因转移和插入,最典型的例子就是肌动蛋白基因。典型的肌动蛋白基因有一个非翻译的前导区(100bp),一个编码区(约1200bp),和一个尾巴(约200bp)。多数肌动蛋白基因是不连续的,且内含子存在于编码序列中,除了少数存在于先导序列中。,几乎每个肌动蛋白基因具有不同的断裂模式。考查所有类型的基因,内含子出现在12种不同的位置上,但是每一个单个基因的内含子数目均小于6,有些基因只有一个内含子,甚至有一个基因是连续的。为什么会发生这种情况呢?如果我们假定原始的肌动蛋白基因是不连续的,现在的基因与原始基因相关,但缺失了部分内含子,在不同的进化分支上缺失不同的内含子,可能有些内含子完全消失,这样在原始基因中可能有20个或更多个内含子。另一个观点认为在不同进化分支上,内含子独立地插入到序列中。在不同物种中内含子位置的关系可能最终被用来构建一个基因的进化树。,脊蚕誓酋涛镁秉起奴索粘膘疗丽今帚偶宰软嘿亚拷钓虾僚筛苯片负焙粥岂4基因和基因组4基因和基因组,内含子,在rRNA和tRNA普遍存在多样性。可以找到不同的形式,有或没有内含子。所有tRNA分子有相同的一般结构,看上去似乎不像是通过把两个区域合并在一起演化而来的。因为基因的不同区域有相当重要的功能,因此它的演化可能是由内含子不断插入基因造成的。,在许多叶绿体基因中,都存在内含子,包括那些和E.coli基因相似的基因。这说明内共生发生在原核生物丢失内含子之前,如果存在一个合适的基因,可能可以推测出内共生现象发生的时期。,酵母和哺乳动物线粒体基因编码了完全相同的蛋白,尽管二者结构上存在很大差别。脊椎动物线粒体基因组相当小,由结构十分紧密的连续基因组成,而酵母的线粒体基因组却大得多,而且有一些复杂的断裂基因,这两者哪个起源更早些呢?酵母线粒体基因的内含子具有移动性,它们是独立的序列,可以从一个RNA中剪接掉而插入另一个DNA序列,这说明它们的基因通过内含子的不断插入而演化。,抨五昌瑰穴秤戌视拳铭搞史碗玖巍僧乙温郸杆钓傈涪纪刃暑焚深匆赘若诛4基因和基因组4基因和基因组,(4) 内含子的功能,a.促进重组。,b.增加基因组的复杂性,提高进化速率。,c.有些,内含子可编码内切酶。,d.有些内含子可编码snoRNA。,e.含有部分剪接信号,内含子编码的成熟酶 (maturase)帮助内含子折叠,促进剪接。,f.影响基因表达的调控。,六思纸空眨薪烩变敏凸届崭御观铲压肿藕舰媒椽员峡派煤五夺密浊浚茶谬4基因和基因组4基因和基因组,Alternative splicing uses the same pre-mRNA to generate mRNAs that have different combin-ations of exons.,冈姐惰课可捣躁轮理惦藩春臭祸韧孤洒指钻哄蛹戒鸥偷钻裙摄歇璃然猛银4基因和基因组4基因和基因组,Alternative splicing generates the a and b variants of troponin T.,逢升写亲破郁闻婉鼎针引亡打婿更谷燎盆孺篱工潭绪溅借慈纽炒蹭淫类咀4基因和基因组4基因和基因组,有氨柯齿音碰粉跃勺猪宴核声植洞寓叹洛弯层茁狭寄遁秦部碘之怪剖吏棉4基因和基因组4基因和基因组,These,c,0,t,curves show the rates of reassociation of denatured DNA from various sources and illustrate how the rate of reassociation is inversely proportional to genome complexity. The DNA sources are as follows: poly + poly U, a synthetic DNA duplex of poly A and poly U polynucleotide chains; mouse satellite DNA, a fraction of mouse DNA in which the same sequence is repeated many thousands of times; MS-2 dsRNA, the double-stranded form of RNA found during replication of MS-2, a simple bacteriophage; T4 DNA, the DNA of a more complex bacteriophage;,E. coli,DNA, bacterial DNA; calf DNA (nonrepetitive fraction), mammalian DNA (calf) from which the highly repetitive DNA fraction (satellite DNA) has been removed. Arrows indicate the genome size (in bp) of the various DNAs.,3. 真核生物基因组的序列异质性,(1)DNA的复兴动力学和序列重复频度,dsRNA,音搬落瞩奇榨陌筛考伺挺鸯瓮眷署贡浊后卢嫩倪资诈雄拐炳嘎孰渤札景瑰4基因和基因组4基因和基因组,逞重铜姆耪态状荡迭欲龙樱晾吨雹朱梅绎士懒湘客乘我铲胯伐铆洒灯柱芬4基因和基因组4基因和基因组,c,0,t,1/2,是单链的初始浓度与复性进行至一半时所需时间的积,较大的c,0,t,1/2,值表示复性的速度较慢。c,0,t,1/2,与基因组中DNA的拷贝数相关,如果12pg的细菌DNA和3pg的真核生物DNA有相同的c,0,t,1/2,,对于细菌基因组(大小为0.004pg)来说将有3000个拷贝,但是真核生物基因组(大小为0.75pg)只有4个拷贝。因此,若以mg/mL计的DNA浓度相同,则细菌基因组的拷贝数是真核生物基因组拷贝数的3000/4 = 750倍。要使真核生物序列的拷贝数与细菌相同,它就必须有750倍的DNA。因此,c,0,t,1/2,也显示了单一序列的总长度,即复杂度。,c,0,t,1/2,与复杂度成比例,任何DNA的复杂度可由其c,0,t,1/2,与已知复杂性的标准DNA比较而获得。通常E. Coli(4.210,6,)DNA被当作标准,其复杂度被用来标记基因组的长度。即,被测DNA的C,0,t,1/2,/ E.Coli C,0,t,1/2,= 被测DNA的复杂度 / 4.2,10,6,芝桃肩镶哮愁撩淹撒权俘青污缸逸诚擎芳乱尼燃返坚令赎价滇咙拢镶懦循4基因和基因组4基因和基因组,约占总DNA的25%,复杂度约340bp,重复频度约510,5,。,约占总DNA的30%,复杂度约610,5,,重复频度约350。,约占总DNA的45%,复杂度约310,8,bp,重复频度为1。,帽魔弦冰燕姿变盛忧斑婆艰拳攒绎朽缘睫卑垢绪饼赁捻蔬婚砍篇益螺绕猖4基因和基因组4基因和基因组,The reassociation kinetics of eukaryotic DNA show 3 types of component (indicated by the shaded areas). The arrows identify the Cot,1/2,values for each component.,酋社浇旗圃垛魄政栖莫纱仁玩稿叮狂朋硬孝烽恐皋屿谴桩芽俩幽徊摆稠梢4基因和基因组4基因和基因组,真核生物基因组的c,0,t值为10,-4,10,4,,曲线分为三个明显的相区(阴影框),在前两相区区间有一个平台区,而后两个相区则有重叠。每个相区都代表了基因组不同的动力学成分:,1.快速组分占总DNA的25%,在c,o,t值为10,-4,210,-2,,c,o,t,值为0.0013。,2.是中间组分占DNA的30%,在c,o,t值为0.2,100, c,o,t,值为1.9.,3.慢组分占总DNA的45%,在c,o,t范围为100,10000,c,o,t,为630。,为了计算这些组分的复杂度,每个组分都必须视为独立的动力学组分进行复性并与标准DNA比较。慢组分占总DNA45%,因此重组反应中它的浓度为测定c,o,的0.45倍,这样慢组分c,o,t,为0.45630 = 283,如果慢组分被纯化出进单独复性,其c,o,t,也为283。假定同样条件下,大肠杆菌DNA的c,o,t,为40,比较这两个值,我们可以发现这个组分复杂性为3.010,8,bp.用同样方法处理其他组分表明,中间成分复杂度为610,5,bp,快速组分为340bp.这为我们提供了一个进行量化的依据:组分重组越快复杂性越低。,反过来,如果我们把三种DNA每种含有的独特序列均为恰好长度(340bp,610,5,bp与310,8,bp),并且以质量比25:30:45混合,每一种组分就会如同仍是单一组分一样进行重组,混合物将显示出与图示全基因组相同的动力学图。,邑贯吩皑盔卖下晶杜鸳剿觉淮腥晤登力句凌色味钩刚帆抒漠魂衅估魁唾秸4基因和基因组4基因和基因组,(2)真核生物基因组的序列类型,重复率达10,6,以上的称,高度重复序列,(highly repective sequence),位于异染色质,在基因组中的比例一般为10%,60%,在人类基因组中约占20%。高度重复序列一般不为蛋白质或RNA编码,可能与染色体结构的形成及基因表达的调控有关。高度重复序列一般富含A-T对或G-C对,非重复序列的DNA在密度梯度离心中形成的区带处于二者之间。因此,高度重复序列被形象地称为,卫星DNA,(Satellite DNA)。,骚谎仍咱颂锗雀逸绢骸峡黄坛孩医趣述袭颂河插蝎嗡宣较圃蛤悼象星霍团4基因和基因组4基因和基因组,Mouse DNA is separated into a main band and a satellite by centrifugation through a density gradient of CsCl.,镰芬驮韶晴执冗芬锨落嗣节淋咐蜘颜布绷倪吉懊扩渐痘躯虹部喀胸倡浇尚4基因和基因组4基因和基因组,Satellite DNAs often lie in heterochromatin,Satellite DNA,consists of many tandem repeats (identical or related) of a short basic repeating unit.,Cryptic satellite,is a satellite DNA sequence not identifie
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!