资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第 十 三 章,真核基因与基因组,Eukaryotic Gene and Genome,Nanjing medical university Department of biochemistry and molecular biology,基因(,gene,):,DNA,上的功能单位,能够编码蛋白质或者,RNA,。,基因组(,genome,):,包含了所有编码,RNA,和蛋白质的序列,及所有的非编码序列,也就是,DNA,分子的全序列。,生物:简单 复杂,基因组:小 大,人类基因组计划,HGP,1990-2001.2,20,亿美元,第 一 节 真核基因的结构与功能,Structure and Function of,Eukaryotic Gene,真核生物结构基因,由若干个编码区和非编码区互相间隔开但又连续镶嵌而成,去除非编码区再连接后,可翻译出由连续氨基酸组成的完整蛋白质,这些基因称为断裂基因。,断裂基因,(splite gene),C,A,B,D,编码区,A,、,B,、,C,、,D,非编码区,*,外显子(,exon,),结构基因中有表达活性的编码区,*,内含子(,intron,),结构基因中无表达活性的非编码区。,一、真核基因的基本结构,电镜照片,解释图,鸡卵清蛋白基因中外显子和内含子的排列顺序及大小,RNA,编辑作用说明,基因的编码序列经过转录后加工,是可有多用途分化的,因此也称为分化加工,(differential RNA processing),。,二、,mRNA,的编辑,(mRNA editing),人类,apo B,基因,mRNA,(,14500,个核苷酸),肝脏,apo B100,(分子量为,500 000,),肠道细胞,apo B48,(分子量为,240 000,),mRNA,编辑,三、调控序列参与真核基因表达调控,顺式作用元件,启动子,(promotor),2.,增强子,(enhancer),3.,沉默子,(silencer),-25bp,RNA,聚合酶结合位点,控制转录起始的精确性,上游启动子序列 (,UPE,),控制着转录起始的频率,真核基因的,顺式作用元件,启动子,结构基因,顺式作用元件,2.,增强子,(enhancer),指,远离,转录起始点、决定基因的时间、空间特异性、,增强启动子转录活性的,DNA,序列,。发挥作用的方式通常与,方向、距离无关,。,增强子,promoter,gene,5,3,GCGAGCT,ACGT.ACG,enhancer,gene,5,3,TCG.AGCG,GCA.TGCA,发挥作用的方式通常与,方向、距离无关,。,第 二 节 真核基因组的结构与功能,Structure and Function of,Eukaryotic Genome,总体特征,1,真核生物基因组远大于原核生物,结构复杂,基因数庞大。,2,基因组中有大量低度(重复频率,10,3,)、中度(重复频率,10,5,)和高度,重复序列。,3,基因是不连续的,由外显子和内含子镶嵌排列而成。基因转录的初级产,物需经一定的加工,切除内含子使外显子拼接,才能形成成熟的,mRNA,。,4,非编码区远大于编码区。,5,基因不存在操纵子结构,功能相关基因分散在不同的染色体上,转录产,物为单顺反子。,6,真核生物基因组的化学本质为,DNA,,大多与蛋白质结合形成染色质,基,本结构单位为核小体。,(,二)单顺反子,单顺反子,(monocistron),:,即一个编码基因转录生成一个,mRNA,分子,经翻译生成一条多肽链。,(,三)重复序列,单拷贝序列(一次或数次),高度重复序列(,10,6,次),中度重复序列(,10,3,10,4,次),多拷贝序列,二、真核基因组中存在大量重复序列,C0t1/2,高度重复序列,中度重复序列,单一序列,(一)高度重复序列,1.,卫星,DNA,5-10,个,bp,,大多位于着丝粒和端粒、表达基因的间隔区、内含子。,人的卫星,DNA,可分为,I,、,II,、,III,、,IV,四种,个类型由不同的重复顺序家族构成。分子杂交研究表明,同一类型中不同家族成员之间不能进行杂交,说明卫星,DNA,具有多态性。,2.,微卫星,DNA,又称简单重复序列(,SRS,)。,6bp,为重复单位,,10-60,次拷贝串联。最常见是,2bp,串联,散在分布在基因组中,多位于编码区附近,也存在于卫星序列中及中度重复序列中。,功能:参与遗传物质结构的改变、基因调控及细胞分化等过程。,(二)中等重复序列,特征:,一般是不编码的序列,在基因调控中起重要作用,包括开启或关闭基因的活性、,DNA,复制的起始、其转录产物参与,hnRNA,的处理等;,重复单位的序列相似,不完全一样,分散在基因组中,序列的长度和拷贝数不均一;具有种属特异性。,(,1,),Alu family,哺乳动物中含量最丰富的中度重复序列家族。,重复单位中带有限制性内切酶,Alu,的酶切位点:,AGCT,TCGA,主要集中在细胞分裂晚期的,R,带,大部分属于非编码,DNA,,但也有一部分位于,mRNA,的非翻译区,甚至位于编码区内。,(,2,),Kpn I family,(,3,),Hinf family,仅次于,Alu,家族的第二大家族。,人,Kpn I,顺序长,6.4kb,,散在分布,拷贝数约为,3000-4800,个,占人体基因组的,1%,。,限制性内切酶,Hinf I,约有,50-100,个拷贝分散在基因组的不同区域。,(三)单拷贝序列,(,低度重复序列),也称为单拷贝序列。,真核生物一般为二倍体细胞,因此不重复的单一序列存在,2,个拷贝。,大多数结构基因都是单一序列。,80%,左右的,mRNA,来自单一序列,DNA,。,结构基因的突变容易引起遗传性状的改变或产生遗传性疾病。,假基因(,pseudogene,),在基因家族中,有些成员的序列于相关功能基因的序列相似,但不能被转录或转录后生成无功能的基因产物。,一个假基因常常有多个有害的突变,可能因为作为一种活性基因一旦停止,就再没有适当机制阻止进一步突变的聚积。假基因数目一般较少,往往只占基因总数的一小部分。,人,-,珠蛋白基因簇及各个功能,-,类珠蛋白基因的结构,典型的前,rRNA,基因(转录单位)结构示意图,组蛋白基因簇,三种动物中的组蛋白基因簇,黑色方框:组蛋白基因,空心方框:基因间的间隔区,箭头:基因的转录方向,假基因主要有两种类型,(,1,)由于一种基因的加倍而失活。这种类型假基因保留原来亲本基因的外显子及内含子组织并常与亲本基因密切联系,如,、,球蛋白基因簇的假基因。它们可能是由于失去起始转录信号,或外显子,内含子连接处不能剪接或翻译不能终止。,(,2,)第二种假基因仅含有亲本基因的外显子,常常拥有,3,端,polyA,尾,并随机分布于基因组中。这些假基因是源于,mRNA,,并通过逆转录而重新整合进基因组。,超基因家族,指一组由多基因家族及单基因组成的更大的基因家族。结构上有不同程度的同源性,可能起源于相同的祖先基因,但功能不相同。,例如,,免疫球蛋白超基因家族,。,Human Genome Project,研究背景,1985,年,美国能源部(,DOE,)率先提出,旨在阐明人类基因组,DNA,长达,3109,碱基对(,base pair,,,bp,)的序列。发现所有人类基因并阐明其在染色体上的位置,从而在整体上破译人类遗传信息。,1986,年美国宣布启动“人类基因组启动计划”。,1989,年,美国国家卫生研究院(,NIH,)建立国家人类基因组研究中心(,NCHGR,)。,1990,年,,NIH,和,DOE,联合提出美国人类基因组计划,正式启动,HGP,,计划于,15,年内提供,30,亿美元的资助,在,2005,年完成人类基因组全部序列的测定。,人类基因组计划,(,HGP,,,human genome project,),
展开阅读全文