生化课件第十三章-真核基因与基因组

上传人:仙*** 文档编号:241621211 上传时间:2024-07-10 格式:PPT 页数:39 大小:8.85MB
返回 下载 相关 举报
生化课件第十三章-真核基因与基因组_第1页
第1页 / 共39页
生化课件第十三章-真核基因与基因组_第2页
第2页 / 共39页
生化课件第十三章-真核基因与基因组_第3页
第3页 / 共39页
点击查看更多>>
资源描述
EukaryoticGeneandGenome刘向华刘向华南京医科大学南京医科大学 生化与分子生物学系生化与分子生物学系Nanjing medical university Department of biochemistry and molecular biology基因(基因(gene):):DNA上的功能单位,能够编码蛋白质或者上的功能单位,能够编码蛋白质或者RNA。基因组(基因组(genome):):包含了所有编码包含了所有编码RNA和蛋白质的序列和蛋白质的序列 及所有的非编码序列,也就是及所有的非编码序列,也就是DNA分子的全序列。分子的全序列。生物:生物:简单简单 复杂复杂基因组:基因组:小小 大大人类基因组计划人类基因组计划 HGP1990-2001.220亿美元亿美元第第 一一 节节 真核基因的结构与功能真核基因的结构与功能StructureandFunctionofEukaryoticGene真核生物结构基因,由若干个编码区和非编码区真核生物结构基因,由若干个编码区和非编码区互相间隔开但又连续镶嵌而成,去除非编码区再连接互相间隔开但又连续镶嵌而成,去除非编码区再连接后,可翻译出由连续氨基酸组成的完整蛋白质,这些后,可翻译出由连续氨基酸组成的完整蛋白质,这些基因称为断裂基因。基因称为断裂基因。断裂基因断裂基因(splitegene)CABD编码区编码区A、B、C、D非编码区非编码区*外显子(外显子(exon)结构基因中有表达结构基因中有表达活性的编码区活性的编码区*内含子(内含子(intron)结构基因中无表达结构基因中无表达活性的非编码区。活性的非编码区。一、真核基因的基本结构一、真核基因的基本结构真核生物和原核生物基因表达的对比真核生物和原核生物基因表达的对比电镜照片电镜照片解释图解释图鸡卵清蛋白基因中外显子和鸡卵清蛋白基因中外显子和内含子的排列顺序及大小内含子的排列顺序及大小 RNA编辑作用说明,基因的编码序列经过转录编辑作用说明,基因的编码序列经过转录后加工,是可有多用途分化的,因此也称为分后加工,是可有多用途分化的,因此也称为分化加工化加工(differentialRNAprocessing)。二、二、mRNA的编辑的编辑(mRNAediting)人类人类apoB基因基因mRNA(14500个核苷酸)个核苷酸)肝脏肝脏apoB100(分子量为(分子量为500000)肠道细胞肠道细胞apoB48(分子量为(分子量为240000)mRNA编辑编辑三、调控序列参与真核基因表达调控三、调控序列参与真核基因表达调控 顺式作用元件顺式作用元件1.启动子启动子(promotor)2.增强子增强子(enhancer)3.沉默子沉默子(silencer)顺式作用元件:顺式作用元件:启动子、增强子、沉默子启动子、增强子、沉默子1.启动子启动子真真核核基基因因启启动动子子是是RNA聚聚合合酶酶结结合合位位点点周周围围的的一一组组转转录录控控制制组组件件,至至少少包包括括一个一个转录起始点转录起始点以及一个以上的以及一个以上的功能组件功能组件。TATA盒盒-25bpRNA聚合酶结合位点聚合酶结合位点GC盒盒CAAT盒盒-70bp反式作用因子结合位点反式作用因子结合位点-25bp RNA聚合酶结合位点聚合酶结合位点 控制转录起始的精确性控制转录起始的精确性上游启动子序列上游启动子序列 (UPE)控制着转录起始的频率控制着转录起始的频率 真核基因的真核基因的顺式作用元件顺式作用元件启动子启动子结构基因结构基因顺式作用元件顺式作用元件2.增强子增强子(enhancer)指指远远离离转转录录起起始始点点、决决定定基基因因的的时时间间、空空间间特特异异性性、增增强强启启动动子子转转录录活活性性的的DNA序序列列。发挥作用的方式通常与发挥作用的方式通常与方向、距离无关方向、距离无关。TATA盒盒TF IIDRNA聚合酶聚合酶II通用转录因子通用转录因子转录方向转录方向中介子中介子活化蛋白活化蛋白活化蛋白活化蛋白增强子增强子增强子增强子DNATF IIA增强子增强子promotergene53GCGAGCTACGT.ACGenhancergene53TCG.AGCGGCA.TGCA 发挥作用的方式通常与发挥作用的方式通常与方向、距离无关方向、距离无关。SilentSilentExpressed沉默子沉默子沉默子沉默子3.沉默子沉默子(silencer)某些基因的负性调节元件,当其结合特异某些基因的负性调节元件,当其结合特异蛋白因子时,对基因转录起蛋白因子时,对基因转录起阻遏作用阻遏作用。第第 二二 节节 真核基因组的结构与功能真核基因组的结构与功能StructureandFunctionofEukaryoticGenome总体特征总体特征1真核生物基因组远大于原核生物,结构复杂,基因数庞大。真核生物基因组远大于原核生物,结构复杂,基因数庞大。2基因组中有大量低度(重复频率基因组中有大量低度(重复频率103)、中度(重复频率)、中度(重复频率105)和高度)和高度重复序列。重复序列。3基因是不连续的,由外显子和内含子镶嵌排列而成。基因转录的初级产基因是不连续的,由外显子和内含子镶嵌排列而成。基因转录的初级产物需经一定的加工,切除内含子使外显子拼接,才能形成成熟的物需经一定的加工,切除内含子使外显子拼接,才能形成成熟的mRNA。4非编码区远大于编码区。非编码区远大于编码区。5基因不存在操纵子结构,功能相关基因分散在不同的染色体上,转录产基因不存在操纵子结构,功能相关基因分散在不同的染色体上,转录产物为单顺反子。物为单顺反子。6真核生物基因组的化学本质为真核生物基因组的化学本质为DNA,大多与蛋白质结合形成染色质,基,大多与蛋白质结合形成染色质,基本结构单位为核小体。本结构单位为核小体。一、真核基因组具有独特的结一、真核基因组具有独特的结构构(一)真核基因组结构庞大一)真核基因组结构庞大哺乳类动哺乳类动物基因组物基因组DNA 约约 3 10 9 碱基对碱基对编码基因编码基因约约 有有 40000 个个,占总长的占总长的6%rDNA等重复基因等重复基因约约 占占 5%10%(二)单顺反子二)单顺反子单顺反子单顺反子(monocistron):即一个编码基因转录生即一个编码基因转录生成一个成一个mRNA分子,经翻译生成一条多肽链。分子,经翻译生成一条多肽链。(三)重复序列三)重复序列单拷贝序列(一次或数次)单拷贝序列(一次或数次)高度重复序列(高度重复序列(106次)次)中度重复序列(中度重复序列(103104次)次)多拷贝序列多拷贝序列二二、真核基因组中存在大量重复序列、真核基因组中存在大量重复序列C0t1/2高度重复序列中度重复序列单一序列(一)高度重复序列(一)高度重复序列1.卫星卫星DNA5-10个个bp,大多位于着丝粒和端粒、表达基因的间隔区、内含子。,大多位于着丝粒和端粒、表达基因的间隔区、内含子。人人的的卫卫星星DNA可可分分为为I、II、III、IV四四种种,个个类类型型由由不不同同的的重重复复顺顺序序家家族族构构成成。分分子子杂杂交交研研究究表表明明,同同一一类类型型中中不不同同家家族族成成员员之之间间不不能能进进行行杂杂交交,说明卫星说明卫星DNA具有多态性。具有多态性。2.微卫星微卫星DNA又称简单重复序列(又称简单重复序列(SRS)。)。6bp为为重重复复单单位位,10-60次次拷拷贝贝串串联联。最最常常见见是是2bp串串联联,散散在在分分布布在在基基因因组中,多位于编码区附近,也存在于卫星序列中及中度重复序列中。组中,多位于编码区附近,也存在于卫星序列中及中度重复序列中。功能:参与遗传物质结构的改变、基因调控及细胞分化等过程。功能:参与遗传物质结构的改变、基因调控及细胞分化等过程。卫星卫星DNA与微卫星与微卫星DNA的比较的比较卫星卫星DNA微卫星微卫星DNA存在部位存在部位染色体近端粒和着丝粒区染色体近端粒和着丝粒区染色体任何部位染色体任何部位重复单位长度重复单位长度6-70bp,常富含,常富含GC1-6bp重复次数重复次数几次到几百次几次到几百次10-60次次总序列长度总序列长度0.5-30kb约约200bp重复单位的差异重复单位的差异重复单位组成稍有差异,重复单位组成稍有差异,重复单位的变异性低重复单位的变异性低如单个碱基置换如单个碱基置换存在数量存在数量有限,有些染色体尚未见到有限,有些染色体尚未见到很多很多(二)中等重复序列(二)中等重复序列特征:特征:一一般般是是不不编编码码的的序序列列,在在基基因因调调控控中中起起重重要要作作用用,包包括括开开启启或或关关闭闭基基因因的的活活性性、DNA复复制制的的起起始始、其其转转录录产物参与产物参与hnRNA的处理等;的处理等;重重复复单单位位的的序序列列相相似似,不不完完全全一一样样,分分散散在在基基因因组组中,序列的长度和拷贝数不均一;具有种属特异性。中,序列的长度和拷贝数不均一;具有种属特异性。(1)Alufamily哺乳动物中含量最丰富的中度重复序列家族。哺乳动物中含量最丰富的中度重复序列家族。重复单位中带有限制性内切酶重复单位中带有限制性内切酶Alu的酶切位点:的酶切位点:AGCTTCGA主主要要集集中中在在细细胞胞分分裂裂晚晚期期的的R R带带,大大部部分分属属于于非非编编码码DNADNA,但但也也有有一一部部分分位位于于mRNAmRNA的的非非翻翻译译区区,甚甚至至位位于于编编码码区区内。内。可可能能是是由由7SRNA降降解解形形成成并并反反转转录录后后整整合合于于基基因因组组中中,从从而而在在体体外外对对许许多多启启动动子子发发挥挥正正性性或或负负性性转转录录调调节节作作用用,但但这这些些序序列列在在体体内内条条件件下下可可能能由由于于DNA甲甲基基化化和和/或或处处于于核核糖糖体体部部位位而而不不能能转转录录。Alu序序列列在在体体细细胞胞中中几几乎乎完完全全甲甲基基化而在精子中处于低甲基化状态。化而在精子中处于低甲基化状态。(2)KpnIfamily(3)Hinffamily仅次于Alu家族的第二大家族。人Kpn I顺序长6.4kb,散在分布,拷贝数约为3000-4800个,占人体基因组的1%。限制性内切酶Hinf I约有50-100个拷贝分散在基因组的不同区域。(三)单拷贝序列(三)单拷贝序列(低度重复序列)低度重复序列)也称为单拷贝序列。也称为单拷贝序列。真核生物一般为二倍体细胞,因此不重复的单一序列存真核生物一般为二倍体细胞,因此不重复的单一序列存在在2个拷贝。个拷贝。大多数结构基因都是单一序列。大多数结构基因都是单一序列。80%左右的左右的mRNA来自单一序列来自单一序列DNA。结构基因的突变容易引起遗传性状的改变或产生遗传性结构基因的突变容易引起遗传性状的改变或产生遗传性疾病。疾病。多基因家族(多基因家族(multigene family)真真核核生生物物基基因因组组中中一一组组来来源源相相同同、结结构构相相似似、功功能能相相关关的的基基因因,有有的编码蛋白质,有的编码的编码蛋白质,有的编码RNA。根据分布不同,可分为两大类:根据分布不同,可分为两大类:(1)基基因因成成簇簇地地分分布布在在一一条条染染色色体体上上,呈呈串串联联排排列列,产产生生多多个个拷拷贝贝,具有几乎相同的序列,同时发挥作用,如具有几乎相同的序列,同时发挥作用,如rRNA、tRNA、组蛋白、组蛋白等。等。(2)各各家家族族成成员员分分布布在在不不同同的的染染色色体体上上,序序列列虽虽然然不不相相同同,但但编编码码的的是一组紧密相关的蛋白,如是一组紧密相关的蛋白,如干扰素、生长激素、珠蛋白干扰素、生长激素、珠蛋白等。等。三三、真核基因组中存在大量的多基因、真核基因组中存在大量的多基因家族与假基因家族与假基因 假假基基因因(pseudogene)在基因家族中,有些成员的序列于相关功能基因的序列在基因家族中,有些成员的序列于相关功能基因的序列相似,但不能被转录或转录后生成无功能的基因产物。相似,但不能被转录或转录后生成无功能的基因产物。一一个个假假基基因因常常常常有有多多个个有有害害的的突突变变,可可能能因因为为作作为为一一种种活活性性基基因因一一旦旦停停止止,就就再再没没有有适适当当机机制制阻阻止止进进一一步步突突变变的的聚聚积积。假假基基因因数数目目一一般般较较少少,往往往往只只占占基基因因总总数数的的一一小部分。小部分。人人-珠蛋白基因簇及各个功能珠蛋白基因簇及各个功能-类珠蛋白基因的结构类珠蛋白基因的结构典型的前典型的前rRNA基因(转录单位)结构示意图基因(转录单位)结构示意图组蛋白基因簇组蛋白基因簇三种动物中的组蛋白基因簇黑色方框:组蛋白基因黑色方框:组蛋白基因 空心方框:基因间的间隔区空心方框:基因间的间隔区 箭头:基因的转录方向箭头:基因的转录方向假基因主要有两种类型假基因主要有两种类型(1)由于一种基因的加倍而失活。这种类型假基因保留原)由于一种基因的加倍而失活。这种类型假基因保留原来亲本基因的外显子及内含子组织并常与亲本基因密切联系,来亲本基因的外显子及内含子组织并常与亲本基因密切联系,如如、球蛋白基因簇的假基因。它们可能是由于失去起始球蛋白基因簇的假基因。它们可能是由于失去起始转录信号,或外显子转录信号,或外显子内含子连接处不能剪接或翻译不能终内含子连接处不能剪接或翻译不能终止。止。(2)第第二二种种假假基基因因仅仅含含有有亲亲本本基基因因的的外外显显子子,常常常常拥拥有有3端端polyA尾尾,并并随随机机分分布布于于基基因因组组中中。这这些些假假基基因因是是源源于于mRNA,并通过逆转录而重新整合进基因组。,并通过逆转录而重新整合进基因组。超基因家族超基因家族指一组由多基因家族及单基因组成的更大的基因指一组由多基因家族及单基因组成的更大的基因家族。结构上有不同程度的同源性,可能起源于家族。结构上有不同程度的同源性,可能起源于相同的祖先基因,但功能不相同。相同的祖先基因,但功能不相同。例如,例如,免疫球蛋白超基因家族免疫球蛋白超基因家族。HumanGenomeProject研究背景1985年,美国能源部(年,美国能源部(DOE)率先提出,旨在阐明人类基)率先提出,旨在阐明人类基因组因组DNA长达长达3109碱基对(碱基对(basepair,bp)的序列。)的序列。发现所有人类基因并阐明其在染色体上的位置,从而在整发现所有人类基因并阐明其在染色体上的位置,从而在整体上破译人类遗传信息。体上破译人类遗传信息。1986年美国宣布启动年美国宣布启动“人类基因组启动计划人类基因组启动计划”。1989年,美国国家卫生研究院(年,美国国家卫生研究院(NIH)建立国家人类基因)建立国家人类基因组研究中心(组研究中心(NCHGR)。1990年,年,NIH和和DOE联合提出美国人类基因组计划,正式联合提出美国人类基因组计划,正式启动启动HGP,计划于,计划于15年内提供年内提供30亿美元的资助,在亿美元的资助,在2005年完成人类基因组全部序列的测定。年完成人类基因组全部序列的测定。人类基因组计划人类基因组计划(HGP,humangenomeproject)
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!