资源描述
第二章第二章 第一节基因与基因组第一节基因与基因组 1、基因概念的历史演变基因概念的历史演变2、割裂基因割裂基因3、重叠基因重叠基因4、基因和基因组大小基因和基因组大小5、真核生物真核生物DNA序列组织序列组织6、细胞器基因组细胞器基因组7、基因鉴定基因鉴定8、人类基因组计划人类基因组计划第一节第一节 基因概念的历史演变基因概念的历史演变1.早期关于遗传物质的臆测早期关于遗传物质的臆测2.基因的前奏基因的前奏遗传因子遗传因子3.遗传的染色体学说遗传的染色体学说4.“基因基因”一词的创立一词的创立5.基因存在的证实基因存在的证实6.基因化学本质以及功能的认识基因化学本质以及功能的认识7.近代基因的概念近代基因的概念1 早期关于遗传物质的臆测早期关于遗传物质的臆测n1864年英国哲学家斯宾塞年英国哲学家斯宾塞“生理单位生理单位”;n1868年达尔文将其称为年达尔文将其称为“微芽微芽”;n1883年德国生物学家魏斯曼称之为年德国生物学家魏斯曼称之为“种质种质”n1884年瑞士植物学家冯内格列年瑞士植物学家冯内格列“异胞质异胞质”;n1889年荷兰学者德弗里斯称为年荷兰学者德弗里斯称为“泛生子泛生子”;2 基因的前奏基因的前奏遗传因子遗传因子 1865 1865年年 Mendel,n两个基本遗传规律两个基本遗传规律分离分离规律和自由组合规律,并提规律和自由组合规律,并提出了出了“遗传因子遗传因子”的观点。的观点。n指出遗传因子是一种物质,指出遗传因子是一种物质,它控制着生物的性状。它控制着生物的性状。3 遗传的染色体学说遗传的染色体学说n1903年,萨顿和鲍威尔年,萨顿和鲍威尔n遗传的染色体学说遗传的染色体学说n认为孟德尔的认为孟德尔的“遗传因子遗传因子”与配子形成以与配子形成以及受精过程中的染色体传递行为具有平行及受精过程中的染色体传递行为具有平行性,且孟德尔的遗传因子位于染色体上,性,且孟德尔的遗传因子位于染色体上,n第一次把遗传物质和染色体联系起来。第一次把遗传物质和染色体联系起来。4“基因基因”一词的创立一词的创立:n1909年,丹麦遗传学家约翰逊年,丹麦遗传学家约翰逊。n替代替代 Mendel早年所提出的遗传因子早年所提出的遗传因子(genetic factor)一词,并创立了基因一词,并创立了基因型型(genotype)和表现型和表现型(phenotype)的概念。的概念。5 基因存在的证实基因存在的证实n1926年年 美国美国 摩尔根基因论出版摩尔根基因论出版n认为基因是组成染色体的遗传单位,并且认为基因是组成染色体的遗传单位,并且证明基因在染色体上占有一定位置,而且证明基因在染色体上占有一定位置,而且呈线性排列。呈线性排列。n提出提出“功能、交换、突变功能、交换、突变”三位一体的基三位一体的基因概念。因概念。6 基因化学本质以及功能的认识基因化学本质以及功能的认识 n“一个基因一种酶一个基因一种酶”和和“一个基因一条一个基因一条多肽链多肽链”n基因的化学本质是基因的化学本质是DNA(有时是有时是RNA)n基因顺反子的概念基因顺反子的概念n基因是一段有功能的基因是一段有功能的DNA序列序列 6.1 从从“一个基因一个酶一个基因一个酶”到到“一个基因一条多肽一个基因一条多肽链链”n1941年年 G W Beadle 和和 E L Tatum n一个基因一个酶一个基因一个酶:红色链孢霉各种营养缺陷突红色链孢霉各种营养缺陷突变体与酶缺陷相关变体与酶缺陷相关-基因对性状的控制是基因对性状的控制是通过基因控制酶的合成来实现的通过基因控制酶的合成来实现的。n本世纪本世纪50年代,年代,Yanofskyn一个基因一条多肽链:一个基因一条多肽链:有些蛋白质不只由一种有些蛋白质不只由一种肽链组成,如血红蛋白和胰岛素,不同肽链由肽链组成,如血红蛋白和胰岛素,不同肽链由不同基因编码。不同基因编码。Beadle Tatum 6.2 DNA是遗传物质(有时是有时是RNA)n1944年,年,Avery Avery 证实了证实了DNA是遗传物是遗传物质。质。n有些病毒只含有有些病毒只含有RNA。6.3 基因顺反子(基因顺反子(Cistron)的概念)的概念n1955年,美国本兹尔年,美国本兹尔(Benzer)提出提出顺反子顺反子的概念:的概念:n是指编码一个蛋白质的全部组成所需信息的最短片是指编码一个蛋白质的全部组成所需信息的最短片段,即一个基因。段,即一个基因。n基因仅是一个基因仅是一个功能单位功能单位,基因内部的碱基对才是,基因内部的碱基对才是重重组单位和突变单位组单位和突变单位。n一对同源染色体上两突变(一对同源染色体上两突变(a和和b)在同一染色体上)在同一染色体上时,时,称为称为顺式构型顺式构型,n两突变(两突变(a和和b)在两条染色体上时,)在两条染色体上时,为为反式构型反式构型;n顺反互补测验顺反互补测验(cis-trans test):比较顺式和反):比较顺式和反式构型个体的表型来判断两个突变是否发生在一个式构型个体的表型来判断两个突变是否发生在一个基因(顺反子)内的测验。基因(顺反子)内的测验。n测验时测验时:两突变发生在同一基因上,杂合体就两突变发生在同一基因上,杂合体就不存在野生型的基因,因而为突变体表型;不存在野生型的基因,因而为突变体表型;n如果两突变在两个不同的基因上,后代杂合体如果两突变在两个不同的基因上,后代杂合体中将有一个基因是野生型的,另外一个基因是中将有一个基因是野生型的,另外一个基因是突变型,杂合体的表型成了野生型。这两个基突变型,杂合体的表型成了野生型。这两个基因的这种关系称为因的这种关系称为互补互补。基因内突变位点突变位点在同一基在同一基因上因上突变位点突变位点在不同的在不同的基因上基因上基因上;的基因上;6.4 6.4 基因是一段有功能的基因是一段有功能的DNADNA序列序列 DNA DNA双螺旋模型双螺旋模型 1953 1953年年 Watson Watson和和CrickCrick提出提出 遗传中心法则遗传中心法则 1957 1957年年 Crick Crick提出提出 顺反互补试验顺反互补试验 1955 1955年年 Benzer Benzer提出:顺反子提出:顺反子 三联遗传密码的破译三联遗传密码的破译 Nirenberg Nirenberg等等 1961-67 1961-67年:年:70 70年代:可移动基因的证实、隔裂基因和重叠年代:可移动基因的证实、隔裂基因和重叠 基因的发现等。基因的发现等。7 7 近代基因的概念近代基因的概念:基因是一段有功能的基因是一段有功能的DNADNA序列,序列,基因是遗传的功能单位,基因是遗传的功能单位,DNA分子中分子中不同排不同排列顺序列顺序的的DNA片段构成特定的功能单位;片段构成特定的功能单位;可转录、可翻译的(可转录、可翻译的(结构基因结构基因:能够编码多肽能够编码多肽链的基因链的基因)可转录但不翻译可转录但不翻译(tDNA,rDNA)不转录、不翻译不转录、不翻译(调控基因调控基因:调控调控邻近的结构基因邻近的结构基因的表达,如:的表达,如:启动基因,操纵基因启动基因,操纵基因)基因的类型基因的类型不是所有的基因都能为蛋白质编码不是所有的基因都能为蛋白质编码基因的新概念基因的新概念n断裂基因断裂基因n重叠基因重叠基因n跳跃基因跳跃基因n等等第三章第三章 基因与基因组基因与基因组 第一节第一节 基因概念的历史演变基因概念的历史演变第二节第二节 真核生物的割裂基因真核生物的割裂基因第三节第三节 重叠基因重叠基因第四节第四节 基因和基因组大小基因和基因组大小第五节第五节 真核生物真核生物DNA序列组织序列组织第六节第六节 细胞器基因组细胞器基因组第七节第七节 基因鉴定基因鉴定第八节第八节 人类基因组计划人类基因组计划 1 割裂基因(割裂基因(splitting gene)不连续基因不连续基因 断裂基因断裂基因n发现:发现:1977 美美Sharp&Roberts 同时同时发现了发现了断裂基因断裂基因n 法法 Chambon 失机失机n通过成熟通过成熟mRNA(或(或cDNA)与编码基因与编码基因的的DNA杂交杂交试验而发现。试验而发现。Richard J.Roberts Phillip A.Sharp Nobel Prize 1993杂交(hybridization)n杂交:杂交:亲缘关系很近亲缘关系很近的不同来源的的不同来源的DNA单单链或链或RNA单链与单链与DNA单链之间通过碱基互单链之间通过碱基互补形成杂交分子的过补形成杂交分子的过程。程。图核酸杂交及其应用示意图图核酸杂交及其应用示意图1 杂化双链杂化双链.突变体的鉴别突变体的鉴别I 变性、复性和杂交变性、复性和杂交.分子探针标记分子探针标记n 法法 Chambon 失机失机 鸡的输卵管分泌卵清蛋白、卵粘蛋白和鸡的输卵管分泌卵清蛋白、卵粘蛋白和伴清蛋白,而其红细胞(鸟类的红细胞伴清蛋白,而其红细胞(鸟类的红细胞上有核的)只合成血红蛋白,那么两种上有核的)只合成血红蛋白,那么两种组织之间组织之间DNA有什么不同呢?有什么不同呢?n southern杂交杂交 b bp p E.colia 9200 E.colib 2350 E.colic 1750 E.colid 1250 红细胞 输卵管 图10-38鸡卵清蛋白cDNA探针和红细胞及 输卵管DNA Southern杂交的结果 EcoR1 HindIII Berget,Sharp小组和小组和Roberts小组用小组用R环法环法鸡卵清蛋白基鸡卵清蛋白基因因DNA与其与其mRNA杂交图杂交图n割裂基因:割裂基因:基因的编码序列在基因的编码序列在DNA上不是连续上不是连续的,而是被不编码的序列隔开。的,而是被不编码的序列隔开。n外显子外显子Exon:基因中编码的序列,与:基因中编码的序列,与mRNA的序列相对应。的序列相对应。n内含子内含子Intron:基因中不编码的序列。:基因中不编码的序列。Precursor mRNA(pre-mRNA)Heterogeneous nuclear RNA(HnRNA)真核生物基因的转录物又称为真核生物基因的转录物又称为 所以真核生物基因又称为所以真核生物基因又称为 Splitting gene Interrupted gene间隔基因,断裂基因间隔基因,断裂基因前体前体mRNA,核内不均一核内不均一 RNA由于真核生物的绝大多数结构基因都含有内含子由于真核生物的绝大多数结构基因都含有内含子剪接剪接:前体前体RNA中由内含子转录下来的序列去除,并中由内含子转录下来的序列去除,并把由外显子转录的把由外显子转录的RNA序列连接起来的过程。序列连接起来的过程。割裂基因割裂基因前体前体mRNAIntrons 去除去除Exons 连接连接剪接剪接2 割裂基因割裂基因的分布的分布a)a)真核生物中:真核生物中:绝大部分结构基因绝大部分结构基因 tDNA,rDNAtDNA,rDNA mtDNA,cpDNAmtDNA,cpDNAb)b)原核生物中:原核生物中:SV40 SV40 大大T T 抗原抗原gene gene 小小t t 抗原抗原 gene gene T4 T4 噬菌体的胸苷合成酶噬菌体的胸苷合成酶 gene gene1017 bp intron 1017 bp intron Splitting gene Splitting gene 并非真核生物所特有并非真核生物所特有c)并非真核生物所有的结构基因均为并非真核生物所有的结构基因均为splitting genesplitting gene 不是不是splitting splitting genegene组蛋白基因家族组蛋白基因家族 干扰素干扰素酵母酵母中多数基因中多数基因成熟酶成熟酶合成受合成受 intron II intron II 的调控的调控 a)IntronIntron 并非并非“含而不露含而不露”酵母酵母细胞色素细胞色素b b基因基因 Intron II Intron II 编码成熟酶编码成熟酶3 割裂基因割裂基因概念的相对性概念的相对性 b)ExonExon 并非并非“表里如表里如一一”人类尿激酶原基因人类尿激酶原基因 Exon I I 不编码不编码 氨基酸序列氨基酸序列4 割裂基因的性质:割裂基因的性质:1)外显子在基因中的排列顺序和它在成熟)外显子在基因中的排列顺序和它在成熟mRNA产物中的排列顺序是相同的,产物中的排列顺序是相同的,2)某种割裂基因在所有组织中都有)某种割裂基因在所有组织中都有相同的内含子相同的内含子成分,成分,3)核基因的内含子的可读框)核基因的内含子的可读框通常通常含无义含无义密码子,没有编码功能。密码子,没有编码功能。4)通常内含子上发生的突变不能影响蛋)通常内含子上发生的突变不能影响蛋白质的结构,其突变对生物体没有影响;白质的结构,其突变对生物体没有影响;但也有例外。但也有例外。第三章第三章 基因与基因组基因与基因组 第一节第一节 基因概念的历史演变基因概念的历史演变第二节第二节 真核生物的割裂基因真核生物的割裂基因第三节第三节 重叠基因重叠基因第四节第四节 基因和基因组大小基因和基因组大小第五节第五节 真核生物真核生物DNA序列组织序列组织第六节第六节 细胞器基因组细胞器基因组第七节第七节 基因鉴定基因鉴定第八节第八节 人类基因组计划人类基因组计划1 1 重叠基因重叠基因1.1 1.1 重叠基因的概念重叠基因的概念 重叠基因重叠基因:是指两个或两个以上的基因共有:是指两个或两个以上的基因共有 一段一段DNADNA序列。序列。1.2 1.2 重叠基因的发现重叠基因的发现:19781978年,年,SangerSanger,Feir X174DNAX174DNA全长:全长:53865386核苷酸核苷酸 编码的编码的9 9种蛋白全长:种蛋白全长:20002000个氨基酸;个氨基酸;3X2000=6000 3X2000=6000核苷酸核苷酸n噬菌体噬菌体G4、MS2和和SV40中都发现了重叠基因中都发现了重叠基因 原核生物的重叠基因原核生物的重叠基因 1.3 基因重叠的方式基因重叠的方式 1)大基因内包含小基因大基因内包含小基因:如:如:B基因包含在基因包含在A基因内,基因内,E基因完全包含在基因完全包含在D基因内。基因内。2)前后两基因首尾重叠:前后两基因首尾重叠:例例1:如:基因如:基因D 终止终止 X174DNA序列:序列:5TAATG3 重叠一个碱基重叠一个碱基 基因基因J 起始起始 例例2:如:基因如:基因A 终止终止 X174DNA序列序列 5ATGA3 重叠重叠4个碱基个碱基 基因基因C 起始起始n根据密码子的起始位置,一个根据密码子的起始位置,一个DNA顺序可能有顺序可能有3种种阅读框阅读框n例如,序列例如,序列ATTCGATCGCAACAA A ATT CGA TCGA TTC GAT CGC AAAT TCG ATC GCA(1)(3)(2)n但只有一种具有编码的作用,称为但只有一种具有编码的作用,称为开放阅读框开放阅读框(open reading frame,ORF)。)。n开放阅读框:开放阅读框:基因序列的一部分,包含一段可以基因序列的一部分,包含一段可以编码蛋白的碱基序列,不能被终止子打断。编码蛋白的碱基序列,不能被终止子打断。n果蝇蛹上皮蛋白质基因果蝇蛹上皮蛋白质基因位于另一个基因的内含子之中位于另一个基因的内含子之中 n人人I型神经纤维瘤型神经纤维瘤(NF1)基因基因的第一个内含子中有三个编的第一个内含子中有三个编码蛋白质的基因,码蛋白质的基因,其转录方向与其转录方向与NF1的相反。的相反。n线虫基因组中每个基因平均有线虫基因组中每个基因平均有5个内含子,有的内含子个内含子,有的内含子中包含中包含tRNA基因,其转录方向不一定与基因,其转录方向不一定与包含它的基因包含它的基因的转录方向一致。的转录方向一致。n可见,两个重叠基因的转录是各自独立、互不依赖可见,两个重叠基因的转录是各自独立、互不依赖。2 真核生物的重叠基因真核生物的重叠基因真核生物的重叠基因真核生物的重叠基因第三章第三章 基因与基因组基因与基因组 第一节第一节 基因概念的历史演变基因概念的历史演变第二节第二节 真核生物的割裂基因真核生物的割裂基因第三节第三节 重叠基因重叠基因第四节第四节 基因和基因组大小基因和基因组大小第五节第五节 真核生物真核生物DNA序列组织序列组织第六节第六节 细胞器基因组细胞器基因组第七节第七节 基因鉴定基因鉴定第八节第八节 人类基因组计划人类基因组计划1.1 取决于它所包含的内含子的长度取决于它所包含的内含子的长度n例如:例如:31Kb的的二氢叶酸还原酶基因二氢叶酸还原酶基因含含6个外显个外显子,子,mRNA长度为长度为2Kb,内含子长,内含子长29Kb,内含,内含子比外显子大很多。子比外显子大很多。n在进化相关的相似组织的基因,其外显子基本在进化相关的相似组织的基因,其外显子基本一致,内含子的位置也是保守的,只是长度有一致,内含子的位置也是保守的,只是长度有变化。变化。n如小鼠的如小鼠的a-珠蛋白基因长度珠蛋白基因长度850bp,b-珠蛋白珠蛋白1382bp,两个的,两个的mRNA却大小差不多。却大小差不多。1 基因的大小基因的大小1.2 取决于所包含的内含子的数目取决于所包含的内含子的数目n不同生物的外显子数目随着进化增加,不同生物的外显子数目随着进化增加,基因平均长度也在增加。基因平均长度也在增加。n基因组(基因组(genome):指一个物种单倍体的染色:指一个物种单倍体的染色体所携带的一整套基因。体所携带的一整套基因。2 基因组:基因组:例:人类与例:人类与E.coli编码基因数目的比较编码基因数目的比较 E.coli.4.2 X 106bp 编码约编码约3000种基因种基因 人类人类 3.3 X 109 bp 大肠杆菌的大肠杆菌的700多倍多倍 有上百万个基因?有上百万个基因?根据不同细胞中的根据不同细胞中的 mRNA数目估算表达基因数目估算表达基因 人类编码基因约为人类编码基因约为3-4 万个万个 约为大肠杆菌的约为大肠杆菌的30倍,那么倍,那么90以上的以上的DNA功能何在?功能何在?果蝇基因组的基因果蝇基因组的基因 与预期的编码蛋白质的基因的数量相比,基因组的与预期的编码蛋白质的基因的数量相比,基因组的DNADNA含量过多含量过多真核生物与原核生物基因组的比较:真核生物与原核生物基因组的比较:1)真核生物基因分布在多个染色体上,而原核生物只一个染)真核生物基因分布在多个染色体上,而原核生物只一个染色体。色体。2)真核生物在基因组转录后的绝大部分前体)真核生物在基因组转录后的绝大部分前体RNA必须经过剪必须经过剪接过程才能形成成熟的接过程才能形成成熟的mRNA,而原核生物的基因几乎不,而原核生物的基因几乎不需要转录后加工。需要转录后加工。3)真核生物细胞中)真核生物细胞中DNA与组蛋白和大量非组蛋白结合,并有与组蛋白和大量非组蛋白结合,并有核膜将其与细胞质隔离,结果真核细胞的转录和翻译在时核膜将其与细胞质隔离,结果真核细胞的转录和翻译在时间上和空间上都是分离的,而原核细胞的基因转录和翻译间上和空间上都是分离的,而原核细胞的基因转录和翻译是同步的。是同步的。4)真核生物的基因是不连续的,中间存在不被翻译的内含子)真核生物的基因是不连续的,中间存在不被翻译的内含子序列,而原核生物几乎每一个基因都是完整的连续的序列,而原核生物几乎每一个基因都是完整的连续的DNA片段。片段。3 基因组大小和基因组大小和C值值nC值值(C Value):在每一种生物中其单倍体基在每一种生物中其单倍体基因组的因组的DNA总量是特异的。总量是特异的。nDNA的长度是根据碱基对的多少推算出来的。的长度是根据碱基对的多少推算出来的。nC值是每种生物的一个特征,不同生物之间差值是每种生物的一个特征,不同生物之间差别很大别很大显花植物鸟类哺乳类爬行类两栖类骨鱼类软骨鱼类棘皮类甲壳类昆虫类软体动物蠕虫类酶菌藻类真菌革兰氏阳性菌革兰氏阴性菌枝原体 106 107 108 109 1010 1011图 10-37 不同门类生物的 C 值分布(仿 B.Lewin:GENES,1997,Fig 21.1)低等真核生物中与形态学复杂程度相关,但低等真核生物中与形态学复杂程度相关,但高等真核生物中变化很大高等真核生物中变化很大n生物体进化程度高低与生物体进化程度高低与C值值不成明显线性相关不成明显线性相关n亲缘关系相近的生物亲缘关系相近的生物C值相值相差较大。差较大。n高等生物的高等生物的C值不一定就意值不一定就意味着它的味着它的C值高于比它低等值高于比它低等的生物。的生物。nC值矛盾值矛盾/C值悖论:值悖论:C值和值和生物结构或组成的复杂性不生物结构或组成的复杂性不一致的现象。一致的现象。nC值变化范围宽意味着在某值变化范围宽意味着在某些生物中有些生物中有DNA是不编码的。是不编码的。显 花 植 物鸟 类哺 乳 类爬 行 类两 栖 类骨 鱼 类软 骨 鱼 类棘 皮 类甲 壳 类昆 虫 类软 体 动 物蠕 虫 类酶 菌藻 类真 菌革 兰 氏 阳 性 菌革 兰 氏 阴 性 菌枝 原 体 106 107 108 109 1010 1011图10-37 不 同 门 类 生 物 的C值 分 布(仿B.Lewin:GENES ,1997,Fig 21.1)某些生物的基因组数据 物种 基因组大小 基因数目 基因长度 X174 0.7kb 10噬菌体 45Kb 100大肠杆菌 4.2Mb 4200 1.2kb酿酒酵母 13.5Mb 6300 1.4kb果蝇 14 Mb 12000 11.3kb人 3.3Gb 35000 16.3kb拟南芥 70Gb 250004 基因组的基因数目基因组的基因数目第三章第三章 基因与基因组基因与基因组 第一节第一节 基因概念的历史演变基因概念的历史演变第二节第二节 真核生物的割裂基因真核生物的割裂基因第三节第三节 重叠基因重叠基因第四节第四节 基因和基因组大小基因和基因组大小第五节第五节 真核生物真核生物DNA序列组织序列组织第六节第六节 细胞器基因组细胞器基因组第七节第七节 基因鉴定基因鉴定第八节第八节 人类基因组计划人类基因组计划1 DNA的复性动力学的复性动力学2 重复序列重复序列3 真核生物的真核生物的DNA序列序列第五节第五节 真核生物真核生物DNA序列组织序列组织nDNA复性过程遵循二级反应动力学复性过程遵循二级反应动力学nDNA复性过程中单链消失的速度用公式表示:复性过程中单链消失的速度用公式表示:-dC/dt=kC21 DNA的复性动力学的复性动力学其中,其中,C是单位时间的单链是单位时间的单链DNA的浓度的浓度K复性速度常数复性速度常数DNA复性的影响因素:复性的影响因素:nDNA序列的复杂性、初始浓度、片段大小、温度、序列的复杂性、初始浓度、片段大小、温度、离子强度离子强度1 DNA的复性动力学的复性动力学2 重复序列重复序列3 真核生物的真核生物的DNA序列序列第五节第五节 真核生物真核生物DNA序列组织序列组织2 重复序列重复序列(repetitive sequences)根据复性动力学研究将真核生物根据复性动力学研究将真核生物DNA序列归类:序列归类:p 单拷贝序列单拷贝序列p 轻度重复序列轻度重复序列p 中度重复序列中度重复序列p 高度重复序列高度重复序列n1)单拷贝序列)单拷贝序列(single copy sequences)n 又称非重复序列:又称非重复序列:n一个基因组中只有一个拷贝。一个基因组中只有一个拷贝。n慢复性速度慢复性速度n单一序列的复性曲线常只有一个拐点,而重复序单一序列的复性曲线常只有一个拐点,而重复序列常有多个拐点。列常有多个拐点。n 结构基因结构基因(蛋白质基因蛋白质基因)大多是单拷贝序列。大多是单拷贝序列。大部分结构基因大部分结构基因位于非重复的位于非重复的DNA序列内序列内2)轻度重复序列)轻度重复序列(light repetitive sequences)n在基因组中重复数在基因组中重复数2-10的重复顺序,的重复顺序,n为慢复性速度。为慢复性速度。n少数在基因组中成串排列在一个区域,大多数少数在基因组中成串排列在一个区域,大多数与单拷贝基因间隔排列。与单拷贝基因间隔排列。n多为多为编码功能的序列编码功能的序列3)中度重复序列)中度重复序列(moderate repetitive sequences)n基因组中重复数十至数万(基因组中重复数十至数万(105)次的重复顺序,)次的重复顺序,n复性速度快于单拷贝顺序,慢于高度重复顺序。复性速度快于单拷贝顺序,慢于高度重复顺序。n多与单拷贝基因间隔排列。多与单拷贝基因间隔排列。n多为非编码序列多为非编码序列,如,如Alu序列序列n也有编码基因也有编码基因产物的,如产物的,如rDNA、tDNA、组蛋白、组蛋白基因基因家族家族,一般往往以基因家族的形式组织。一般往往以基因家族的形式组织。rDNA gene familyrDNA gene family海胆海胆450copies烟草烟草750 copies果蝇果蝇100 copiesHistone gene familyHistone gene family 组蛋白基因家族组蛋白基因家族TS:可转录的间隔序列可转录的间隔序列NTS:不转录的间隔序列不转录的间隔序列 NTS NTS TS 18s TS 5.8s TS 28s TS 图10.29 非洲爪蟾rRNA基因的串联重复排列 TS:可转录的间隔(spacer)顺序 NTS:不可转录的间隔顺序 NTSNTS H1 H4 H2B H3 H2A海胆(R)6000bp海胆(S)6540bp海胆(L)7240bp H1 H3 H4 H2A H2B果蝇 4800bp H1 H3 H2B H2A H4蝾螈 9000bp 图 10-31 组蛋白基因簇的重复单位 图例:基因;间隔区;转录方向 真核生物的真核生物的 Alu familyAlu family300,000 copies 广泛分布于非重复序列间广泛分布于非重复序列间300bp300bp300bp6000bp6000bp6000bp6000bp4)高度重复序列)高度重复序列(highly repetitive sequences)n在基因组中重复频率高,可达百万在基因组中重复频率高,可达百万(106)以上,以上,n复性速度很快。复性速度很快。n序列一般较短,长序列一般较短,长10-300bp,n如真核生物的如真核生物的卫星卫星DNA。卫星 DNA序列螃蟹螃蟹2ATATAT.果蝇果蝇5ATAATATAAT.老鼠老鼠9GAAAAATGAGAAAAATGA重复碱基数重复碱基数 序列序列 不同生物的非重复基因占基因组的比例差不同生物的非重复基因占基因组的比例差别很大;别很大;原核生物无重复序列原核生物无重复序列 低等真核生物低等真核生物 10-20%repetitive sequence 高等植物高等植物 80%高等动物高等动物 50%、1 DNA的复性动力学的复性动力学2 重复序列重复序列3 真核生物的真核生物的DNA序列序列3.1真核生物的单一序列真核生物的单一序列3.2 真核生物的重复序列真核生物的重复序列第五节第五节 真核生物真核生物DNA序列组织序列组织3.1 真核生物的单一序列真核生物的单一序列n单拷贝顺序在基因组占单拷贝顺序在基因组占50-80,n平均长度为平均长度为13000bpn单拷贝顺序储存了巨大的遗传信息。单拷贝顺序储存了巨大的遗传信息。n只有一小部分单拷贝序列编码蛋白质。只有一小部分单拷贝序列编码蛋白质。3.2 真核生物的重复序列真核生物的重复序列n基因家族基因家族(有编码功能有编码功能)n基因外的重复基因外的重复DNA序列序列(无编码功能无编码功能)3.2.1 基因家族基因家族1)基因家族(基因家族(gene family):真核生物基因组中来:真核生物基因组中来源相同,结构和功能相关的基因聚集在一起形成源相同,结构和功能相关的基因聚集在一起形成基因家族。基因家族。根据分布形式分根据分布形式分基因簇和散布的基因家族:基因簇和散布的基因家族:A 基因簇(基因簇(gene cluster)n基因家族的各个成员基因家族的各个成员紧密成簇排列紧密成簇排列成大段的成大段的串联串联重复重复单位,分布在某一条染色体的特殊区域;单位,分布在某一条染色体的特殊区域;n它们可同时发挥作用,合成某些蛋白质。它们可同时发挥作用,合成某些蛋白质。n如如 组蛋白基因家族聚集在第组蛋白基因家族聚集在第7号染色体长臂号染色体长臂3区内。区内。Histone gene familyHistone gene family 组蛋白基因家族组蛋白基因家族n假基因(假基因(pseudo gene):):具有与功能基因具有与功能基因相似的序列,但由于有许多突变以致失去相似的序列,但由于有许多突变以致失去了原有的功能,所以假基因是没有功能的了原有的功能,所以假基因是没有功能的基因,用基因,用表示。表示。n来源:来源:一般认为是由一般认为是由mRNA反转录成反转录成cDNA,然后整合在基因组中,然后整合在基因组中,n假基因不含内含子。假基因不含内含子。2 1 G A 图 10-30 人 类 血 红 蛋 白 的 和 基 因 簇 B 散布的基因家族(散布的基因家族(interspersed gene family)n概念:概念:一个基因家族的不同成员成簇地一个基因家族的不同成员成簇地分布不同染色体上,各成员在序列上有分布不同染色体上,各成员在序列上有明显差异。明显差异。n这些不同成员编码一组这些不同成员编码一组功能上紧密相关功能上紧密相关的蛋白质,如的蛋白质,如珠蛋白基因家族。珠蛋白基因家族。两种亚基的编码基因分别形成两个不同的基两种亚基的编码基因分别形成两个不同的基因簇,并存在于不同的染色体上因簇,并存在于不同的染色体上.人类珠蛋白基因家族典型的人类珠蛋白基因家族典型的血红蛋白血红蛋白珠蛋白珠蛋白血红素血红素 2 2 2 2 不同的亚基由各自不同的亚基由各自 的基因编码的基因编码 2 1 G A 图 10-30 人 类 血 红 蛋 白 的 和 基 因 簇 2)广义的基因家族广义的基因家族 根据基因家族成员序列的相似程度分类:根据基因家族成员序列的相似程度分类:A 经典的基因家族经典的基因家族,家族成员序列有高度的同源性,家族成员序列有高度的同源性,序列一致,拷贝数高,非转录间隔区短而一致。序列一致,拷贝数高,非转录间隔区短而一致。B 基因家族各成员的编码产物保守(基因家族各成员的编码产物保守(大段的高度保大段的高度保守守氨基酸序列);只是氨基酸序列);只是DNA序列的相似性低。序列的相似性低。C 基因家族各成员的编码产物之间只有基因家族各成员的编码产物之间只有很短的保守氨很短的保守氨基酸基酸序列,序列,DNA序列的相似性更低。序列的相似性更低。D 超基因家族超基因家族,各基因序列之间,各基因序列之间无同源性无同源性,但其基,但其基因产物的功能相似。编码产物之间也无明显的保因产物的功能相似。编码产物之间也无明显的保守氨基酸序列,但也有一些共同特征。守氨基酸序列,但也有一些共同特征。1 DNA的复性动力学的复性动力学2 重复序列重复序列3 真核生物的真核生物的DNA序列序列3.1真核生物的单一序列真核生物的单一序列3.2 真核生物的重复序列真核生物的重复序列3.2.1 基因家族基因家族(有编码功能有编码功能)3.2.2 基因外的重复基因外的重复DNA序列序列(无编码功能无编码功能)第五节第五节 真核生物真核生物DNA序列组织序列组织3.3.2 基因外的重复序列基因外的重复序列n即为无编码功能的重复序列即为无编码功能的重复序列1)串联重复串联重复DNA-卫星卫星DNA(高度重复序列高度重复序列)2)散布的重复散布的重复DNA1)卫星卫星DNA(satellite DNA)特点:特点:n高度重复序列高度重复序列,n重复单位由重复单位由2-10bp组成,组成,n成串排列,成串排列,重复数以百万次重复数以百万次 106。卫星 DNA序列螃蟹螃蟹2ATATAT.果蝇果蝇5ATAATATAAT.老鼠老鼠9GAAAAATGAGAAAAATGA重复碱基数重复碱基数 序列序列 卫星卫星DNA:这类高度重复序列的碱基组成不同与其他部这类高度重复序列的碱基组成不同与其他部分,浮力密度也不同,用等密度梯度离心法分,浮力密度也不同,用等密度梯度离心法可将其与主体可将其与主体DNA分开分开。等密度梯度离心法等密度梯度离心法 浮力密度浮力密度 卫星卫星DNA的分类的分类(1)卫星卫星DNA:长串联重复序列,位于染色体上的异长串联重复序列,位于染色体上的异染色区域。染色区域。(2)小卫星小卫星DNA重复序列重复序列(minisatellite):中等大小的:中等大小的串联重复序列,位于染色体末端,或其他部位。串联重复序列,位于染色体末端,或其他部位。n 高变小卫星高变小卫星DNA:重复单位之间的序列差异大,但重复单位之间的序列差异大,但是有一个核心序列是有一个核心序列GGGCAGGAXG,近端粒部位;近端粒部位;n 端粒端粒DNA:主要有六个串联重复单位组成主要有六个串联重复单位组成 TTAGGG卫星卫星DNA的分类的分类(3)微卫星微卫星(microsatellite,MS)或为简短串联重复或为简短串联重复(STR,short tandem repeats):n由更简单的重复单位组成的小序列,一般为由更简单的重复单位组成的小序列,一般为26个碱基重复,如个碱基重复,如(CA)n,(GT)n,(CAG)n等,等,(CA)n最为常见。最为常见。n在染色体在染色体DNA中散在分布,中散在分布,n其数量可达五到十万其数量可达五到十万,n是目前最有用的遗传标记。是目前最有用的遗传标记。3.3.2 基因外的重复序列基因外的重复序列n即为无编码功能的重复序列即为无编码功能的重复序列1)串联重复串联重复DNA-卫星卫星DNA(高度重复序列高度重复序列)2)散布的重复散布的重复DNA2)散布的重复散布的重复DNA重复单位不成簇重复单位不成簇,分散在染色体的各个位点上。,分散在染色体的各个位点上。A 短分散片段短分散片段B 长分散片段长分散片段A 短分散片段(短分散片段(short interspersed repeated segments,SINES)特点:特点:n长度约为长度约为300bp,n与长度约与长度约1000bp的单拷贝顺序间隔排列。的单拷贝顺序间隔排列。n拷贝数可达拷贝数可达10万左右。万左右。n如人的如人的Alu家族。家族。有有Alu酶切位点(酶切位点(AG/CT)而得名。)而得名。Alu家族:家族:重复单位约重复单位约300bp,由两个,由两个130bp重复序列及重复序列及31bp间隔序列组成;重复间隔序列组成;重复30-50万万次,分散存在;灵长类特有。次,分散存在;灵长类特有。约占人基因组约占人基因组的的3-6。n功能:功能:n可能参与可能参与hnRNA的加工与成熟。的加工与成熟。n与遗传重组及染色体不稳定性有关。与遗传重组及染色体不稳定性有关。n有形成有形成Z-DNA的能力。的能力。n可能具有转录调节作用。可能具有转录调节作用。还有许多其它家族如:还有许多其它家族如:nKpn家族、家族、nHinf家族、家族、n多聚多聚d-d家族等。家族等。B 长分散片段(长分散片段(long interspersed repeated segments,LINES)n重复顺序的长度大于重复顺序的长度大于1000bp,平均长度为,平均长度为3500-5000bp,n与平均长度为与平均长度为13000bp(个别长几万(个别长几万bp)的单)的单拷贝顺序间隔排列。拷贝顺序间隔排列。n在基因组中的比例随不同种属差异大,为在基因组中的比例随不同种属差异大,为10-40。,内含子、启动子,内含子、启动子第六节第六节 细胞器基因组细胞器基因组1 真核细胞中的线粒体和叶绿体基因组真核细胞中的线粒体和叶绿体基因组n大多数细胞器大多数细胞器DNA是是闭合环状闭合环状的。的。n通常在一个细胞中有许多细胞器,每一个细胞器通常在一个细胞中有许多细胞器,每一个细胞器中有其基因组的许多拷贝。中有其基因组的许多拷贝。1)线粒体的基因组线粒体的基因组mtDNA:n脯乳动物的脯乳动物的mtDNA为为16.5Kbn为核为核DNA的的1%。2)叶绿体的基因组)叶绿体的基因组cpDNAn植物的植物的cpDNA是动物的是动物的8-9倍倍n一般为一般为121-155Kb;2 细胞器的蛋白合成系统细胞器的蛋白合成系统n细胞器基因组只编码其中的一部分蛋白质,其余细胞器基因组只编码其中的一部分蛋白质,其余所需的蛋白质和酶均由核基因编码。所需的蛋白质和酶均由核基因编码。n线粒体和叶绿体基因表达所需要的线粒体和叶绿体基因表达所需要的RNA均由自身均由自身提供提供(tRNA和和rRNA)。n而而RNA聚合酶、氨酰聚合酶、氨酰tRNA合成酶和核糖体蛋合成酶和核糖体蛋白均由核基因编码。白均由核基因编码。n还有一些基因在某些生物中是自我合成的,在别还有一些基因在某些生物中是自我合成的,在别的生物中由核基因组编码,如的生物中由核基因组编码,如ATP合成酶基因;合成酶基因;END9、静夜四无邻,荒居旧业贫。22.8.1222.8.12Friday,August 12,202210、雨中黄叶树,灯下白头人。23:27:2423:27:2423:278/12/2022 11:27:24 PM11、以我独沈久,愧君相见频。22.8.1223:27:2423:27Aug-2212-Aug-2212、故人江海别,几度隔山川。23:27:2423:27:2423:27Friday,August 12,202213、乍见翻疑梦,相悲各问年。22.8.1222.8.1223:27:2423:27:24August 12,202214、他乡生白发,旧国见青山。2022年8月12日星期五下午11时27分24秒23:27:2422.8.1215、比不了得就不比,得不到的就不要。2022年8月下午11时27分22.8.1223:27August 12,202216、行动出成果,工作出财富。2022年8月12日星期五23时27分24秒23:27:2412 August 202217、做前,能够环视四周;做时,你只能或者最好沿着以脚为起点的射线向前。下午11时27分24秒下午11时27分23:27:2422.8.129、没有失败,只有暂时停止成功!。22.8.1222.8.12Friday,August 12,202210、很多事情努力了未必有结果,但是不努力却什么改变也没有。23:27:2423:27:2423:278/12/2022 11:27:24 PM11、成功就是日复一日那一点点小小努力的积累。22.8.1223:27:2423:27Aug-2212-Aug-2212、世间成事,不求其绝对圆满,留一份不足,可得无限完美。23:27:2423:27:2423:27Friday,August 12,202213、不知香积寺,数里入云峰。22.8.1222.8.1223:27:2423:27:24August 12,202214、意志坚强的人能把世界放在手中像泥块一样任意揉捏。2022年8月12日星期五下午11时27分24秒23:27:2422.8.1215、楚塞三湘接,荆门九派通。2022年8月下午11时27分22.8.1223:27August 12,202216、少年十五二十时,步行夺得胡马骑。2022年8月12日星期五23时27分24秒23:27:2412 August 202217、空山新雨后,天气晚来秋。下午11时27分24秒下午11时27分23:27:2422.8.129、杨柳散和风,青山澹吾虑。22.8.1222.8.12Friday,August 12,202210、阅读一切好书如同和过去最杰出的人谈话。23:27:2423:27:2423:278/12/2022 11:27:24 PM11、越是没有本领的就越加自命不凡。22.8.1223:27:2423:27Aug-2212-Aug-2212、越是无能的人,越喜欢挑剔别人的错儿。23:27:2423:27:2423:27Friday,August 12,202213、知人者智,自知者明。胜人者有力,自胜者强。22.8.1222.8.1223:27:2423:27:24August 12,202214、意志坚强的人能把世界放在手中像泥块一样任意揉捏。2022年8月12日星期五下午11时27分24秒23:27:2422.8.1215、最具挑战性的挑战莫过于提升自我。2022年8月下午11时27分22.8.1223:27August 12,202216、业余生活要有意义,不要越轨。2022年8月12日星期五23时27分24秒23:27:2412 August 202217、一个人即使已登上顶峰,也仍要自强不息。下午11时27分24秒下午11时27分23:27:2422.8.12MOMODA POWERPOINTLorem ipsum dolor sit amet,consectetur adipiscing elit.Fusce id urna blandit,eleifend nulla ac,fringilla purus.Nulla iaculis tempor felis ut cursus.感 谢 您 的 下 载 观 看感 谢 您 的 下 载 观 看专家告诉
展开阅读全文