资源描述
基因(gene):指编码RNA和蛋白质序列信息及表达这些信息所必需的全部核苷酸序列。基因组(genome):一个细胞或生物体所载的全部遗传信息。基因组学(genomics):阐明整个基因组结构与功能及基因之间相互作用。转录组学(transcriptomics):全面了解基因组的整体转录情况及调控。断裂基因(splite gene): 真核生物结构基因,由若干个编码区和非编码区互相间隔开但又连续镶嵌而成,去除非编码区再连接后,可翻译出由连续氨基酸组成的完整蛋白质。外显子(expressed region):是真核生物基因的一部分,它在剪接(Splicing)后仍会被保存下来,并出可在蛋白质生物合成过程中被表达为蛋白质。外显子是最后出现在成熟RNA中的基因序列,又称表达序列。内含子(introns):在转录后的加工中,从最初的转录产物除去的内部的核苷酸序列。启动子:指与RNA聚合酶结合的DNA序列(20-300bp),包括识别位点、结合位点和转录起始点。启动子具有方向性,一般位于上游。不同基因的启动子之间存在一定的保守性,称为一致序列或保守序列(consensus sepuence)。位于转录起始点上游,由转录因子识别和结合并决定RNA Pol结合和转录起始的核苷酸序列多数启动子位于真核细胞基因转录起点的上游(-100-200),启动子本身通常不被转录。少数启动子(如编码tRNA基因的启动子)位于转录起始点的下游,这些DNA序列可以被转录。终止子(terminator)和Poly A加尾信号( polyadenylation signal ):加尾信号为3端下游的AATAAA序列;其下游有一个反向重复序列,形成发夹结构,使转录终止;加尾信号和反向重复序列称为终止子。依赖因子的转录终止:因子:因子是由相同亚基组成的六聚体蛋白质,亚基分子量46kD。因子能结合RNA,又以对poly C的结合力最强。因子还有ATP酶活性和解螺旋酶(helicase)的活性。 目前认为,因子终止转录的作用是:与RNA转录产物结合,结合后因子和RNA聚合酶都可发生构象变化,从而使RNA聚合酶停顿,解螺旋酶的活性使DNA/RNA杂化双链拆离,利于产物从转录复合物中释放 。非依赖 Rho因子的转录终止DNA模板上靠近终止处,有些特殊的碱基序列,转录出RNA后,RNA产物形成特殊的结构来终止转录。近终止区的转录产物形成发夹(hairpin)结构是非依赖因子终止的普遍现象。 茎环结构使转录终止的机理:使RNA聚合酶变构,转录停顿;使转录复合物趋于解离,RNA产物释放。增强子(enhancer)增强真核基因启动子工作效率,决定着每一个基因在细胞内的表达水平。能够在相对于启动子的任何方向和位置(上游或者下游)上发挥这种增强作用,大部分位于上游。增强子序列距离所调控基因距离近者几十个碱基对,远的可达几千个碱基对。常与启动子有交错,有时也可位于内含子之中。不同的增强子序列结合不同的调节蛋白。沉默子:是抑制基因转录的特定DNA序列,当其结合一些反式作用因子时对基因的转录起阻遏作用,使基因沉默。绝缘子: 位于启动子与正负调控元件之间,为一种边界元件。绝缘子本身对基因的表达既没有正效应,也没有负效应,其作用是不让其他调控元件对基因的活化效应或失活效应发生作用。反应元件(response element):是启动子或增强子的上游元件,通常位于启动子附近、启动子内或增强子区域。能介导基因对细胞外的某种信号产生反应的DNA序列。基因组(genome):细胞或生物体中,一套完整单倍体的遗传物质的总和称为基因组。真核生物基因组包括一套完整单倍体DNA(染色体DNA)和线粒体DNA的全部序列某些病毒的基因组由RNA组成。基因组的大小有巨大差别:C值:单倍体基因组中的全部DNA的量。单位:bp(碱基对)不同生物基因组的结构与组织形式也明显不同:原核生物的基因组一般较小,结构比较简单;病毒基因组的大小和结构差异较大;真核生物基因组一般较庞大,但结构基因在基因组中所占的比例较小,其中编码序列更小,且存在大量重复序列(人的基因组中只有23% 的DNA序列是编码序列)。不同生物基因组的结构特点:真核基因组:一、 人类基因组贮存于染色体和线粒体中人单倍体基因组DNA约为3109bp由染色体DNA和染色体外DNA(细胞器DNA)构成细胞器DNA通常是环状DNA分子,位于核外人类基因组中90%序列可以转录编码序列:凡是可以转录出RNA的序列均属于编码序列2%的编码序列会翻译成蛋白质,其他为非编码RNA(non-coding RNA,ncRNA1.高度重复序列重复频率105,占人类基因组长度的20%1)反向重复序列(inverted repeat)两个顺序相同的拷贝在DNA链上呈反向排列,又称回文结构(palindrome)占人类基因组5%,可能与复制、转录调控有关。2) 卫星DNA(satellite DNA)存在于间隔DNA和内含子中的非编码区重复序列,具有固定的重复单位,首尾相连。2.中度重复序列重复频率为103-105,占人类基因组长度的35%1)短分散重复序列:Alu家族。Alu家族为灵长类基因组所特有,可作为天然标记长约300bp,重复30-50万次,在170bp处有个限制性内切酶AluI的酶切位点。2)长分散重复序列3.单拷贝序列/低度重复序列在单倍体基因组中只出现一次或数次,大多数蛋白质编码基因编码酶、激素、受体、结构蛋白和调节蛋白等。假基因:指与某些有功能的基因结构类似,但不能表达产物的基因,由功能基因发生突变或者cDNA插入所致。线粒体DNA:mtDNA编码的RNA和多肽有:线粒体核糖体中2种rRNA(12S及16S),22种tRNA,13种多肽。 线粒体DNA的特点:遗传物质不为核膜所包被。DNA不为蛋白质所压缩。基因组没有包含那么多非编码区域(调控区域或“内含子”)。一些密码子与通用密码子不同。一些碱基为两个不同基因的一部分:某碱基作为一个基因的末尾,同时作为下一个基因的开始。很多基因没有完整的终止密码,以T或者TA结尾。原核基因组:转位因子 转位因子(transposable element) 即可移动的基因成分(可移动基因,movable gene mob),是指能够在一个DNA分子内部或两个DNA分子之间移动的DNA片段。在细菌中指在质粒和染色体之间或在质粒和质粒之间移动的DNA片段(文献上有时形象地称其为是跳跃基因,jumping gene)。转位也是DNA重组的一种形式。(一)转位因子的种类及特征 原核生物:插入序列,转座子及可转座的噬菌体。 1.插入序列(insertion sequence,IS): 不含有其它编码蛋白质结构基因,本身没有表型效应,但会使该基因发生失活,或者极性效应。2.转座子(transposon,Tn)是一类较大的可移动成分,除转座相关基因外,尚含有其它基因,如抗药基因等。3.可转座的噬菌体(transposable phage)(1)包括Mu和D108两种噬菌体,是一类温和噬菌体。(2)感染细菌后,可以整合到细菌染色体中,插入位点是随机的(而入phage插入位点是专一的),可以插到结构基因内部,引起突变。(三)转位的遗传效应1.基因重排 可能产生1个新的蛋白分子等,基因重排是进化的动力。2.基因突变 插入到基因内部,可引起插入失活。3.插入位点引入新的基因 如引进抗药基因。病毒基因组 种类单一;单倍体基因组:每个基因组在病毒中只出现一次;形式多样;大小不一;基因重叠;动物/细菌病毒与真核/原核基因相似:内含子;具有不规则的结构基因;基因编码区无间隔:通过宿主及病毒本身酶切;无帽状结构;结构基因没有翻译起始序列。质粒DNA独立于染色体外的有自我复制能力的双链环形DNA,会赋予细胞新的表型质粒的特点:1. 分子相对较小 (在5kb左右,比较稳定,不易受物理因素的损伤,此外,较小的质粒一般有较高的拷贝数。)2. 含有高效的自主复制成分(有复制起始点,利用细菌染色体DNA复制所用的同一套酶系统,在细菌中独立地进行自我复制及转录。分为低拷贝型(严密控制型)和高拷贝型(松弛控制型)复制调控系统 分配系统 细胞分裂控制系统)3. 不相容性 利用同一复制系统的不同质粒不能稳定地和平共处,可称之为不相容质粒,当两个上述质粒被导入同一细胞时,它们在复制及随后分配到子细胞的过程中彼此竞争。最初拷贝数的微小差异,导致优势质粒占绝对上风,细菌生长几代之后,占少数的质粒将会丧失殆尽,在原始细胞的后代中可含有两种质粒中的任意一种,但不会兼而有之。4.可转移性:在自然条件下,很多质粒都可以通过一种称为细菌接合的作用转移到新宿主内。5.选择性标记;带有一个或几个可供选择的标记,便于对转化株的筛选。 抗生素抗性基因 lac Z基因编码半乳糖苷酶 X-gal X + gal 无色 蓝色产物 半乳糖 X-gal:5-溴-4-氯-3-吲哚-D-半乳糖苷6. 多个限制性内切酶单一切口(多克隆位点)便于外源基因的插入。若处于选择标记基因的内部,外源基因片断插入后会导致该基因失活便于筛选。 结构基因组学:揭示人类基因组全部DNA序列及组成比较基因组学:通过模式生物基因组之间和模式生物与人类基因组之间的比较鉴定,为预测新基因的功能和研究生物进化提供依据。功能基因组学:利用结构基因组所提供的信息,分析和鉴定基因组中所有基因的功能。遗传作图(genetic mapping):确定连锁的遗传标志位点在一条染色体上的排列顺序及它们之间的相对遗传距离,用厘摩(cM)表示 。当两个遗传标记之间的重组值为1%时为1cM。限制性片段长度多态性(RFLP)(restriction fragment length polymorphism)利用特定的限制性内切核酸酶 识别切割基因组DNA,得到大小不等的DNA片段,所产生的DNA数目和各个片段的长度实际上反映了DNA分子上不同酶切位点的分布情况。单核苷酸多态性(single nucleotide polymorphism, SNP)指在基因组水平上,由单个核苷酸变异所引起的DNA序列多态性。不再以“长度”的差异作为检测手段,而直接以序列的变异作为标记 原核生物基因组结构特点:1. 基因组通常仅由一条环状双链DNA分子组成。2. 基因组中只有1个复制起点。3. 具有操纵子结构4. 基因序列是连续的,无内含子结构。5. 编码区所占比例较大(可达到50左右)6. 基因组中的重复序列很少。7. 具有编码同工酶的基因(isogene)8. 不同的原核生物基因组中的GC含量变化很大(2575),测量基因组的GC含量可以识别细菌种类。9. 细菌基因组中存在可移动的DNA序列,包括插入序列和转座子。
展开阅读全文