基因相关名词解释

上传人:m**** 文档编号:152458682 上传时间:2022-09-15 格式:DOCX 页数:14 大小:78.33KB
返回 下载 相关 举报
基因相关名词解释_第1页
第1页 / 共14页
基因相关名词解释_第2页
第2页 / 共14页
基因相关名词解释_第3页
第3页 / 共14页
点击查看更多>>
资源描述
名词解释、生物学名称解释1. 什么是高通量测序技术?高通量测序技术(High-throughput sequencing , HTS )是对传统Sanger测序(称为一代测序技 术)革命性的改变, 一次对几十万到几百万条核酸分子进行序列测定, 因此在有些文献中称其为下一代测序 技术(next generation sequencing,NGS )足见其划时代的改变,同时高通量测序使得对一个物种的转录 组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序(Deep sequencing)。2. 什么是Sanger法测序(一代测序)?Sanger法测序利用一种DNA聚合酶来延伸结合在待定序列模板上的引物。直到掺入一种链终止核 苷酸为止。每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP), 并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP)。由于ddNTP缺乏延伸所需要的3-OH基团,使延 长的寡聚核苷酸选择性地在G、A、T或C处终止。终止点由反应中相应的双脱氧而定。每一种dNTPs和 ddNTPs的相对浓度可以调整,使反应得到一组长几百至几千碱基的链终止产物。它们具有共同的起始点, 但终止在不同的的核苷酸上,可通过高分辨率变性凝胶电泳分离大小不同的片段,凝胶处理后可用X-光胶 片放射自显影或非同位素标记进行检测。3. 什么是SNP、SNV (单核苷酸位点变异)?单核苷酸多态性(single nucleotide polymorphism,SNP)和单核苷酸位点变异(single nucleotide variants, SNV)。个体间基因组DNA序列同一位置单个核苷酸变异(替代、插入或缺失)所引 起的多态性。不同物种、个体基因组DNA序列同一位置上的单个核苷酸存在差别的现象。有这种差别的 基因座、DNA序列等可作为基因组作图的标志。人基因组上平均约每1000个核苷酸即可能出现1个单核 苷酸多态性的变化,其中有些单核苷酸多态性可能与疾病有关,但可能大多数与疾病无关。单核苷酸多态 性是研究人类家族和动植物品系遗传变异的重要依据。在研究癌症基因组变异时,相对于正常组织,癌症 中特异的单核苷酸变异是一种体细胞突变(somatic mutation ),称做SNV。4. 什么是INDEL (基因组小片段插入)?基因组上小片段(50bp )的插入或缺失,形同SNP/SNV。5什么是copy number variation (CNV):基因组拷贝数变异?基因组拷贝数变异是基因组变异的一种形式,通常使基因组中大片段的DNA形成非正常的拷贝数量。 例如人类正常染色体拷贝数是2,有些染色体区域拷贝数变成1或3,这样,该区域发生拷贝数缺失或增 加,位于该区域内的基因表达量也会受到影响。如果把一条染色体分成A-B-C-D四个区域,则 A-B-C-C-D/A-C-B-C-D/A-C-C-B-C-D/A-B-D分别发生了 C区域的扩增及缺失,扩增的位置可以是连续 扩增如A-B-C-C-D也可以是在其他位置的扩增,如A-C-B-C-D。6什么是structure variation (SV):基因组结构变异?染色体结构变异是指在染色体上发生了大片段的变异。主要包括染色体大片段的插入和缺失(引起 CNV的变化),染色体内部的某块区域发生翻转颠换,两条染色体之间发生重组(inter-chromosome trans-location )等。一般SV的展示利用Circos软件。7什么是 Segment duplication ?一般称为SD区域,串联重复是由序列相近的一些DNA片段串联组成。串联重复在人类基因多样性 的灵长类基因中发挥重要作用。在人类染色体Y和22号染色体上,有很大的SD序列。8什么是 genotype and phenotype ?既基因型与表型;一般指某些单核苷酸位点变异与表现形式间的关系。9什么是Read?高通量测序平台产生的序列标签就称为reads。10.什么是 soft-clipped reads ?当基因组发生某一段的缺失,或转录组的剪接,在测序过程中,横跨缺失位点及剪接位点的reads 回帖到基因组时,一条reads被切成两段,匹配到不同的区域,这样的reads叫做soft-clipped reads, 这些reads对于鉴定染色体结构变异及外源序列整合具有重要作用。11什么是 multi-hits reads ?由于大部分测序得到的reads较短,一个reads能够匹配到基因组多个位置,因而无法区分其真实 来源的位置。一些工具根据统计模型,如将这类reads分配给reads较多的区域。12. 什么是功能基因组学?功能基因组学(Functuionalgenomics )又往往被称为后基因组学(Postgenomics ),它利用结构 基因组所提供的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能, 使得生物学研究从对单一基因或蛋白质得研究转向多个基因或蛋白质同时进行系统的研究。这是在基因组 静态的碱基序列弄清楚之后转入对基因组动态的生物学功能学研究。研究内容包括基因功能发现、基因表 达分析及突变检测。基因的功能包括:生物学功能,如作为蛋白质激酶对特异蛋白质进行磷酸化修饰;细 胞学功能,如参与细胞间和细胞内信号传递途径;发育上功能,如参与形态建成等。采用的手段包括经典 的减法杂交,差示筛选,cDNA代表差异分析以及mRNA差异显示等,但这些技术不能对基因进行全面系 统的分析,新的技术应运而生,包括基因表达的系统分析(serial analysis of gene expression,SAGE), cDNA 微阵列(cDNA microarray),DNA 芯片(DNA chip )和序列标志片段显示(sequence tagged fragmentsdisplay)。13. 什么是比较基因组学?t匕较基因组学(ComparativeGenomi cs)是基于基因组图谱和测序基础上,对已知的基因和基因组结 构进行比较,来了解基因的功能、表达机理和物种进化的学科。利用模式生物基因组与人类基因组之间编 码顺序上和结构上的同源性,克隆人类疾病基因,揭示基因功能和疾病分子机制,阐明物种进化关系,及 基因组的内在结构。14. 什么是表观遗传学?表观遗传学是研究基因的核苷酸序列不发生改变的情况下,基因表达了可遗传的变化的一门遗传学 分支学科。表观遗传的现象很多,已知的有DNA甲基化(DNAmethylation ),基因组印记(genomicimpriting ),母体效应(maternaleffects ),基因沉默(genesilencing ),核仁显性,休眠 转座子激活和RNA编辑(RNA editing )等。15. 什么是计算生物学?计算生物学是指开发和应用数据分析及理论的方法、数学建模、计算机仿真技术等。当前,生物学 数据量和复杂性不断增长,每14个月基因研究产生的数据就会翻一番,单单依靠观察和实验已难以应付。 因此,必须依靠大规模计算模拟技术,从海量信息中提取最有用的数据。16. 什么是基因组印记?基因组印记(又称遗传印记)是指基因根据亲代的不同而有不同的表达。印记基因的存在能导致细胞中 两个等位基因的一个表达而另一个不表达。基因组印记是一正常过程,此现象在一些低等动物和植物中已 发现多年。印记的基因只占人类基因组中的少数,可能不超过5%,但在胎儿的生长和行为发育中起着至 关重要的作用。基因组印记病主要表现为过度生长、生长迟缓、智力障碍、行为异常。目前在肿瘤的研究 中认为印记缺失是引起肿瘤最常见的遗传学因素之一。17. 什么是基因组学?基因组学(英文genomics ),开究生物基因组和如何利用基因的一门学问。用于概括涉及基因作图、 测序和整个基因组功能分析的遗传学分支。该学科提供基因组信息以及相关数据系统利用,试图解决生物, 医学,和工业领域的重大问题。18. 什么是基因组注释?基因组注释(Genomeannotation)是利用生物信息学方法和工具,对基因组所有基因的生物学功能 进行高通量注释,是当前功能基因组学研究的一个热点。基因组注释的研究内容包括基因识别和基因功能注 释两个方面。基因识别的核心是确定全基因组序列中所有基因的确切位置。二、DNA测序1. 什么是基因组重测序(Genome Re-sequencing)?全基因组重测序是对基因组序列已知的个体进行基因组测序,并在个体或群体水平上进行差异性分 析的方法。随着基因组测序成本的不断降低,人类疾病的致病突变研究由外显子区域扩大到全基因组范围。 通过构建不同长度的插入片段文库和短序列、双末端测序相结合的策略进行高通量测序,实现在全基因组 水平上检测疾病关联的常见、低频、甚至是罕见的突变位点,以及结构变异等,具有重大的科研和产业价 值。2. 什么是基因组de novo测序?de novo测序也称为从头测序:其不需要任何现有的序列资料就可以对某个物种进行测序,利用生 物信息学分析手段对序列进行拼接,组装,从而获得该物种的基因组图谱。获得一个物种的全基因组序列 是加快对此物种了解的重要捷径。随着新一代测序技术的飞速发展,基因组测序所需的成本和时间较传统 技术都大大降低,大规模基因组测序渐入佳境,基因组学研究也迎来新的发展契机和革命性突破。利用新 一代高通量、高效率测序技术以及强大的生物信息分析能力,可以高效、低成本地测定并分析所有生物的 基因组序列。3. 什么是外显子测序(whole exon sequencing)?夕卜显子组测序是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序的 基因组分析方法。夕卜显子测序相对于基因组重测序成本较低,对研究已知基因的SNP、Indel等具有较大 的优势,但无法研究基因组结构变异如染色体断裂重组等。4. 什么是Chip ?什么是Chip-seq ?染色质免疫共沉淀技术(Chromatinimmunoprecipitation , ChIP )也称结合位点分析法,是研究 体内蛋白质与DNA相互作用的有力工具,通常用于转录因子结合位点或组蛋白特异性修饰位点的研究。 将ChIP与第二代测序技术相结合的ChIP-Seq技术,能够高效地在全基因组范围内检测与组蛋白、转录因 子等互作的DNA区段。ChIP-Seq的原理是:首先通过染色质免疫共沉淀技术(ChIP )特异性地富集目的蛋白结合的DNA 片段,并对其进行纯化与文库构建;然后对富集得到的DNA片段进行高通量测序。研究人员通过将获得 的数百万条序列标签精确定位到基因组上,从而获得全基因组范围内与组蛋白、转录因子等互作的DNA 区段信息。5. 什么是DNA甲基化?DNA甲基化是指在DNA甲基化转移酶的作用下,在基因组CpG二核苷酸的胞嘧啶5碳位共价键结 合一个甲基基团。正常情况下,人类基因组垃圾序列的CpG二核苷酸相对稀少,并且总是处于甲基化 状态,与之相反,人类基因组中大小为1001000 bp左右且富含CpG二核苷酸的CpG岛则总是处于未 甲基化状态,并且与56的人类基因组编码基因相关。人类基因组序列草图分析结果表明,人类基因组 CpG岛约为28890个,大部分染色体每1 Mb就有515个CpG岛,平均值为每Mb含10.5个CpG 岛,CpG岛的数目与基因密度有良好的对应关系。由于DNA甲基化与人类发育和肿瘤疾病的密切关系, 特别是 学的重要研究内容。6. 什么是Scaffold?基因组de novo测序,通过reads拼接获得Contigs后,往往还需要构建454 Paired-end库或 Illumina Mate-pair库,以获得一定大小片段(如3Kb、6Kb、10Kb、20Kb )两端的序列。基于这些序 列,可以确定一些Contig之间的丿顺序关系,这些先后顺序已知的Contigs组成Scaffold。7. 什么是 Scaffold N50?Scaffold N50与Contig N50的定义类似。Contigs拼接组装获得一些不同长度的Scaffolds。将所 有的Scaffold长度相加,能获得一个Scaffold总长度。然后将所有的Scaffolds按照从长到短进行排序, 如获得 Scaffold 1,Scaffold 2 , Scaffold 3Scaffold 25。将 Scaffold 按照这个顺序依次相加,当相加的长度达到Scaffold总长度的一半时,最后一个加上的Scaffold长度即为Scaffold N50。举例: Scaffold 1 + Scaffold 2+ Scaffold 3 +Scaffold 4 +Scaffold 5 = Scaffold 总长度*1/2 时,Scaffold 5 的 长度即为Scaffold N50。Scaffold N50可以作为基因组拼接的结果好坏的一个判断标准。8. 什么是测序深度和覆盖度?测序深度是指测序得到的总碱基数与待测基因组大小的比值。假设一个基因大小为2M,测序深度为 10X,那么获得的总数据量为20M。覆盖度是指测序获得的序列占整个基因组的比例。由于基因组中的高 GC、重复序列等复杂结构的存在,测序最终拼接组装获得的序列往往无法覆盖有所的区域,这部分没有获 得的区域就称为Gap。例如一个细菌基因组测序,覆盖度是98%,那么还有2%的序列区域是没有通过测 序获得的。9. 什么是metagenomic (宏基因组)?Magenomics研究的对象是整个微生物群落。相对于传统单个细菌研究来说,它具有众多优势,其 中很重要的两点:1. (1) 微生物通常是以群落方式共生于某一小生境中,它们的很多特性是基于整个群落环境及个体间的相互 影响的,因此做Metagenomics研究比做单个个体的研究更能发现其特性;2. (2) Metagenomics研究无需分离单个细菌,可以研究那些不能被实验室分离培养的微生物。宏基因组是基因组学一个新兴的科学研究方向。宏基因组学(又称元基因组学,环境基因组学,生 态基因组学等),是研究直接从环境样本中提取的基因组遗传物质的学科。传统的微生物研究依赖于实验 室培养,元基因组的兴起填补了无法在传统实验室中培养的微生物研究的空白。过去几年中,DNA测序技 术的进步以及测序通量和分析方法的改进使得人们得以一窥这一未知的基因组科学领域。三、RNA测序1.什么是 mRNA测序(RNA-seq)?转录组学(transcriptomics )是在基因组学后新兴的一门学科,即研究特定细胞在某一功能状态下 所能转录出来的所有RNA (包括mRNA和非编码RNA )的类型与拷贝数Illumina提供的mRNA测序 技术可在整个mRNA领域进行各种相关研究和新的发现。mRNA测序不对引物或探乍十进行设计,可自由 提供关于转录的客观和权威信息。研究人员仅需要一次试验即可快速生成完整的poly-A尾的RNA完整序 列信息,并分析基因表达、cSNP、全新的转录、全新异构体、剪接位点、等位基因特异性表达和罕见转录 等最全面的转录组信息。简单的样品制备和数据分析软件支持在所有物种中的mRNA测序研究。2. 什么是small RNA测序?Small RNA ( micro RNAs、siRNAs 和 pi RNAs )是生命活动重要的调控因子,在基因表达调控、 生物个体发育、代谢及疾病的发生等生理过程中起着重要的作用Illumina能够对细胞或者组织中的全部 Small RNA进行深度测序及定量分析等研究。实验时首先将18-30 nt范围的Small RNA从总RNA中分 离出来,两端分别加上特定接头后体外反转录做成cDNA再做进一步处理后,利用测序仪对DNA片段进 行单向末端直接测序。通过Illumina对Small RNA大规模测序分析,可以从中获得物种全基因组水平的 miRNA图谱实现包括新miRNA分子的挖掘其作用靶基因的预测和鉴定、样品间差异表达分析、miRNAs 聚类和表达谱分析等科学应用。3. 什么是miRNA测序?成熟的microRNA ( miRNA )是1724nt的单链非编码RNA分子,通过与mRNA相互作用影响 目标mRNA的稳定性及翻译,最终诱导基因沉默,调控着基因表达、细胞生长、发育等生物学过程。基于 第二代测序技术的microRNA测序,可以一次性获得数百万条microRNA序列,能够快速鉴定出不同组 纵 不同发育阶段、不同疾病状态下已知和未知的microRNA及其表达差异,为研究microRNA对细胞 进程的作用及其生物学影响提供了有力工具。4. 什么是 RIP-seq ?RNA Immunoprecipitation是研究细胞内RNA与蛋白结合情况的技术,是了解转录后调控网络动 态过程的有力工具,能帮助我们发现miRNA的调节靶点。这种技术运用针对目标蛋白的抗体把相应的 RNA-蛋白复合物沉淀下来,然后经过分离纯化就可以对结合在复合物上的RNA进行测序分析。RIP可以看成是普遍使用的染色质免疫沉淀ChIP技术的类似应用,但由于研究对象是RNA-蛋白复 合物而不是DNA-蛋白复合物,RIP实验的优化条件与ChIP实验不太相同(如复合物不需要固定,RIP反 应体系中的试剂和抗体绝对不能含有RNA酶,抗体需经RIP实验验证等等)RIP技术下游结合microarray 技术被称为RIP-Chip,帮助我们更高通量地了解癌症以及其它疾病整体水平的RNA变化。5. 什么是 CLIP-seq ?CLIP-seq,又称为HITS-CLIP,即紫外交联免疫沉淀结合高通量测序(crosslinking-immunprecipitation and high-throughput sequencing), 是一项在全基因组水平揭示RNA分子与RNA结合蛋白相互作用的革命性技术。其主要原理是基于RNA分子与RNA结合蛋白在紫外 照射下发生耦联,以RNA结合蛋白的特异性抗体将RNA-蛋白质复合体沉淀之后,回收其中的RNA片段, 经添加接头、RT-PCR等步骤,对这些分子进行高通量测序,再经生物信息学的分析和处理、总结,挖掘 出其特定规律,从而深入揭示RNA结合蛋白与RNA分子的调控作用及其对生命的意义。6. 什么是表达谱?基因表达谱(geneexpression profile):指通过构建处于某一特定状态下的细胞或组织的非偏性 cDNA文库,大规模cDNA测序,收集cDNA序列片段、定性、定量分析其mRNA群体组成,从而描绘该特 定细胞或组织在特定状态下的基因表达种类和丰度信息,这样编制成的数据表就称为基因表达谱。7. 什么是Contig ?拼接软件基于reads之间的overlap区,拼接获得的序列称为Contig (重叠群)。8. 什么是 Contig N50?Reads拼接后会获得一些不同长度的Contigs。将所有的Contig长度相加,能获得一个Contig总 长度。然后将所有的Contigs按照从长到短进行排序如获得Contig 1,Contig 2 ,Contig 3Contig25。将Contig按照这个丿顺序依次相加当相加的长度达到Contig总长度的一半时最后一个加上的Contig 长度即为 Contig N50。举例:Contig 1+Contig 2+ Contig 3+Contig 4=Contig总长度*1/2 时,Contig 4的长度即为Contig N50。Contig N50可以作为基因组拼接的结果好坏的一个判断标准。9什么是RPKM、FPKM ?RPKM,Reads Per Kilobase of exon model per Million mapped reads, is defined in thisway Mortazavi etal., 2008:每1百万个map上的reads中map至0外显子的每1K个碱基上的reads个数。假如有1百万个reads 映射到了人的基因组上,那么具体到每个外显子呢,有多少映射上了呢,而外显子的长度不一,那么每1K 个碱基上又有多少reads映射上了呢,这大概就是这个RPKM的直观解释。RKPM(exon)=109*exon_tag_count/(total_tag_count*exon_size)RPKM(gene)=109*gene_tag_count/(total_tag_count*canonical_transcript_size)如果对应特定基因的话,那么就是每1000000 mapped到该基因上的reads中每kb有多少是 mapped到该基因上的exon的read。映射到外显子上总的reads个数。这个是映射到某个区域上的reads个数,这个区域或者是已知注 释的基因或者跨两个外显子的边界或者是某个基因已经注释的转录本的内含子、外显子。对于真核生物来 说,外显子和它们自己内部的关系由某类型的mRNA来注释。外显子的长度:计算时,计算所有某个基因已注释的所有外显子长度的总和。即使某个基因以多种注 释的转录本呈现,这个外显子在求和时只被包含一次。即使部分重叠的外显子共享相同的区域,重叠的外 显子以其总长来计算。举例:比如对应到该基因的read有1000个,总reads个数有100万,而该基因的外显子总长为 5kb,那么它的RPKM为:10人9*1000(reads个数)/10人6(总reads个数)*5000(外显子长度)=200或者: 1000(reads个数)/1(百万)*5(K)=200这个值反映基因的表达水平。FPKM(fragments per kilobase of exon per million fragments mapped). FPKM 与 RPKM 计算 方法基本一致。不同点就是FPKM计算的是fragments,而RPKM计算的是reads。Fragment比read 的含义更广,因此FPKM包含的意义也更广,可以是pair-end的一个fragment,也可以是一个read。10. 什么是转录本重构?用测序的数据组装成转录本。有两种组装方式:1, de-novo构建;2,有参考基因组重构。其中 de-novo组装是指在不依赖参考基因组的情况下,将有overlap的reads连接成一个更长的序列,经过不 断的延伸,拼成一个个的contig及scaffold。常用工具包括velvet , trans-ABYSS , Trinity等。有参考 基因组重构,是指先将read贴回到基因组上,然后在基因组通过reads覆盖度,junction位点的信息等 得到转录本,常用工具包括scripture、cufflinks。11. 什么是 genefusion?将基因组位置不同的两个基因中的一部分或全部整合到一起,形成新的基因,称作融合基因,或嵌合体基因。该基因有可能翻译出融合或嵌合体蛋白。四、rsnp分析1. 等位基因特异 PCR等位基因特异PCR(Allele-specific PCR , AS-PCR)其基本原理是:根据SNP位点设计特异引物,其 中一条链(特异链)的3末端与SNP位点的碱基互补(或相同),另一条链(普通链)按常规方法进行设计,因 此,AS-PCR技术是一种基于SNP的PCR标记。因为特异引物在一种基因型中有扩增产物,在另一种基 因型中没有扩增产物,用凝胶电泳就能够很容易地分辨出扩增产物的有无,从而确定基因型的SNP。AS-PCR技术的基本原理如图1:等位基因1(Allele1)和等位基因2(Allele2)除SNP(T-C)位点外其他 序列完全相同,弓I物P1、P2分别为根据等位基因1的SNP位点(T)和等位基因2的SNP位点(C)设计的 特异引物(图1A)。以基因型l(Genotypel)为模板,分别用引物P1和P2进行扩增,因为P1特异链的3 末端刚好与基因型1的SNP 位点T互补,所以能够产生扩增产物,P2特异链的3末端与基因型1的SNP 位点T不互补,所以没有扩增产物,因此基因型1是纯合型T/T ;同样基因型2(Genotype2)是纯合型C / C以基因型3(Genotype3)是杂合型T / C(图1B)。根据凝胶电泳中有无带型就可以确定基因型的SNP(图 1C)。AAlicia IAlkie 2.丁Htienoiype 1(icnfltype 2Genotype 3ri4A乂Jrr1AAGAGIIIIII卩K prcidncllnoduciprodmillPCR 卩rndLiciPCEt pmdLLitR product图1.AS-PCR技术的原理2.变性的高效液相色谱(DHPLC)变性的高效液相色谱法(denaturing high performance liquid chromatography, DHPLC),是一项 在SSCP和DGGE基础上发展起来的检测SNP的突变技术。DHPLC亦称为温度调节的杂合双链分析(TMHA),具有半自动化、快速、检出率高等特点,是一种 新的高通量、自动化筛查SNPs的有效方法。通过PCR扩增出包含多态性位点的片段,由带正电荷的流动 相将带负电荷的DNA分子吸附到固定相上。在加热部分变性的条件下,若原先只有一种DNA,则只形成 同源双链分子;若是2种DNA,哪怕只是1个碱基的错配,也会形成2种同源双链分子和2种异源杂合 双链分子。而存在同源和异源双链是DHPLC进行色谱分离的重要前提利用发生错配的异源杂合双链DNA 与完全匹配的同源双链DNA解链特征(melting pelting)的差异,用离子对反向高效液相色谱法将它们分 离开来并检测异源双链。在相同的部分变性条件下,错配的异源双链DNA因有错配区的存在而更易变性, 被色谱柱保留时伺(retention time)短于同源双链DNA。在乙腈(acetonitrile)浓度梯度增加时,与固定相 亲和力较弱的异源双链将先于同源双链被洗脱出来,从而发现DNA的突变,据此可用于检测反相柱 (reverse-phasecolumns)中单个碱基置换、插入或缺失杂合二倍体的片段。这一技术1995年由Oefner 建立,现已有商业化的检测仪器,称为WAVE DNA片段分析系统,将其用于基因序列的比较、人类基因 多态性的系统研究。实验步骤:1. 1.PCR反应(同前)2. 2.PCR产物经琼脂糖凝胶电泳确认。3. 3缓慢变性:95弋变性5分钟,然后以0.03/S速率缓慢复性至25弋,使杂合子形成异源双链。4. 4确定熔解温度:根据温度预测软件对DNA片段进行序列分析,确定熔解温度。5. 5取10pl缓慢变性PCR产物上样,分析流出峰峰形。3. DGGE& TGGEDGGE(denaturing gradient gel electrophoresis),即变性梯度凝胶电泳,是根据DNA在不同浓 度的变性剂中解链行为的不同而导致电泳迁移率发生变化,从而将片段大小相同而碱基组成不同的DNA 片段分开。温度梯度凝胶电泳(temperature gradient gel electrophoresis ,TGGE)与DGGE非常类似, 是通过温度梯度使DNA解链从而区分不同碱基组成的DNA片段。TGGE/DGGE具体原理是:如果DNA双链分子全长不断增加温度或用化学变性剂处理,两条链就 会开始分开(解链)。首先解链的区域由解链温度较低的碱基组成。 G.C 碱基对比 A.T 碱基对结合得要 牢固,因此 G. C 含量高的区域具有较高的解链温度。同时影响解链温度的因素还有相邻碱基间的吸引力 (称作堆积)。解链温度低的区域,通常位于端部称作低温解链区(lower melting domain )。如 果端部分开,那么双螺旋就由未解链部分束在一起,这一区域便称作高温解链区( high melting domain ( 图 2) 。如果温度或变性剂浓度继续升高,两条链就会完全分开。变性梯度凝胶电泳法依据首要的一点 是: DNA 双链末端一旦解链,其在凝胶中的电泳速度将会极剧下降(图3 )。第二个根据是,如果某一 区域首先解链,而与其仅有一个碱基之差的另一条链就会有不同的解链温度,因此,将样品加入含有变性 剂梯度的凝胶进行电泳就可将二者分开。最终,如果一双链在其低温解链区碱基错配(异源双链),而与 另一等同的双链相比差别仅在于此,那么,含有错配碱基的双链将在低得多的变性剂浓度下解链。事实上,样品通常含有突变、正常的同源双链以及配对的异源双链,后者是在 PCR 扩增加时产行的。而含有错配 的双链通常可以远远地与两个同源双链分开,这种分离效果使该方法灵敏度很高。II11仗h melting I ow mel ido infill图 2.高温解链区和低温解链区图 3.不同构象 DNA 片段的电泳迁移速度4. CRS-PCR-RLFP 法DNA 序列是由 ATCG 四种碱基按一定顺序组成的核苷酸序列,特定的核苷酸序列构成了限制性酶切 位点。当单个碱基发生突变时,可能引起限制性内切酶酶切位点的改变,经过酶切反应、电泳,可以很直 观的进行基因分型。获得目的基因或序列后,对其进行序列分析,看其是否含有限制性内切酶酶切位点。如果有我们感 兴趣的酶切位点,可以直接采用RFLP的方法,观察基因分型。但并不是所有的目的序列都含有酶切位点, 或原有的限制性内切酶价格比较昂贵。随着科研的需要,科研工作者发明了改进的RFLP方法 CRS-PCR-RFLP。CRS-PCR-RFLP ( created restriction site PCR):是从 PCR-RFLP 衍生出来的目前较为廉价的检 测基因多态性的方法。它在靠近引物3末端引入错配位点以和已知的SNP位点形成限制性内切酶酶切位 点,从而可以通过RFLP来检测样本基因型。注意事项:1. CRS-PCR产物酶切后,不同等位基因间片段的长度差异只有一个弓I物的长度(20-25bp ),如果扩增的片 段较大,将给基因型的判断带来很大不便,因此应用CRS-PCR时,扩增的长度应该在100bp以内为好。2. 2.CRS弓|物选择的余地较小,只能利用多态性位点的近旁序列,当临近多态性位点的正向序列不适合作为 引物序列时,可选择其反向序列作为引物,反之亦然。3. 3当引物3序列与模版出现G-A、G-G或C-C的碱基错配时,PCR的扩增效率会受到显著影响,有可能 引起引物无法延伸。4. 4.3末端错配碱基较多(超过3个时),将严重影响PCR的扩增效率。5. 5.设计引物时,应考虑限制性内切酶的价格等。6. 6.设计引物网址:http:/helix.wustl.edu/dcaps/dcaps.html5. SSCP 法DNA分子通常以双链形式存在,在高温变性的情况下,双链分子解成单链。单链DNA片段呈复杂 的空间折叠构象,这种立体结构主要是由其内部碱基配对等分子内相互作用力来维持的,当有一个碱基发 生改变时,会或多或少地影响其空间构象,使构象发生改变。空间构想有差异的单链DNA分子在聚丙烯 酰胺凝胶中受排阻大小不同。因此,通过非变性聚丙烯酰胺凝胶电泳(PAGE ),可以非常敏锐地将构象上 有差异的分子分离开。这种方法被称为单链构象多态性(single - strand conformational polymorphism, SSCP)。在随后的研究中,SSCP又用于检查PCR扩增产物的基因突变,从而建立了 PCR-SSCP技术,进一 步提高了检测突变方法的简便性和灵敏性。其基本过程是PCR扩增靶DNA ;将特异的PCR扩增产物 变性,而后快速复性,使之成为具有一定空间结构的单链DNA分子;将适量的单链DNA进行非变性聚 丙烯酰胺凝胶电泳;最后通过放射性自显影、银染或溴化乙锭显色分析结果。若发现单链DNA带迁移 率与正常对照的相比发生改变,就可以判定该链构象发生改变,进而推断该DNA片段中有碱基突变。SSCP的灵敏性依赖于SNP对折叠的影响和折叠如何影响目的序列的电泳迁移率。相同长度的DNA 单链其顺序不同,甚至单个碱基不同,所形成的构象不同,电泳迁移率也不同。注意事项:1. 1.重复性:影响SSCP重复性的主要因素为电泳的电压和温度。这两个条件保持不变,SSCP图谱可保持 良好的重复性。一般SSCP图谱是二条单链DNA带,但有时有的DNA片段可能只呈现一条ssDNA带, 或者三条以上,这主要是由于两条单链DNA之间存在相似的立体构象。有时三条以上的SSCP图谱是由 于野型DNA片段和突变型DNA片段共同存在的结果。2. 2.靶DNA序列长度的影响:在实验中发现SSCP对短链DNA或RNA的点突变检出率要比长链的高,这 可能是由于长链DNA和RNA分子中单个碱基的改变在维持立体构象中起的作用较小的缘故。而有人认为 在DNA链较短的(400bP以下)情况下,DNA的长度不会影响SSCP的效果。3. 3.电泳电压和温度的影响为了使单链DNA保持一定的稳定立体构象SSCP应在较低温度下进行(一般4弋 -15弋之间)。在电泳过程中除环境温度外,电压过高也是引起温度升高的主要原因,因此,在没有冷却装 置的电泳槽上进行SSCP时,开始的5min应用较高的电压(250V),以后用100V左右电压进行电泳。这 主要是由于开始的高电压可以使不同立体构象的单链DNA初步分离,而凝胶的温度不会升高。随后的低 电压电泳可以使之进一步分离。在实验中应根据具体实验条件确定电泳电压。4. 4.DNA片段中点突变的位对SSCP的影响:点突变在DNA和RNA中的位置对SSCP检测率的影响, 取决于该位置对维持立体构象作用的大小,而不是仅仅取决于点突变在DNA链上的位置(有人认为点突变 在DNA链中部要比在近端部容易被SSCP检测出来)。White曾设计了一组样品DNA片段,并将其中的 点突变设在DNA链的中部,而且该点又正处在发夹结构顶端的环上,结果发现SSCP只能检测出9个样 品中的2个(检出率为22%),说明DNA链中任何部位的突变,只要对其单链立体构象没有影响,都有可 能被漏检。5. 5.SSCP的结果断定:由于在SSCP分析中非变性PAG电泳不是根据单链DNA分子和带电量的大小来分 离的,而是以单链DNA片段空间构象的立体位阻大小来实现分离的,因此,这种分离不能反映出分子量 的大小。有时正常链与突变链的迁移率很接近,很难看出两者之间的差别。因此一般要求电泳长度在16-18cm 以上,以检测限为指标来判定结果。检测限是指突变DNA片段与正常DNA片段可分辨的电泳距离差的最小值。大于检测限则判定链的 迁移率有改变,说明该DNA序列有变化,小于检测限则说明链之间无变化。例如,一般检测限定为3mm , 那么当两带间距离在3mm以上,则说明两链之间有改变。另夕卜检测限不能定的太低,否则主观因素太大, 易造成假阳性结果。另外,SSCP分析中其它条件,如PCR产物的上样量,PAG的交联度、以及胶的浓 度等,都应根据具体实验进行选择确定。总之,SSCP分析法是一种快速、简便、灵敏的突变检测方法,适 合临床实验室的要求。它可以检测各种点突变,短核苷酸序列的缺失或插入。随着SSCP分析不断完善, 它将成为基因诊断研究的一个有力工具。
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑环境 > 建筑资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!