外显子组测序课件

上传人:txadgkn****dgknqu... 文档编号:241924535 上传时间:2024-08-05 格式:PPT 页数:31 大小:1.66MB
返回 下载 相关 举报
外显子组测序课件_第1页
第1页 / 共31页
外显子组测序课件_第2页
第2页 / 共31页
外显子组测序课件_第3页
第3页 / 共31页
点击查看更多>>
资源描述
外显子组测序外显子组测序1外显子组测序1目录一、外一、外显子子测序序简介介二、二、测序深度序深度三、三、测序平台序平台四、数据分析流程四、数据分析流程五、数据分析内容五、数据分析内容六、后期六、后期验证2目录一、外显子测序简介二、测序深度三、测序平台四、数据分 外显子测序(也称目标外显子组捕获)是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序的基因组分析方法。是一种选择基因组的编码序列的高效策略,外显子测序相对于基因组重测序成本较低,对研究已知基因的SNP、Indel等具有较大的优势。在人类基因中大约有180,000外显子,占人类基因组的1%,约30MB。Ng S B,Turner E H,Robertson P D,et al.Targeted capture and massively parallel sequencing of 12 human exomesJ.Nature,2009,461(7261):272276.人类基因组的蛋白编码区域大约包含85%的致病突变。Choi M,Scholl U I,Ji W,et al.Genetic diagnosis by whole exome capture and massively parallel DNA sequencingJ.Proceedings of the National Academy of Sciences,2009,106(45):1909619101.一、外一、外显子子测序序简介介3外显子测序(也称目标外显子组捕获)是指利用序列捕获技The sensitivity to detect heterozygous variants with 10 reads is 78.6%,but increases to 95.2%at 20 x and approximately 100%at 30 x and greater.1The average coverage of each base in the targeted regions was 100fold,and 95.3%of these bases were covered sufficiently deeply for variant calling(10 coverage)2Exome sequencing produced a higher level of coverage for the targeted sequences(mean,167.50),slightly increasing our ability to detect mutations with VAFs of less than 10%.31.Choi M,Scholl U I,Ji W,et al.Genetic diagnosis by whole exome capture and massively parallel DNA sequencingJ.Proceedings of the National Academy of Sciences,2009,106(45):1909619101.2.Yan X J,Xu J,Gu Z H,et al.Exome sequencing identifies somatic mutations of DNA methyltransferase gene DNMT3A in acute monocytic leukemiaJ.Nature genetics,2011,43(4):309315.3.Platforms A.Genomic and Epigenomic Landscapes of Adult De Novo Acute Myeloid LeukemiaJ.N Engl J Med,2013,2013(368):20592074.二、二、测序深度序深度4ThesensitivitytodetectheteCoveragerateSequencing depth and coverage of the nine paired initial sequencing samples.5CoveragerateSequencingdepth三、三、测序平台序平台Ion ProtonIllumina HiSeq6三、测序平台IonProtonIlluminaHiSe基于IonProton的外显子测序流程7基于IonProton的外显子测序流程7The bound DNA is isolated using streptavidincoated Dynabeads paramagnetic beads,and then amplified and purified.The purified,targetenriched sample is then returned to the Ion Torrent system workflow for emulsion PCR,enrichment,and sequencing.Exome sequencing results on the Ion Proton System using the Ion PI Chip and the Ion TargetSeq Exome Kit8TheboundDNAisisolatedusinRawreadsReadsmappedPercentreadsmappedReadsontargetPercentreadsontarget89,782,719 87,156,36497.1%68,899,95779.1%MeandepthofcoverageTargetbasesat1xTargetbasesat10 xTargetbasesat20 x119x98.5%95.3%92.5%TypeNumberofvariantsConcordancewithdbSNP135SNVs30,09598.0%HeterozygousSNVs 18,03197.1%HomozygousSNVs12,04699.4%基于IonProton的外显子测序结果9RawreadsReadsmappedPercent基于IlluminaHiSeq的外显子测序流程10基于IlluminaHiSeq的外显子测序流程10DNA样本要求(单次):总量:6gDNA;浓度:37.5ng/L;纯度:OD260/280=1.8-2.0。(来自华大基因)DNA样本要求(单次):总量:200-300bp小片段PE文库5g;浓度:50ng/L;纯度:OD260/280=1.8-2.0。(来自美吉生物)DNA样本要求(单次):总量:50g;浓度:100ng/L;纯度:OD260/280=1.8-2.0。(来自派森诺生物)基因组DNA样本要求11DNA样本要求(单次):基因组DNA样本要求11外显子捕获平台12外显子捕获平台12Highly uniform coverage across 62 Mb of exomic sequence,including 5UTR,3 UTR,microRNA,and other noncoding RNA.Streamlined protocol for preenrichment pooling of up to six samples dramatically reduces handson time and cost.Optimized for use with the TruSeq DNA Sample Preparation Kit,providing a gelfree protocol that requires the lowest DNA input.Automationfriendly with mastermixed reagents and platebased processing for up to 96 reactions.TruSeq Exome Enrichment Kit13HighlyuniformcoverageacrossTruSeq Exome Enrichment Workflow14TruSeqExomeEnrichmentWorkfl烈冰生物外显子测序数据分析思路15烈冰生物外显子测序数据分析思路15四四、数据分析流程、数据分析流程16四、数据分析流程161.数据下机文件:*.fastq2.序列QC去除低质量reads,和连续的低质量片段,去掉接头序列。QC统计reads数量及测序质量。3.Mapping由于bwa能准确、快速的将短序列比对到基因组上,而且软件持续更新和说明文档完备,是外显子捕获测序的首选。4.Sam到bam转换:Samtools的多种工具可以将sam文件转换为bam文件,rmdup工具能去除PCR扩增产生的冗余reads,消除由于文库扩增而导入的突变,降低假阳性。Flagstat统计reads的mapping情况以及比较去除duplicate前后reads数目的反映样品建库的冗余情况。Picard提供的多个工具,修改bam文件,使之适合于后续的GATK软件包中的工具的处理。171.数据下机文件:*.fastq175.Indel区域的reads重新做局部多序列比对:在indel的边缘,一些错配看起来很像是SNP,通过对dbSNP库及bam文件检测到的indel附近的reads进行局部的重新比对,可以消除indel周边的假阳性SNP。6.碱基质量重新打分:测序仪给reads中的碱基的qual值存在一定的偏差,通过经验的错误模型来重新计算的碱基的qual值,重新给reads的各个碱基的qual打分。7.Call snv和indel:对处理好的多样品bam文件同时运行UnifiedGenotyper,大大提高call SNP的灵敏度和准确性,多样品同时比较的结果,方便了后续的样品间差异的筛选。8.突变位点的重新打分:通过hapmap,omni,dbsnp数据库中已知的突变位点建模优化,对各个突变位点重新打分,筛选。大大降低了假阳性率。9.注释:通过ANNOVAR软件对vcf结果注释,关联到多个数据库。185.Indel区域的reads重新做局部多序列比对:在i1.Mapping1.Mapping统计:统计:统计总reads数,mapped reads及unique mapped reads数目及百分比。2.2.捕获效率统计:捕获效率统计:统计来自捕获区域的统计来自捕获区域的FragmentFragment比例:比例:五五、数据分析内容、数据分析内容191.Mapping统计:统计总reads数,mappe统计统计target区域所有的碱基覆盖次数分布:区域所有的碱基覆盖次数分布:对每个对每个target区域的覆盖和深度统计:区域的覆盖和深度统计:如果客户对某些基因特别感兴趣,想要看看来自这些基因的外显子区域的覆盖情况,可以提供每个target或者特定target区域的覆盖情况和测序深度统计。20统计target区域所有的碱基覆盖次数分布:对每个targe3.Snv和和indel关联数据库:关联数据库:Snv和indel结果按照突变的位点是否在捕获的区域之内分成两部分:*_target.snv:突变处于捕获的靶区域(targetregion)内。*_off_target.snv或者*_target.indel:突变在捕获的靶区域之外。Snv和indel结果与以下的数据库关联,为突变的筛选提供大量的信息。213.Snv和indel关联数据库:211)基因注释:)基因注释:通过基因注释可以达到以下的目的:a.突变的功能定位(在外显子,内含子,剪接位点还是基因间区);b.突变所在的基因名称或者临近的基因;c.突变如果在编码区域,是否引起氨基酸的改变(同义突变,非同义突变的呢过);d.如果引起氨基酸的改变,按照HGVS命名规则表示-改变的基因ID,转录本ID,外显子编号,以及氨基酸改变,如OD2:NM_022162:exon8:c.G2722C:p.G908R。默认使用refSeq完成基因注释,如果有特殊的要求,可以使用UCSCknowngene,Ensembl,GENCODE,CCDS等基因注释系统。221)基因注释:通过基因注释可以达到以下的目的:22232324242)1000G注释:注释:检测突变位点是否在1000GenomesProjects(2012release)数据库中检测到,如果检测到,显示等位基因频率(allelefrequency)。默认是使用所有人种的数据库,如果有特定要求,可以按照要求展示不同人种(比如AMR,AFR,ASN,EUR,中国人,日本人)等位基因频率。3)dbSNP注释:注释:检测突变是否在dbSNP数据库中,如果在,显示rsID。默认使用dbSNP135数据库,如果有特定的要求,可以使用dbSNP129,dbSNP130,dbSNP131,dbSNP132数据库。4)AVSIFT:SIFT是一款很受欢迎的检测非同义突变位点重要性的软件,对应非同义突变位点,会给定一个打分,若打分低于0.05,则表明突变很可能会影响到蛋白质的功能。252)1000G注释:检测突变位点是否在1000Gen5)与与UCSC的数据库的关联:的数据库的关联:ftp:/hgdownload.cse.ucsc.edu/goldenPath/hg19/database/.txt.gz,提供了大量的基因组注释信息,目前关联的数据库有:tfbsConsSites:在人/小鼠/大鼠中保守的转录因子结合位点,以transfacMatrixDatabase(v7.0)为基础。wgRna:snoRNAandmiRNA注释。targetScanS:TargetScan预测的miRNA把区域。gwasCatalog:已经发表的各种疾病的GWAS结果。genomicSuperDups:基因组中的重复片段。phastConsElements46way:通过phastCons对脊椎动物的全基因组比对生成的保守区域,根据用于比对的物种数目,分为17way,28way,30way,44way等。默认使用46way。如果客户需要关联UCSC中其它的数据库,也可以定制。6)cosmic63:已观察到的癌症相关突变,显示在COSMIC中的ID(identifiers),观察到的次数,以及观察到的癌组织。265)与UCSC的数据库的关联:ftp:/hgdown4.CNV:XHMM是一款外显子捕获拷贝数变异检测的优秀软件包,使用GATK和XHMM能够得到较好的外显子捕获的CNV结果。5.其它:其它:Polyphen-2(PolymorphismPhenotypingv2)也是一款基于多序列比对和蛋白质3D结构,预测氨基酸替换(从一种氨基酸改变为另一种氨基酸)对蛋白质结构和功能影响的软件,如果客户有要求,可以提供Polyphen-2对snv结果的进一步分析服务。274.CNV:XHMM是一款外显子捕获拷贝数变异检测的优28282929可以通过GT(genotype)直接比较样品间的差异(GT简介:0表示与Ref相同,1表示与ALTS第1个碱基相同,2表示如ALTS第2个碱基相同)。通过和多个数据库的提供关联精细筛选条件:30可以通过GT(genotype)直接比较样品间的差异(GT简六、后六、后续验证1.Sanger测序验证2.根据目的基因设计个性化验证方案(后续验证由老师自己完成)31六、后续验证Sanger测序验证31
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!