资源描述
,TCGA数据库介绍专题,上海尔云-云生信团队 2015.9.20,目录,前言,01,TCGA- the Cancer genome ATLAS,癌症种类丰富,样本量大 34 kinds of cancer 325 samples on average,http:/cancergenome.nih.gov/,数据产生历程,02,TCGA数据的产生历程: 1. 组织样本和临床数据来源网站(TSS)收集的数据发送到Biospecimen核心资源(BCRs)。 2. BCRs提交临床数据和元数据到数据协调中心(DCC)和测序中心(GSCs),获取组织变异数据,然后提交给DCC。 3. GSCs提交跟踪文件,序列比对后文件到癌症基因组学中心(CGHub)。 4. 提交给DCC和CGHub的数据可供研究团队和基因组数据分析中心(GDACs)使用。 5. 分析pipeline以及由GDACs产生的数据结果通过DCC保存到研究社区(community)中。,http:/cancergenome.nih.gov/abouttcga/overview,barcode解读,03,详细请见:https:/wiki.nci.nih.gov/display/TCGA/TCGA+barcode,DaTA TYPES AND LEVELS,04,DATA TYPES,DATA LEVLES,注意: 低水平的测序数据存储在CGHub https:/cghub.ucsc.edu/, 申请下载时需要DUNS number. The Cancer Genomics Hub (CGHub) is a secure repository for storing, cataloging, and accessing cancer genome sequences, alignments, and mutation information from the Cancer Genome Atlas (TCGA) consortium and related projects.,目前已有的癌症种类,05,癌症种类丰富,样本量大 34 kinds of cancer 325 samples on average,详细见: TCGA publication guideline, http:/cancergenome.nih.gov/publications/publicationguidelines,数据下载及解读,06,最简单的方法:,https:/tcga-data.nci.nih.gov/tcga/tcgaHome2.jsp,第1封邮件通知下载申请已经提交,第2封给出下载链接,Step4,Step 4 文件内容,File_manifest.txt,对所下载文件的说明,临床数据解读,CDE:Common Data Elements https:/tcga-data.nci.nih.gov/docs/dictionary/,THANKS,
展开阅读全文