(精品)基因芯片数据的获取与分析

上传人:仙*** 文档编号:246633490 上传时间:2024-10-15 格式:PPT 页数:31 大小:1.85MB
返回 下载 相关 举报
(精品)基因芯片数据的获取与分析_第1页
第1页 / 共31页
(精品)基因芯片数据的获取与分析_第2页
第2页 / 共31页
(精品)基因芯片数据的获取与分析_第3页
第3页 / 共31页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第二期生物信息学培训班,2010,年,8,月 中国,哈尔滨,复杂疾病基因芯片数据的获取与分析,姜伟,2011-,08,-,08,生物信息科学与技术学院、生物信息学中心,哈尔滨医科大学,大纲,基因芯片数据获取,基因芯片简介,Gene Expression Omnibus(GEO),ArrayExpress,基因芯片数据分析,预处理,差异表达基因筛选,聚类与分类,功能注释和富集分析,大纲,基因芯片数据获取,基因芯片简介,Gene Expression Omnibus(GEO),ArrayExpress,基因芯片数据分析,预处理,差异表达基因筛选,聚类与分类,功能注释和富集分析,基因芯片数据获取,基因芯片简介,cDNA,微阵列芯片,寡核苷酸芯片,原位合成芯片,光纤微珠芯片,基因芯片数据获取,基因芯片简介,基因芯片数据获取,Gene Expression Omnibus(GEO),http:/www.ncbi.nlm.nih.gov/geo/,基因芯片数据获取,Gene Expression Omnibus(GEO),GPLXXXX,GSMXXXX,GSEXXXX,GDSXXXX,实验组,GEO,自己,组织的相近实验,基因芯片数据获取,Gene Expression Omnibus(GEO),Alzheimers disease(AD),基因芯片数据获取,Gene Expression Omnibus(GEO),GSE12685,基因芯片数据获取,ArrayExpress,http:/,www.ebi.ac.uk/arrayexpress,/,大纲,基因芯片数据获取,基因芯片简介,Gene Expression Omnibus(GEO),ArrayExpress,基因芯片数据分析,预处理,差异表达基因筛选,聚类与分类,功能注释和富集分析,基因芯片数据分析,预处理,对数转换,数据过滤,标准化,基因芯片数据分析,预处理,对数转换,目的:使数据服从正态分布,基因芯片数据分析,预处理,数据过滤,去除表达水平是负值或很小的数据或者明显的噪声数据,波动筛选:去掉一成不变的基因,要求在一定的变化范围内波动,标准化,片内标准化:去除系统误差,片间标准化:,在不同列之间的标准化,使每列在同一量纲上比较,基因芯片数据分析,差异表达基因筛选,Fold change,:,差了几倍,一般是两倍,T-test,疾病样本中的表达值,正常样本中的表达值,基因芯片数据分析,差异表达基因筛选,,越宽越严格,越窄越宽松,SAM(Significance Analysis of,Microarrays,),基因芯片数据分析,聚类,(无监督,可用于发现疾病亚型),与分类,(有监督),层次聚类,(一刀切或者阈值),点与类的距离如下所示,基因芯片数据分析,聚类与分类,k,均值聚类,随机的两个点,基因芯片数据分析,聚类与分类,k,近邻分类器,基因芯片数据分析,聚类与分类,决策树分类器,Outlook,Humidity,Windy,Play,Sunny,75,False,No,Sunny,79,True,No,Overcast,60,False,Yes,Rainy,55,False,Yes,Rainy,75,False,Yes,Rainy,80,True,No,Overcast,80,True,Yes,Sunny,85,False,No,Sunny,50,False,Yes,Rainy,45,False,Yes,Sunny,40,True,Yes,Overcast,50,True,Yes,Overcast,55,False,Yes,Rainy,55,True,No,功能注释,(一个基因的功能),和富集分析,(一组基因的功能),GO(Gene Ontology),Biological Process,Molecular Function,Cellular Component,KEGG(Kyoto Encyclopedia of Genes and Genomes),基因芯片数据分析,有向无环图,Enrichment analysis(,富集分析,),m,:,人类所有基因数,t,:,通路中所有的基因数,n,:,疾病风险基因数(用户提供的基因集合中的基因数),(差异表达基因),r,:,注释到通路中的疾病风险基因数,常用软件(,DAVID,GSEG,),t,n,m,r,功能节点基因,疾病风险基因,人类所有的基因,基因芯片数据分析,基因芯片数据分析,基因芯片数据分析,(,ArrayTools,),预处理:表达强度小于,x,的时候就去掉,本例中是,10,至少有,20%,有波动,基因芯片数据分析,(,ArrayTools,),差异表达基因筛选,(SAM),输入样本类别,一般默认即可,基因芯片数据分析,(ArrayTools),样本、基因聚类,基因芯片数据分析,(,ArrayTools,),样本、基因聚类,THANK YOU!,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!