生物信息学基因组分析课件

上传人:txadgkn****dgknqu... 文档编号:241841537 上传时间:2024-07-29 格式:PPT 页数:57 大小:5.30MB
返回 下载 相关 举报
生物信息学基因组分析课件_第1页
第1页 / 共57页
生物信息学基因组分析课件_第2页
第2页 / 共57页
生物信息学基因组分析课件_第3页
第3页 / 共57页
点击查看更多>>
资源描述
生物信息学生物信息学生物信息学生物信息学第七章第七章 基因组分析基因组分析1生物信息学第七章 基因组分析1人类基因组计划人类基因组计划2人类基因组计划2基因组、转录组和蛋白质组基因组、转录组和蛋白质组基因组基因组 转录组转录组蛋白质组蛋白质组化学生物学化学生物学3基因组、转录组和蛋白质组基因组转录组蛋白质组化学生物学3本章内容提要本章内容提要r1.基因组的结构与内容基因组的结构与内容r2.基因组注释基因组注释r3.比较基因组学比较基因组学r4.基因基因/蛋白质的功能预测蛋白质的功能预测4本章内容提要1.基因组的结构与内容41.基因组的结构与内容基因组的结构与内容r(1)基因的结构基因的结构r(2)mRNA:可变剪切:可变剪切r(3)蛋白质:翻译后修饰蛋白质:翻译后修饰r(4)相互作用网络:基因、蛋白质、小分子之间相互作用网络:基因、蛋白质、小分子之间的相互作用的相互作用r(5)非编码区非编码区|a.功能元件功能元件:转录因子结合位点;启动子转录因子结合位点;启动子|b.Non-coding RNA:MicroRNA|c.转座子转座子|d.重复片段重复片段|e.伪基因伪基因(Pseudogene)51.基因组的结构与内容(1)基因的结构5(1)基因的结构基因的结构6(1)基因的结构6基因组大小基因组大小&基因数基因数7基因组大小&基因数7基因数量基因数量-生物复杂性?生物复杂性?r1.基因数量的变化,无法解释生物学功能、调控机基因数量的变化,无法解释生物学功能、调控机理以及物种多样性和复杂性的巨大变化理以及物种多样性和复杂性的巨大变化r2.当前解释:蛋白质组的多样性和复杂性当前解释:蛋白质组的多样性和复杂性-物种的物种的多样性和复杂性;多样性和复杂性;10,000,000种蛋白质分子种蛋白质分子r3.两种观点:两种观点:|a.转录后层面,转录后层面,mRNA剪切,产生拼接异构体剪切,产生拼接异构体|b.蛋白质层面,蛋白质序列上一个或多个位点上发生的蛋白质层面,蛋白质序列上一个或多个位点上发生的翻译后修饰翻译后修饰8基因数量-生物复杂性?1.基因数量的变化,无法解释生Genotype to Phenotype9Genotype to Phenotype9isoform 1isoform 2isoform 3mRNA Splicing转录后层面:转录后层面:mRNA Splicing10isoform 1isoform 2isoform 3mRNPhosphorylationSumoylationPalmitoylationAcetylationUbiquitination蛋白质层面:翻译后修饰蛋白质层面:翻译后修饰11PhosphorylationSumoylationPalm(4)相互作用网络相互作用网络蛋白质蛋白质-蛋白蛋白质相互作用质相互作用网络网络12(4)相互作用网络蛋白质-蛋白质相互作用网络12细胞信号通路细胞信号通路G1/S检验点:检验点:有调控方向有调控方向13细胞信号通路G1/S检验点:13(5)非编码区非编码区ra.功能元件功能元件:转录因子结合位点;启动子转录因子结合位点;启动子rb.Non-coding RNA:MicroRNArc.转座子转座子rd.重复片段重复片段re.伪基因伪基因(Pseudogene)14(5)非编码区a.功能元件:转录因子结合位点;启动子Functional elements:Promotor15Functional elements:Promotor1Transcription Factor Binding SiteCRM:cis-regulatory modules16Transcription Factor Binding SGal4p and KruppelGal4pKruppel17Gal4p and KruppelGal4pKruppel1其他功能元件其他功能元件rExon splicing enhancer(ESE)and silencer(ESS)rIntron splicing enhancer(ISE)and silencer(ISS)18其他功能元件Exon splicing enhancer(Non-coding RNAr1.不翻译成蛋白质,具有重要的调控功能不翻译成蛋白质,具有重要的调控功能r2.分类:分类:|a.transfer RNA(tRNA)|b.ribosomal RNA(rRNA)|c.snoRNAs,|d.microRNAs,|e.siRNAs|f.piRNAs:与与piwi相互作用的相互作用的RNA|g.long ncRNAs:Xist|19Non-coding RNA1.不翻译成蛋白质,具有重要的tRNA&rRNA20tRNA&rRNA20snoRNAsrsnoRNAs:Small nucleolar RNAs;介导介导其他其他RNA分子的化学修饰,例如甲基化分子的化学修饰,例如甲基化21snoRNAssnoRNAs:Small nucleolamicroRNA/miRNAr1.长度长度21-23bpr2.调控基因的表达调控基因的表达r3.pre-miRNA:70bp22microRNA/miRNA1.长度21-23bp22Transposonr转座子:在基因组中能够移动位置的转座子:在基因组中能够移动位置的DNA序序列列23Transposon转座子:在基因组中能够移动位置的DNA序2.基因组注释基因组注释r(1)基因组序列的拼装基因组序列的拼装r(2)基因预测基因预测r(3)可变剪切的预测可变剪切的预测r(4)非编码的功能元件的预测非编码的功能元件的预测242.基因组注释(1)基因组序列的拼装24(1)基因组测序:鸟枪法基因组测序:鸟枪法25(1)基因组测序:鸟枪法25基因组的拼装基因组的拼装26基因组的拼装26重复序列带来干扰重复序列带来干扰27重复序列带来干扰27(2)基因预测基因预测r直接的,序列高度匹配直接的,序列高度匹配|同一或近缘物种中,与同一或近缘物种中,与EST,cDNA,蛋白质蛋白质等序列完美或近似完美的匹配等序列完美或近似完美的匹配r间接的,基于统计学的间接的,基于统计学的a.序列比对序列比对(Homology)b.从头预测从头预测(ab initio)c.以上两种方法的结合以上两种方法的结合28(2)基因预测直接的,序列高度匹配28真核生物的基因结构真核生物的基因结构5335 1-100 Mbp 5335 1-1000 kbp exons(cds&utr)/introns(102-103 bp)(102-105 bp)Polyadenylation sitepromoter(103 bp)enhancers(101-102 bp)other regulatory sequences (101-102 bp)29真核生物的基因结构5335 1-100 Mbp 基因的其他特征基因的其他特征r1.ORF(Open Reading Frame):从从AUG开始,至开始,至stop codon终止终止r2.Codon Usage:CAI r30基因的其他特征1.ORF(Open Reading FrHMM model for Gene Prediction(Genie)Kulp,D.,PhD Thesis,UCSC 200331HMM model for Gene Prediction(3)可变剪切的预测可变剪切的预测r将将EST,cDNA序列比对到基因组上序列比对到基因组上32(3)可变剪切的预测将EST,cDNA序列比对到基因组上部分有向图算法部分有向图算法33部分有向图算法333.比较基因组学比较基因组学r(1)有功能的通常保守有功能的通常保守r(2)例:例:SUMO底物的预测:底物的预测:|a.SUMO化位点存在化位点存在-K-X-E模体模体|b.核定位信号核定位信号(NLS)|c.人和小鼠中,人和小鼠中,SUMO化位点应当保守化位点应当保守|d.功能分析:功能分析:Gene Ontologyr(3)分析结果:分析结果:|a.2,683个人个人-小鼠保守的小鼠保守的SUMO化底物化底物|b.SUMO化的功能:参与转录调控、信号转导等化的功能:参与转录调控、信号转导等343.比较基因组学(1)有功能的通常保守34Gene Ontology:基因本体论:基因本体论r1.描述基因描述基因/蛋白质的功能蛋白质的功能r2.三类术语三类术语(Term):|a.Cellular component:在哪里?在哪里?|b.Biological process:干什么?干什么?|c.Molecular function:我是谁?:我是谁?35Gene Ontology:基因本体论1.描述基因/蛋白质Gene Ontology:基因本体论:基因本体论36Gene Ontology:基因本体论363737功能显著性分析:超几何分布功能显著性分析:超几何分布38功能显著性分析:超几何分布383939转录因子转录因子rIn human proteome:rDNA binding(GO:0003677):2,255 rTranscription factor activity(GO:0003700):1,102 rregulation of transcription,DNA-dependent(GO:0006355):2,174rIn SUMO Substrates:rDNA binding(GO:0003677):530 rTranscription factor activity(GO:0003700):304 rregulation of transcription,DNA-dependent(GO:0006355):510r因此,可以估计因此,可以估计1/4 1/3的转录因子受到的转录因子受到SUMO化的调控化的调控40转录因子In human proteome:404.基因基因/蛋白质的功能预测蛋白质的功能预测r(1)一级序列的比较:相似的序列具有相似一级序列的比较:相似的序列具有相似的功能的功能r(2)保守的功能结构域:保守的功能保守的功能结构域:保守的功能r(3)三级结构的比较:相似的结构具有相似三级结构的比较:相似的结构具有相似的功能的功能r(4)蛋白质相互作用的预测蛋白质相互作用的预测414.基因/蛋白质的功能预测(1)一级序列的比较:相似的序(1)一级序列的比较一级序列的比较r1.同源物的鉴定:不同物种中的直系、旁系同源物的鉴定:不同物种中的直系、旁系同源物的预测同源物的预测r2.主要工具:主要工具:BLAST42(1)一级序列的比较1.同源物的鉴定:不同物种中的直系、(2)保守的功能结构域保守的功能结构域r1.保守的功能结构域:保守的功能保守的功能结构域:保守的功能r2.常用工具:常用工具:工具工具网址网址Interprohttp:/www.ebi.ac.uk/interpro/Pfamhttp:/pfam.sanger.ac.uk/SMARThttp:/smart.embl.de/PROSITEhttp:/www.expasy.org/prosite/ProDomhttp:/prodom.prabi.fr/prodom/current/html/home.phpCDDhttp:/www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi43(2)保守的功能结构域1.保守的功能结构域:保守的功能工例:例:Nek244例:Nek244(3)三级结构的比较三级结构的比较r1.Ubiquitin:泛素,主要负责蛋白质的降解泛素,主要负责蛋白质的降解r2.SUMO:小的类泛素蛋白质,基因转录:小的类泛素蛋白质,基因转录&信号通路信号通路r3.催化反应通路的分子机制相似催化反应通路的分子机制相似r4.序列相似性:不显著!序列相似性:不显著!45(3)三级结构的比较1.Ubiquitin:泛素,主要Ubiquitin vs.SUMO46Ubiquitin vs.SUMO46序列相似性:序列相似性:20%47序列相似性:20%47结构相似性结构相似性SUMOUbiquitin48结构相似性SUMOUbiquitin48(4)蛋白质相互作用的预测蛋白质相互作用的预测r1.基因组信息基因组信息(Genomic information)|A.Gene fusion and fission|B.Conservation of gene order/bidirectional pairs|C.Phylogenetic profiler2.关联的序列特征关联的序列特征(Correlated sequence signatures)r3.mRNA co-expressionr4.Literature mining49(4)蛋白质相互作用的预测1.基因组信息(GenomiGene fusion/fission:Rosetta StoneABABQuery proteinLinked proteinRosetta proteinMarcotte EM et al.,Science 1999,285:751-753;Enright AJ et al.,Nature,1999,402:86-90Genome AGenome B50Gene fusion/fission:Rosetta SConservation of gene order/bidirectional pairsGene order pairsBidirectional transcribed gene pairsDandekar T et al.,TIBS,1998,23:324-328;Overbeek R et al.,PNAS,1999,96:2896-2901;Korbel JO et al.,NBT,2004,22:911-91751Conservation of gene order/biPhylogenetic profilesPellegrini M et al.,PNAS,1999,96:4285-4288;Huynen MA et al.,PNAS,1998,95:5849-585652Phylogenetic profilesPellegrinCorrelated sequence signatures A.B.This model is computationally faster and more convenientPID modelPIDC model53Correlated sequence signaturesPID模型:最大似然性法模型:最大似然性法54PID模型:最大似然性法54P(Imn=1):训练训练55P(Imn=1):训练55Conserved co-expressionNot PPI,but functional linkageStuart JM et al.,Science,2003,302:249-255;von Mering C et al.,NAR,2005,33:D433-D43756Conserved co-expressionNot PPISTRING:方法的整合方法的整合57STRING:方法的整合57
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!