非编码RNA和复杂疾病课件

上传人:无*** 文档编号:242013793 上传时间:2024-08-09 格式:PPT 页数:189 大小:35.46MB
返回 下载 相关 举报
非编码RNA和复杂疾病课件_第1页
第1页 / 共189页
非编码RNA和复杂疾病课件_第2页
第2页 / 共189页
非编码RNA和复杂疾病课件_第3页
第3页 / 共189页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,文档仅供参考,不能作为科学依据,请勿模仿;如有不当之处,请联系网站或本人删除。,*,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,Click to edit Master title style,文档仅供参考,不能作为科学依据,请勿模仿;如有不当之处,请联系网站或本人删除。,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,文档仅供参考,不能作为科学依据,请勿模仿;如有不当之处,请联系网站或本人删除。,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,文档仅供参考,不能作为科学依据,请勿模仿;如有不当之处,请联系网站或本人删除。,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,文档仅供参考,不能作为科学依据,请勿模仿;如有不当之处,请联系网站或本人删除。,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,文档仅供参考,不能作为科学依据,请勿模仿;如有不当之处,请联系网站或本人删除。,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,文档仅供参考,不能作为科学依据,请勿模仿;如有不当之处,请联系网站或本人删除。,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,Click to edit Master title style,文档仅供参考,不能作为科学依据,请勿模仿;如有不当之处,请联系网站或本人删除。,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,Click to edit Master title style,文档仅供参考,不能作为科学依据,请勿模仿;如有不当之处,请联系网站或本人删除。,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,Click to edit Master title style,文档仅供参考,不能作为科学依据,请勿模仿;如有不当之处,请联系网站或本人删除。,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,Click to edit Master title style,文档仅供参考,不能作为科学依据,请勿模仿;如有不当之处,请联系网站或本人删除。,第十二章 非编码,RNA,与,复杂疾病,北京大学 崔庆华,哈尔滨医科大学 李霞、徐娟,生物信息学,人类基因组的蛋白质编码区的总和占总基因组长度为1,2,,那么其他,98,的基因组有什么功能,呢(,junk dna,)?,(,1,),42,的基因组是插入编码序列的,内含子序列,;人类基因平均每个基因有7个内含子。但这么冗长的内含子序列有什么生物学功能呢?,(,2,)其他,55%,的基因组的功能是什么?,【,注:,90%,以上的基因组都是转录的!,】,人类基因组草图带给科学家们的困惑,人类基因组绝大部分都被转录成,RNA,,细胞内非编码,RNA,的数量是编码,RNA,的上百倍。这促使许多科学家认为,生物体复杂性被隐藏在它们所输出的非编码,RNA,内,而非编码序列内,。,non-coding RNA,ncRNA,不能翻译成蛋白的功能性,RNA分子,Housekeeping non-coding RNA,tRNAs,、,rRNAs,、,snRNAs etc.,Regulatory non-coding RNA,small non-coding RNA,siRNA,、,miRNA,、,piRNA,etc.,Long non-coding RNA,(,lncRNA,,,200 nt,),第一节 引言,Section 1 Introduction,随着,ncRNA,在复杂疾病中的研究深入,研究者发现其在疾病的发生发展过程中起着巨大的作用,其功能异常能够导致各种人类复杂疾病的发生。这将使,ncRNA,可能成为疾病诊断、预后的新的生物学标记(,biomark,),并为更进一步理解复杂疾病的发病机理提供了新的手段。,第二节,非编码,RNA,与其靶基因,Section 2,Non-coding RNAs and Targets,(一),miRNA,的发现,一、,miRNA,概述,miRNA was first discovered in 1993 by Victor Ambros at Harvard,(,lin-4,),The second miRNA,Let-7,was discovered in 2000 by Frank Slack as a postdoc at Harvard,(,Gary Ruvkun lab,),The discovery of miRNAs,Victor Ambros,Gary Ruvkun,microRNAs had been neglected for so many years because of their small size.,The underlying reason is:people never dream that small RNAs will have important biological roles.,The number of the identified miRNAs is growing rapidly in recent years,.,Release 21,(,Ju,ly,201,4,),of the miRBase database have added,4196,new hairpin sequences and,5441,new mature products,Release 20,contains,24521,entries representing hairpin precursor miRNAs,expressing,30424,mature miRNA products,in,206,species.,These miRNAs are from primates,rodents,啮齿类,birds,fish,worms,flies,plants and viruses.,The data are freely available to all through the web interface at www.mirbase.org/.,Since around 2007,the overwhelming majority of microRNAs deposited in miRBase have been predicted from,small RNA deep sequencing experiments,.,miRNA,的生物合成过程,mature miRNA,Precursor miRNA,Primary miRNA,miRNA gene,转录,剪切,剪切,miRNA,(二),miRNA,的生物合成,RNA poly,II/III,Drosha,Dicer,几百,几千碱基,约,70 90,碱基,约,22,碱基,miRNA,例子,The miRNA genes and Structure of pri-miRNAs,Pri-miRNAs bear the 5 cap and 3 poly,(,A,),tails,(三),miRNA,的特点、作用机制及分类,microRNA,命名规则,hsa-miR-181a-2*,hsa,人,,mus,小鼠,,rat,大鼠,let,,,lin,mir,,,miR,181,:编号,按注册顺序,a,:与已注册的,miRNA,序列高度同源,2:,由不同染色体上的,DNA,序列转录加工而成的具有相同成熟体序列的,miRNA,则在后面加上阿拉伯数字以区分,*:如果一个前体的,2,个臂分别产生,miRNA,则根据克隆实验,在表达水平较低的,miRNA,后加“*”,;,或进行如下命名,hsa-miR-188-5p,(或,hsa-miR-188-3p,),5p,:表示从,5,端的臂加工而来;,3p,:表示从,3,端的臂加工而来,hsa-mir-188,二级结构,hsa-miR-188-5p,hsa-miR-188-3p,5,3,miRNA/miRNA-star VS -5p/-3p,the dominant strand could change in different biological settings leading to different names describing the same molecule,5p arm,(,placenta,),to the 3p arm,(,heart,liver,and kidney,),物理位置特点,miRNA基因以单拷贝、多拷贝和基因簇等多种形式存在于基因组中。,miRNA,簇(,miRNA clusters,)是指在染色体上彼此紧密相邻的两个或者多个,miRNA,构成的,miRNA,群,miRNA,倾向于成簇出现在染色体上;通常定义,50kb,的距离为一簇,同一簇中的,miRNA,倾向是共表达的,miRNA一般特点,miRNA,家族,/,簇,序列(特别是种子序列)高度同源的,miRNA,被归为一个,miRNA,家族,同一家族中的,miRNA,并不一定是成簇的。,seed,miRNA,的一般特点,序列特点,非编码性,成熟的,miRNA 5,端为单一磷酸基团,,3,端为羟基,这一特点使它与大多数寡核苷酸和功能,RNA,的降解片段区别开来;,表达特点,miRNA,具有时序性以及组织特异性,在特定的时间,组织中才会表达,保守性特点,在物种间高度保守,miRNA,的作用机制,通过和靶基因,3UTR,(,3,非翻译区)结合,导致,RNA,诱导的沉默复合体(,RNA-induced silencing complex,简称,RISC,),降解,其靶,mRNA,或,阻碍,其靶的,翻译,。,RISC,转录后层面,调控基因表达,二、基于序列的,miRNA,靶基因预测方法,miRNA,靶基因预测遵循的基本原则,miRanda,TargetScan,Three Classes of miRNA Target Sites,(,Brennecke et al.Plos Biology 2005,),(一),miRNA,靶基因预测遵循的原则和基本步骤,miRNA,的“种子区”与,mRNA,的,3UTR,序列碱基互补,靶点在多物种间的序列保守性,miRNA,与,mRNA,形成双链结构的热力学稳定性,靶基因二级结构和靶点外的序列对靶基因预测的影响,遵循的原则,miRNA,靶位点预测的难点:,miRNA,与,靶位点的不完全互不配对,基本步骤,在,3UTR,上探寻和,miRNA“,种子区”完全互补的序列;,计算,miRNA,和这些序列结合产生的自由能下降值,对靶点进行筛选;,对靶点进行物种间序列比对,利用物种保守性进一步筛选。,(三),TargetScan,TargetScan,主要考虑物种间保守的,miRNA,靶基因,并且在,TargetScan,中首次提出了“种子匹配”(,seed match,)的概念。,www.targetscan.org/,TargetScan,算法的基本步骤,在,TargetScan,算法中,“种子匹配”被定义为,miRNA 5,端的第,2,8,位碱基与,mRNA 3UTR,上的一段,7nt,(,nucleotide,)序列完全互补,,miRNA,上的这,7,个核苷酸被称为,miRNA“,种子区”。,从种子区开始向,miRNA,两侧寻找互补碱基,允许,G-U,配对,直到出现碱基错配为止。在物种保守方面,,TargetScan,算法发现随着物种数目的增多,预测的靶基因数目逐渐减少,但预测结果的准确率得到提高。,三、基于表达信息预测,miRNA,靶基因,Huang,等人利用在,88,个组织中同时检测了,miRNA,和,mRNA,表达的数据,并结合贝叶斯方法开发了靶基因预测算法,GenMiR+,,得到了,104,个人类,miRNA,的高精度靶基因,并通过实验证实了预测的,let-7b,靶基因,结果表明,与基于序列的方法相比,利用相同样本中同时检测,miRNA,和,mRNA,的表达谱可以更准确的预测,miRNA,靶基因。,(,Huang,Using expression profiling data to identify human microRNA targets.Nat.Methods.,),四、基于高通量测序结果预测,miRNA,靶基因,Argonaute CLIP-Seq,RIP-CLIP,pSILAC,Degradome-Seq,Ago binds in a,ternary,三元的,complex to both miRNA and mRNA,with sufficiently close contacts to allow UV-crosslinking to either RNA;mRNA tags will be in the immediate vicinity of miRNA binding sites.,Argonaute CLIP-Seq,Argonaute CLIP-Seq,Argonaute CLIP-Seq,又称为,HITS-CLIP,(,ultraviolet cross-linking and immune-precipitationand and high-throughput sequencing,),即紫外交联免疫共沉淀与高通量测序偶联技术。,CLIP,技术是研究,RNA,结合蛋白,(或者,RNA,)体内结合靶标的新技术。,通过紫外交联将,RNA,结合蛋白,与,体内结合的,RNA,分子,进行固定,用,Ago,蛋白的抗体,免疫共沉淀,之后酶解未受蛋白保护的,RNA,,可以获得,Ago,蛋白,直接结合,的,RNA,序列。,针对,AGO,蛋白的,CLIP-seq,技术能够在全基因组范围内鉴定与,AGO,蛋白结合的小,RNA,及其,mRNA,靶标。,Chi,SW,Zang,JB,Mele,A,Darnell,RB.,2009,.Argonaute HITS-CLIP decodes microRNA-mRNA interaction maps.Nature.460:479-86,。,Furthermore HITS-CLIP reads do not precisely pinpoint the position of crosslinking between the RNA and protein,and thus can only identify a targeted region,(,100-nt,),as opposed to a specific target site.,2010,年,,Gene W.Yeo,采用,AGO-CLIPseq,技术在线虫中鉴定了,Argonaute,的结合位点,发现其不仅结合,mRNA,的,3UTR,区域,,也会结合编码,外显子区域,,还发现,Argonaute,大量结合的区域对于,miRNA,的功能非常重要,揭示了其新的自我调控的功能。,要想获得检测区域被哪个,miRNA,调控,还需结合预测算法,五、整合已有知识预测,miRNA,靶基因,在当前的,miRNA,靶基因预测研究中,研究人员逐渐意识到单一依靠序列信息或表达信息已不能继续提高,miRNA,靶基因预测效能。,整合功能信息、蛋白质互作信息、表达信息、序列信息以及当前实验证实的,miRNA,靶基因等已有资源预测,miRNA,靶基因十分必要。,miRNA,靶点优化算法,六、,lncRNA,概述及靶基因识别,lncRNA,定义,lncRNA,特点,lncRNA,作用机制,Definition of lncRNA,Long non-coding RNAs,(,long ncRNAs,lncRNAs,),are non-protein coding transcripts longer than 200 nucleotides,(,Perkel 2013,),.,lncRNAs are transcripts that are 200 nucleotides in length and,do not have,the potential to encode for proteins exceeding lengths,of 30 amino acid,s,(,Mercer TR.Nat.Rev.Genet.2009,Li X Med.Res.Rev.2012,),.,This somewhat,arbitrary,limit distinguishes long ncRNAs from small regulatory RNAs such as miRNAs,siRNAs,piRNAs,snoRNAs,and other short RNAs.,Large scale RNA-seqindicate that,lncRNA number,in the order of,tens of thousands,in mammals.,9277,manually annotated genes producing,14880,transcripts,(,GENCODE v7,),.,The number of protein coding genes in our genome has been revised downward multiple times,whereas the number of known non protein coding transcripts has increased exponentially over the past decade.,Features of lncRNAs,Features of lncRNAs,lncRNAs are generated by the same transcriptional machinery as are other mRNAs,lncRNAs are with,similar histone-modification profiles,splicing signals,.,H3K4me3,H3K36me3,lncRNAs are predominantly localized in the,chromatin and nucleus,and a fraction appear to be preferentially processed into small RNAs,.,lncRNA expression,Tissue-specific lncRNAs expressed in the brain.,conservation,Many small RNAs,such as miRNAs or snoRNAs,exhibit,strong conservation,across diverse species,(,Bentwich 2005,),.,In contrast,in general,lncRNAs lack strong conservation,which is often cited as evidence of non-functionality,(,Brosius 2005;Struhl 2007,),.,Despite low conservation of long ncRNAs in general,it should be noted that many long ncRNAs still contain strongly conserved elements,生化鉴定和功能研究尚处于起步阶段,目前仅有大约,100,多种已知功能的,lncRNAs,。,As of December 2012,127 LncRNAs have been functionally annotated inLncRNAdb,(,a database of literature described LncRNAs,)(,Amral 2011,),.,lncRNA,通过,表观遗传学调控、转录调控、转录后调控、蛋白活性调控,等多种方式调控相关基因的作用,LncRNA as Scaffold for Transcription Repression,HOTAIR and PRC2,lncRNA as miRNA Decoy,Poliseno et al,Nat 2011,lncRNA,研究存在的问题,lncRNA,的定义,200nt,,过于武断,lncRNA,的命名原则:目前根据功能、结构、作用方式等命名,lncRNA,相关数据库的内容不够全,注释内容不够丰富,lncRNA,生物学功能的阐明,lncRNA,功能预测的工具不多,区分功能性和非功能性非编码转录本,种类和功能复杂,使不同的,lncRNA,研究结果之间的借鉴意义并不高,七、,ncRNA,数据资源,ncRNA,常用数据库,miRBase,是一个集,miRNA,序列、注释信息以及预测的靶基因数据为一体的数据库,是目前存储,miRNA,信息最主要的公共数据库之一,网址:,www.mirbase.org/,(一),miRBase,数据库,TarBase,是一个目前使用广泛的存储实验检测的,miRNA,与靶基因间关系的数据库,涵盖多种实验方法检测的超过,65000,个,miRNA,与靶基因关系对。,其网址为:,diana.cslab.ece.ntua.gr/tarbase/,(二),TarBase,数据库,TarBase,数据库界面介绍,(三),microRNA.org,数据库,microRNA.org,数据库,包含,miRNA,靶基因以及表达谱数据,网址:,www.microrna.org/microrna/home.do,miRNA,靶基因数据,主要是利用,miRanda,算法预测得来,miRNA,表达谱数据,来自一个针对人类主要器官和细胞系的小,RNA,库测序计划,(四),lncRNA,相关数据库,因为,lncRNA,是一个非常新的研究领域,,lncRNA,在疾病中的作用的研究还是起步阶段,数据量还不够大,因此,相关的数据库也是处于起步阶段,相关数据库还不多,也不够丰富。,第三节,非编码,RNA,多态和复杂疾病,Section 3,Non-coding RNA Polymorphisms and Complex Disease,miRNA,多态(,miRNA polymorphisms,)是影响,miRNA,功能,的多态,可能发生在,miRNA,形成和行使功能的任一个过程,,以插入、删除、扩增或染色体异位的形式出现,,最终导致,miRNA,绑定位点或者功能的缺失(获得),,是人类基因组一类新的功能多态。,不仅会影响,miRNA,的产生和表达,而且会影响,miRNA,与靶基因的结合从而影响靶基因的表达,。,介绍,影响蛋白质参与,miRNA,合成与成熟,导致新的,miRNA,生成和靶基因的调控。,一、位于,miRNA,基因内部影响,miRNA,生物学形成的多态,在染色体基因组水平上单个核苷酸变异引起的,miRNA,序列多态性对,miRNA,的转录、形成、输出和调控具有重要影响。,Saunders,M.A.,等对人类,474,个,miRNAs,的,SNPs,进行系统的分析发现单核苷酸多态在,miRNA,序列内的密度低于其周围的侧翼序列。,49,个,pre-miRNA,内存在,65,个,SNPs,位点,其中,3,个,miRNAs,的种子序列存在,SNPs,。,(一)位于,pri/pre-miRNA,基因序列内部,Saunders,M.A.,和,Duan,等人利用生物信息学的方法研究发现在,pri/pre-miRNA,内部存在单核苷酸多态。位于,pri/pre-miRNA,内部的多态会影响,miRNA,的表达,产生新的,miRNA,以及影响,miRNA,与靶基因的结合,甚至与疾病的风险相关。,1.,影响,miRNA,的表达,Duan,等人在研究,miR-125,时发现,该基因位点存在,SNP,,含有,miR-125a-G/U,两种等位,其中,miR-125a-U,能够显著影响,DGCR8,与,pri-miRNA-125a,的结合与剪接,使成熟的,miR-125a,生成减少,使,miR-125a,对靶基因,Lin-128,的翻译抑制作用减弱。,2.,产生新的,miRNA,miR-146a,前体会产生,miR-146a,(正链)和,miR-146a*,(负链)两种,miRNA,。在,miR-146a,前体的茎环上存在的,SNP,(,rs2910164,)不仅会影响,miR-146a,的表达,而且会导致,miR-146a*C,和,miR-146a*G,两种,miRNA,的产生。,(二)位于成熟的,miRNA,序列内部,成熟的,miRNA,与,mRNA,的,3,UTR,区域结合对,mRNA,进行转录后调控。,miRNA,与,mRNA,结合的区域包括两部分:,种子区域,这一部分区域要求与,mRNA,严格匹配;,种子区域附近的,3,端方向,允许一定的程度的错配,位于成熟,miRNA,序列的这些多态会影响对靶基因的调控,消除、弱化、增强或者产生新的结合靶点。,目前的研究发现,位于,miRNA,种子区域的多态不仅会影响靶结合位点,还影响,miRNA,的表达。,例如,位于,miR-125a,种子区域的多态显著的抑制了,pri/pre-miRNA,过程,导致,miRNA,表达的减少。,二、,miRNA,靶点的多态,miRNA靶点的多态性,靶基因上,影响miRNA与靶基结合,的序列多态性。,这些多态性位点,可以,影响miRNA对靶基因表达的调控。,越来越多研究发现,与多种疾病的发病风险有关,。,miRNA,靶点多态可分为:,miRNA,结合位点上的多态性,miRNA,结合位点上下游的多态性,miRNA,结合位点上(或上下游)的多态性与疾病,与疾病相关的,miRNA,结合位点上的多态性举例,位于整联蛋白基因,-4,(,IGBT-4,),miRNA,结合位点的,SNP,(,rs743553,)与乳腺癌发病密切相关(,Brendle,等)。,位于,GEMIN3,基因,miRNA,结合位点的,SNP,(,rs197414,)与膀胱癌发病密切相关(,Yang,等)。,位于靶点附近的多态位点可能会改变,mRNA,的二级结构从而影响,miRNA,与靶基因的结合;或影响,miRNA,与,3UTR,上其他调控元件的协同作用(,间接影响,),例如,,HLA-G,基因,3UTR,区的,SNP,影响,miR-148a,,,miR-148b,和,miR-152,与,HLA-G,结合,从而与哮喘的发病风险相关(,Zheng,等)。,五、,lncRNA,多态与复杂疾病,近些年,高通量技术,(,如,GWAS,,全基因组关联分析,),已经确定大量和疾病相关的,SNP,。,因此,如果该,SNP,是位于一个,lncRNA,上的话,很可能是该,SNP,影响了该,lncRNA,的功能,从而和疾病有关。,乳头状甲状腺癌,(,papillary thyroid carcinoma,,,PTC,),相关的风险,SNP,(,rs944289,),位于一个,lncRNA,(,PTCSC3,),的上游,3.2kb,处,这个风险,SNP,可以影响该,lncRNA,的表达,并阐明了这个,SNP,通过影响,lncRNA,功能导致乳头状甲状腺癌发生的致病机制。,例子,数据资源,miRNASNP,miRNA-related SNPs,their potential target loss and gain information,dbSMR,数据库,miracle.igib.res.in/polyreg/,一个分析基因,3,UTR,上的,SNP,对,miRNA,与靶点结合关系影响的数据库。,PolymiRTS,数据库,compbio.utmem.edu/miRSNP/,整合了序列多态性位点数据、表型数据和基因表达谱数据,来挖掘潜在的可以用于解释表达数量性状位点和表型数量性状位点效应的,miRNA,靶基因的结合区域上的多态性位点,并把这些多态称作,PolymiRTS,。,lincSNP,数据库简介,LincSNP是一个整合的数据库,为了识别和注释人类lncRNA上疾病相关的SNP而构建的全面的综合数据库。,目前该数据库中包括大约140,000疾病相关的SNP,这些SNP位于大约5000个人类的lncRNA周围。这个数据库也包含了注释的,实验证实的SNP-lncRNA-疾病的关联数据以及疾病相关的lncRNA数据,并提供了友好的界面和有效的工具获得疾病相关的SNP以及lncRNA。,LincSNP,数据库(,al,BMC bioinformatics,2014,第四节,非编码,RNA,表达谱与复杂疾病,Section 4,Non-coding RNA Expression Profile and Complex Disease,癌症的本质归结为各种原因引起的基因结构和功能的异常,一、,ncRNA,表达谱识别癌症相关,ncRNA,致癌基因,的高表达,抑癌基因,的低表达,miRNA,和,lncRNA,作为两类重要的基因调控子,其表达变化将会对靶基因的活动产生深远的影响,复杂疾病的诊断和治疗研究中必定会引入,miRNA,及,lncRNA,(一),miRNA,表达谱,1.ncRNA,的特征,低丰度、组织特异性、发育阶段特异性、疾病状态特异性,2.ncRNA,表达检测技术,Northern,印迹、克隆(,cloning,)、定量,PCR,扩增、,SAGE,技术、磁珠技术和寡核苷酸芯片技术、新一代测序技术,miRNA,表达谱,microRNA,芯片制作和分析流程,制作芯片,差异表达,miRNA,数据分析,miRNA,表达谱,预处理,1.ncRNA,表达数据来源,Gene Expression Omnibus,(,GEO,)数据库、,ArrayExpress,数据库、,Sequence Read Archive,(,SRA,),2.miRNA,表达谱数据标准化 中值处理,mRNA,表达,谱数据标准化方法并不能简单地应,用于,miRNA,表达,谱数据,目前仍没有统一有效,的标准化方法可用,于,miRNA,表达,谱,small RNAseq library preparation,(,Directional,),A pipeline for small RNA annotation(see in GED Galaxy),Sequence reads(fasta format),Bowtie,pre-miRNA(miRBase),Unmatched reads,Unmatched reads,Transposons,Unmatched reads,Genes,Unmatched reads,Unmatched reads,Remaining unmatched sequences,Bowtie,Bowtie,Non coding RNAs,Bowtie,Bowtie,Bowtie,Intergenic regions,Viruses,transgenes,etc,hierarchical,annotation,of,sequence,datasets,Matched reads,(fasta,),Read Count,Matched reads,(fasta,),Read Count,Matched reads,(fasta,),Read Count,Matched reads,(fasta,),Read Count,Matched reads,(fasta,),Read Count,Matched reads,(fasta,),Read Count,丰度数据(,count,)预处理,数据过滤,-,去除低质量的或噪声数据点,去除序列标签匹配性差的表达值,重复数据合并,加和,,代表同一个基因的标签的,tag,(或完全相同读段)的表达数目相加,缺失数据的处理,一般不补缺失值,因为,0,是有意义的,可以发现某种条件下不表达的基因,数据标准化,RPM,(,Reads Per Million reads,),miRNA,表达谱,M,个,miRNA,N,1,个疾病样本、,N,2,个正常样本,利用表达谱寻找复杂疾病,相关,miRNA,差异表达分析,寻找异常表达,miRNA,Fold change,、,T-test,、,ANOVA,、,SAM,等,低通量实验证实,生物学证实,Target genes,miRNA,功能,1,功能,n,功能,2,功能注释,/,功能富集,表型,miRNA,功能预测和病理假设,miRNA,表达的失调和许多复杂疾病相关,比如心血管类疾病和癌症等,miRNA,与癌症,miRNA,表达谱的基因组范围研究指出原发癌中存在,miRNA,的表达变化,特异的,miRNA,表达谱与特定类型的癌症有关,提示其有用于诊断的潜能,癌症的本质归结为各种原因引起的基因结构和功能的异常,致癌基因的高表达,抑癌基因的低表达,某些,miRNA,作用靶基因是重要的癌通路组成部分,参与了癌基因网络调控,miRNA,miRNA,表达,的变化认为是发生癌症的共同特征,oncogenic,miRNAs,(,oncomiRs,),Proliferation,Invasion,metastasis Angiogenesis,Apoptosis,Oncogenic,miRNAs,Tumor Suppressor,miRNAs,Cancer,表达降低,表达升高,mir-17-92 cluster as,oncogenic,miRNAs,c-MYC,mir-17,Promote stem cell properties,mir-17-92 cluster is located at a amplified region DNA in B-cell lymphomas.,Here,we have shown that one miRNA polycistron is not only the subject of tumour-specific amplification,but that it is also overexpressed in tumours and tumour cell lines,and can act as an oncogene in vivo.,A detailed,mechanistic understanding of how this non-coding RNA cluster acts as an oncogene is at present hampered by,the lack of a validated biochemical strategy for identifying miRNA targets,.,mir-17-92 cluster as tumour suppressor,c-MYC,17-5p,20a,E2F1,mir-17,Proliferation,Growth,Loss-of-heterozygosity,of the chromosomal region encompassing the mir-17 cluster,(,13q31,),has been observed in human malignancies.,Negative regulation of E2F1 translation,by miR-17-5p and miR-20a provides a mechanism to,dampen this reciprocal activation,promoting,tightly controlled,expression of c-Myc and E2F1 gene products.It suggests that the mir-17 cluster,by decreasing E2F1 expression,tightly regulates c-Myc-mediated cellular proliferation.,It is thus likely that these,miRNAs,influence cell proliferation and tumorigenesis in a cell-type specific manner,depending on the milieu of target mRNAs that are expressed,.,与癌症相关的,miRNA,Journal of Thoracic Oncology,:,December 2011-Volume 6,癌症中的,ncRNA,表达,ncRNA,表达谱可作为特定癌症的表型标签,癌症中的,ncRNA,表达变化是因还是果,需要对,ncRNA,功能的进一步研究,二、,ncRNA,表达谱分类人类癌症,许多研究已经表明编码蛋白的转录本,(,mRNA,),可以有效地区分各种癌症。这些与癌症相关的转录本作为一种可靠的生物学标记(,biomark,)已被广泛应用于各种癌症的分型研究。,我们将采用,Lu,等人发表于,2005,年,nature,期刊,miRNA,表达谱数据来探索基于,miRNA,表达水平的癌症分类。,首先,GEO,数据库,GSE2564,获取所有相关数据,其中包括,334,个样本的原始,miRNA,表达数据,预处理后的,miRNA,表达数据,探针信息,样本信息等。该表达谱数据包含用两个芯片平台检测的,334,个样本的,miRNA,表达谱。,所采用的预处理过程包括基于控制探针的标准化,修正表达强度偏低的探针,删除所有控制探针,以及对表达值进行以,2,为底的对数转换。,采用层次聚类方法,平均链路算法,皮尔森相关系数可以明显看出具有共同组织发育起源的样本被聚到一起。,除了上述所用到,218,个样本,该数据还包括了检测自,73,个急性淋巴细胞白血病患者骨髓样本的,miRNA,表达水平。,利用,t,检验方法对正常组织与肿瘤组织的,miRNA,表达水平进行比较,并使用随机扰动的方法为每个,miRNA,产生一个,p,值,最后对,p,值进行,bonferroni,校正。,2012,年,8,月,28,日,Genome Biology,,斯坦福大学医学院研究人员进行首个大型的癌症,lncRNA,表达谱分析。对,64,个肿瘤样品高通量,RNA-seq,测序,在各种肿瘤类型之间找出差异表达的,1065,个,lncRNA,(,图,12-13,),。因此,lncRNA,可以成为生物标志物。,图,12-13 lncRNA,表达谱分类人类癌症,Glioma gene expression data used in this study were obtained from the publicly available GEO.,Affymetrix HG-U133 Plus 2.0 platform,2448 lncRNA transcripts with corresponding Affymetrix probe IDs,Significance Analysis of Microarrays was used to determine the differentially expressed lncRNAs,2-fold,FDR10%,Differentially expressed lncRNA probe sets between normal brains and gliomas,A total of 129 lncRNA probe sets,(,corresponding to 102 lncRNAs,),identified as significantly different between normal brain tissues and gliomas by SAM.,Blue-normal brain tissues,;,yellow-glioma samples.,三,、,nc,RNA,表达谱与,mRNA,表达谱的整合分析,随着检测技术的不断发展,生物学资源的大量涌现,生物信息学研究者已经不仅仅局限于使用一种数据资源,表型数据,互作网络,表达数据,SNP,整合,整合多种类型的生物数据(如各种表达谱数据、互作网络、调控网络、,SNP,数据、表型数据等)来解决特定复杂的生物医学问题,剖析重大疾病相关,miRNA,的调控机制和功能,生物学证实,Target genes,miRNA,功能,1,功能,n,功能,2,表型,背景信息,?,HITS-CLIP,It is clear that,miRNAs,have many different targets dozens in some cases,hundreds in others but depending on the cells involved,it seems likely that only a small number of them have a crucial role in cancer pathogenesis.,nature reviews genetics,(,2009,),预测疾病背景下,miRNA,调控的靶基因,数据,mRNA,表达谱,miRNA,表达谱,miRNA-mRNA,靶向关系,皮尔森相关系数,A hub miRNA signature predicts survival in glioma,前提假设,miRNAs implicated in a specific tumor phenotype will,show aberrant regulation,of their target genes,A key difference from other methods is that we identified dysregulated network edges,(,regulations,),instead of dysregulated nodes,(,miRNAs,),to assemble disease-related signatures.,miRNA,family,的协同失调作用,包含三个,miRNA,家族,mir-125,mir-181,和,mir-145,家族,最小的后验概率为,77.4%,,表明这些,miRNA,和前列腺癌相关,这些基因富集的功能有,pathways in prostate cancer,cell adhesion and apoptosis,等,第五节,复杂疾病非编码,RNA,的计算识别,Section 5,Computational Identification of Complex Diseases Associated Non-coding RNAs,一、概述,二、复杂疾病相关,miRNA,的,计算,识别,三、复杂疾病相关,lncRNA,的,计算,识别,四、复杂疾病相关非编码,RNA,数据资源,一、概述,系统地识别疾病相关的,ncRNA,是在分子水平上理解,ncRNA,诱导疾病的发病机制的前体,是为疾病诊断,治疗和预防设计有关特定分子工具的关键。,通过实验方法通常只局限于单一或者少量的,ncRNA,,难以从系统的角度研究疾病相关的,ncRNA,。,计算生物学的方法成为解决这一问题的关键,为未来实验设计提供优先的对象。,基于,miRNA-,靶基因预测,基于,miRNA,调控网络预测,miRNA,协同与复杂疾病,二、复杂疾病相关,miRNA,的,计算,识别,基于,miRNA-,靶基因预测,虽然许多靶预测算法预测,miRNA,靶基因,但是预测出来的,miRNA,靶基因列表具有很高的假阳性。,Liu,等人提出一个简单的算法识别癌症中异常调控,miRNA-,靶基因对,这些互作满足:,1,),种子序列的完美匹配且在物种间具有保守性;,2,),miRNA,和靶基因在癌症样本中显著差异表达;,3,),miRNA,和靶基因在表达上呈现显著逆向相关。,识别癌症相关的关键,miRNA-,靶互作成为一把理解,miRNA,在癌症发生,机制,的关键钥匙,Xiao,等人通过阅读大量文献,构建已知癌症相关的,miRNA-,靶互作对,发现癌症相关的关键,miRNA-,靶互作,与,非疾病相关,miRNA-,靶互作,相比:,癌症相关的关键,miRNA-,靶互作拥有更多的,miRNA,绑定位点,(,尤其是,8-mer,结合位点,),、更可靠的结合作用、更高的表达相关性和更广泛的功能覆盖度,The PCmtI model,优化癌症相关的,key miRNAtarget interactions,miRNA-,靶互作不同的特征,包括整合序列、表达和功能等多方面的基因组信息,SVM,分类器,李等人提出了一种计算的方法,可以通过计算,miRNAs,靶基因和癌症基因之间的功能一致性得分,(,FCS,),来衡量,miRNAs,和癌症之间的关联性。,miRNA,通过控制一些在分子网络中起关键作用的编码基因从而调控整个分子网络。,miRNA,倾向调控信号蛋白、代谢酶、互作网络,HUB,(,互作关系多的蛋白,),等一系列网络中起关键作用的基因。,被,miRNA,靶向的基因也倾向被转录因子调控。,miRNA1,疾病,1,miRNA2,miRNA3,疾病,2,疾病,3,miRNA1,miRNA2,miRNA3,疾病,1,疾病,2,疾病,3,A,B,C,重大疾病中的,miRNA,协同调控作用,重大疾病中的,miRNA,协同调控作用,重大疾病中的,miRNA,协同调控作用,Nucleic Acids Research,.,Vol.39,No.3 825836,February,201,1,miRNAmiRNA synergistic network:construction via co-regulating functional modules and disease miRNA topological features*,Juan Xu,Chuan-Xing Li,Yong-Sheng Li,Jun-Ying Lv,Ye Ma,Ting-Ting Shao,Liang-De Xu,Ying-Ying Wang,Lei Du,Yun-Peng Zhang,Wei Jiang,Chun-Quan Li,Yun Xiao and Xia Li*,College of Bioinformatics Science and Technology,Harbin Medical University,Harbin 150081,China,被引用,81,次,包括,PNAS,,,Genome research,,,Frontiers in Genetics,,,Nuc
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!