生物信息学第二版-非编码RNA与复杂疾病课件

上传人:风*** 文档编号:241878472 上传时间:2024-08-02 格式:PPT 页数:192 大小:36.62MB
返回 下载 相关 举报
生物信息学第二版-非编码RNA与复杂疾病课件_第1页
第1页 / 共192页
生物信息学第二版-非编码RNA与复杂疾病课件_第2页
第2页 / 共192页
生物信息学第二版-非编码RNA与复杂疾病课件_第3页
第3页 / 共192页
点击查看更多>>
资源描述
生物信息学生物信息学生物信息学第十二章第十二章 非编码非编码RNARNA与与复杂疾病复杂疾病北京大学北京大学 崔庆华崔庆华哈尔滨医科大学哈尔滨医科大学 李霞、徐娟李霞、徐娟生物信息学生物信息学第十二章非编码RNA与北京大学人类基因组的蛋白质编码区的总和占总基因组人类基因组的蛋白质编码区的总和占总基因组长度为长度为1 12 2,那么其他,那么其他9898的基因组有什的基因组有什么功能么功能呢(呢(junk dnajunk dna)?)?(1 1)4242的基因组是插入编码序列的的基因组是插入编码序列的内含子序列内含子序列;人类基因平均每个基因有人类基因平均每个基因有7 7个内含子。但这个内含子。但这么冗长的内含子序列有什么生物学功能呢么冗长的内含子序列有什么生物学功能呢?(2 2)其他)其他55%55%的基因组的功能是什么?的基因组的功能是什么?【注:注:90%90%以上的基因组都是转录的!以上的基因组都是转录的!】人类基因组草图带给科学家们的困惑人类基因组草图带给科学家们的困惑人类基因组的蛋白质编码区的总和占总基因组长度为12,那生物信息学第二版-非编码RNA与复杂疾病课件人类基因组绝大部分都被转录成人类基因组绝大部分都被转录成RNARNA,细胞内非编码细胞内非编码RNARNA的数量是编码的数量是编码RNARNA的上百倍。这促使许多科学家认的上百倍。这促使许多科学家认为为生物体复杂性被隐藏在它们所输出的非编码生物体复杂性被隐藏在它们所输出的非编码RNARNA内,内,而非编码序列内而非编码序列内。人类基因组绝大部分都被转录成RNA,细胞内非编码RNA的数量生物信息学第二版-非编码RNA与复杂疾病课件non-coding RNA,ncRNAnon-coding RNA,ncRNA不能翻译成蛋白的功能性不能翻译成蛋白的功能性RNARNA分子分子Housekeeping non-coding RNAHousekeeping non-coding RNAtRNAstRNAs、rRNAsrRNAs、snRNAs etc.snRNAs etc.Regulatory non-coding RNARegulatory non-coding RNAsmall non-coding RNAsmall non-coding RNAsiRNAsiRNA、miRNAmiRNA、piRNApiRNA etc.etc.Long non-coding RNA Long non-coding RNA(lncRNAlncRNA,200 nt 200 nt)non-codingRNA,ncRNA不能翻译成蛋白的功生物信息学第二版-非编码RNA与复杂疾病课件第一节第一节 引言引言 Section 1 IntroductionSection 1 Introduction第一节引言Section1Introduction随着随着ncRNAncRNA在复杂疾病中的研究深入,研究者发现其在复杂疾病中的研究深入,研究者发现其在疾病的发生发展过程中起着巨大的作用,其功能异在疾病的发生发展过程中起着巨大的作用,其功能异常能够导致各种人类复杂疾病的发生。这将使常能够导致各种人类复杂疾病的发生。这将使ncRNAncRNA可能成为疾病诊断、预后的新的生物学标记可能成为疾病诊断、预后的新的生物学标记(biomarkbiomark),并为更进一步理解复杂疾病的发病机),并为更进一步理解复杂疾病的发病机理提供了新的手段。理提供了新的手段。随着ncRNA在复杂疾病中的研究深入,研究者发现其在疾病的发第二节第二节 非编码非编码RNARNA与其靶基因与其靶基因 Section 2 Section 2 Non-coding RNAs and TargetsNon-coding RNAs and Targets第二节非编码RNA与其靶基因Section(一)(一)miRNAmiRNA的发现的发现一、一、miRNAmiRNA概述概述 miRNA was first discovered in 1993 by miRNA was first discovered in 1993 by Victor Ambros at Harvard Victor Ambros at Harvard(lin-4lin-4)The second miRNA The second miRNA Let-7Let-7 was discovered in was discovered in 2000 by Frank Slack as a postdoc at Harvard2000 by Frank Slack as a postdoc at Harvard (Gary Ruvkun labGary Ruvkun lab)(一)miRNA的发现一、miRNA概述miRNAwasThe discovery of miRNAsThe discovery of miRNAsVictor AmbrosVictor AmbrosGary RuvkunGary RuvkunThediscoveryofmiRNAsVictor生物信息学第二版-非编码RNA与复杂疾病课件microRNAs had been neglected for so many years microRNAs had been neglected for so many years because of their small size.because of their small size.The underlying reason The underlying reason is:people never dream is:people never dream that small RNAs will that small RNAs will have important have important biological roles.biological roles.microRNAshadbeenneglectedfThe number of the identified miRNAs is The number of the identified miRNAs is growing rapidly in recent yearsgrowing rapidly in recent years.Release 21 Release 21(JuJulyly 201 2014 4)of the miRBase of the miRBase database have added database have added 4196 4196 new hairpin new hairpin sequences andsequences and 5441 5441 new mature productsnew mature productsRelease 20 Release 20 contains contains 24521 24521 entries entries representing hairpin precursor miRNAs,representing hairpin precursor miRNAs,expressingexpressing 30424 30424 mature miRNA products,in mature miRNA products,in 206206 species.species.ThenumberoftheidentifiedmThese miRNAs are from primates,rodentsThese miRNAs are from primates,rodents啮齿类啮齿类,birds,fish,worms,flies,plants and viruses.birds,fish,worms,flies,plants and viruses.The data are freely available to all through The data are freely available to all through the web interface at http:/www.mirbase.org/.the web interface at http:/www.mirbase.org/.ThesemiRNAsarefromprimatesSince around 2007,the overwhelming majority of Since around 2007,the overwhelming majority of microRNAs deposited in miRBase have been microRNAs deposited in miRBase have been predicted from predicted from small RNA deep sequencing small RNA deep sequencing experimentsexperiments.Sincearound2007,theoverwhemiRNAmiRNA的生物合成过程的生物合成过程mature miRNAmature miRNAPrecursor miRNAPrecursor miRNAPrimary miRNAPrimary miRNAmiRNA genemiRNA gene转录转录剪切剪切剪切剪切 miRNA miRNA(二)(二)miRNAmiRNA的生物合成的生物合成miRNA的生物合成过程maturemiRNAPrecurRNA poly II/IIIDroshaDicer几百几百 几千碱基几千碱基约约70 9070 90碱碱基基约约2222碱基碱基RNApolyDroshaDicer几百几千碱基约70miRNA miRNA 例子例子miRNA例子The miRNA genes and Structure of pri-miRNAsThe miRNA genes and Structure of pri-miRNAsPri-miRNAs bear the 5 cap and 3 Pri-miRNAs bear the 5 cap and 3 polypoly(A A)tailstailsThemiRNAgenesandStructure(三)(三)miRNAmiRNA的特点、作用机制及分类的特点、作用机制及分类microRNAmicroRNA命名规则命名规则hsa-miR-181a-2*hsa-miR-181a-2*hsahsa人,人,musmus小鼠,小鼠,ratrat大鼠大鼠letlet,lin,mirlin,mir,miR,miR,181181:编号,按注册顺序:编号,按注册顺序a a:与已注册的:与已注册的miRNAmiRNA序列高度同源序列高度同源(三)miRNA的特点、作用机制及分类microRNA命名规2:2:由不同染色体上的由不同染色体上的DNADNA序列转录加工而成的具序列转录加工而成的具有相同成熟体序列的有相同成熟体序列的 miRNA,miRNA,则在后面加上阿拉伯则在后面加上阿拉伯数字以区分数字以区分*:如果一个前体的:如果一个前体的2 2个臂分别产生个臂分别产生miRNA,miRNA,则根据则根据克隆实验克隆实验,在表达水平较低的在表达水平较低的miRNA miRNA 后加后加“*”“*”;或进行如下命名或进行如下命名 hsa-miR-188-5p hsa-miR-188-5p(或(或hsa-miR-hsa-miR-188-3p188-3p)5p5p:表示从:表示从 5 5 端的臂加工而来;端的臂加工而来;3p3p:表示:表示从从 3 3 端的臂加工而来端的臂加工而来2:由不同染色体上的DNA序列转录加工而成的具有相同成熟hsa-mir-188二级结构 hsa-miR-188-5phsa-miR-188-3p5 3 hsa-mir-188hsa-miR-188-5phsa-mmiRNA/miRNA-star VS -5p/-3pmiRNA/miRNA-star VS -5p/-3pthe dominant strand could change in different the dominant strand could change in different biological settings leading to different names biological settings leading to different names describing the same moleculedescribing the same moleculemiRNA/miRNA-starVS-5p/-3p5p arm 5p arm(placentaplacenta)to the 3p arm to the 3p arm(heart,liver,and heart,liver,and kidneykidney)5parm(placenta)tothe3parm物理位置特点物理位置特点miRNAmiRNA基因以单拷贝、多拷贝和基因簇等多种形基因以单拷贝、多拷贝和基因簇等多种形式存在于基因组中。式存在于基因组中。miRNAmiRNA簇(簇(miRNA clustersmiRNA clusters)是指在染色体上彼)是指在染色体上彼此紧密相邻的两个或者多个此紧密相邻的两个或者多个miRNAmiRNA构成的构成的miRNAmiRNA群群miRNAmiRNA倾向于成簇出现在染色体上;通常定义倾向于成簇出现在染色体上;通常定义50kb50kb的距离为一簇的距离为一簇同一簇中的同一簇中的miRNAmiRNA倾向是共表达的倾向是共表达的miRNAmiRNA一般特点一般特点 miRNA miRNA家族家族/簇簇物理位置特点miRNA一般特点miRNA家族/簇序列(特别是种子序列)高度同源的序列(特别是种子序列)高度同源的miRNAmiRNA被归为一被归为一个个miRNAmiRNA家族家族同一家族中的同一家族中的miRNAmiRNA并不一定是成簇的。并不一定是成簇的。生物信息学第二版-非编码RNA与复杂疾病课件seedseedseedmiRNAmiRNA的一般特点的一般特点序列特点序列特点非编码性非编码性成熟的成熟的miRNA 5 miRNA 5 端为单一磷酸基团,端为单一磷酸基团,33端端为羟基为羟基,这一特点使它与大多数寡核苷酸和功这一特点使它与大多数寡核苷酸和功能能RNA RNA 的降解片段区别开来;的降解片段区别开来;miRNA的一般特点序列特点表达特点表达特点miRNAmiRNA具有时序性以及组织特异性具有时序性以及组织特异性在特定的时间,组织中才会表达在特定的时间,组织中才会表达保守性特点保守性特点在物种间高度保守在物种间高度保守表达特点miRNAmiRNA的作用机制的作用机制 通过和靶基因通过和靶基因3UTR3UTR(33非翻译区)结合非翻译区)结合导致导致RNARNA诱导的沉默复合体(诱导的沉默复合体(RNA-induced RNA-induced silencing complex,silencing complex,简称简称RISCRISC)降解降解其靶其靶mRNAmRNA或或阻阻碍碍其靶的其靶的翻译翻译。miRNA的作用机制通过和靶基因3UTR(3非翻译区)RISCRISC转录后层面转录后层面调控基因表达调控基因表达RISC转录后层面二、基于序列的二、基于序列的miRNAmiRNA靶基因预测方法靶基因预测方法miRNAmiRNA靶基因预测遵循的基本原则靶基因预测遵循的基本原则 miRanda miRanda TargetScan TargetScan 二、基于序列的miRNA靶基因预测方法miRNA靶基因预测遵Three Classes of miRNA Target Three Classes of miRNA Target Sites Sites(Brennecke et al.Plos Brennecke et al.Plos Biology 2005Biology 2005)ThreeClassesofmiRNATarget(一)(一)miRNAmiRNA靶基因预测遵循的原则和基本步骤靶基因预测遵循的原则和基本步骤 miRNAmiRNA的的“种种子子区区”与与mRNAmRNA的的3UTR3UTR序序列列碱碱基基互互补补靶点在多物种间的序列保守性靶点在多物种间的序列保守性miRNAmiRNA与与mRNAmRNA形成双链结构的热力学稳定性形成双链结构的热力学稳定性靶靶基基因因二二级级结结构构和和靶靶点点外外的的序序列列对对靶靶基基因因预预测测的的影响影响遵循的原则遵循的原则(一)miRNA靶基因预测遵循的原则和基本步骤miRNA的miRNAmiRNA靶位点预测的难点:靶位点预测的难点:miRNAmiRNA与靶位点的不完全互不配对与靶位点的不完全互不配对miRNA靶位点预测的难点:基本步骤基本步骤在在3UTR3UTR上探寻和上探寻和miRNA“miRNA“种子区种子区”完全互补的完全互补的序列;序列;计算计算miRNAmiRNA和这些序列结合产生的自由能下降值,和这些序列结合产生的自由能下降值,对靶点进行筛选;对靶点进行筛选;对靶点进行物种间序列比对,利用物种保守性进对靶点进行物种间序列比对,利用物种保守性进一步筛选。一步筛选。基本步骤在3UTR上探寻和miRNA“种子区”完全互补的序(三)(三)TargetScanTargetScanTargetScanTargetScan主要考虑物种间保守的主要考虑物种间保守的miRNAmiRNA靶基因,并靶基因,并且在且在TargetScanTargetScan中首次提出了中首次提出了“种子匹配种子匹配”(seed seed matchmatch)的概念。)的概念。http:/www.targetscan.org/http:/www.targetscan.org/(三)TargetScanTargetScan 主要考虑物种间TargetScanTargetScan算法的基本步骤算法的基本步骤在在TargetScanTargetScan算算法法中中,“种种子子匹匹配配”被被定定义义为为miRNA miRNA 55端端的的第第2 28 8位位碱碱基基与与mRNA mRNA 3UTR 3UTR 上上的的一一段段7nt7nt(nucleotidenucleotide)序序列列完完全全互互补补,miRNAmiRNA上上的的这这7 7个核苷酸被称为个核苷酸被称为miRNA“miRNA“种子区种子区”。从从种种子子区区开开始始向向miRNAmiRNA两两侧侧寻寻找找互互补补碱碱基基,允允许许G-UG-U配配对对,直直到到出出现现碱碱基基错错配配为为止止。在在物物种种保保守守方方面面,TargetScanTargetScan算算法法发发现现随随着着物物种种数数目目的的增增多多,预预测测的的靶靶基基因因数数目目逐逐渐渐减减少少,但但预预测测结结果果的的准准确确率率得得到到提提高。高。TargetScan 算法的基本步骤在TargetScan 算法三、基于表达信息预测三、基于表达信息预测miRNAmiRNA靶基因靶基因 HuangHuang等人利用在等人利用在8888个组织中同时检测了个组织中同时检测了miRNAmiRNA和和mRNAmRNA表达的数据,并结合贝叶斯方法开发了靶基因表达的数据,并结合贝叶斯方法开发了靶基因预测算法预测算法GenMiR+GenMiR+,得到了,得到了104104个人类个人类miRNAmiRNA的高精的高精度靶基因,并通过实验证实了预测的度靶基因,并通过实验证实了预测的let-7blet-7b靶基因,靶基因,结果表明,与基于序列的方法相比,利用相同样本结果表明,与基于序列的方法相比,利用相同样本中同时检测中同时检测miRNAmiRNA和和mRNAmRNA的表达谱可以更准确的预的表达谱可以更准确的预测测miRNAmiRNA靶基因。靶基因。(Huang,Using expression profiling data to identify Huang,Using expression profiling data to identify human microRNA targets.Nat.Methods.human microRNA targets.Nat.Methods.)三、基于表达信息预测miRNA靶基因Huang等人利用在8生物信息学第二版-非编码RNA与复杂疾病课件生物信息学第二版-非编码RNA与复杂疾病课件四、基于高通量测序结果预测四、基于高通量测序结果预测miRNAmiRNA靶基因靶基因Argonaute CLIP-SeqArgonaute CLIP-SeqRIP-CLIPRIP-CLIPpSILACpSILACDegradome-SeqDegradome-Seq四、基于高通量测序结果预测miRNA靶基因ArgonauteAgo binds in a Ago binds in a ternary ternary 三元的三元的 complex to both complex to both miRNA and mRNA,with sufficiently close miRNA and mRNA,with sufficiently close contacts to allow UV-crosslinking to either contacts to allow UV-crosslinking to either RNA;mRNA tags will be in the immediate RNA;mRNA tags will be in the immediate vicinity of miRNA binding sites.vicinity of miRNA binding sites.Agobindsinaternary三元的coArgonaute CLIP-SeqArgonaute CLIP-SeqArgonauteCLIP-SeqArgonaute CLIP-SeqArgonaute CLIP-SeqArgonaute CLIP-Seq,Argonaute CLIP-Seq,又称为又称为HITS-CLIP HITS-CLIP(ultraviolet cross-linking and immune-ultraviolet cross-linking and immune-precipitationand and high-throughput precipitationand and high-throughput sequencing sequencing),即紫外交联免疫共沉淀与高通量测),即紫外交联免疫共沉淀与高通量测序偶联技术。序偶联技术。CLIP CLIP 技术是研究技术是研究RNARNA结合蛋白结合蛋白(或者(或者RNARNA)体内)体内结合靶标的新技术。结合靶标的新技术。通过紫外交联将通过紫外交联将RNARNA结合蛋白结合蛋白与与体内结合的体内结合的RNARNA分分子子进行固定,用进行固定,用AgoAgo蛋白的抗体蛋白的抗体免疫共沉淀免疫共沉淀之后之后酶解未受蛋白保护的酶解未受蛋白保护的RNARNA,可以获得,可以获得AgoAgo蛋白蛋白直接直接结合结合的的RNARNA序列。序列。ArgonauteCLIP-SeqArgonauteCL针对针对AGOAGO蛋白的蛋白的CLIP-seqCLIP-seq技术能够在全基因组范围内技术能够在全基因组范围内鉴定与鉴定与AGOAGO蛋白结合的小蛋白结合的小RNARNA及其及其mRNAmRNA靶标。靶标。Chi,SW,Zang,JB,Mele,A,Darnell,Chi,SW,Zang,JB,Mele,A,Darnell,RB.RB.20092009.Argonaute HITS-CLIP decodes.Argonaute HITS-CLIP decodes microRNA-mRNA interaction maps.Nature.microRNA-mRNA interaction maps.Nature.460:479-86460:479-86。针对AGO蛋白的CLIP-seq技术能够在全基因组范围内鉴定Furthermore HITS-CLIP reads do not precisely Furthermore HITS-CLIP reads do not precisely pinpoint the position of crosslinking between the pinpoint the position of crosslinking between the RNA and protein,and thus can only identify a RNA and protein,and thus can only identify a targeted region targeted region(100-nt100-nt)as opposed to a as opposed to a specific target site.specific target site.FurthermoreHITS-CLIPreadsdo生物信息学第二版-非编码RNA与复杂疾病课件20102010年,年,Gene W.YeoGene W.Yeo采用采用AGO-CLIPseqAGO-CLIPseq技术在线技术在线虫中鉴定了虫中鉴定了ArgonauteArgonaute的结合位点,发现其不仅结的结合位点,发现其不仅结合合mRNAmRNA的的3UTR3UTR区域区域,也会结合编码,也会结合编码外显子区域外显子区域,还发现还发现ArgonauteArgonaute大量结合的区域对于大量结合的区域对于miRNA miRNA 的功的功能非常重要,揭示了其新的自我调控的功能。能非常重要,揭示了其新的自我调控的功能。要想获得检测区域被哪个要想获得检测区域被哪个miRNAmiRNA调控,还需结合预调控,还需结合预测算法测算法2010年,GeneW.Yeo采用AGO-CLIPseq生物信息学第二版-非编码RNA与复杂疾病课件五、整合已有知识预测五、整合已有知识预测miRNAmiRNA靶基因靶基因 在在当当前前的的miRNAmiRNA靶靶基基因因预预测测研研究究中中,研研究究人人员员逐逐渐渐意意识识到到单单一一依依靠靠序序列列信信息息或或表表达达信信息息已已不不能能继继续续提提高高miRNAmiRNA靶基因预测效能。靶基因预测效能。整整合合功功能能信信息息、蛋蛋白白质质互互作作信信息息、表表达达信信息息、序序列列信信息息以以及及当当前前实实验验证证实实的的miRNAmiRNA靶靶基基因因等等已已有有资资源源预测预测miRNAmiRNA靶基因十分必要。靶基因十分必要。五、整合已有知识预测miRNA靶基因在当前miRNAmiRNA靶点优化算法靶点优化算法miRNA靶点优化算法生物信息学第二版-非编码RNA与复杂疾病课件生物信息学第二版-非编码RNA与复杂疾病课件六、六、lncRNAlncRNA概述及靶基因识别概述及靶基因识别lncRNAlncRNA定义定义lncRNAlncRNA特点特点lncRNAlncRNA作用机制作用机制六、lncRNA概述及靶基因识别lncRNA定义Definition of lncRNADefinition of lncRNALong non-coding RNAs Long non-coding RNAs(long ncRNAs,long ncRNAs,lncRNAslncRNAs)are non-protein coding transcripts are non-protein coding transcripts longer than 200 nucleotides longer than 200 nucleotides(Perkel 2013Perkel 2013).lncRNAs are transcripts that are 200 lncRNAs are transcripts that are 200 nucleotides in length and nucleotides in length and do not have do not have the the potential to encode for proteins exceeding potential to encode for proteins exceeding lengths lengths of 30 amino acidof 30 amino acids s(Mercer TR.Nat.Mercer TR.Nat.Rev.Genet.2009,Li X Med.Res.Rev.2012 Rev.Genet.2009,Li X Med.Res.Rev.2012).DefinitionoflncRNALongnon-cThis somewhat This somewhat arbitraryarbitrary limit distinguishes limit distinguishes long ncRNAs from small regulatory RNAs such long ncRNAs from small regulatory RNAs such as miRNAs,siRNAs,piRNAs,snoRNAs,and other as miRNAs,siRNAs,piRNAs,snoRNAs,and other short RNAs.short RNAs.ThissomewhatarbitrarylimitLarge scale RNA-seqLarge scale RNA-seqindicate that indicate that lncRNA number lncRNA number in the order of in the order of tens of thousands tens of thousands in mammals.in mammals.9277 9277 manually annotated genes producing manually annotated genes producing 1488014880 transcripts transcripts(GENCODE v7GENCODE v7).The number of protein coding genes in our The number of protein coding genes in our genome has been revised downward multiple genome has been revised downward multiple timestimeswhereas the number of known non protein whereas the number of known non protein coding transcripts has increased coding transcripts has increased exponentially over the past decade.exponentially over the past decade.生物信息学第二版-非编码RNA与复杂疾病课件Features of lncRNAsFeatures of lncRNAsFeaturesoflncRNAs生物信息学第二版-非编码RNA与复杂疾病课件生物信息学第二版-非编码RNA与复杂疾病课件Features of lncRNAsFeatures of lncRNAslncRNAs are generated by the same lncRNAs are generated by the same transcriptional machinery as are other mRNAs transcriptional machinery as are other mRNAs lncRNAs are with lncRNAs are with similar histone-modification similar histone-modification profiles,splicing signalsprofiles,splicing signals.H3K4me3,H3K36me3H3K4me3,H3K36me3lncRNAs are predominantly localized in the lncRNAs are predominantly localized in the chromatin and nucleus,and a fraction appear to chromatin and nucleus,and a fraction appear to be preferentially processed into small RNAsbe preferentially processed into small RNAs.FeaturesoflncRNAslncRNAsarelncRNA expressionlncRNA expressionTissue-specific Tissue-specific lncRNAs expressed lncRNAs expressed in the brain.in the brain.lncRNAexpressionTissue-specif生物信息学第二版-非编码RNA与复杂疾病课件conservationconservationMany small RNAsMany small RNAs,such as miRNAs or snoRNAs,such as miRNAs or snoRNAs,exhibit exhibit strong conservation strong conservation across diverse across diverse species species(Bentwich 2005Bentwich 2005).In contrast,in general In contrast,in general lncRNAs lack strong lncRNAs lack strong conservationconservation,which is often cited as,which is often cited as evidence of non-functionality evidence of non-functionality(Brosius 2005;Brosius 2005;Struhl 2007Struhl 2007).Despite low conservation of long ncRNAs in Despite low conservation of long ncRNAs in general,it should be noted that many long general,it should be noted that many long ncRNAs still contain strongly conserved ncRNAs still contain strongly conserved elementselementsconservationManysmallRNAs,s生化鉴定和功能研究尚处于起步阶段生化鉴定和功能研究尚处于起步阶段,目前仅有目前仅有大约大约100100多种已知功能的多种已知功能的lncRNAslncRNAs。As of December 2012,127 LncRNAs have As of December 2012,127 LncRNAs have been functionally annotated been functionally annotated ininLncRNAdbLncRNAdb(a database of literature a database of literature described LncRNAsdescribed LncRNAs)()(Amral 2011Amral 2011).lncRNAlncRNA通过通过表观遗传学调控、转录调控、转录后表观遗传学调控、转录调控、转录后调控、蛋白活性调控调控、蛋白活性调控等多种方式调控相关基因的等多种方式调控相关基因的作用作用生化鉴定和功能研究尚处于起步阶段,目前仅有大约100多种已生物信息学第二版-非编码RNA与复杂疾病课件LncRNA as Scaffold for Transcription RepressionLncRNA as Scaffold for Transcription RepressionLncRNAasScaffoldforTranscrHOTAIR and PRC2HOTAIR and PRC2HOTAIRandPRC2lncRNA as miRNA DecoylncRNA as miRNA DecoyPoliseno et al,Nat Poliseno et al,Nat 20112011lncRNAasmiRNADecoyPolisenolncRNAlncRNA研究存在的问题研究存在的问题lncRNAlncRNA的定义的定义 200nt200nt,过于武断,过于武断lncRNAlncRNA的命名原则:目前根据功能、结构、作用的命名原则:目前根据功能、结构、作用方式等命名方式等命名lncRNAlncRNA相关数据库的内容不够全,注释内容不够相关数据库的内容不够全,注释内容不够丰富丰富lncRNA研究存在的问题lncRNA的定义200ntlncRNAlncRNA生物学功能的阐明生物学功能的阐明lncRNAlncRNA功能预测的工具不多功能预测的工具不多区分功能性和非功能性非编码转录本区分功能性和非功能性非编码转录本种类和功能复杂,使不同的种类和功能复杂,使不同的lncRNAlncRNA研究结果研究结果之间的借鉴意义并不高之间的借鉴意义并不高lncRNA生物学功能的阐明七、七、ncRNAncRNA数据资源数据资源ncRNAncRNA常用常用数据库数据库七、ncRNA数据资源ncRNA常用数据库miRBasemiRBase是一个集是一个集miRNAmiRNA序列、注释信息以及预测的序列、注释信息以及预测的靶基因数据为一体的数据库,是目前存储靶基因数据为一体的数据库,是目前存储miRNAmiRNA信息信息最主要的公共数据库之一最主要的公共数据库之一网址:网址:http:/www.mirbase.org/http:/www.mirbase.org/(一)(一)miRBasemiRBase数据库数据库miRBase是一个集miRNA序列、注释信息以及预测的靶基生物信息学第二版-非编码RNA与复杂疾病课件 TarBaseTarBase是一个目前使用广泛的存储实验检测的是一个目前使用广泛的存储实验检测的miRNAmiRNA与靶基因间关系的数据库,涵盖多种实验方与靶基因间关系的数据库,涵盖多种实验方法检测的超过法检测的超过6500065000个个miRNAmiRNA与靶基因关系对。与靶基因关系对。其网址为:其网址为:http:/diana.cslab.ece.ntua.gr/tarbase/http:/diana.cslab.ece.ntua.gr/tarbase/(二)(二)TarBaseTarBase数据库数据库TarBase是一个目前使用广泛的存储实验检测的miRNATarBaseTarBase数据库界面介绍数据库界面介绍TarBase数据库界面介绍(三)(三)microRNA.orgmicroRNA.org数据库数据库microRNA.orgmicroRNA.org数据库数据库包含包含miRNAmiRNA靶基因以及表达谱数据靶基因以及表达谱数据网址:网址:http:/www.microrna.org/microrna/home.dohttp:/www.microrna.org/microrna/home.domiRNAmiRNA靶基因数据靶基因数据主要是利用主要是利用miRandamiRanda算法预测得来算法预测得来 miRNAmiRNA表达谱数据表达谱数据来自一个针对人类主要器官和细胞系的小来自一个针对人类主要器官和细胞系的小RNARNA库库测序计划测序计划 (三)microRNA.org数据库microRNA.org(四)(四)lncRNAlncRNA相关数据库相关数据库因为因为lncRNAlncRNA是一个非常新的研究领域,是一个非常新的研究领域,lncRNAlncRNA在疾在疾病中的作用的研究还是起步阶段,数据量还不够大,病中的作用的研究还是起步阶段,数据量还不够大,因此,相关的数据库也是处于起步阶段,相关数据因此,相关的数据库也是处于起步阶段,相关数据库还不多,也不够丰富。库还不多,也不够丰富。(四)lncRNA相关数据库因为lncRNA是一个非常新的研第三节第三节 非编码非编码RNARNA多态和复杂疾病多态和复杂疾病 Section 3 Section 3 Non-coding RNA Polymorphisms and Non-coding RNA Polymorphisms and Complex DiseaseComplex Disease第三节非编码RNA多态和复杂疾病Section3miRNAmiRNA多多态态(miRNA miRNA polymorphismspolymorphisms)是是影影响响miRNAmiRNA功功能能的的多多态态,可可能能发发生生在在miRNAmiRNA形形成成和和行行使使功功能能的的任任一一个个过过程程,以以插插入入、删删除除、扩扩增增或或染染色色体体异异位位的的形形式式出出现现,最最终终导导致致miRNAmiRNA绑绑定定位位点点或或者者功功能能的的缺缺失失(获获得得),是人类基因组一类新的功能多态。,是人类基因组一类新的功能多态。不不仅仅会会影影响响miRNAmiRNA的的产产生生和和表表达达,而而且且会会影影响响miRNAmiRNA与与靶基因的结合从而影响靶基因的表达靶基因的结合从而影响靶基因的表达。介绍介绍miRNA多态(miRNApolymorphisms)是影影响蛋白质参与影响蛋白质参与miRNAmiRNA合成与成熟,合成与成熟,导致新的导致新的miRNAmiRNA生成和靶基因的调控。生成和靶基因的调控。影响蛋白质参与miRNA合成与成熟,导致新的miRNA生成和一、位于一、位于miRNAmiRNA基因内部影响基因内部影响miRNAmiRNA生物学形成的多态生物学形成的多态在染色体基因组水平上单个核苷酸变异引起的在染色体基因组水平上单个核苷酸变异引起的miRNAmiRNA序列多态性对序列多态性对miRNAmiRNA的转录、形成、输出和调控具有的转录、形成、输出和调控具有重要影响。重要影响。一、位于miRNA基因内部影响miRNA生物学形成的多态在染Saunders,M.A.Saunders,M.A.等对人类等对人类474474个个miRNAsmiRNAs的的SNPsSNPs进行系进行系统的分析发现单核苷酸多态在统的分析发现单核苷酸多态在miRNAmiRNA序列内的密度低序列内的密度低于其周围的侧翼序列。于其周围的侧翼序列。Saunders,M.A.等对人类474个miRNAs的S4949个个pre-miRNApre-miRNA内存在内存在6565个个SNPsSNPs位点,其中位点,其中3 3个个miRNAsmiRNAs的种子序列存在的种子序列存在SNPsSNPs。49个pre-miRNA内存在65个SNPs位点,其中3个m(一)位于(一)位于pri/pre-miRNApri/pre-miRNA基因序列内部基因序列内部Saunders,M.A.Saunders,M.A.和和DuanDuan等人利用生物信息学的方法等人利用生物信息学的方法研究发现在研究发现在pri/pre-miRNApri/pre-miRNA内部存在单核苷酸多态。内部存在单核苷酸多态。位于位于pri/pre-miRNApri/pre-miRNA内部的多态会影响内部的多态会影响miRNAmiRNA的表达,的表达,产生新的产生新的miRNAmiRNA以及影响以及影响miRNAmiRNA与靶基因的结合,甚与靶基因的结合,甚至与疾病的风险相关。至与疾病的风险相关。(一)位于pri/pre-miRNA基因序列内部Saunde1.1.影响影响miRNAmiRNA的表达的表达DuanDuan等人在研究等人在研究miR-125miR-125时发现,该基因位点存在时发现,该基因位点存在SNPSNP,含有,含有miR-125a-G/UmiR-125a-G/U两种等位,其中两种等位,其中miR-125a-UmiR-125a-U能够显著影响能够显著影响DGCR8DGCR8与与pri-miRNA-125apri-miRNA-125a的结合与剪接,的结合与剪接,使成熟的使成熟的miR-125amiR-125a生成减少,使生成减少,使miR-125amiR-125a对靶基因对靶基因Lin-128Lin-128的翻译抑制作用减弱。的翻译抑制作用减弱。1.影响miRNA的表达Duan等人在研究miR-125时发生物信息学第二版-非编码RNA与复杂疾病课件2.2.产生新的产生新的miRNAmiRNAmiR-146amiR-146a前体会产生前体会产生miR-146amiR-146a(正链)和(正链)和miR-146a*miR-146a*(负链)两种(负链)两种miRNAmiRNA。在。在miR-146amiR-146a前体的茎环上存在的前体的茎环上存在的SNPSNP(rs2910164rs2910164)不仅会影响)不仅会影响miR-146amiR-146a的表达,而且的表达,而且会导致会导致miR-146a*CmiR-146a*C和和miR-146a*GmiR-146a*G两种两种miRNAmiRNA的产生。的产生。2.产生新的miRNAmiR-146a前体会产生miR-14(二)位于成熟的(二)位于成熟的miRNAmiRNA序列内部序列内部成熟的成熟的miRNAmiRNA与与mRNAmRNA的的3 3UTRUTR区域结合对区域结合对mRNAmRNA进行转录进行转录后调控。后调控。miRNAmiRNA与与mRNAmRNA结合的区域包括两部分:结合的区域包括两部分:种子区域种子区域 ,这一部分区域要求与,这一部分区域要求与mRNAmRNA严格匹配;严格匹配;种子区域附近的种子区域附近的3 3端方向,允许一定的程度的错配端方向,允许一定的程度的错配位于成熟位于成熟miRNAmiRNA序列的这些多态会影响对靶基因的调控,序列的这些多态会影响对靶基因的调控,消除、弱化、增强或者产生新的结合靶点。消除、弱化、增强或者产生新的结合靶点。(二)位于成熟的miRNA序列内部成熟的miRNA与mRNA目前的研究发现,位于目前的研究发现,位于miRNAmiRNA种子区域的多态不仅会种子区域的多态不仅会影响靶结合位点,还影响影响靶结合位点,还影响miRNAmiRNA的表达。的表达。例如例如位于位于miR-125amiR-125a种子区域的多态
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!