生物信息学miRNA资料课件

上传人:痛*** 文档编号:241596624 上传时间:2024-07-08 格式:PPT 页数:31 大小:1.74MB
返回 下载 相关 举报
生物信息学miRNA资料课件_第1页
第1页 / 共31页
生物信息学miRNA资料课件_第2页
第2页 / 共31页
生物信息学miRNA资料课件_第3页
第3页 / 共31页
点击查看更多>>
资源描述
第十六章第十六章 MicroRNAMicroRNA与复杂疾病与复杂疾病MicroRNA And Complex Disease 哈尔滨医科大学 李霞 MicroRNAMicroRNAMicroRNAMicroRNA简称简称简称简称miRNAmiRNAmiRNAmiRNA,一类非编码的小,一类非编码的小,一类非编码的小,一类非编码的小RNARNARNARNA分子(约分子(约分子(约分子(约22222222个核苷酸),通过和其靶基因个核苷酸),通过和其靶基因个核苷酸),通过和其靶基因个核苷酸),通过和其靶基因33非翻译区结合,导致非翻译区结合,导致非翻译区结合,导致非翻译区结合,导致RNARNARNARNA诱诱诱诱导的沉默复合体(导的沉默复合体(导的沉默复合体(导的沉默复合体(RNA-induced silencing complexRNA-induced silencing complexRNA-induced silencing complexRNA-induced silencing complex,简,简,简,简称称称称RISCRISCRISCRISC)降解其靶)降解其靶)降解其靶)降解其靶mRNAmRNAmRNAmRNA或阻碍其靶的翻译。或阻碍其靶的翻译。或阻碍其靶的翻译。或阻碍其靶的翻译。随着随着随着随着miRNAmiRNAmiRNAmiRNA在复杂疾病中的研究深入,研究者发现在在复杂疾病中的研究深入,研究者发现在在复杂疾病中的研究深入,研究者发现在在复杂疾病中的研究深入,研究者发现在疾病的发生发展过程中起着巨大的作用,其功能异常能够疾病的发生发展过程中起着巨大的作用,其功能异常能够疾病的发生发展过程中起着巨大的作用,其功能异常能够疾病的发生发展过程中起着巨大的作用,其功能异常能够导致各种人类复杂疾病的发生。这将使导致各种人类复杂疾病的发生。这将使导致各种人类复杂疾病的发生。这将使导致各种人类复杂疾病的发生。这将使miRNAmiRNAmiRNAmiRNA可能成为疾可能成为疾可能成为疾可能成为疾病诊断、预后的新的生物学标记(病诊断、预后的新的生物学标记(病诊断、预后的新的生物学标记(病诊断、预后的新的生物学标记(biomarkbiomarkbiomarkbiomark),并为更进),并为更进),并为更进),并为更进一步理解复杂疾病的发病机理提供了新的手段。一步理解复杂疾病的发病机理提供了新的手段。一步理解复杂疾病的发病机理提供了新的手段。一步理解复杂疾病的发病机理提供了新的手段。第一节第一节 引言引言 Section 1 Introduction Section 1 Introduction第二节第二节 miRNAmiRNA与靶基因与靶基因 Section 2 Section 2 miRNAsmiRNAs and Their Targets and Their Targets一、miRNA生物起源(一)(一)miRNAmiRNA的发现的发现 miRNAmiRNA首次发现于首次发现于首次发现于首次发现于19931993年,是在对秀丽新小杆线年,是在对秀丽新小杆线年,是在对秀丽新小杆线年,是在对秀丽新小杆线虫发育过程的研究中发现的,命名为虫发育过程的研究中发现的,命名为虫发育过程的研究中发现的,命名为虫发育过程的研究中发现的,命名为Lin-4Lin-4,它通过与,它通过与,它通过与,它通过与Lin-Lin-1414的的的的3UTR3UTR相互作用,调节线虫的发育。随后,在线虫、相互作用,调节线虫的发育。随后,在线虫、相互作用,调节线虫的发育。随后,在线虫、相互作用,调节线虫的发育。随后,在线虫、果蝇、果蝇、果蝇、果蝇、HelaHela细胞、斑马鱼、人类、拟南芥和水稻等多种真细胞、斑马鱼、人类、拟南芥和水稻等多种真细胞、斑马鱼、人类、拟南芥和水稻等多种真细胞、斑马鱼、人类、拟南芥和水稻等多种真核模式生物中找到了上百个类似的小分子核模式生物中找到了上百个类似的小分子核模式生物中找到了上百个类似的小分子核模式生物中找到了上百个类似的小分子RNARNA,并将其称,并将其称,并将其称,并将其称miRNAmiRNA。(二)(二)(二)(二)microRNAmicroRNAmicroRNAmicroRNA生物起源生物起源生物起源生物起源细细 胞胞 miRNA 基因基因初始初始miRNAmiRNA前体前体转录转录细细胞胞核核剪切剪切转运蛋白转运蛋白Dicer酶酶剪切剪切成熟miRNA和miRNA*RNA诱导沉默复合物成熟miRNAmiRNA*降解降解细细 胞胞 质质miRNA种子区与靶mRNA完全互补则降解靶mRMA 3端miRNA种子区与靶mRNA不完全互补则抑制翻译(三)(三)miRNAmiRNA的特点的特点n n序列特点序列特点序列特点序列特点n nmiRNAmiRNA本身不具有开放阅读框本身不具有开放阅读框本身不具有开放阅读框本身不具有开放阅读框ORFORF,不编码蛋白质,不编码蛋白质,不编码蛋白质,不编码蛋白质n n成熟的成熟的成熟的成熟的miRNAmiRNA 5 5 端为单一磷酸基团,端为单一磷酸基团,端为单一磷酸基团,端为单一磷酸基团,3 3 端为羟基端为羟基端为羟基端为羟基n n表达特点表达特点表达特点表达特点n nmiRNAmiRNA具有时序性以及组织特异性具有时序性以及组织特异性具有时序性以及组织特异性具有时序性以及组织特异性n n在特定的时间,组织中才会表达在特定的时间,组织中才会表达在特定的时间,组织中才会表达在特定的时间,组织中才会表达n n调控特点调控特点调控特点调控特点n nmiRNAmiRNA与其靶基因间是多对多的关系与其靶基因间是多对多的关系与其靶基因间是多对多的关系与其靶基因间是多对多的关系n n一个一个一个一个miRNAmiRNA可能调控多个靶基因可能调控多个靶基因可能调控多个靶基因可能调控多个靶基因n n一个基因也可能受多个一个基因也可能受多个一个基因也可能受多个一个基因也可能受多个miRNAmiRNA调控调控调控调控n n物理位置特点物理位置特点物理位置特点物理位置特点n nmiRNAmiRNA倾向于成簇出现在染色体上倾向于成簇出现在染色体上倾向于成簇出现在染色体上倾向于成簇出现在染色体上n n通常定义通常定义通常定义通常定义50kb50kb的距离为一簇的距离为一簇的距离为一簇的距离为一簇n n保守型特点保守型特点保守型特点保守型特点n n在物种间高度在物种间高度在物种间高度在物种间高度miRNAmiRNAmiRNAmiRNA的作用机制的作用机制的作用机制的作用机制 n n抑制或降解抑制或降解抑制或降解抑制或降解n n取决于取决于取决于取决于miRNAmiRNA与靶与靶与靶与靶mRNAmRNA种子区域的互补程度种子区域的互补程度种子区域的互补程度种子区域的互补程度n n种子区域种子区域种子区域种子区域n n通常指通常指通常指通常指miRNAmiRNA 5 5 端第二位到第八位的核苷酸序端第二位到第八位的核苷酸序端第二位到第八位的核苷酸序端第二位到第八位的核苷酸序列列列列n n两者完全互补两者完全互补两者完全互补两者完全互补n n降解降解降解降解n n两者不完全互补两者不完全互补两者不完全互补两者不完全互补n n抑制翻译抑制翻译抑制翻译抑制翻译 二、二、基于序列的基于序列的miRNA靶基因预测方法靶基因预测方法n nmiRNAmiRNA靶基因预测遵循的基本原则靶基因预测遵循的基本原则靶基因预测遵循的基本原则靶基因预测遵循的基本原则 n nmiRandamiRanda n nTargetScanTargetScan n nRNAhybridRNAhybrid n nTargetBoostTargetBoost和和和和miTargetmiTarget n n其他方法其他方法其他方法其他方法(一)(一)miRNA靶点类型靶点类型 miRNAmiRNA 的靶点通常分为两类:的靶点通常分为两类:的靶点通常分为两类:的靶点通常分为两类:n n5 5 端主导型(端主导型(端主导型(端主导型(5 -dominant5 -dominant)n n3 3 端补充型(端补充型(端补充型(端补充型(3 -compensatory3 -compensatory)n n5 5 端主导型又分为端主导型又分为端主导型又分为端主导型又分为5 5 端主导的端主导的端主导的端主导的“标准型标准型标准型标准型”(canonicalcanonical)和)和)和)和“种子型种子型种子型种子型”(seedseed)(二)(二)miRNA靶基因预测遵循的原则和基本步骤靶基因预测遵循的原则和基本步骤 n nmiRNAmiRNA的的的的“种子区种子区种子区种子区”与与与与mRNAmRNA的的的的3UTR3UTR序列碱基互补序列碱基互补序列碱基互补序列碱基互补n n靶点在多物种间的序列保守性靶点在多物种间的序列保守性靶点在多物种间的序列保守性靶点在多物种间的序列保守性n nmiRNAmiRNA与与与与mRNAmRNA形成双链结构的热力学稳定性形成双链结构的热力学稳定性形成双链结构的热力学稳定性形成双链结构的热力学稳定性n n靶基因二级结构和靶点外的序列对靶基因预测的影响靶基因二级结构和靶点外的序列对靶基因预测的影响靶基因二级结构和靶点外的序列对靶基因预测的影响靶基因二级结构和靶点外的序列对靶基因预测的影响遵循的原则遵循的原则遵循的原则遵循的原则基本步骤基本步骤基本步骤基本步骤n n在在在在3UTR3UTR上探寻和上探寻和上探寻和上探寻和miRNAmiRNA“种子区种子区种子区种子区”完全互补的序列;完全互补的序列;完全互补的序列;完全互补的序列;n n计计计计算算算算miRNAmiRNA和和和和这这这这些些些些序序序序列列列列结结结结合合合合产产产产生生生生的的的的自自自自由由由由能能能能下下下下降降降降值值值值,对对对对靶靶靶靶点点点点进进进进行筛选;行筛选;行筛选;行筛选;n n对靶点进行物种间序列比对,利用物种保守性进一步筛选。对靶点进行物种间序列比对,利用物种保守性进一步筛选。对靶点进行物种间序列比对,利用物种保守性进一步筛选。对靶点进行物种间序列比对,利用物种保守性进一步筛选。(三)(三)miRanda n n第一个利用生物信息学方法开发的基于序列的第一个利用生物信息学方法开发的基于序列的第一个利用生物信息学方法开发的基于序列的第一个利用生物信息学方法开发的基于序列的miRNAmiRNA靶基因预测算法靶基因预测算法靶基因预测算法靶基因预测算法http:/cbio.mskcc.org/research/sander/data/miRNA2003/miranda_new.htmlmiRanda算法的基本步骤算法的基本步骤n n对对对对miRNAmiRNA和和和和mRNAmRNA的的的的3 3UTRUTR序序序序列列列列进进进进行行行行碱碱碱碱基基基基互互互互补补补补分析,碱基互补遵循分析,碱基互补遵循分析,碱基互补遵循分析,碱基互补遵循4 4个规则;个规则;个规则;个规则;n nmiRandamiRanda采采采采用用用用一一一一种种种种类类类类似似似似于于于于Smith-WatermanSmith-Waterman的的的的算算算算法来构建打分矩阵;法来构建打分矩阵;法来构建打分矩阵;法来构建打分矩阵;n nmiRNAmiRNA与与与与靶靶靶靶基基基基因因因因形形形形成成成成二二二二聚聚聚聚体体体体的的的的热热热热力力力力学学学学稳稳稳稳定定定定性性性性方方方方面面面面,miRandamiRanda利利利利用用用用ViennaVienna软软软软件件件件包包包包中中中中的的的的RNAlibRNAlib 计计计计算算算算miRNAmiRNA与与与与mRNA 3UTRmRNA 3UTR结合的自由能;结合的自由能;结合的自由能;结合的自由能;n nmiRandamiRanda要要要要求求求求靶靶靶靶点点点点在在在在多多多多物物物物种种种种间间间间保保保保守守守守,即即即即靶靶靶靶点点点点在在在在多多多多物种物种物种物种3UTR3UTR序列比对中相同位置具有相同的碱基。序列比对中相同位置具有相同的碱基。序列比对中相同位置具有相同的碱基。序列比对中相同位置具有相同的碱基。(四)(四)TargetScann nTargetScanTargetScan主要考虑物种间保守的主要考虑物种间保守的主要考虑物种间保守的主要考虑物种间保守的miRNAmiRNA靶基因,并且在靶基因,并且在靶基因,并且在靶基因,并且在TargetScanTargetScan中首次提出了中首次提出了中首次提出了中首次提出了“种子匹配种子匹配种子匹配种子匹配”(seed matchseed match)的)的)的)的概念。概念。概念。概念。http:/www.targetscan.org/TargetScan算法的基本步骤算法的基本步骤n n在在在在TargetScanTargetScan算算算算法法法法中中中中,“种种种种子子子子匹匹匹匹配配配配”被被被被定定定定义义义义为为为为miRNAmiRNA 55端端端端的的的的第第第第2 28 8位位位位碱碱碱碱基基基基与与与与mRNA mRNA 3UTR 3UTR 上上上上的的的的一一一一段段段段7nt7nt(nucleotidenucleotide)序序序序列列列列完完完完全全全全互互互互补补补补,miRNAmiRNA上的这上的这上的这上的这7 7个核苷酸被称为个核苷酸被称为个核苷酸被称为个核苷酸被称为miRNAmiRNA“种子区种子区种子区种子区”。n n从从从从种种种种子子子子区区区区开开开开始始始始向向向向miRNAmiRNA两两两两侧侧侧侧寻寻寻寻找找找找互互互互补补补补碱碱碱碱基基基基,允允允允许许许许G-UG-U配配配配对对对对,直直直直到到到到出出出出现现现现碱碱碱碱基基基基错错错错配配配配为为为为止止止止。在在在在物物物物种种种种保保保保守守守守方方方方面面面面,TargetScanTargetScan算算算算法法法法发发发发现现现现随随随随着着着着物物物物种种种种数数数数目目目目的的的的增增增增多多多多,预预预预测测测测的的的的靶靶靶靶基基基基因因因因数数数数目目目目逐逐逐逐渐渐渐渐减减减减少少少少,但但但但预预预预测测测测结结结结果果果果的的的的准准准准确确确确率率率率得到提高。得到提高。得到提高。得到提高。(五)(五)RNAhybrid算法算法n nRNAhybridRNAhybrid考虑了靶基因结合自由能对预测结果考虑了靶基因结合自由能对预测结果考虑了靶基因结合自由能对预测结果考虑了靶基因结合自由能对预测结果的影响。该算法利用动态规划算法寻找一条短链的影响。该算法利用动态规划算法寻找一条短链的影响。该算法利用动态规划算法寻找一条短链的影响。该算法利用动态规划算法寻找一条短链RNARNA(miRNAmiRNA)和一条长链)和一条长链)和一条长链)和一条长链RNARNA(mRNA mRNA 3UTR)3UTR)杂交时的最优自由能鉴别杂交时的最优自由能鉴别杂交时的最优自由能鉴别杂交时的最优自由能鉴别miRNAmiRNA的靶点。的靶点。的靶点。的靶点。n n与其他的与其他的与其他的与其他的RNARNA二级结构预测软件二级结构预测软件二级结构预测软件二级结构预测软件mfoldmfold、RNAfoldRNAfold等相比,等相比,等相比,等相比,RNAhybridRNAhybrid除了具有明显的速度优势外,除了具有明显的速度优势外,除了具有明显的速度优势外,除了具有明显的速度优势外,RNAhybridRNAhybrid算法还禁止算法还禁止算法还禁止算法还禁止miRNAmiRNA 分子间和靶基因间分子间和靶基因间分子间和靶基因间分子间和靶基因间杂交产生二聚体。杂交产生二聚体。杂交产生二聚体。杂交产生二聚体。n nRNAhybridRNAhybrid没有考虑靶基因的物种间保守性,允没有考虑靶基因的物种间保守性,允没有考虑靶基因的物种间保守性,允没有考虑靶基因的物种间保守性,允许用户自己定义自由能的阈值、许用户自己定义自由能的阈值、许用户自己定义自由能的阈值、许用户自己定义自由能的阈值、P P 值,也允许用值,也允许用值,也允许用值,也允许用户自己设置户自己设置户自己设置户自己设置miRNAmiRNA“种子区种子区种子区种子区”的位置和长度以及的位置和长度以及的位置和长度以及的位置和长度以及是否允许出现是否允许出现是否允许出现是否允许出现G-UG-U错配等。错配等。错配等。错配等。(六)机器学习方法(六)机器学习方法 n n通通通通过过过过在在在在少少少少量量量量实实实实验验验验证证证证实实实实的的的的miRNAmiRNA靶靶靶靶基基基基因因因因集集集集合合合合内内内内提提提提取取取取miRNAmiRNA与与与与靶靶靶靶基基基基因因因因的的的的结结结结合合合合特特特特征征征征,并并并并利利利利用用用用这这这这些些些些特特特特征征征征训训训训练分类器来预测练分类器来预测练分类器来预测练分类器来预测miRNAmiRNA的靶基因。的靶基因。的靶基因。的靶基因。n n如如如如TargetBoostTargetBoost和和和和miTargetmiTarget等等等等miRNAmiRNA靶靶靶靶基基基基因因因因预预预预测测测测算算算算法法法法都都都都是是是是基基基基于于于于机机机机器器器器学学学学习习习习方方方方法法法法开开开开发发发发的的的的,这这这这些些些些算算算算法法法法从从从从实实实实验验验验证证证证实实实实的的的的miRNAmiRNA靶靶靶靶基基基基因因因因集集集集出出出出发发发发,评评评评估估估估miRNAmiRNA与与与与靶靶靶靶基基基基因因因因结结结结合合合合的的的的序序序序列列列列特特特特征征征征、二二二二聚聚聚聚体体体体结结结结构构构构特特特特征征征征和和和和热热热热力力力力学学学学特征等参数,最后对预测的靶基因进行打分。特征等参数,最后对预测的靶基因进行打分。特征等参数,最后对预测的靶基因进行打分。特征等参数,最后对预测的靶基因进行打分。(七)二级结构的影响(七)二级结构的影响n n在在在在 miRNAmiRNA与与与与 靶靶靶靶 基基基基 因因因因 结结结结 合合合合 的的的的 过过过过 程程程程 中中中中,mRNA mRNA 的的的的3UTR3UTR二级结构起着重要作用。二级结构起着重要作用。二级结构起着重要作用。二级结构起着重要作用。n nmiRNAmiRNA靶靶靶靶点点点点几几几几乎乎乎乎都都都都落落落落入入入入3UTR3UTR的的的的二二二二级级级级结结结结构构构构不不不不稳稳稳稳定定定定区区区区域域域域内内内内,通通通通过过过过计计计计算算算算mRNA mRNA 的的的的3UTR3UTR二二二二级级级级结结结结构构构构被被被被破破破破坏坏坏坏、形形形形成成成成或或或或破破破破坏坏坏坏碱碱碱碱基基基基互互互互补补补补配配配配对对对对、形形形形成成成成miRNAmiRNA-mRNAmRNA二二二二聚聚聚聚体体体体时时时时获获获获得得得得或或或或损损损损失失失失的的的的自自自自由由由由能能能能,可可可可以以以以鉴鉴鉴鉴别别别别miRNAmiRNA靶基因;靶基因;靶基因;靶基因;n n通通通通过过过过实实实实验验验验发发发发现现现现,提提提提高高高高靶靶靶靶点点点点附附附附近近近近序序序序列列列列二二二二级级级级结结结结构构构构的的的的稳稳稳稳定性大大降低了定性大大降低了定性大大降低了定性大大降低了miRNAmiRNA对靶基因的作用。对靶基因的作用。对靶基因的作用。对靶基因的作用。(八)靶点周围序列的影响(八)靶点周围序列的影响n n靶靶靶靶点点点点外外外外的的的的序序序序列列列列也也也也对对对对miRNAmiRNA调调调调节节节节靶靶靶靶基基基基因因因因起起起起到到到到重重重重要要要要作作作作用。用。用。用。n n靶靶靶靶点点点点后后后后的的的的一一一一段段段段序序序序列列列列对对对对miRNAmiRNA与与与与靶靶靶靶基基基基因因因因的的的的识识识识别别别别起起起起着着着着重重重重要要要要的的的的作作作作用用用用,对对对对该该该该段段段段序序序序列列列列突突突突变变变变后后后后miRNAmiRNA对对对对靶靶靶靶基基基基因因因因的的的的调调调调控控控控作作作作用用用用明明明明显显显显减减减减弱弱弱弱,而而而而将将将将该该该该段段段段序序序序列列列列完完完完全全全全删删删删除除除除后后后后miRNAmiRNA对靶基因的调控作用完全消失。对靶基因的调控作用完全消失。对靶基因的调控作用完全消失。对靶基因的调控作用完全消失。n n在在在在miRNAmiRNA调调调调控控控控靶靶靶靶基基基基因因因因的的的的过过过过程程程程中中中中,靶靶靶靶点点点点外外外外的的的的其其其其他他他他序序序序列列列列甚甚甚甚至至至至整整整整个个个个3UTR3UTR序序序序列列列列都都都都起起起起到到到到了了了了关关关关键键键键作作作作用用用用,这这这这些些些些序列可能是序列可能是序列可能是序列可能是RNARNA结合蛋白的作用位点。结合蛋白的作用位点。结合蛋白的作用位点。结合蛋白的作用位点。三、基于表达信息或实验结果预测三、基于表达信息或实验结果预测miRNA靶靶基因基因 n n研研研研究究究究人人人人员员员员认认认认为为为为miRNAmiRNA结结结结合合合合在在在在mRNAmRNA的的的的3UTR3UTR上上上上抑抑抑抑制制制制mRNAmRNA翻翻翻翻译译译译成成成成蛋蛋蛋蛋白白白白质质质质,降降降降低低低低蛋蛋蛋蛋白白白白质质质质丰丰丰丰度度度度,并并并并不不不不会影响到相应会影响到相应会影响到相应会影响到相应mRNAmRNA的表达水平。的表达水平。的表达水平。的表达水平。n n现现现现在在在在已已已已经经经经明明明明确确确确认认认认为为为为:在在在在许许许许多多多多情情情情况况况况下下下下,miRNAmiRNA还还还还能能能能直直直直接接接接对对对对mRNAmRNA的的的的表表表表达达达达产产产产生生生生影影影影响响响响。科科科科研研研研人人人人员员员员已已已已经经经经开开开开发发发发了了了了整整整整合合合合表表表表达达达达信信信信息息息息的的的的miRNAmiRNA靶靶靶靶基基基基因因因因预预预预测测测测算算算算法法法法,并并并并证证证证明明明明了了了了表表表表达达达达信信信信息息息息在在在在miRNAmiRNA靶靶靶靶基基基基因因因因预预预预测测测测上上上上的的的的重重重重要要要要价价价价值。值。值。值。n nHuangHuang等等等等人人人人利利利利用用用用在在在在8888个个个个组组组组织织织织中中中中同同同同时时时时检检检检测测测测了了了了miRNAmiRNA和和和和mRNAmRNA表表表表达达达达的的的的数数数数据据据据,并并并并结结结结合合合合贝贝贝贝叶叶叶叶斯斯斯斯方方方方法法法法开开开开发发发发了了了了靶靶靶靶基基基基因因因因预预预预测测测测算算算算法法法法GenMiRGenMiR+,得得得得到到到到了了了了104104个个个个人人人人类类类类miRNAmiRNA的的的的高高高高精精精精度度度度靶靶靶靶基基基基因因因因,并并并并通通通通过过过过实实实实验验验验证证证证实实实实了了了了预预预预测测测测的的的的let-7blet-7b靶靶靶靶基基基基因因因因,结结结结果果果果表表表表明明明明,与与与与基基基基于于于于序序序序列列列列的的的的方方方方法法法法相相相相比比比比,利利利利用用用用相相相相同同同同样样样样本本本本中中中中同同同同时时时时检检检检测测测测miRNAmiRNA和和和和mRNAmRNA的表达谱可以更准确的预测的表达谱可以更准确的预测的表达谱可以更准确的预测的表达谱可以更准确的预测miRNAmiRNA靶基因。靶基因。靶基因。靶基因。(Huang,Huang,Using Using expression expression profiling profiling data data to to identify identify human human microRNAmicroRNA targets.Nat.Methods.targets.Nat.Methods.)人民卫生出版社8年制及7年制临床医学等专业用生物信息学n nGennarinoGennarino等等等等人人人人通通通通过过过过研研研研究究究究miRNAmiRNA宿宿宿宿主主主主基基基基因因因因(host host genegene)的的的的表表表表达达达达情情情情况况况况,开开开开发发发发了了了了miRNAmiRNA靶靶靶靶基基基基因因因因预预预预测测测测算算算算法法法法HOCTARHOCTAR。HOCTARHOCTAR是是是是第第第第一一一一个个个个利利利利用用用用miRNAmiRNA宿宿宿宿主主主主基基基基因因因因表表表表达达达达与与与与mRNAmRNA表表表表达达达达信信信信息息息息进进进进行行行行miRNAmiRNA靶靶靶靶基基基基因因因因预预预预测测测测的的的的算算算算法法法法,它它它它基基基基于于于于两两两两者者者者表表表表达达达达的的的的逆逆逆逆相相相相关关关关(inversely inversely correlatedcorrelated)特特特特征征征征对对对对预预预预测测测测的的的的miRNAmiRNA靶靶靶靶基基基基因因因因进进进进行行行行筛筛筛筛选选选选。通通通通过过过过对对对对178178个个个个人人人人类类类类miRNAmiRNA的的的的宿宿宿宿主主主主基基基基因因因因分分分分析析析析,发发发发现现现现预预预预测测测测准准准准确确确确性性性性优优优优于于于于现现现现存存存存的的的的基基基基于于于于序序序序列列列列的的的的预预预预测测测测方方方方法法法法,HOCTARHOCTAR减减减减少少少少了了了了基基基基于于于于序序序序列列列列算算算算法法法法预预预预测测测测的的的的靶基因数量。靶基因数量。靶基因数量。靶基因数量。(V.V.A.A.GennarinoGennarino,MicroRNAMicroRNA target target prediction prediction by by expression expression analysis of host genes.Genome Res.analysis of host genes.Genome Res.)n nBandyopadhyayBandyopadhyay等人利用等人利用等人利用等人利用miRNAmiRNA的表达谱和的表达谱和的表达谱和的表达谱和mRNAmRNA表达谱构建一组阴表达谱构建一组阴表达谱构建一组阴表达谱构建一组阴性样本集,并利用机器学习方法开发了性样本集,并利用机器学习方法开发了性样本集,并利用机器学习方法开发了性样本集,并利用机器学习方法开发了miRNAmiRNA靶基因预测算法靶基因预测算法靶基因预测算法靶基因预测算法TargetMinerTargetMiner。由于当前实验证实的。由于当前实验证实的。由于当前实验证实的。由于当前实验证实的miRNAmiRNA靶基因阴性数据较少,用机靶基因阴性数据较少,用机靶基因阴性数据较少,用机靶基因阴性数据较少,用机器学习方法预测器学习方法预测器学习方法预测器学习方法预测miRNAmiRNA靶基因常具有较高的假阳性率,作者从靶基因常具有较高的假阳性率,作者从靶基因常具有较高的假阳性率,作者从靶基因常具有较高的假阳性率,作者从miRNAmiRNA和和和和mRNAmRNA的表达谱中得到了的表达谱中得到了的表达谱中得到了的表达谱中得到了300300多个组织特异的阴性样本,并结合实验证多个组织特异的阴性样本,并结合实验证多个组织特异的阴性样本,并结合实验证多个组织特异的阴性样本,并结合实验证实的实的实的实的miRNAmiRNA靶基因数据,利用支持向量机(靶基因数据,利用支持向量机(靶基因数据,利用支持向量机(靶基因数据,利用支持向量机(SVMSVM)方法开发了新的)方法开发了新的)方法开发了新的)方法开发了新的miRNAmiRNA靶基因算法。靶基因算法。靶基因算法。靶基因算法。(SanghamitraSanghamitra BandyopadhyayBandyopadhyay,TargetMinerTargetMiner:microRNAmicroRNA target target prediction with systematic identification of tissue-specific prediction with systematic identification of tissue-specific negative negative examples.Bioinformaticsexamples.Bioinformatics.).)四、其他方法四、其他方法 整合已有知识预测整合已有知识预测miRNA靶基因靶基因 n n在在在在当当当当前前前前的的的的miRNAmiRNA靶靶靶靶基基基基因因因因预预预预测测测测研研研研究究究究中中中中,研研研研究究究究人人人人员员员员逐逐逐逐渐渐渐渐意意意意识识识识到到到到单单单单一一一一依依依依靠靠靠靠序序序序列列列列信信信信息息息息或或或或表表表表达达达达信信信信息息息息已已已已不不不不能能能能继继继继续提高续提高续提高续提高miRNAmiRNA靶基因预测效能。靶基因预测效能。靶基因预测效能。靶基因预测效能。n n整整整整合合合合功功功功能能能能信信信信息息息息、蛋蛋蛋蛋白白白白质质质质互互互互作作作作信信信信息息息息、表表表表达达达达信信信信息息息息、序序序序列列列列信信信信息息息息以以以以及及及及当当当当前前前前实实实实验验验验证证证证实实实实的的的的miRNAmiRNA靶靶靶靶基基基基因因因因等等等等已已已已有有有有资源预测资源预测资源预测资源预测miRNAmiRNA靶基因十分必要。靶基因十分必要。靶基因十分必要。靶基因十分必要。n n高高高高通通通通量量量量的的的的实实实实验验验验方方方方法法法法预预预预测测测测miRNAmiRNA靶靶靶靶基基基基因因因因也也也也在在在在不不不不断断断断的的的的发发发发展展展展中中中中,这这这这些些些些研研研研究究究究将将将将对对对对最最最最终终终终揭揭揭揭示示示示miRNAmiRNA功功功功能能能能和和和和参参参参与与与与的的的的生生生生物物物物学学学学过过过过程程程程、找找找找出出出出miRNAmiRNA诱诱诱诱导导导导的的的的疾疾疾疾病病病病发发发发生生生生机机机机制制制制、以以以以及及及及最最最最终终终终将将将将miRNAmiRNA用用用用于于于于治治治治疗疗疗疗癌癌癌癌症症症症等等等等相相相相关关关关疾疾疾疾病病病病具有重要意义。具有重要意义。具有重要意义。具有重要意义。五、五、miRNA数据资源数据资源 靶基因与表达靶基因与表达(一)TarBase数据库n nTarBaseTarBase数据库数据库n n目前使用广泛的存储真实目前使用广泛的存储真实miRNAmiRNA与靶基因间关与靶基因间关系的数据库系的数据库 n n网址:网址:http:/http:/diana.cslab.ece.ntua.gr/tarbasediana.cslab.ece.ntua.gr/tarbase/n n数据库以数据库以ExcelExcel文件形式存储,可供用户下载本文件形式存储,可供用户下载本地化使用。地化使用。microRNAmicroRNAmicroRNAmicroRNA靶基因数据库靶基因数据库靶基因数据库靶基因数据库-TarBaseTarBaseTarBaseTarBase(二)(二)miRBasemiRBase数据库数据库n nmiRBasen n集集miRNAmiRNA序列,注释信息以及预测的靶基因数序列,注释信息以及预测的靶基因数据为一体的数据库,是目前存储据为一体的数据库,是目前存储miRNAmiRNA信息最信息最主要的公共数据库之一主要的公共数据库之一 n n网址:网址:http:/www.ebi.ac.uk/enright-http:/www.ebi.ac.uk/enright-srv/microcosm/htdocs/targets/v5/srv/microcosm/htdocs/targets/v5/n n主要采用主要采用miRandamiRanda算法预测靶基因算法预测靶基因 microRNAmicroRNAmicroRNAmicroRNA靶基因数据库靶基因数据库靶基因数据库靶基因数据库-miRBasemiRBasemiRBasemiRBase(三)(三)miRGenmiRGen数据库数据库n nmiRGenn n整合了整合了miRNAmiRNA靶基因数据(靶基因数据(TargetsTargets库),基因库),基因组注释信息(组注释信息(GenomicsGenomics库)以及位置关系库)以及位置关系(ClustersClusters库)的综合数据库库)的综合数据库n n网址:网址:http:/www.diana.pcbi.upenn.edu/miRGen/v3/http:/www.diana.pcbi.upenn.edu/miRGen/v3/miRGen.htmlmiRGen.htmln n靶基因库中,采用四种常用的靶基因预测算法靶基因库中,采用四种常用的靶基因预测算法DIANA-DIANA-microTmicroT,miRandamiRanda,PicTarPicTar,TargetScanSTargetScanS对对miRNAmiRNA的靶基因进行预测的靶基因进行预测microRNAmicroRNA靶基因数据库靶基因数据库-miRNAMapmiRNAMap n nmiRNAMap数据库n n存储存储miRNAmiRNA及其靶基因信息及其靶基因信息n n包括四种类型的哺乳动物包括四种类型的哺乳动物n n人类,小鼠,大鼠和犬人类,小鼠,大鼠和犬n n网址:网址:http:/http:/mirnamap.mbc.nctu.edu.tw/index.phpmirnamap.mbc.nctu.edu.tw/index.php(四)(四)RNA22RNA22数据库数据库n nRNA22数据库n n主要为了算法主要为了算法RNA22RNA22而建立而建立n n该算法不要求与物种间的保守性该算法不要求与物种间的保守性n n提出提出miRNAmiRNA靶位点可能存在于靶位点可能存在于5 5 UTRUTRn n已被实验证实已被实验证实n n与多数忽略或仅考虑少量与多数忽略或仅考虑少量miRNAmiRNA 5 5 UTRUTR影响的算法影响的算法相比具有其特定的生物学意义。相比具有其特定的生物学意义。n n网址:网址:http:/ nmicroRNA.org数据库n n包含包含miRNAmiRNA靶基因以及表达谱数据靶基因以及表达谱数据n n网址:网址:http:/http:/www.microrna.org/microrna/home.dowww.microrna.org/microrna/home.don nmiRNAmiRNA靶基因数据靶基因数据n n主要是利用主要是利用miRandamiRanda算法预测得来算法预测得来 n nmiRNAmiRNA表达谱数据表达谱数据n n来自一个针对人类主要器官和细胞系的小来自一个针对人类主要器官和细胞系的小RNARNA库测库测序计划序计划 microRNAmicroRNA综合数据库综合数据库-microRNA.orgmicroRNA.orgn n查询功能查询功能 n n已知已知miRNAmiRNA寻找其调控的靶基因寻找其调控的靶基因n n选择导航条中的选择导航条中的“miRNAmiRNA”,选择物种,输入,选择物种,输入miRNAmiRNA的部分名称的部分名称n n已知一个基因,寻找它被哪些已知一个基因,寻找它被哪些miRNAmiRNA调控及其位点调控及其位点n n选中导航条中的选中导航条中的“Targeted mRNATargeted mRNA”然后输入基因名称,从匹配的基然后输入基因名称,从匹配的基因列表中选择感兴趣的基因(具有同样名称的基因通常都是有相同因列表中选择感兴趣的基因(具有同样名称的基因通常都是有相同3 3 UTRUTR)n n已知一个或一个已知一个或一个miRNAmiRNA集合,寻找其在组织中的表达情况集合,寻找其在组织中的表达情况n n选择导航条中的选择导航条中的“miRNAmiRNA”,输入全部或部分,输入全部或部分microRNAmicroRNA名称,在结果名称,在结果列表中选择列表中选择“view expression profileview expression profile”,将得到排在前,将得到排在前2020位的组织位的组织n n已知一个或多个组织,寻找哪些已知一个或多个组织,寻找哪些microRNAmicroRNA在其中表达在其中表达n n选择导航条上的选择导航条上的“miRNAmiRNA Expression Expression”在结果中选择感兴趣的物种和组在结果中选择感兴趣的物种和组织,将得到在这个组织中排名前织,将得到在这个组织中排名前2020的的的的miRNAmiRNA
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!