microRNA

上传人:紫** 文档编号:242865658 上传时间:2024-09-10 格式:PPT 页数:103 大小:3.97MB
返回 下载 相关 举报
microRNA_第1页
第1页 / 共103页
microRNA_第2页
第2页 / 共103页
microRNA_第3页
第3页 / 共103页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,microRNA,的检测,及其靶标的确定,张尚书,版权归郑州大学所有,copyright,目录,microRNA,研究的兴起与发展,microRNA,的检测,microRNA,的靶基因,扩展与举例(,Blast,),扩展与举例(,cancer genetics web,),扩展与举例(,miRanda,),microRNA,研究思路,2,microRNA,研究的兴起与发展,基因组,编码蛋白质的基因,多种非编码的,RNA,有着重要的调控作用,miRNA,兴起,1993,年发现第一个,miRNA,lin-4,,,没有引起重视,2001,年,涌现大量,miRNA,报道,,自此,miRNA,备受关注,,随后,几年相关,学术文献呈爆炸性增长。,microRNA,研究的兴起与发展,miRNA,发展中,遇到的问题:,在各种生物中,寻找,miRNA,发现,miRNA,的靶基因,揭示,miRNA,的,功能,miRNA,?,目前靶基因检测,工作成为,miRNA,功能研究的瓶颈,microRNA,是什么?,miRNA(microRNA,,微小,RNA,),是,一类长约,1925,个核苷酸,的,内源性,单链,非编码,小,分子,RNA,。,根据,预测,人体中,30%,以上的基因都受到,miRNA,的调控。,pri-mRNA,5,端带帽、,3,端加多聚,A,尾,RNase,(,一种核糖核,酸内切酶,是特定的双链,RNA,。它对转录后的,RNA,前核糖体,RNA,和各种,其他包含,RNA,双链区的结构,加工起到了重要的作用。,),Drosha,酶、,Dicer,酶,RISC,:,RNA-Induced,Silencing Complex,miRNA,如何行使功能?,与,mRNA,的,3,端,非编码区特定位点,(,其第,2,8,个核苷酸,),绑定:,与,mRNA,完美,互补时,会,引发,mRNA,降解,;,不,完美的与,mRNA,配对时,会引发转录后的,基因,沉默,(,抑制,靶基因的,表达,),从而抑制或阻止相应的,mRNA,翻译过程,。,举例分析:在,DNA,修复通路中行使上述过程,1,)抑制或阻止正常细胞,DNA,修复,产生,致癌,作用,2,)抑制或阻止癌细胞,DNA,修复达到,治疗,效果,miRNA,调控作用及相关检测方法,microRNA,功能,miRNA,序列,(,其基因位置和序列高度保守,),、,结构,、*丰度,和表达方式的多样性使其可能作为,mRNA,表达的调节因子,从而在以下生命过程中起着重要的调控作用,:,【,细胞,发育 细胞增殖 细胞凋亡,细胞分化,】,【,应激反应,】,【,病毒感染,】,【,脂肪,代谢,】,【,癌症 心脏病,】,在人类基因组中大约,50%,的已知,miRNA,成簇表达,而且一个簇的,miRNA,经常是彼此相关的,。,*丰度:,DNA,在混合物中的浓度,。,一般,以百分数表示。,miRNA,的检测,miRNA,的获取,miRNA,的确认,miRNA,的检测方法,miRNA,的获取,miRNA,分子的序列,短小,1,)在,基因组中存在,较多的,互补,序列,2,)在,不同生物体内与靶基因结合的,方式也,不尽,相同,3,)通常与,多种蛋白,相互作用,这使得,建立一个有效而且普遍适用的研究方法异常,困难,。,#,到目前为止,miRBase,上公布的,miRNA,总数将近,3 000,种。,#,现在,已知靶基因的,miRNA,多是通过基因克隆和,生物,信息学筛选的方法发现的。,miRNA,的获取,基因克隆,1.1,基因克隆,直接,克隆的方法通常是从,总,RNA,中提取大约,22 nt,的小,RNA,分子,制备一个小,RNA,的,cDNA,(complementary,DNA),文库,。,将文库中的小,RNA,序列与,基因组数据库,中,BLAST,序列类似性 比,对,排除非,miRNA,序列后,通过,Northern,印迹方法,(Northern blotting),得到最终,确认,。目前,大量的已知,miRNA,都是通过这种,方法,获得的。,基因克隆方法的优点是对于高丰度或常表达,的基因,来说,可以获得完整的,miRNA,序列。然而,对于另,一些,miRNA,它们在生物体内浓度很低,(,表达,量低,或表达产物极不稳定,或前体到成熟的加工,效率低等,原因引起,) ,或者某些只在生物体的特定,时期或,特定组织器官中表达,直接克隆法则无法获取,。,注:,Northern,印迹杂交(,Northern blot,)。这是一种将,RNA,从琼脂糖凝胶中转印到硝酸纤维素膜上的方法。,miRNA,的获取,生物信息学筛选,1.2,生物信息学,筛选,随着生物全基因组测序,的完成,利用计算机对基因组序列进行搜索可以,大大提高,miRNA,的鉴定效率。所以,人们,根据目前,已知的,miRNA,基因序列总结它们的特征和规律,编写,了一些,计算机程序,通过对生物基因组数据库进行,搜索,可以找到那些可能为,miRNA,的基因序列,然后通过,Northern blotting,来筛选真正的,miRNA,基因,。,生物,信息学方法是依据在不同的物种中,其,成熟的,miRNA,具有较大的序列同源性以及前体的茎环结构具有相当大的保守性,这一特征在基因组数据库中搜索新的,miRNA,基因。该方法根据比较基因组学原理并结合生物信息软件在已测序基因组中进行搜索比对,,根据同源性的高低再进行,RNA,二级结构预测,,,将符合条件的候选,miRNA,与已经通过实验鉴定的,miRNA,分子进行比较分析,,,最终确定该物种,miRNA,的分布及数量,。近年来随着,miRNA,预测方法的不断发展,人们发现的,miRNA,数量呈几何级数增长。这些预测方法从简单的序列比对搜索发展到现在的机器学习算法,程序设计越来越智能化,复杂化。,miRNA,的获取,生物信息学筛选,随着,人,miRNA,基因转录出的,pri-miRNA,迅速加工成具有茎环结构的,pre-miRNA,,随后被切割成,miRNA,:,miRNA*,双体,并被选择性地组合进核糖核酸沉默诱导复合体(,RISC,)并进行靶基因识别。在相似的物种中,,miRNA,是很保守的;但在相距较远的物种间,,miRNA,又有一定的分歧,尤其体现在,pre-miRNA,上。这些,miRNA,功能作用机制的阐明为预测软件的研发提供了理论依据,但仍需要不断修补和完善。近年来,几个基于这些规则的,miRNA,预测程序先后被开发,(下表),,并被广泛使用。,生物,信息学手段可以说是一种更高通量的方法。通常有以下几种方法,:,Mirscan,是一种基于二级结构的预测程序,通过扫描两种系之间是否存在同源的茎环结构,应用于检测,脊椎动物和线虫,的候选基因。,miRNA,的获取,生物信息学筛选,Mirseeker,是一种检查,RNA,序列茎环结构的预测程序,应用于筛选,昆虫,的候选基因,。,它,是根据,3,个标准来预测的,:,一是具有长度为,70,100 nt,茎环结构的,Pre-miRNA,;,二是不同种系生物中,Pre-miRNA,的保守性,;,三是,miRNA,的,核苷酸,差,异性。,ERP IN,是一种类似于,BLAST,的校对程序,用于搜寻,动物,基因组中与,miRNA,序列类似的,序列。,MiPred,可以通过,random forest,预测模型和,miRNA,特征的结合,区分,miRNA,的真正前体和假冒,前体。,miRBase,序列数据库,miRBase,序列数据库是一个提供包括,miRNA,序列数据、注释、预测基因靶标等信息的全方位数据库,是存储,miRNA,信息最主要的公共数据库之一。,miRBase,提供便捷的网上查询服务,允许用户使用关键词或序列在线搜索已知的,miRNA,和靶标信息,详情请(,http:/www.mirbase.org/,)。,2012,年,8,月,1,日正式发布。相比于以往版本的数据库(,Sanger microRNA,序列数据库),,19.0,版数据库进行了巨大的数据更新:,miRNA,发夹前体序列已升至,21264,条,新增,3171,条;成熟,miRNA,升至,25141,条,新增,3625,条;已发布的,miRNA,序列共涵盖,193,个物种,相比于,18.0,版新增,25,个物种。新版数据库对,miRNA,序列注释和命名进行了系统的修正,,miR*,命名已经终止使用,取而代之的是,-5p,和,-3p,的命名法。,miRNA,的确认,判断标准,:,能够通过与特定大小的总,RNA,样品杂交,得到,22,个碱基对,(,22nt),的产物,(,即需要,Northern,杂交,或引物延伸反应验证表达,),。,所得的序列是,从特定,大小的,(,22nt),的小分子,RNA,库中克隆到的,并且必需与克隆的来源物种的基因组序列完全匹配。,经过前体的二级结构预测,有发夹状的,二级结构,并且成熟的,miRNA,序列在发夹的一条臂上。,成熟的,miRNA,序列与预测的二级结构在不同,物种,间有保守性,。,在,Dicer,突变的系统中,前体,的积累,增多。,要,确认基因克隆获得的或生物信息学分析,预测的,基因是否为真正的,miRNA,就应该采用上面,5,个原则,来,检验,。,miRNA,的检测方法,要了解,miRNA,在基因调控中扮演的角色,很,关键,的一个方法就是迅速、准确地定量检测,miRNA,基因,的,表达,。,检测,miRNA,的方法主要,有以下,几种,:,Northern blotting,是现在检测,miRNA,表达,最主要的手段,所有克隆和生物信息学分析,得来的,miRNA,都需要经过,Northern blotting,来,验证和确,认,。,这种,方法的缺点在于灵敏度较低且不能进行高,通量的检测。,miRNA,的检测方法,RT-PCR,(,reverse transcription PCR,,反转录,PCR,)也被用来检测,miRNA,前体的,表达水平,但,miRNA,前体的表达水平并不一定,和成熟,miRNA,的表达水平一致。因此,在,RT-PCR,的基础,上,人们改进了一些技术,从而使得能够检测,低表达,量的,miRNA,。,实时,荧光定量,PCR (,real-time PCR,),可以很精确的定量分析,miRNA,的表达,也,经常用于验证预测的,miRNA,。,引物延伸,法,就是,在引物的,5,末端加一个特异标记,可以定量,测定低,丰度的,RNA,含量,。,原位杂交,技术,可以方便的,检测,miRNA,的时空表达的,差异。,原位杂交,是指将特定标记的已知顺序核酸为探针与细胞或组织切片中核酸进行杂交,从而对特定核酸顺序进行精确定量定位的过程。原位杂交可以在细胞标本或组织标本上进行。另有荧光原位杂交。,miRNA,的检测方法,芯片技术,(mi-croarray),是一种更快、更广泛、更有前途的研究,miRNA,表达的方法。,Liu,等最先发表了关于微点阵能够获得高通量的结果。这些结果显示了组织特异性,miRNA,的表达标记,而且通过,Northern blot,和,real-time PCR,进行了验证。,芯片技术固然以其高通量和并行处理的特点在基因信息分析中占据重要地位,但信息量大并不等于质量高。实际上,基因芯片的一个突出弱点就是其信息质量的稳定性和可重复性比较差,且无法实现定量检测,因此后来又出现了多种改进的芯片技术,其中现在流行的就是液相芯片技术。,液相芯片,( liquichip ),是美国纳斯达克上市的,Luminex,公司研制出的新一代生物芯片技术,它既能为后基因组时代科学研究提供强大的技术支持,又能提供高通量的新一代分子诊断技术平台。,miRNA,的识别,多个研究小组采用生物化学结合是生物信息学的方法开展对,miRNAs,的研究工作。由于据推测都是由,Dicer,酶降解,RNA,得到的,,2123,个碱基大小、有,5,端磷酸基和,3,羟基的,RNA,片断,有的实验室采用,改良的定向克隆方法,来筛选具有相同特征的小分子,1.,筛选一定大小的,RNA,分子,连接到,3,和,5,的适配子,(adapters),2.,逆转录,3.,通过,PCR,扩增,4.,亚克隆,5.,测序。,miRNA,前体在基因组上的定位和聚类是通过向基因组数据库查询进行。这个方法有助于判断,miRNAs,是否是,mRNAs,、,tRNAs,、,rRNAs,等分子的降解产物,。,生物信息学的方法被鉴别出来,已经鉴别出来的,miRNAs,只不过是沧海一粟,由于很多已经鉴别出来的,miRNAs,是从单个克隆中鉴别出来的,所以可以假设还有很多,miRNAs,在分离和鉴定过程中被“漏掉”了,测序工作还远远不够。,在分子克隆中指从大片段的克隆中选取特定小片段再克隆,/subclone,miRNA,的靶基因,miRNA,的靶基因预测,miRNA,的靶基因检测,miRNA,的生物学功能,miRNA,的靶基因预测,以前,研究,miRNA,的靶基因依赖于正向,遗传学方法,包括突变体的产物、变形筛选、定位克隆,和,miRNA,及其靶基因的确认,如,lin24,和,let27,及,它们的,靶基因的发现。在果蝇中,miRNA bantam,及其,靶基因,hid,的发现就是正向遗传学研究,miRNA,的,经典,过程。,反向遗传学联合生物信息学的方法比正向,遗传学,更优越。,它主要是由软件来预测,miRNA,的靶,基因,并为分子实验提供指标,,其基本原理,是基于,miRNA,与其靶基因的自然配对。,已知,miRNA,及其靶基因之间的对比和相关性, lin24,、,let27,和,bantam,基因的确认等都为计算机程序,发展提供,了更多的信息。,计算机程序预测方法在植物种属中运用的很成功,而在动物中则不是很成功,这可能是因为植物中的,miRNA,与其靶基因几乎完全配对结合。而在动物中,miRNA,与靶基因,mRNA,通常以不精确的碱基互补配对结合。,miRNA,的靶基因预测,miRNA,的研究意义之重大是毋庸置疑的。然而,与新的,miRNA,的频频发现相比,,miRNA,的功能研究相对缓慢,。,到,目前为止,,在发现的,4449,多个,miRNA,中,确定功能的,miRNA,仅有几十个,。,导致,miRNA,功能研究进展缓慢的非常重要的原因是,miRNA,的作用靶标难以确定,。,通过,实验方法确定,miRNA,的作用靶标非常耗时,目前尚无高通量的靶标鉴定方法,。,因此,,通过理论方法预测,miRNA,的作用靶标成为当前识别,miRNA,作用靶标的较为理想的途径。以下重点介绍几种经典预测软件的算法分析,其他软件,(见下表):,miRNA,几种常见的预测方法,下面概括介绍几种常见的预测,方法:,() miRanda.,miRanda,是最早的一个利用生物信息学对,miRNA,靶基因进行预测的软件,由,Enright,等人于,2003,年设计开发,.,其对,3UTR,的筛选依据主要是从序列匹配、,miRNA,与,mRNA,双链的热稳定性以及靶位点的保守性三个方面进行分析,.,miRanda,软件首先选取了黑腹果蝇,(Drosophila melanogaster),中已知的,73,条,miRNA,作为探针,采用类似于,Smith-Waterman,的算法对,9805,个,3UTR,进行碱基互补分析,.,首先,互补参数被设定为,: GC, AU,为,+5, GU,为,+2,其他配对方式为,3,同时起始,空位,(gap-opening),罚分为,8,延伸空位,(gap-extension),罚分为,2;,*,序列,比对,就是通过一定的算法对两个或多个序列进行比较,找出序列间最大的相似性匹配,。*,Smith&Waterman,算法,是一种经典的序列比对算法,在双序列比较的情况下具有比较好的速度和结果,但是在进行序列数据库搜索时则显得处理速度不足。,miRanda,其次,为体现与靶基因作用过程中,miRNA5,端和,3,端的不对称性, 5,端的前,11,个碱基的互补分值,(complementarity scores),将乘以一个,scale,参数,;,最后, miRNA,与靶,mRNA,的互补还要遵循以下,4,个规则,:,miRNA,第,24,位碱基和靶基因精确匹配,;,第,312,位碱基和靶基因错配不得多于,5,个,;,9L-5(L,为,miRNA,总长,),位碱基最少一个错配,;,最后,5,个碱基错配不得多于,2,个,.,miRanda,在热稳定性方面, miRanda,采用,Vienna,软件包计算,miRNA,与,3UTR,作用的自由能,(G).,在,物种间保守性方面,要求靶位点在多物种,3UTR,比对中相同位置处碱基相同,.,综合,以上,3,条原则, miRanda,选取每条,miRNA,相对的,3UTR,中排名前,10,位的基因,作为,miRNA,的候选靶基因,对于多个,miRNA,对应于同一靶位点的情况, miRanda,则使用贪心算法,(Greedy Algorithm),选取其中得分最高且自由能最低的那一对,.,TargetScan,() TargetScan,和,TargetScanS,.,TargetScan,是,Lewis,等人在,2003,年开发的一款用于预测哺乳动物,miRNA,靶基因的软件,该软件将,RNA,间相互作用的热力学模型与序列比对分析相结合,预测不同物种间保守的,miRNA,结合位点,.,与,miRanda,不同,在,TargetScan,的算法中,要求,miRNA5,端,第,28,位碱基与,mRNA,的,3UTR,完全互补,这,7,个核苷酸被称作“,miRNA,种子区,/,关键区”(,seed region,),.,种子区向两侧延伸直到出现碱基错配为止,这期间允许,GU,配对,同时利用,RNAFold,计算结合位点的自由能,.,TargetScan,中引入了,信号噪声比,来评估预测结果的准确度,所谓信号噪声比即用已知,(,信号组,),和随机生成的,miRNA(,噪声组,),分别对,mRNA,的,3UTR,进行预测,所得靶基因数目的比值,.,当,仅针对人,(Homo sapiens),和小鼠,(Mus musculus),的,3UTR,对,miRNA,靶位点进行预测时,信号噪声比为,21,针对,人、小鼠、大鼠,(Rattus norvegicus),的,3UTR,进行预测时信号噪声比为,3.21,研究,范围扩大到人、小鼠、大鼠和河豚,(Takifugu rubripes),时,信号噪声比为,4.61.,随着,物种数目的增多,预测得到的靶基因减少,但准确性得到了相应的提高,.,TargetScanS,后来, Lewis,等人又对,TargetScan,进行了优化,即,TargetScanS.,TargetScanS,在人、小鼠、大鼠的基础上增加了狗,(Canis familiaris),和鸡,(Gallus gallus),的,基因组,数据,同时在,算法上做了改动,将种子区由先前的,7,个核苷酸调整为,5,端第,27,位碱基共,6,个核苷酸,要求在种子区完全互补的情况下, miRNA,第,8,位碱基与靶基因互补或者,miRNA,第,1,位碱基是腺嘌呤,.,2007,年, Andrew,等人又将,TargetScanS,的算法中加入了新的,条件,1,)即,有效的,miRNA,结合位点多分布于,3UTR,中,AU,富集的,区域,2,)功能,上具有协同作用的,miRNA,靶位点,相近,3,),miRNA,的第,1217,个核苷酸与,3UTR,互补促进两者的,结合,4,)有效,的,miRNA,结合位点优先分布于,3UTR,的两侧,但距离终止密码子至少,15,个核苷酸,.,动物中靶基因预测方法,扩展,miRNA,命名,物种缩写,癌基因和,相关,miRNA,的特征,基因数据库,Blast,简介,cancer genetics,web,miRanda,应用,miRNA,命名,(1)miRNA,简写成,miR-No.,它的基因简写成,mir-No.,如,miR-21,;,(2),高度同源的,miRNA,在,No.,其后加英文字母,(,小写,一般从,a,开始,),如,miR-199a,和,miR-199b,;,(3),由不同染色体上的,DNA,序列转录加工而成的具有相同成熟体序列的,miRNA,,则在后面加上阿拉伯数字以区分,如,miR-199a-1,和,miR-199a-2,;,(4),如果一个前体的,2,个臂分别加产生,miRNA,,则根据克隆实验,在表达水平较低的,miRNA,后面加,“*”,,如,miR-199amiR-199a*,,或进行如下命名,,miR-142-5p(,也可命名为,miR-142-s,,表示从,5,端的臂加工而来,),和,miR-142-3p(,也可命名为,miR-142-as,,表示从,3,端的臂加工而来,),;,(5),将物种缩写置于,miRNA,之前,如,hsa-miR-195,;,(6),确定命名规则之前发现的,miRNA,,如,let-7,,则保留原来名字。,物种缩写,http/www.gene.ucl.ac.uk/nomenclature/guidelines.html,hsa: Homo sapiens,人,mmu: Mus musculus,小家鼠,rno,:,Rattus norvegicus,大鼠,cfa,:,Canis familiaris,狗,gga,:,Gallus gallus,鸡,dan,、,der,、,dgr,、,dme,(黑腹果蝇)、,dmo,、,dpe,、,dps,、,dse,、,dsi,、,dvi,、,dwi,、,dya,:,果蝇(不同种属),癌基因和相关,miRNA,的特征,大量关于癌症的相关研究证实在癌症患者体内确实存在着某些异常表达的,miRNA,值得研究的是癌症患者体内已发现的,异常表达的,miRNA,几乎全部作用于癌症患者的癌基因上,从这个角度看,,miRNA,在癌症的发生过程中,特别是对癌基因的基因调控,抑制蛋白质表达方面应该起着非常重要的作用,因此,研究癌症与,miRNA,的关系具有非常重要的生物学意义。,癌基因和相关,miRNA,的特征,癌症患者体内存在的某些与癌症有密切关系的蛋白质,其出现与癌基因的激活有密切关系,因此研究蛋白质的结构域与,miRNA,的关系也非常有意义。,目前研究的,RNAi,技术可在体外培养细胞中沉默人类的内源性基因,使得,RNAi,技术可能进入肿瘤治疗领域。利用,RNAi,技术封闭恶性细胞中的癌基因成为高特异性治疗癌症的新希望。,基因数据库,一,.GenBank,数据库,GenBank,(,http:/www.ncbi.nlm.nih.gov/),是美国国家卫生研究所(,NIH,)基因序列数据库,由美国生物技术信息中心开发。该数据库中半数以上是人类基因组的序列。,GenBank,提供,Entrez,浏览检索,,Blast,序列类似性检索,,dbEST,检索,,dbSTS,检索和文本检索。,可按基因存取号、著者号、基因名称、期刊刊号、刊名、标题词、文本词、序列号等字段进行限定检索。,Blast,简介,BLAST,是由美国国立生物技术信息中心(,NCBI,)开发的一个基于序列相似性的数据库搜索程序。,BLAST,是“局部相似性基本查询工具”,(Basic Local Alignment Search Tool),的 缩写。,主要的,blast,程序,生物序列的相似性,相似性,(similarity),:,是指一种很直接的,数量关系,,比如部分相同或相似的百分比或其它一些合适的度量。比如说,,A,序列和,B,序列的相似性是,80,,或者,4/5,。这是个量化的关系。当然可进行自身局部比较。,生物序列的同源性,同源性,(homology),:,指从一些数据中推断出的两个基因或蛋白质序列具而共同祖先的结论,属于,质的判断,。就是说,A,和,B,的关系上,只有是同源序列,或者非同源序列两种关系。而说,A,和,B,的同源性为,80,都是不科学的。,Blast,资源,1.NCBI,主站点:,http:/www.ncbi.nlm.nih.gov/BLAST/,(,网络版,),ftp:/ftp.ncbi.nlm.nih.gov/blast/,(,单机版,),2.,其他站点:, 相似性越高则,Score,值越大。,Evalue,:,在相同长度的情况下,两个氨基酸残基(或碱基)随机排列的序列进行打分,得到上述,Score,值的概率的大小。,E,值越小表示随机情况下得到该,Score,值的可能性越低,。,46,NCBI,提供的,Blast,服务,登陆,ncbi,的,blast,主页,核酸序列,蛋白序列,翻译序列,底下有其他一些针对特殊数据库的和查看以往的比对结果等,47,Blast,任务提交表单(一),1.,序列信息部分,填入查询(,query,)的序列,序列范围,(默认全部),选择搜索数据库,如果接受其他参数默认设置,点击开始搜索,48,Blast,任务提交表单(二),设置搜索的范围,,entrez,关键词,或者选择特定物种,2.,设置各种参数部分,一些过滤选项,包括简单重复序列,人类基因组中的重复序列等,E,值上限,窗口大小,如果你对,blast,的命令行选项熟悉的话,可以在这里加入更多的参数,49,Blast,任务提交表单(三),3.,设置结果输出显示格式,选择需要显示的选项以及显示的文件格式,显示数目,Alignment,的显示方式,筛选结果,E,值范围,其他一些显示格式参数,点击开始搜索,50,提交任务,返回查询号(,request id,),可以修改显示结果格式,修改完显示格式后点击进入结果界面,51,结果页面(一),图形示意结果,52,结果页面(二),目标序列描述部分,带有,genbank,的链接,点击可以进入相应的,genbank,序列,匹配情况,分值,,e,值,53,结果页面(三),详细的比对上的序列的排列情况,54,一个具体的例子(,blastp,),假设以下为一未知蛋白序列,query_seq,MSDNGPQSNQRSAPRITFGGPTDSTDNNQNGGRNGARPKQRRPQGLPNNTASWFTALTQHGKEELRFPRGQGVPINTNSGPDDQIGYYRRATRRVRGGDGKMKELSPRWYFYYLGTGPEASLPYGANKEGIVWVATEGALNTPKDHIGTRNPNNNAATVLQLPQGTTLPKGFYAEGSRGGSQASSRSSSRSRGNSRNSTPGSSRGNSPARMASGGGETALALLLLDRLNQLESKVSGKGQQQQGQTVTKKSAAEASKKPRQKRTATKQYNVTQAFGRRGPEQTQGNFGDQDLIRQGTDYKHWPQIAQFAPSASAFFGMSRIGMEVTPSGTWLTYHGAIKLDDKDPQFKDNVILLNKHIDAYKTFPPTEPKKDKKKKTDEAQPLPQRQKKQPTVTLLPAADMDDFSRQLQNSMSGASADST QA,我们通过,blast,搜索来获取一些这个序列的信息。,在生物信息学中,,FASTA,格式,(又称为,Pearson,格式),是一种基于文本用于表示核苷酸序列或氨基酸序列的格式。在这种格式中碱基对或氨基酸用单个字母来编码,且允许在序列前添加序列名及注释。,55,具体步骤,1.,登陆,blast,主页,http:/www.ncbi.nlm.nih.gov/BLAST/,2.,根据数据类型,选择合适的程序,3.,填写表单信息,4.,提交任务,5.,查看和分析结果,56,分析过程(一),1.,登陆,ncbi,的,blast,主页,2.,选择程序,因为查询序列是蛋白序列可以选择,blastp,,点击进入,也可以选择,tblastn,作为演示,,我们这里选,blastp,57,分析过程(二),3.,填入序列(,copy,paste,),Fasta,格式,或者纯序列,4.,选择搜索区域,这里我们要搜索整个序列,不填,5.,选择搜索数据库,这里我们选,nr(,非冗余的蛋白序列库,),。,是否搜索保守区域数据库(,cdd,),蛋白序列搜索才有。,我们选上,58,分析过程(三),6.,限制条件,我们限制在病毒里面找。,7.,其他选项保持默认值,打分矩阵,59,分析过程(四),8.,输出格式选项保持默认值,9.,点击开始搜索,60,分析过程(五),10.,查询序列的一些相关信息,在,cdd,库里面找到两个保守区域,,点击可以进入,61,分析过程(六),图形结果,62,分析过程(七),匹配序列列表,63,分析过程(八),具体匹配情况,64,两个保守区域的信息,返回,cancer genetics web,cancer,genetics web,(,http:/,www.cancerindex.org/geneweb,/,),主要,目的是为相关专业人员和研究者提供全面可靠的与癌症肿瘤相关的突变基因、蛋白质的数据信息。每个基因都包含着其他基因数据库、参考文献摘要、其他研究和总结等链接。,cancer genetics web,的异常基因信息按照三种方式分类,一种是以异常基因所在的染色体分类,标记了人类包括性染色体在内的共,24,条染色体(其中男性,Y,染色体,女性,X,染色体);第二种以基因的名字字母表分类查询;第三种主要是以相关癌症和肿瘤等疾病的致病基因分类。,导航,三种检索方式,按疾病分类检索,选择,breast cancer,选择,GSTM1,GSTM1,检索结果,miRNA,预测,主要遵循原则,主要遵循以下几个常用原则,:,()miRNA,与其靶位点的互补性,()miRNA,靶位点在不同物种之间的保守性,()miRNA-mRNA,双链之间的热稳定性,()miRNA,靶位点处不应有复杂二级结构,()miRNA 5,端与靶基因的结合能力强于,3,端,.,区别:,miRNA,与,mRNA,的,3,端结合,举例:,miRanda,搜索框,输入,miRNA,信息特征和物种信息,http:/www.microrna.org/microrna/home.do,例如:输入,let-7,与,let-7,对应的物种,是,Dme,黑腹果蝇,搜索结果,【view targets】,【view in miRBase】,View targets,选择第一行的“细节描述”,Alignment details,返回,miRBasedme-let-7,前体信息,成熟,dme-let-7,序列,Let-7a,Let-7b,相关参考文献,靶基因的检测方法,目前由于,miRNA,相关研究开展时间不长,可以辅助或实现,miRNA,靶基因鉴定的生物实验方法种类不多,总结起来主要,有,:,DNA,微阵列实验(,DNA microarray,),、,免疫印迹,(,Western blot,),、,报告,基因检验(,report gene assay,),、,靶,位点突变实验,、,免疫,沉淀反应实验(,immunoprecipitation,,,IP,),、,蛋白质,谱分析实验(,mass spectrometry,)。,与,miRNA,靶基因的预测方法相比,对,miRNA,靶基因,进行实验验证的方法并不多,目前还没有一,个快速,、简便、高通量的鉴定方法,.,靶基因的检测方法,最直接的鉴定方法是,利用,荧光定量,PCR,及,Western blot,方法,分别检测转染,(,水平升高,),或敲低,(,水平降低,)miRNA,后细胞中,mRNA,水平及蛋白水平的,变化,从而确定,miRNA,与靶基因的对应关系,.,这种方法能够直接鉴定出,miRNA,的靶基因,准确度高但不能鉴定,miRNA,的靶位点,.,目前,最为常用的,miRNA,靶位点鉴定方法,是,荧光素酶报告基因法,.,其基本原理是首先构建荧光素酶表达载体,将希望鉴定的,miRNA,靶基因的,3UTR,构建到荧光素酶基因的,3UTR,中,之后将构建好的载体转染细胞并改变细胞中相应,miRNA,的表达水平,最后检测荧光素酶的表达情况以分析转染,3UTR,中是否含有,miRNA,的靶位点,.,(荧光素酶表达量与荧光水平相关),DNA microarray,DNA microarray,是最为常见的观测,miRNA,对活性样本影响的生物学实验手段。,首先,将生物样本(如成长过程中的细胞)一分为二,其中一份样本正常生长,而在领一份样本中通过加入过量,miRNA(Over-express),或减小,miRNA,含量(,Knock Down,、,Knock Out,)的方法人为改变观测的,miRNA,的表达水平。在此基础上分别用,microarray,检测两个样本中,mRNA,的浓度,并进行比较以评估,miRNA,的作用,。,microarray,可以一次性检测过万个基因的转录水平,有着很大的吞吐量。加上,技术成熟,且,成本相对较低,的优点,,microarray,实验成为,miRNA,靶标预测的重要手段,。,但是,由于它的检测目标是,mRNA,的浓度,无法直接观测到,miRNA,对蛋白质的影响,而在高等动物中,,miRNA,的最主要功能恰恰是翻译的抑制、而非,mRNA,的降解,因此无法对靶基因识别做出判别性的结论,。,*吞吐量:单位,时间,内成功传输数据的量*, blot,),免疫印迹(,Western blot,)是对目标蛋白质进行定性或半定量分析的一种方法。简单来说,,Western blot,利用电泳现象根据分子量大小分离蛋白质,再通过对应抗体对靶蛋白的特异性进行检测,从而推断目标蛋白质的大致含量,。,Western,blot,成本较低、技术成熟,因此常用于检测,miRNA,对特定蛋白质的影响,但由于其原理的限制,一般用于检验单个蛋白质的含量,而无法进行大吞吐量的靶标鉴定。,靶位点的突变实验,靶位点的突变实验:,是人为地讲,3UTR,中可疑的靶位点序列改变或去除,然后根据改变前后,miRNA,对基因表达的影响程度不同进行判定。靶位点突变实验同样具有针对性强、置信度高的特点,而且被用作,miRNA,靶标鉴定以绑定点鉴定的判定实验,但吞吐量小也是其不可克服的不足。,蛋白质质谱分析实验,蛋白质质谱分析实验(,mass spectrometry,)是用酶将蛋白质切成小段的蛋白质肽链,加载电荷后通过电场到达接收板形成质谱信号。由于不同荷质比粒子在电场中运行轨迹的不同,各肽链到达接收板的时间和落点均有所不同,据此可以鉴定出肽链碎片的质量,并进一步辨别出原始蛋白质的种类和含量,通过,miRNA,表达前后蛋白质数量的变化,可得到相关信息进行进一步的靶基因鉴定,。,蛋白质,质谱分析实验可一次性检测上千种蛋白质的含量,有着客观的吞吐量,可以为靶基因鉴定提供有力的证据;但质谱实验所检测到的蛋白质含量的变化,可能是受整个生物调控系统调控的结果,而非,miRNA,的直接作用,因此也不具判决性;此外,质谱实验成本极高,对其数据的分析仍然处于起步阶段,因此直到近期仅发现一篇将其用于靶基因鉴定的文章,短时间内发范围开展相关研究的难度较大。,总结,在目前靶基因鉴定的生物学实验中,判决性实验的吞吐量太小,根本无法实现大批量的靶基因鉴定;,而大吞吐量的实验置信度较低,只适合参与缩小靶基因范围的辅助型工作。,总体来看,生物实验成本高、耗时长,对实验人员的技能水平也有很高的要求;且生物实验的可重现性有限,条件、设备的不同均会对结果产生较大的影响。,因此,在,miRNa,靶基因鉴定领域,生物学家对新型靶基因鉴定实验不断进行开发的同时,生物信息学家也在积极尝试探索靶基因预测这一问题的解决方案。,研究思路,如何写论文?例如:,一,.,某种功能基因,二,.microRNA,结合位点,SNP,三,.,与疾病的关联,特征数据库数据提取流程图,可以作为信息检索,的思路,microRNA,靶序列,SNP,的检索与分析步骤,具体实施,1.,寻找相关基因:,BRCA1,2.,http:/www.ncbi.nlm.nih.gov/projects/SNP/,SNP,的筛选,1.SNP,的筛选:,NCBI,Genebank,、,UCSC genome,、,dbSNP,、,dbTSS,、,peseudogene,、,transfac,miRNA,特征信息,基因座的选择,Hapmap,(,www.hapmap.org,)人类基因组计划,的主要目的是对人,基因组多态性和连锁不平衡,的模式进行整体的分析,发布相关数据,并利用该数据指导,人全,基因组的标签,SNPs,的选择,。,国际,HapMap,协作组遵循尽可能快的发布数据的政策,以期为众多的研究者提供帮助。协作组,期望该计划产生的数据能被应用于多个方面,,如开发新的分析方法,理解多态性、连锁不平衡和单体型联合的模式,以及指导用于定位疾病相关基因的分子标记的选择。因此,协作组,承诺这些数据可被任何人以任何目的的使用,。,microRNA,相关变异数据库,系统性,的,microRNA,靶序列,SNP,与肿瘤的关联研究需要全面的生物信息学检索和分析。近年,,microRNA,相关变异的数据库有了较大的发展,以,“,Patrocles”,(http:/www.patrocles.org/Patrocles.htm),和,“,polymiRTS (,Poly,morphism in,mi,cro,R,NA,T,arget,S,ite,)”,(http:/compbio.uthsc.edu/miRSNP/),为,代表的数据库都收录了大量的,microRNA,靶序列,SNP,的信息,;,“,miRanda”,数据库能够检索,miRNA,与特定序列结合与否,以及结合自由能等信息,;,“,RNAhybrid”,数据库可以构建,microRNA,与其靶序列的结合模式图,;,“,dbSNP”,数据库可以检索,SNP,相关的频率信息,;,“,Pubmed”,数据库可以检索靶基因与肿瘤的关联,情况。,这些,数据库的综合运用可以对,microRNA,靶序列单核苷酸多态性进行深入的生物学分析。,microRNA,相关,SNP,主要包括三个部分,即,miRNA,基因自身,SNP,,,miRNA,靶序列,SNP,和,miRNA,合成通路相关基因,SNP,。,其中有些单碱基替换在正常人群中也有分布,分布频率,0.01,的单碱基变化成为,SNP,。,使用到的软件:,Snapshot,检索与分析步骤,第一步,选取当前,microRNA,靶序列变异数据库中最权威的两个数据库,Patrocles,和,polymiRTS,,检索全基因组的,microRNA,靶序列,SNP,。按照检索结果,以其中较为保守的数据库为基准数据库,另一个数据库为参考数据库。利用基准数据库检索,在设定种子区类型的条件下,检索全部,microRNA,种子区结合序列内已确认(,Validated,)的,SNP,。,共,5033,,为基准,共,16300,,为参考,1742,个,validated SNP(,每页显示,100,个,),进入第二步搜索,检索与分析步骤,第二步,利用,dbSNP,数据库(,http:/www.ncbi.nlm.nih.gov/projects/SNP/,),,获得上述全部,SNP,的,频率(,MAF,),信息,、野生型等位基因,信息(,RefSNP,)和,SNP,周边,序列信息,。按照预先设定的频率标准筛选上述,SNP,,例如设定,的频率标准是:每个,SNP,有,三种,基因型(,genetype,)存在,且最少基因的频率,=0.05,。在基因型频率方面,首选中国,北京人,的频率(,HapMap-HCB,),在没有中国北京频率的情况下,参考亚洲人群频率,数据(,Asian,)。,检索与分析步骤,第三步,利用,pubmed,数据库,检索上述,SNP,所在基因是否与肿瘤发病或预后相关,在,pubmed,数据库,中使用检索词“靶基因名称”,+“cancer”,,检索全部相关论文,阅读论文摘要(或,全文),,保留与肿瘤有明确关联的靶基因的,SNP,。,以,TTLL 10,(基因:见上图),和,breast cancer,在,Pubmed,搜索,No items found,检索与分析步骤,第四步,按照同一基因上,高频率,(,高,MAF,?,),靶序列,SNP,的数量对靶基因分组,即分为包含,单个靶序列,SNP,的基因和包含,多个靶序列,SNP,的基因,统计各组靶基因的数量和构成情况。,检索与分析步骤,第五步,针对包含多个,microRNA,靶序列,SNP,的基因,利用,DIANA microT,,,RNA22,和,RNAhybrid,等软件分析每个靶序列,SNP,的功能类型,描述同一基因上多个靶序列,SNP,的组合模式。(,熟悉软件操作,),检索与分析步骤,第六步,将,基准数据库,检索获得的,全部肿瘤相关基因,microRNA,靶序列,SNP,与参考数据库对比,,,选取重复的,SNP,,统计两个数据库的重复率。,检索与分析步骤,第八步,对上述两个数据库重复预测的,SNP,进行,功能分型,,即按照该,SNP,对,microRNA,结合靶基因的影响,分类,统计各类的数量和比例。,检索与分析步骤,第七步,选取具有特殊模式或重要功能,的典型靶序列,SNP,进行深入分析。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业管理 > 营销创新


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!