资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,利用,ORFfinder,(,NCBI,)搜索,E.coli,部分基因组序列上的,ORF,当一个新基因被识别,其,DNA,序列被解读,我们能搞清相应的蛋白序列是什么吗?,那么我们怎么样能知道相应的蛋白序列是什么呢?,在没有其它信息的前提下,,DNA,序列可以按六种框架阅读和翻译(每条链三种,对应三种不同的起始密码子)。,ORF,识别包括检测这六个阅读框架并决定哪一个包含以启动子和终止子为界限的,DNA,序列而其内部不包含启动子或终止子,符合这些条件的序列有可能对应一个真正的单一的基因产物。,在细菌基因组中,基因很少有内含子的中断。因此,检测基因的有效途径是对基因组序列进行六个可读框的翻译并识别长的可读框,(ORF),。,ORF,的识别是证明一个新的,DNA,序列为特定的蛋白质编码基因的部分或全部的先决条件。,什么是,ORF,?,ORF,(,开放阅读框,),:,是一段较长(,300bp,)的有义密码子序列,位于 起始密码子,(usually,ATG),和 终止密码子,(,无义密码子,TGA,TAG or TAA),之间。,认识,NCBI ORF finder,ORF Finder,是一个图形的序列分析工具,,通过执行六个可读框的翻译,,分析并找到序列的,ORF,区,(,开放读码框架,),,这个工具使用标准的或其它特殊的遗传密码子列出所有可能的,ORF,区,并推导出氨基酸序列。,对于复杂的真核生物基因组,则需要更复杂的统计分析方法。,1,,输入,GI,号或,Accession,,或直接输入序列的,fasta,格式,2,,结果出现六个图形,这是根据六种不同的编码方式得到的(包括正反链)。,3,,拿到氨基酸序列后,你可以直接做,blastp,,如果有匹配到,就是正确的,ORF,区了。另外也可以用,Pfam,的方法,在,Pfam,数据库搜索。,4,,结果表明该,ORF,编码的蛋白是属于,BTB,家族的。,注意,说明,你可以同时用几个工具来验证,如,blastp,Pfam,CDD,。但有时的结果不一定全部一致。这有可能是因为不同的数据库,存放的数据有些差异,算法也有些差异,是属于正常的。基本上大部分都是可靠的,NCBI,主页,我们来做个示范,谢谢!,
展开阅读全文