blast简介及其应用.ppt

上传人:max****ui 文档编号:3391489 上传时间:2019-12-13 格式:PPT 页数:57 大小:2.11MB
返回 下载 相关 举报
blast简介及其应用.ppt_第1页
第1页 / 共57页
blast简介及其应用.ppt_第2页
第2页 / 共57页
blast简介及其应用.ppt_第3页
第3页 / 共57页
点击查看更多>>
资源描述
BLAST简介及其应用,BasicLocalAlignmentSearchTool,2,实验目的,1、了解Blast资源和功能2、了解blast的应用3、掌握使用blast进行序列搜索,3,生物序列的相似性,相似性(similarity):是指一种很直接的数量关系,比如部分相同或相似的百分比或其它一些合适的度量。比如说,A序列和B序列的相似性是80,或者4/5。这是个量化的关系。当然可进行自身局部比较。,4,同源性(homology):指从一些数据中推断出的两个基因或蛋白质序列具有共同祖先的结论,属于质的判断。就是说A和B的关系上,只有是同源序列,或者非同源序列两种关系。而说A和B的同源性为80都是不科学的。,生物序列的同源性,5,相似性和同源性关系,序列的相似性和序列的同源性有一定的关系,一般来说序列间的相似性越高的话,它们是同源序列的可能性就更高,所以经常可以通过序列的相似性来推测序列是否同源。正因为存在这样的关系,很多时候对序列的相似性和同源性就没有做很明显的区分,造成经常等价混用两个名词。所以有出现A序列和B序列的同源性为80一说。,6,Blast程序评价序列相似性的两个数据,Score:使用打分矩阵对匹配的片段进行打分,这是对各对氨基酸残基(或碱基)打分求和的结果,一般来说,匹配片段越长、相似性越高则Score值越大。Evalue:在相同长度的情况下,两个氨基酸残基(或碱基)随机排列的序列进行打分,得到上述Score值的概率的大小。E值越小表示随机情况下得到该Score值的可能性越低。我们在获得一个Blast结果时需要看这两个指标。如果Blast获得的目标序列的Score值越高并且E-value越低表明结果越可信,反之越不可信.,7,BLAST简介,BLAST既是一种算法也是一种基于该算法设计出的搜索工具,是由美国国家生物信息中心(NCBI)研发的一个生物信息数据库搜索工具系统,该系统对于生物基因序列数据在计算机中的表达和处理作了许多的研究,提供了一个快速的基于碱基数据的搜索引擎。BLAST是基于匹配短序列片段,用一种强有力的统计模型来确定未知序列与数据库序列的最佳局部联配,可在序列数据库中对查询序列进行相似性比对工作。,8,BLAST简介,BLAST搜索的六大优点:使用方便,功能齐全速度快,结果可信NCBI精心维护,持续开发配套数据库不断更新免费服务(NCBI、EBI、TIGR)免费下载,本地安装,9,主要的BLAST程序(功能),10,两种版本的BLAST比较(一),网络版本包括NCBI在内的很多网站都提供了在线的BLAST服务,这也是我们最经常用到的BLAST服务。网络版本的BLAST服务就有方便,容易操作,数据库同步更新等优点。但是缺点是不利于操作大批量的数据,同时也不能自己定义搜索的数据库。,11,单机版单机版的BLAST可以通过NCBI的ftp站点获得,有适合不同平台的版本(包括linux,dos等)。获得程序的同时必须获取相应的数据库才能在本地进行BLAST分析。单机版的优点是可以处理大批的数据,可以自己定义数据库,但是需要耗费本地机的大量资源,此外操作也没有网络版直观、方便,需要一定的计算机操作水平。,两种版本的BLAST比较(二),WhyuseBLAST?,BLAST是NCBI中用来将一个蛋白质或DNA序列和各种数据库中的其他序列进行比对的主要工具。BLAST搜索是研究一个蛋白质和基因的最基本的方法之一。,BLAST的使用,BLAST具有非常广泛的应用:研究可能存在多种剪切方式的表达序列标签。寻找对于一个蛋白质的功能和/或结构起关键作用的氨基酸残基。确定特定的蛋白质或核酸序列有哪些已知的直系同源或旁系同源序列。确定哪些蛋白质和基因在特定的物种中出现。确定一个DNA或蛋白质序列身份。发现新基因确定一个特定基因或蛋白质有哪些已经发现了的变种。,Blast的使用,首先在NCBI的基因数据库中找到一段基因核苷酸序列(或者是通过测序得到的核苷酸序列)。将该序列用FASTA格式存入记事本。进入Blast界面选择一种自己所需的功能进行搜索比对。将需要查询序列键入框中选择数据库和确定比对参数。Blast(比对),网页版具体步骤,1.登陆blast主页http:/www.ncbi.nlm.nih.gov/BLAST/2.根据数据类型,选择合适的程序3.填写表单信息4.提交任务5.查看和分析结果,1.登陆blast主页http:/www.ncbi.nlm.nih.gov/BLAST/,组装的基因组序列库,基本blast,特定的BLAST,所有的BLAST基因数据库,18,19,20,核酸数据库中比对核酸序列,蛋白质数据库中比对蛋白质序列,BLASTN,BLASTP,蛋白质数据库中比对核酸序列,蛋白质数据库中比对核酸序列,核酸数据库中比对蛋白质序列,21,标准蛋白质数据库,组装的基因序列库,快速搜索,基本操作,特定的BLAST,所有的BLAST基因数据库,23,特定的BLAST,24,2.根据数据类型,选择合适的程序,2.根据数据类型,选择合适的程序,blastn(nucleotideBLAST):将一个核酸的查询序列与一个核酸序列数据库相比较。blastp(proteinBLAST):将一个氨基酸的查询序列与一个蛋白质序列数据库相比较。这类搜索有专门与蛋白质搜索相关的可选参数,如对各种PAM和BLOSUM打分矩阵的选择。,2.根据数据类型,选择合适的程序,blastx(translatedBLAST):将一个核酸的查询序列按所有可能的阅读框翻译后的序列与一个蛋白质序列数据库进行比较。如若有一个DNA序列,想知道它编码什么蛋白质,用此程序进行搜索。它会自动将DNA翻译成6种可能的蛋白质。然后此程序就会将翻译的6个蛋白质序列逐一与蛋白质序列数据库中的各个成员进行比较。,2.根据数据类型,选择合适的程序,tblastx(translatedBLAST):将一个核酸查询序列的6种框架的翻译结果与一个核酸序列数据库的6种框架翻译产物进行比较。该程序不能使用BLAST网页上提供的主要的去冗余(nr)数据库,因这一操作很消耗计算机资源。,28,3.填写表单信息,29,1.序列信息部分,填入查询(query)的序列,序列范围(默认全部),选择搜索数据库,如果接受其他参数默认设置,点击开始搜索,30,去冗余GenBank编码序列PDB+SwissProt+PIR+PRF,31,常用的检索数据库,32,nr数据库是合并了若干个主要的蛋白质或DNA数据库得到的。这些数据库中经常包含有相同的序列,但nr数据库只收录其中的一个序列(即使在nr数据库中出现看上去一样的序列,实际上还是具有一些细节上的区别)。nr数据库是在要搜索现有的绝大多数序列时典型和常用的数据库。,33,34,1.序列信息部分,填入查询(query)的序列,序列范围(默认全部),选择搜索数据库,如果接受其他参数默认设置,点击开始搜索,4.提交任务5.查看和分析结果,35,36,具体例子,以下列蛋白序列为例,进行BLAST搜素:MSDNGPQSNQRSAPRITFGGPTDSTDNNQNGGRNGARPKQRRPQGLPNNTASWFTALTQHGKEELRFPRGQGVPINTNSGPDDQIGYYRRATRRVRGGDGKMKELSPRWYFYYLGTGPEASLPYGANKEGIVWVATEGALNTPKDHIGTRNPNNNAATVLQLPQGTTLPKGFYAEGSRGGSQASSRSSSRSRGNSRNSTPGSSRGNSPARMASGGGETALALLLLDRLNQLESKVSGKGQQQQGQTVTKKSAAEASKKPRQKRTATKQYNVTQAFGRRGPEQTQGNFGDQDLIRQGTDYKHWPQIAQFAPSASAFFGMSRIGMEVTPSGTWLTYHGAIKLDDKDPQFKDNVILLNKHIDAYKTFPPTEPKKDKKKKTDEAQPLPQRQKKQPTVTLLPAADMDDFSRQLQNSMSGASADSTQA,37,1.登陆NCBI的BLAST主页http:/www.ncbi.nlm.nih.gov/BLAST/界面如图所示:,分析过程,38,登陆BLAST主页,39,2.根据序列的类型,选择合适的比对分析界面程序。本例中分析的是蛋白质序列,所以单击选择BasicBLASTProteinBlast项,进入蛋白质比对分析界面。如下图:,分析过程,40,41,3.填写表单信息在网页的Enteraccessionnumber.gi.orFASTAsequence对话框中输入待查询序列,下面Choosesearchsetdatabase项中选Swissprot库(nr:NCBI所有翻译库,Refseq:专家参照库,Swissprot:欧洲蛋白质专家库,pat:专利库,pdb:蛋白质三维结构库),单击BLAST运行程序。,分析过程,43,如不单击BLAST,而单击BLAST下面的AlgorithmParameters,可以进行BLAST的高级设置选项。,分析过程,45,46,4.BLAST程序启动后,进入FormattingBlast界面,如图:,分析过程,48,5.在色条上单击,进入ConservedDomains(保守结构)分析界面,可以看到序列的保守性利用不同的算法,得出不同的结果,如图:,分析过程,50,6.如果不单击色条而继续等待,系统将自动更新,不久将获得BLAST比对得到大量相似序列;再经过几分钟后,BLAST界面自动刷新,列出分析结果,分析过程,52,53,基因名,来源物种,一致程度,登录号,54,55,56,所选序列,下载序列,
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!