实验五蛋白质序列分析.ppt

上传人:tian****1990 文档编号:11529362 上传时间:2020-04-27 格式:PPT 页数:49 大小:5.28MB
返回 下载 相关 举报
实验五蛋白质序列分析.ppt_第1页
第1页 / 共49页
实验五蛋白质序列分析.ppt_第2页
第2页 / 共49页
实验五蛋白质序列分析.ppt_第3页
第3页 / 共49页
点击查看更多>>
资源描述
实验五:蛋白质序列分析,杜娟dujuannx,基因与蛋白质组学数据分析,实验项目五:蛋白质序列分析一、实验目的和要求:掌握蛋白质基本性质分析;基本理化性质和疏水性分析。掌握蛋白质信号肽的预测,亚细胞定位的预测,跨膜结构及卷曲螺旋结构的预测。了解基于motif、结构位点、结构功能域数据库的蛋白质功能预测掌握基于序列同源性分析的蛋白质功能预测。,2,(一)蛋白质基本理化性质分析,蛋白质理化性质是蛋白质研究的基础蛋白质的基本性质:相对分子质量氨基酸组成等电点(PI)消光系数半衰期不稳定系数总平均亲水性实验方法:相对分子质量的测定、等电点实验、沉降实验缺点:费时、耗资基于实验经验值的计算机分析方法软件Bioedit网络工具ProtParam,ComputePI,3,4,基于一级序列的组分分析氨基酸亲疏水性等分析为高级结构预测提供参考ExPASy(ExpertProteinAnalysisSystem)开发的针对蛋白质基本理化性质的分析:Protparam工具http:/www.expasy.org/tools/protparam.html,蛋白质理化性质分析,Protparam工具http:/www.expasy.org/tools/protparam.html计算以下物理化学性质:相对分子质量理论pI值氨基酸组成原子组成消光系数半衰期不稳定系数脂肪系数总平均亲水性,5,主要选项/参数,序列在线提交形式:如果分析SWISS-PORT和TrEMBL数据库中序列直接填写Swiss-Prot/TrEMBLAC号(accessionnumber)如果分析新序列:直接在搜索框中粘贴氨基酸序列,6,输入Swiss-Prot/TrEMBLAC号分不同的功能域肽段以P02699为例,输出结果,7,点击不同功能域得到以下结果,8,9,40unstable,10,(二)蛋白质疏水性分析,疏水作用是蛋白质折叠的主要驱动力分析蛋白质氨基酸亲疏水性是了解蛋白质折叠的第一步氨基酸疏水分析为蛋白质二级结构预测提供佐证是分析蛋白质跨膜区重要一步,11,ProtScale工具http:/ca.expasy.org/tools/protscale.html氨基酸标度表示氨基酸在某种实验状态下相对其他氨基酸在某些性质的差异,如疏水性、亲水性等收集50多个文献中提供的氨基酸标度默认值以Hphob.Kyte&Doolittle做疏水性分析ProtScale能计算超过50种蛋白质的特性。仅一项需要额外设定的参数是输入框的宽度,该参数将指示系统每次运行计算和显示的残基数,其缺省值为9。如果想考虑跨膜螺旋特性,该参数设置应为20,因为一个跨膜螺旋通常有20个氨基酸长度,蛋白质亲疏水性分析,12,主要选项/参数序列在线提交形式:如果分析SWISS-PORT和TrEMBL数据库中序列直接填写Swiss-Prot/TrEMBLAC号(accessionnumber)如果分析新序列:直接在搜索框中粘贴氨基酸序列以P02699为例,13,14,输出结果,15,16,三信号肽预测,蛋白质合成后要运送到细胞中不同的部位,有的蛋白质要通过内质网膜进入内质网腔内,最终成为分泌蛋白。分泌蛋白的N端都有一段约1535个氨基酸的疏水性肽段,其功能是引导蛋白质多肽链穿过内质网膜进入腔内,称为信号肽(signalpeptide)。按照氨基酸组成及其位置特征,可将信号肽分为4大类:分泌信号肽2.脂蛋白信号肽3.Pilin-like信号肽4.细菌素和细菌素信号肽,蛋白质序列分析,信号肽主要由三个domain组成:N-region、H-regin和C-region.N-region为正电荷区域,至少含有一个精氨酸(R)或赖氨酸(K).H-region为疏水核,一般长为1214个氨基酸.C-region包含信号肽酶(SPase)的剪切位点,在剪切位点的-1位和-3位上多为中性的丙氨酸,该区域也称为富含丙氨酸区域.NHCN端C端,蛋白质序列分析,常用工具SignaIP(http:/www.cbs.dtu.dk/services/SignalP/)通过神经网络方法的组合预测信号肽的位置及相应切点,19,三信号肽的预测,人的内质网驻留蛋白信号肽预测Q9BS26,输入序列的FASTA文件,21,人的内质网驻留蛋白信号肽预测,曲线颜色,此处C值最大;S值陡峭;Y值最高峰。预测为信号肽剪切位点,文本结果,YES代表该蛋白包含信号肽,剪切位点位于29,30残基处,Cscore:剪切位点分值Sscore:信号肽分值Yscore:综合剪切位点分值,四蛋白质亚细胞定位预测,亚细胞定位与蛋白质的功能存在着非常重要的联系。亚细胞定位预测基于如下原理:(1)不同的细胞器往往具有不同的理化环境,它根据蛋白质的结构及表面理化特征,选择性容纳蛋白。(2)蛋白质表面直接暴露于细胞器环境中,它由序列折叠过程决定,而后者取决于氨基酸组成。因此可以通过氨基酸组成进行亚细胞定位的预测。推荐使用PSORT(http:/psort.nibb.ac.jp/)II软件对PDCD5蛋白的细胞内定位进行预测。PSORT将动物蛋白质定位于10个细胞器:(1)细胞浆,(2)细胞骨架,(3)内质网,(4)胞外,(5)高尔基体,(6)溶酶体,(7)线粒体,(8)胞核,(9)过氧化物酶体(peroxisome)和(10)细胞膜。,22,23,输入蛋白质序列FASTA文件,24,25,细胞外,细胞壁,线粒体,细胞骨架,细胞核,五跨膜区预测,各个物种的膜蛋白的比例差别不大,约四分之一的人类已知蛋白为膜蛋白。由于膜蛋白不溶于水,分离纯化困难,不容易生长晶体,很难确定其结构。因此,对膜蛋白的跨膜螺旋进行预测是生物信息学的重要应用。推荐使用TMHMM软件(http:/www.cbs.dtu.dk/servICEs/TMHMM/)对蛋白进行跨膜预测。TMHMM综合了跨膜区疏水性、电荷偏倚、螺旋长度和膜蛋白拓扑学限制等性质,采用隐马氏模型(HiddenMarkovModels),对跨膜区及膜内外区进行整体的预测。TMHMM是目前最好的进行跨膜区预测的软件,它尤其长于区分可溶性蛋白和膜蛋白,因此首选它来判定一个蛋白是否为膜蛋白。所有跨膜区预测软件的准确性都不超过52%,但86%的跨膜区可以通过不同的软件进行正确预测。因此,综合分析不同的软件预测结果和疏水性图以获得更好的预测结果。,26,27,输入蛋白质序列FASTA文件,铝激活苹果酸转运蛋白的跨膜区预测,28,跨膜区,起始氨基酸,终止氨基酸,文字结果,29,跨膜区,膜外区,膜内区,图形结果,卷曲螺旋(coiledcoil)是蛋白质中由27条螺旋链缠绕成麻花状结构的总称存在于多种天然蛋白质中,如转录因子、结构蛋白、膜蛋白中,在生物体内执行着代谢调控、分子运动、膜通道、分子识别等重要的生物功能,,30,六蛋白质卷曲螺旋域分析,典型的有亮氨酸拉链,存在7残基重复结构(heptadrepeat),以a,b,c,d,e,f,g位置表示,其中a和d位置为疏水性氨基酸,而其他位置残基为亲水性,卷曲螺旋控制蛋白质寡聚化的元件,存在于转录因子、蛋白融合多肽等一种很简单的三级结构,容易预测常用工具COILS-PredictionofCoiledCoilRegionsinProteins(http:/www.ch.embnet.org/software/COILS_form.html),选择滑动窗口大小,选择打分矩阵和权重,选择输入格式,选择“SwissProtIDorAC”,查询内容,输入Q9H2G9,http:/www.ch.embnet.org/software/COILS_form.html,33,33,图形结果,34,预测为卷曲螺旋的区域,七结构域分析,结构域(structuredomain)是在蛋白质三级结构中介于二级和三级结构之间的可以明显区分但又相对独立的折叠单元,每个结构域自身形成紧实的三维结构,可以独立存在或折叠,但结构域与结构域之间关系较为松散。结构域通常由25300个氨基酸组成,不同蛋白质结构域数目或同一蛋白质结构域相似度差异较大,蛋白质序列分析,常见的结构域主要有5种:全平行结构域反平行结构域+结构域/结构域其他折叠类型结构域是蛋白质的功能、结构和进化单元,结构域分析对于蛋白质结构的分类和预测有着重要作用。,蛋白质序列分析,七基于结构域(模体)的蛋白质功能预测,一类基因具有转录功能,且它们所编码的蛋白质都具有Y结构域(模体),蛋白质B也具有Y结构域(模体),因而蛋白质B的功能也应该与基因转录相关。,蛋白质B,转录活性,蛋白质模体或结构域在氨基酸序列水平比其他区域保守,通过对序列比对可以发现这些在进化上较为保守的区域;蛋白质模体或结构域通常与该蛋白质的功能直接相关;根据模体或结构域信息可以对同源水平较低的蛋白质的进行功能预测。,基于结构域(模体)的蛋白质功能预测,七蛋白质序列分析蛋白质家族、结构域、位点及功能分析,绿脓假单胞菌RpsA层粘连蛋白受体,蛋白质序列分析,保守结构域以及功能分析,RNA结合结构域,核酸结合,七基于同源序列的蛋白质功能预测,蛋白质A具有转录功能,蛋白质B与A在氨基酸序列上相似(直系同源),因而蛋白质B也具有转录功能。,A,B,转录活性,转录活性,蛋白质A,蛋白质B,至少80个氨基酸长度范围内具有25%以上的序列一致性才提示可能的显著性意义。未知功能序列对库检索的一般分析策略如下:和运行Blastp程序的服务器(http:/www.ncbi.nlm.nih.gov/blast/)连接;将目的序列粘贴到序列输入框中,选择BLOSUM62记分矩阵运行BlastP程序。NCBI的BlastP程序要求输入格式为FASTA格式;如果BlastP检测到了高度同源的序列,将有可能提示目的序列的生物学功能,42,七基于同源序列的蛋白质功能预测,序列相似性比较作为一个非常有效的工具用于同源基因的发现,基于序列同源的蛋白质功能预测,基于序列同源的蛋白质功能预测,45,在uniprot数据库中检索人脂联素(adiponectin)蛋白质序列;写出检索号。使用在线分析平台ExPASy对上述蛋白质序列进行分子质量、氨基酸组成(protparam)、和疏水性等基本性质分析(protscale);写出分子质量是多少?氨基酸组成情况?哪个氨基酸所占比例最高?哪个最低?不稳定系数是多少?根据该系数判断,该蛋白质稳定吗?带正负电荷氨基酸个数分别是多少?疏水性分析结果如何?(截图报道图形结果,在图中标出疏水性高的位点三个,疏水性低的位点3个),并在文字结果中找到这些位点对应的的氨基酸编号和类型(格式例如6号亮氨酸)。,作业,作业,预测海参溶菌酶A0MT08的信号肽,并分析结果,指出信号肽位置。预测P69332的亚细胞定位,并翻译、分析、截取最终结果,指出该蛋白质在那些位置表达。预测P69332的跨膜区,并分析预测结果,指出哪些区域是跨膜区。使用COILSServer对对水稻瘤矮病毒RGDVP2蛋白卷曲螺旋预测分析,指出预测为卷曲螺旋的区域。,46,作业,利用Interproscan分析人脂联素(adiponectin)蛋白质的结构域信息。写出该蛋白包含哪些结构域?其可能的功能是什么?对人脂联素(adiponectin)蛋白质进行blast搜索,找到与其同源的蛋白(前五个列出检索号和蛋白名称),分别来自于五个什么物种?,47,实验报告,到网络教学平台-基因与蛋白质组学数据分析B2100029-教学材料-实验课件下载基因与蛋白质组学数据分析实验报告模版将上述问题答案整理到实验报告中,正反打印放在2张纸上(不超过2张),下次实验课上交。,48,谢谢大家!,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!