资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,生物信息学实验课件,邢晋祎,生命科学学院,Copyright,实验二,常用分子生物学数据库检索方法及数据格式,实验目的,1.了解ncbi所提供的在线entrez检索方法。,2.了解EBI所提供的SRS检索方法。,3.熟悉查询swiss-prot蛋白质序列数据库的查询。,4.详细了解三大核酸序列数据库之一的GenBank数据库平面文件Flat file。,5.详细了解蛋白质结构数据库PDB数据库中的pdb文件。,实验材料,计算机,网络。,实验过程,1.Entrez检索方法,NCBI,All database,Entrez,查询某一关键词(eg.Helicase,insulin,topoisomerase,gyrase,hemoglobin。),依次点击各个数据库查看,实验过程,GenPept文件下载,平面文件获得,查询某一条核酸序列,获得平面文件,保存或者下载,用写字板(记事本)打开,实验过程,2.SRS检索方法。,EBI,SRSEBI,choice database,查询某一关键词(eg.Helicase,insulin,topoisomerase,gyrase,hemoglobin。),实验过程,3.Swiss-prot查询方法。,Swiss-prot,SRSEBI,choice database,查询某一关键词(eg.Helicase,insulin,topoisomerase,gyrase,hemoglobin)。,4.GenBank flatfile(GBFF)内容。,是GenBank数据库的基本信息单位,也是最广泛地用以表示生物序列的格式之一。,GenPept文件,GBFF可以分成三个部分,头部包含关于整个记录的信息(描述符)。,第二部分包含了注释这一记录的特性,,第三部分是核苷酸序列自身。,所有的核苷酸数据库记录(DDBJ/EMBL/GenBank)都在最后一行以/结尾。,实验过程,5.PDB 文件的获得,进入PDB数据库,查询某蛋白质的结构(eg:1d3y),下载结构到本地电脑,用写字板(记事本)打开,源自PDB结构记录的内容,PDB记录包括两个序列信息备份:隐性序列和显性序列。,显性序列在PDB文件中以关键词SEQRES打头逐行存储。,隐性序列蕴涵在由PDB文件中的ATOM记录及相应(X,Y,Z)位置坐标构成的化学立体结构中。,实践中,许多PDB文件浏览器,如Rasmol,仅用隐性序列重构PDB记录蛋白质的化学图象,而忽略由SEQRES引导的显性序列信息。,文件头部,显性序列,隐性序列,作业:格式同实验一,1.写出Genbank flatfile的详细结构组成。,2.写出PDB文件的详细组成。,
展开阅读全文