资源描述
生物信息学实验课件,邢晋祎 生命科学学院 Copyright,实验二 常用分子生物学数据库检索方法及数据格式,实验目的,1. 了解ncbi所提供的在线entrez检索方法。 2.了解EBI所提供的SRS检索方法。 3.熟悉查询swiss-prot蛋白质序列数据库的查询。 4.详细了解三大核酸序列数据库之一的GenBank数据库平面文件Flat file。 5.详细了解蛋白质结构数据库PDB数据库中的pdb文件。,实验材料,计算机,网络。,实验过程,1. Entrez检索方法 NCBI All database Entrez 查询某一关键词(eg. Helicase,insulin,topoisomerase,gyrase,hemoglobin。) 依次点击各个数据库查看,实验过程,GenPept文件下载,平面文件获得 查询某一条核酸序列 获得平面文件 保存或者下载 用写字板(记事本)打开,实验过程,2. SRS检索方法。 EBI SRSEBI choice database 查询某一关键词(eg. Helicase,insulin,topoisomerase,gyrase,hemoglobin。),实验过程,3. Swiss-prot查询方法。 Swiss-prot SRSEBI choice database 查询某一关键词(eg. Helicase,insulin,topoisomerase,gyrase,hemoglobin)。,4.GenBank flatfile(GBFF)内容。 是GenBank数据库的基本信息单位,也是最广泛地用以表示生物序列的格式之一。 GenPept文件 GBFF可以分成三个部分,头部包含关于整个记录的信息(描述符)。 第二部分包含了注释这一记录的特性, 第三部分是核苷酸序列自身。 所有的核苷酸数据库记录(DDBJ/ EMBL/ GenBank)都在最后一行以 / 结尾。,实验过程,5. PDB 文件的获得 进入PDB数据库 查询某蛋白质的结构(eg:1d3y) 下载结构到本地电脑 用写字板(记事本)打开,源自PDB结构记录的内容,PDB记录包括两个序列信息备份:隐性序列和显性序列。 显性序列在PDB文件中以关键词SEQRES打头逐行存储。 隐性序列蕴涵在由PDB文件中的ATOM记录及相应(X,Y,Z)位置坐标构成的化学立体结构中。 实践中,许多PDB文件浏览器,如Rasmol,仅用隐性序列重构PDB记录蛋白质的化学图象,而忽略由SEQRES引导的显性序列信息。,文件头部,显性序列,隐性序列,作业:格式同实验一,1.写出Genbank flatfile的详细结构组成。 2.写出PDB文件的详细组成。,
展开阅读全文