chap基因组序列诠译

上传人:英*** 文档编号:71410549 上传时间:2022-04-07 格式:PPTX 页数:15 大小:362.73KB
返回 下载 相关 举报
chap基因组序列诠译_第1页
第1页 / 共15页
chap基因组序列诠译_第2页
第2页 / 共15页
chap基因组序列诠译_第3页
第3页 / 共15页
点击查看更多>>
资源描述
1会计学chap基因组序列诠译基因组序列诠译4.1.1、根据序列分析搜寻基因 如果一段DNA序列中含有编码基因,那么这段序列的碱基就不会是随机排列的,一定存在某些可辨的特征。目前还没有一个能适用于所有情况的“基因序列”的标准,只能根据已知的某些规律来推测那些序列可能是基因。开放读码框 开放读码框有一个起始密码(ATG)和终止密码(TAA、TAG和TGA)。从DNA序列搜寻基因从ATG开始,而后向下游寻找终止密码。 获得了DNA双链之后,我们不知道那条单链是编码链,也不知道转录起始点从那个碱基开始。由于每条链有三种可能的读框,2条链共计6种读框,计算机可以很快给出结果。ORF扫描的关键是终止密码子在6种读框中出现的频率1)如GC含量为50,则三个终止密码子出现的机率为64bp一次2)如GC含量大于50,则每隔100200bp才会出现1个终止密码子3)随机碱基排列的ORF长度预计不超过50个密码子,即150bp, 以ATG起始计算长度更短4)大多数基因的ORF均多于50个密码子,因此最可能的选择是ORF不少于100个密码子的读框 细菌基因组中缺少内含子,非编码序列11,对读框的排查干扰较少。 高等真核生物DNA的ORF阅读比较复杂,其原因在于:1)基因间存在大量非编码序列;2)绝大多数基因含有非编码的内含子,多数外显子的长度少于100个密码子,有些不到50个密码子内含子的出现给计算机判读基因带来不少问题,在编写ORF扫描程序时要作许多修改,加入一些相应的规则:1)密码子偏爱,不同种属之间使用同义密码的频率有很大差异。特定种属有特征性的密码子偏爱,这些序列在编码区常常出现,非编码区只保持平均的碱基分布。根据已有生物密码子偏爱的资料在编写相应的计算机程序时可加入这些限制。2)外显子内含子边界,边界区有明显的特征:如内含子的5端常见的序列为AGGTAAGT;3端多为PyPyPyPyPyPyCAG。3)上游控制序列,如CpG岛同源查询 利用已存入数据库中的基因顺序与待查的基因序列进行比较,从中查找可与之匹配的碱基顺序及其比例用于界定基因的方法称为同源查询,它可弥补ORF扫描的不足。其依据是生物体不同种属之间具有功能和结构相似的直系基因成员,它们在起源上一脉相承,存在保守的序列,另外,同一物种中由于基因重复所产生的基因家属成员也有保守的序列特征。开放读码框 开放读码框有一个起始密码(ATG)和终止密码(TAA、TAG和TGA)。从DNA序列搜寻基因从ATG开始,而后向下游寻找终止密码。 获得了DNA双链之后,我们不知道那条单链是编码链,也不知道转录起始点从那个碱基开始。由于每条链有三种可能的读框,2条链共计6种读框,计算机可以很快给出结果。同源查询 利用已存入数据库中的基因顺序与待查的基因序列进行比较,从中查找可与之匹配的碱基顺序及其比例用于界定基因的方法称为同源查询,它可弥补ORF扫描的不足。其依据是生物体不同种属之间具有功能和结构相似的直系基因成员,它们在起源上一脉相承,存在保守的序列,另外,同一物种中由于基因重复所产生的基因家属成员也有保守的序列特征。
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!