用判别分析的方法判定DNA序列的类别数学建模

上传人:Wo****A 文档编号:168866057 上传时间:2022-11-12 格式:DOC 页数:5 大小:14.50KB
返回 下载 相关 举报
用判别分析的方法判定DNA序列的类别数学建模_第1页
第1页 / 共5页
用判别分析的方法判定DNA序列的类别数学建模_第2页
第2页 / 共5页
用判别分析的方法判定DNA序列的类别数学建模_第3页
第3页 / 共5页
点击查看更多>>
资源描述
用判别分析p 的方法断定DNA序列的类别数学建模 - 用判别分析p 的方法断定DNA序列的类别 摘 要 判别分析p 法是多元统计分析p 中的重要内容之一。近年来,人们用判别分析p 的方法解决了不少在消费科研和日常生活中的实际问题。本文用Fisher判别的思想,从变量检验入手,给出了对DNA序列进展不同分类的理论根据,并讨论错判概率与判别效率之间的关系。通过对检验样本的回报情况分析p 可知,本文所建立的模型分辨率高95%,错判率低1%,简单而易于运行,合适于各种长度的DNA序列的分类,因此实用性强,有较高的理论价值,为多元统计分析p 方法在生物信息学领域中应用的又一典型实例。 【关键词】:p :DNA数、错判率。 一、问题提出 序列、Fisher判别法、判别函1背景 人类基因组方案中的DNA全序列图是一本记录着人类自生老病死及遗传进化的全部信息的“天书”。这本大自然写成的“天书”是由4个字符A、C、G、T按一定的顺序排成的长约30亿的序列,其中没有断句,也没有标点符号,除了这4个字符表示4种碱基以外,人们对它包含的内容知之甚少,难以读懂 ,破译这部世界上最巨量信息的“天书”是二十世纪最重要的任务之一。在这个目的中,研究DNA全序列具有什么构造,由这4个字符排成看似随机的序列中隐藏着什么规律,又是解读这部天书的根底,是生物信息学最重要的课题之一。对DNA序列的逐步认识让人们相信DNA序列中存在着部分的和全局的构造,充分开掘序列的构造对理解DNA全序列是非常有意义的。 2问题 有20个类别的人工序列:A类,B类。 1. 从中提取特征,构造模型,找出适宜的分类方法,并用该法对另20个给出的未知类别的人工序列进展分类,要求详述方法及给出计算程序。 2.对另给出的182个自然序列进展分类。 二问题的分析p 此题重在从类别的DNA序列中提取某些特征,构造分类方法,提取的某些特征应满足以下条件: 1 来于样本。 2 具有给予未知类别的DNA序列分类的功能。 3 能较好的承受检验样本的检验。 全部地考虑各种因素如碱基的排列组合,碱基间的键强及键长等等,无法得到分类方法。忽略以上特征,突出A、C、G、T在DNA序列中出现的频数,对这个特征利用多元统计分析p 方法可以到达要求。判别分析p 法对分类问题有着较强的合适性,而在Fisher判别法,Bayes判别法,间隔 判别法等方法中,Fisher判别法条件更宽、更通用。 三、符号与假设 1、 主要假设 分析p DNA序列时,不考虑A、C、T、G出现的顺序。 忽略碱基间间键的强弱、长短。 假设文中较小容量的子样能表达母体的一些统计特性。 认为DNA序列中A、C、G、T的出现是独立的。 DNA序列中A、C、G、T对DNA序列的影响是平等的。 将A类误判为B类与将B类误判为A类的损失是相等的。 1 2 3 4 5 6 2、 符号的说明 协差矩阵 判别区域 判别效率 判别函数 随机向量母体 随机向量的均值 分别为标准正态分布的分布函数与分布密度 矩阵的逆 向量u的转置 Vi(i=1、2): Di(i=1、2): (u): W(y)、u(y): 1、2: Ei( i=1、2): (u),(u): V-1: u: 四、模型的建立 1 模型的提出Fisher判别准那么 Fisher判别准那么是借助于方差分析p 的思想来导出判别函数,此判别函数可以是线性的,也可以是一般的Borel函数。 设有两个母体1、2,相应的均值、协差阵分别为E1、E2 与V1、V2;任取一样本个体yn维向量,考虑其线性函数uy=uy其中u为的n维向量,那么在y来自i条件下均值与方差分别为 ei =Euyi=uEi i=1、2 v i2=V(uyi)=uVi u i=1、2 令B0= E0= Fisher准那么是适中选择u,使得 (u) =B0/E0到达最大,此(u)称为判别效率。 一般地,我们有 引理1 假设V1+V2的逆存在,那么Fisher准那么下的线性判别函数与判别效率分别为 u(y)=y(V1+V2)-1(E1-E2) (u)=1/2(E1-E2)(V1+V2)-1(E1-E2) 第 5 页 共 5 页
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 演讲稿件


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!