SPSS第十三章解读课件

上传人:wz****p 文档编号:241299351 上传时间:2024-06-16 格式:PPT 页数:26 大小:617.51KB
返回 下载 相关 举报
SPSS第十三章解读课件_第1页
第1页 / 共26页
SPSS第十三章解读课件_第2页
第2页 / 共26页
SPSS第十三章解读课件_第3页
第3页 / 共26页
点击查看更多>>
资源描述
第十三章SPSS的判别分析第十三章SPSS的判别分析判别分析的一般内容判别分析是多元统计分析中实现数据分类的方法判别分析是多元统计分析中实现数据分类的方法例如:不同类型客户的预测应用例如:不同类型客户的预测应用特点:特点:数据中包含用于预测的变量数据中包含用于预测的变量(自变量自变量),称为判别,称为判别变量(定距)变量(定距)数据中包含已知所属类别的变量数据中包含已知所属类别的变量(因变量因变量),称为,称为类别变量(定类,不同类别依次用整数表示)类别变量(定类,不同类别依次用整数表示)判别分析可以根据已有数据,确定类别变量与判判别分析可以根据已有数据,确定类别变量与判别变量之间的数量关系,建立判别函数,并可通别变量之间的数量关系,建立判别函数,并可通过判别函数实现对未知数据类别的预测过判别函数实现对未知数据类别的预测判别分析的一般内容判别分析是多元统计分析中实现数据分类的方法判别分析与聚类分析的不同点:判别分析与聚类分析的不同点:聚类分析中的类别是未知的,完全通过数据来确聚类分析中的类别是未知的,完全通过数据来确定;判别分析,通过对已知类别的定;判别分析,通过对已知类别的“训练样本训练样本”的学习,建立判别准则,具有的学习,建立判别准则,具有“预测预测”意义意义判别分析的一般要求:判别分析的一般要求:判别变量不应有较强的相关性判别变量不应有较强的相关性判别变量服从正态分布判别变量服从正态分布判别分析方法的划分:判别分析方法的划分:根据类数:两组判别分析、多组判别分析根据类数:两组判别分析、多组判别分析根据模型:线性判别、非线性判别根据模型:线性判别、非线性判别根据判别准则:距离判别法、根据判别准则:距离判别法、FisherFisher判别法、判别法、BayesBayes判别法判别法判别分析与聚类分析的不同点:判别分析中的数据设有分别来自设有分别来自k k 2 2个总体的个总体的k k个样本,每个样本都有个样本,每个样本都有关于关于X X1 1,X X2 2,X Xp p的判别变量的判别变量(p(pk)k)总样本量为总样本量为n n,各样本的样本量为,各样本的样本量为n ni i(i=1,2,.k)(i=1,2,.k)例:设有两个总体例:设有两个总体G G1 1和和G G2 2,从从G G1 1中抽取中抽取n n个观测,从个观测,从G G2 2中抽取中抽取m m个观测;有个观测;有p p个判别变量个判别变量判别分析中的数据设有分别来自k2个总体的k个样本,每个样本思路:思路:将将n n个观测数据看成个观测数据看成p p维空间中的点,计算每个类维空间中的点,计算每个类别的中心别的中心(类别均值类别均值)计算任一观测点到各个类别中心的距离计算任一观测点到各个类别中心的距离(通常采用通常采用平方马氏距离平方马氏距离)根据距离最近的原则,距离哪个中心近,则属于根据距离最近的原则,距离哪个中心近,则属于哪个类哪个类例:设例:设(1)(1),(2)(2),(1)(1),(2)(2)分别为分别为G G1 1和和G G2 2的均值向量的均值向量和协差阵和协差阵,则点则点X X到到G Gi i的距离定义为平方马氏距离为的距离定义为平方马氏距离为:距离判别u u未知时用样本均值未知时用样本均值替代替代思路:距离判别u未知时用样本均值替代当各维度存在数量级的差异时,欧氏距离不恰当当各维度存在数量级的差异时,欧氏距离不恰当马氏距离:马氏距离:除以方差除以方差为什么采用马氏距离当各维度存在数量级的差异时,欧氏距离不恰当为什么采用马氏距离体现了从概率角度出发的距离体现了从概率角度出发的距离(A(A距距u u2 2更近更近,A,B,A,B距离相距离相等等)例如:均值为例如:均值为0 0标准差为标准差为1 1以及均值为以及均值为5 5标准差为标准差为2 2ABx1x2为什么采用马氏距离体现了从概率角度出发的距离(A距u2更近,A,B距离相等)A距离判别法根据根据D D2 2(X,G(X,G1 1)、D D2 2(X,G(X,G2 2)判断:判断:如果如果D D2 2(X,G(X,G1 1)D)D2 2(X,G(X,G2 2),),则则:XG:XG1 1如果如果D D2 2(X,G(X,G2 2)D)0,W(X)0,则则:XG:XG1 1如果如果W(X)0,W(X)0,W(X)0,则则:XG:XG1 1如果如果W(X)0,W(X)0,则:XG1G2W(X)0,W(X)0,则则:XG:XG1 1如果如果W(X)0,W(X)0,则:XG1判别函数等于0表示的直线为两总体中若各组协差阵不相等若各组协差阵不相等:采用采用(separated-groups covariance)(separated-groups covariance)判别函数判别函数(非线性非线性)为:为:距离判别法的特点:直观距离判别法的特点:直观问题:问题:多个总体的均值是否存在显著差异多个总体的均值是否存在显著差异多个总体的协差阵是否存在显著差异多个总体的协差阵是否存在显著差异G2G1G1W(X)0,W(X)0,则则:XG:XG1 1如果如果W(X)0,W(X)0,则:XG1多个总体的均值检验多个总体的均值检验:H H0 0:(1)=(1)=(k)(k)Wilks Wilks 统计量:统计量:Wilks Wilks =|SSE|/|SSG+SSE|=|SSE|/|SSG+SSE|,服,服从从WilksWilks分布。分布。SPSSSPSS输出一元单因素方差分析表输出一元单因素方差分析表(F(F统计量统计量)多个总体的协差阵检验多个总体的协差阵检验:BOX:BOXs检检验验H0H0:若协差阵等,合并的协差阵的广义若协差阵等,合并的协差阵的广义方差与各类别广义方差差异不显著方差与各类别广义方差差异不显著统计量:统计量:M M(近似服从(近似服从F F分布)分布)多个总体的均值检验:H0:(1)=(k)多个总体的Fisher判别法FisherFisher判别也称典型判别判别也称典型判别基本思想是先投影的距离判别基本思想是先投影的距离判别将原来将原来p p维维X X空间的判别变量通过线性变换投影到空间的判别变量通过线性变换投影到m(mp)m(m0,相应的相应的特征向量为特征向量为v1,vr.则判别函数为则判别函数为:yi(x)=vix(=ax)记记pi为第为第i i个判别函数的判别能力个判别函数的判别能力(效率效率):m m个判别函数的判别能力为:个判别函数的判别能力为:最大的值为方程最大的值为方程|B-E|=0的最大特征值根的最大特征值根 1使使希望寻找a使得SSG尽可能大而SSE尽可能小,即:记方程|BBayes判别在认为所有在认为所有k k个类别都是空间互斥的子域的条件下,个类别都是空间互斥的子域的条件下,利用贝叶斯方法进行判别利用贝叶斯方法进行判别n贝叶斯方法是一种研究不确定性问题的决策方法贝叶斯方法是一种研究不确定性问题的决策方法n通过贝叶斯概率描述不确定性通过贝叶斯概率描述不确定性n引进效用函数(引进效用函数(Utility FunctionUtility Function)n选择使期望效用最大的最优决策选择使期望效用最大的最优决策n贝叶斯概率贝叶斯概率n一种主观概率:对事物发生概率的主观估计一种主观概率:对事物发生概率的主观估计n主观概率取决于先验知识的正确性和后验知识的主观概率取决于先验知识的正确性和后验知识的丰富性丰富性Bayes判别在认为所有k个类别都是空间互斥的子域的条件下,n贝叶斯概率贝叶斯概率n首先首先,用先于数据的概率描述最初的不确定性用先于数据的概率描述最初的不确定性n然后然后,将其和试验数据相结合,产生一个后于将其和试验数据相结合,产生一个后于数据的修订了的概率数据的修订了的概率n不确定性须用概率来描述,不确定性的表述须不确定性须用概率来描述,不确定性的表述须与概率论的运算规则相结合与概率论的运算规则相结合n贝叶斯公式贝叶斯公式n事件事件A A与事件与事件B B独立独立n事件事件A A与事件与事件B B不独立不独立Bayes判别贝叶斯概率Bayes判别Bayes判别n贝叶斯公式贝叶斯公式nP(A)P(A)称为先验概率称为先验概率;P(B|A);P(B|A)为条件概率,在贝为条件概率,在贝叶斯判别中为似然函数叶斯判别中为似然函数;P(A|B);P(A|B)为后验概率为后验概率n后验概率可看做一种简化的效用函数后验概率可看做一种简化的效用函数n最大后验概率假设是贝叶斯决策的依据最大后验概率假设是贝叶斯决策的依据Bayes判别贝叶斯公式Bayes判别设:设:有有k k个总体个总体G G1 1,G,G2 2,G,Gk k,观测从属于各总体的先验观测从属于各总体的先验概率分别为概率分别为q q1 1,q,q2 2,q,qk k;似然函数为似然函数为f f1 1(X),f(X),f2 2(X),f(X),fk k(X)(x(X)(x连续为密度连续为密度)则:样本则:样本x x来自第来自第g g总体的后验概率为:总体的后验概率为:对于新样本分别计算其落入各个子域的后验概率,对于新样本分别计算其落入各个子域的后验概率,其所归属的类别为后验概率最大的类别(总体)其所归属的类别为后验概率最大的类别(总体)Bayes判别设:先验概率:一般为等概率先验概率:一般为等概率(熵最大原则熵最大原则)计算似然函数:计算似然函数:计算后验概率计算后验概率只根据对分子计算对数的结果即可判断只根据对分子计算对数的结果即可判断先验概率:一般为等概率(熵最大原则)
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!