SPSS数据简单分析

上传人:美*** 文档编号:243077593 上传时间:2024-09-15 格式:PPT 页数:43 大小:1.71MB
返回 下载 相关 举报
SPSS数据简单分析_第1页
第1页 / 共43页
SPSS数据简单分析_第2页
第2页 / 共43页
SPSS数据简单分析_第3页
第3页 / 共43页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第二讲 数据简单分析,1,、假设检验,2,、方差分析,3,、 回归分析,一、 假设检验,例,1,某汽车厂商宣称每公升汽油可行驶的千米数至少为,15km,。若怀疑这个广告的真实性,现随机抽样,10,辆车,,并且记录下每部汽车每公升汽油行驶的,km,数,假设得到,的数据观测值为:,请检验该广告是否不实?,作为,总体均值,的,估计,拒绝域为,结论 实际,H,0,成立,H,1,成立,接受,H,0,正确判断,“,取伪,”,错误,拒绝,H,0,“,弃真,”,错误 正确判断,称为,显著性水平,,记为,在给定显著性水平为,时,P,值,,认为原假设成立时,利用,样本数据,可以计算出检验统计量,观测值,发生的,概率值,(,该检验统计量在某个特定的极端区域,取值在,H,0,成立时的概率)。,假设检验的实现,H=ztest(x,mu,sigma),在,显著性水平,为,0.05,检验,方差已知,其均值是否为某个指定值,.,h,sig,ci=ztest(x,mu,sigma,alpha,tail),H=ttest(x,mu),检验,方差未知的正态总体,的,其均值是否为某个指定值,.,h,sig,ci=ttest2(x,y),检验,两样本的均值是否相等,.,tail=-1,0,1,例,2,某厂商在和某饮料厂生产厂的合约中,要求生产的,270ml,的饮料中,容量误差不可 超过,10ml,,若抽查出的,方差远大于,10ml,就予以退货;现随机抽取,15,罐饮料,分,别为:,分析问题:检验,方差,是否大于,10,检验统计量为:,成立时,,拒绝域为,chitest=(length(x)-1)*var(x)/10,ljz1=chi2inv(1-0.05,length(x)-1),if chitest=ljz1,h=0;,else,h=1;,end,chitest =,1.8293e+001,ljz1 =,2.3685e+001,h =,0,如果:,例,3,一家旅行社旅馆管理人员研究为期,90,天的时间内注销,房间的数据,研究人员所观测到的结果如图所示:,首先估计:,卡方检验,是利用随机样本观测值与,理论值,之间的,接近程度,,并依据,卡方分布,的,右侧检验,来判定,接受,或者,拒绝,原假设。,其中:,分别是第 类的观测次数和期望频数。,满足条件:每一类别数据的期望频数大于或等于,5,泊松拟合优度检验,计算,的理论频数,使用函数,chitest(actual_range,expected_range),例,4,家庭收入对女生的男朋友的回答,1,、单因素方差分析,二、 方差分析,模型:,样本均值,之间的距离是相对的,,通过假定的共同的方差,的两个点估计值比较,得出的。,2.,计算样本均值和样本方差,总方差,组内误差,组间误差,数学上证明得到,:,3.,构造 统计量,x=6.6610 6.6610 6.6670 6.6670 6.6640,6.6830 6.6810 6.6760 6.6780 6.6790 6.6720,6.6780 6.6710 6.6750 6.6720 6.6740,group=1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 3;,p=anova1(x,group),2,、多因素方差分析,多因素方差分析是研究两个及两个以上控制变量对,观察(应变量)产生显著影响。,模型:,广告地区与销售额,.sav,三、 统计回归模型,牙膏的销售量,问题,建立牙膏销售量与价格、广告投入之间的模型,预测在不同价格和广告费用下的牙膏销售量。,收集了,30,个销售周期本公司牙膏销售量、价格、广告费用,及同期其它厂家同类牙膏的平均售价,某大型牙膏企业为了更好地拓展产品市场,,,有效地管理库存,需要找出公司生产的牙,膏销售量与销售价格,广告投入等之间的关系。,基本模型,y ,公司牙膏销售量,x,1,其它厂家与本公司,价格差,x,2,公司广告费用,x,2,y,x,1,y,x,1,x,2,解释变量,(,回归变量,自变量,),y,被解释变量(因变量),0, ,1, ,2, ,3,回归系数,随机,误差(,均值为零的正态分布随机变量),多元线性回归,一般称,为高斯马尔可夫线性模型(,k,元线性回归模型)。,主要考虑问题,1,、用试验值(样本值)对未知参数,作点估计和假设检验,从而建立,和,之间的数量关系;,y,与,2,、在,即对,y,作区间估计,.,处对,y,的值作预测与控制,,模型参数估计,对,和,作估计,解得估计值,1,、线性模型和回归系数的检验,多元线性回归中的检验与预测,假设,当,成立时,则,其中,残差平方和,回归平方和,回归平方和在总变差平方和,S,中的比值,来度量数据与回归模型的拟合程度,回归变量,的检验,假设,统计量,置信水平为,的置信区间为,2,、预测:经过一系列检验以后,认为模型有一定,意义,即可以用于预测,置信水平为,的置信区间,其中,1,、,确定回归系数的点估计值:,b=regress( Y, X ),软件求解,2,、,求回归系数的点估计和区间估计、并检验回归模型:,b, bint,r,rint,stats=regress(Y,X,alpha,),回归系数的区间估计,残差,置信区间,用于检验回归模型的统计量,,有三个数值:相关系数,r,2,、,F,值、与,F,对应的概率,p,显著性水平,(缺省时为,0.05,),3,、,画出残差图,MATLAB,统计工具箱,模型求解,b,bint,r,rint,stats=regress(y,x,alpha),输入,x=,n,4,数据矩阵,第,1,列为全,1,向量,alpha,(,置信,水平,0.05,),b,的,估计值,bint,b,的置信区间,r,残差向量,y,-,xb,rint,r,的置信区间,Stats,检验统计量,R,2,F,p,y,n,维数据向量,输出,由数据,y,x,1,x,2,估计,参数,参数估计值,置信区间,17.3244,5.7282 28.9206,1.3070,0.6829 1.9311 ,-3.6956,-7.4989 0.1077 ,0.3486,0.0379 0.6594 ,R,2,=0.9054,F,=82.9409,p,=0.0000,0,1,2,3,结果分析,y,的,90.54%,可由模型确定,参数,参数估计值,置信区间,17.3244,5.7282 28.9206,1.3070,0.6829 1.9311 ,-3.6956,-7.4989 0.1077 ,0.3486,0.0379 0.6594 ,R,2,=0.9054,F,=82.9409,p,=0.0000,0,1,2,3,F,远超过,F,检验的临界值,p,远小于,=,0.05,2,的置信区间包含零点,(,右端点距零点很近,),x,2,对因变量,y,的影响不太显著,x,2,2,项显著,可将,x,2,保留在模型中,模型从整体上看成立,销售量预测,价格差,x,1,=,其它厂家,价格,x,3,-,本公司,价格,x,4,估计,x,3,调整,x,4,控制价格差,x,1,=0.2,元,投入广告费,x,2,=650,万元,销售量预测区间为,7.8230,,,8.7636,(置信度,95%,),上限用作库存管理的目标值,下限用来把握公司的现金流,若估计,x,3,=3.9,,设定,x,4,=3.7,,则可以,95%,的把握知道销售额在,7.8320,3.7,29,(百万元)以上,控制,x,1,通过,x,1,x,2,预测,y,(,百万支,),xx=x(:,1) x(:,2) x(:,3) x(:,3).2;,b,bint,r,rint,stats=regress( y,xx),x0=1 0.2 6.5 6.52;,y0=x0*b,sigma=sqrt(var(r)*29/26);,mx0=x0-mean(xx);,deta=sigma*sqrt(1+1/30+mx0*inv(xx*xx)*mx0),*tinv(0.975,26);,yint=y0-deta, y0+deta,区间估计,%,第二种计算,deta=sigma*sqrt(1+x0*inv(xx*xx)*x0)*tinv(0.975,26);,yint=y0-deta, y0+deta,模型改进,x,1,和,x,2,对,y,的,影响独立,参数,参数估计值,置信区间,17.3244,5.7282 28.9206,1.3070,0.6829 1.9311 ,-3.6956,-7.4989 0.1077 ,0.3486,0.0379 0.6594 ,R,2,=0.9054,F,=82.9409,p,=0.0000,0,1,2,3,参数,参数估计值,置信区间,29.1133,13.7013 44.5252,11.1342,1.9778 20.2906 ,-7.6080,-12.6932 -2.5228 ,0.6712,0.2538 1.0887 ,-1.4777,-2.8518 -0.1037 ,R,2,=0.9209,F,=72.7771,p,=0.0000,3,0,1,2,4,x,1,和,x,2,对,y,的影响有交互作用,两模型销售量预测,比较,(,百万支,),区间,7.8230,,,8.7636,区间,7.8953,,,8.7592,(,百万支,),控制价格差,x,1,=0.2,元,投入广告费,x,2,=6.5,百万元,预测区间长度更短,略有增加,x,2,=6.5,x,1,=0.2,x,1,x,1,x,2,x,2,两模型 与,x,1,x,2,关系的,比较,交互作用影响的讨论,价格差,x,1,=0.1,价格差,x,1,=0.3,加大广告投入使销售量增加,(,x,2,大于,6,百万元),价格差较小时增加的速率更大,x,2,价格优势会使销售量增加,价格差较小时更需要靠广告来吸引顾客的眼球,完全二次多项式模型,MATLAB,中有命令,rstool,直接求解,x,1,x,2,从输出,Export,可得,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 小学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!