非参数统计列联表卡方检验

上传人:EY****y 文档编号:57725349 上传时间:2022-02-24 格式:DOC 页数:16 大小:1.11MB
返回 下载 相关 举报
非参数统计列联表卡方检验_第1页
第1页 / 共16页
非参数统计列联表卡方检验_第2页
第2页 / 共16页
非参数统计列联表卡方检验_第3页
第3页 / 共16页
点击查看更多>>
资源描述
精品文档非参数统计期末大作业一、 Wilcoxon符号秩检验某个公司为了争夺竞争对手的市场,决定多公司重新定位进行宣传。在广告创意中,预计广告投放后会产生效果。一组不看广告组和一组看广告,抽取16 位被调查者,让起给产品打分。现有数据如下不看广告62839699716097100看广告8792908694958291分析广告效应是否显著。1、 手算建立假设:H0:广告效应不显著H1:广告效应显著不看广告组记为x,看广告组记为y。检验统计量计算表XYD=x-y|D|D|的秩D 的符号6287-25257-8392-992.5-9690661+998613134+7194-23236-6095-35358-978215155+10091992.5+由表可知:T+=1+4+5+2.5=12.5T-=7+2.5+6+8=23.5根据 n=8,T+和T- 中较大者 T-=23.5 ,查表得,T+的右尾概率为 0.230 到 0.273 ,在显著性水平下, P值显然较大,故没有理由拒绝原假设,表明广告效应不显著。.精品文档2、Spss在spss 中输入八组数据(数据 1):选择非参数检验中的两个相关样本检验对话框中选择 Wilcoxon ,输出如下结果(输出 1):RanksNMean RankSum of Ranks看广告 - 不看广告 Negative Ranks4a3.1212.50.精品文档Positive Ranks4b5.8823.50Ties0cTotal8a. 看广告 不看广告c. 看广告= 不看广告由上表,负秩为 4,正秩也为 4,同分的情况为 0,总共 8。负秩和为 12.5,正秩和为 23.5,与手算结果一致Test Statisticsb看广告 -不看广告Z-.771 aAsymp. Sig. (2-tailed).441a. Based on negative ranks.b. Wilcoxon Signed Ranks Test由上表, Z为负,说明是以负秩为基础计算的结果,其相应的双侧渐进显著性结果为 0.441 ,明显大于 0.05 ,因此在的显著性水平下,没有理由拒绝原假设,即表明广告效应不显著,与手算的结论一致。3、R语言( R语言 1)输入语句:x=c(62,83,96,99,71,60,97,100)y=c(87,92,90,86,94,95,82,91)wilcox.test(x,y,exact=F,cor=F)输出结果:Wilcoxon rank sum testdata:x and yW = 33, p-value = 0.9164alternative hypothesis: true location shift is not equal to 0由输出结果可知, P=0.9164,远大于 =0.05 ,因此没有理由拒绝原假设,即广告效应并不显著,与以上结果一致。.精品文档二、 Wald-Wolfowitz游程检验有低蛋白和高蛋白两种料喂养大白鼠,以比较它们对大白鼠体重的增加是否有显著不同的影响,为此对m=10,n=10只大白鼠分别喂养低蛋白和高蛋白两种饲料,得增重量 X,Y(单位: g)的表如下:饲料增重量低蛋白 X64717275828384909196高蛋白 Y42526165697578787881给定显著性水平=0.05 ,试用游程检验法检验两种饲料的影响有无显著差异。1、 手算建立假设:H0:两种饲料对大白鼠无显著差异H1:两种饲料对大白鼠有显著差异将 X,Y 的数据按从小到大混合排列,得X,Y 的混合样本序列:YYYXYYXXXYYYYYXXXXXX故得游程总数 U=6, m=10,n=10,查表得, U=6的概率为 0.019,由于是双侧检验,对于显著性水平=0.05,对应的 P值为2因此拒绝原假设,即表明两种饲料对大白鼠有显著差异。2、 Spss在 spss中输入数据(数据 2).精品文档在非参数检验中选择两个独立样本检验对话框:在 Define Groups输入 1和2。在 Test Type选中 Wald-Wolfowitz runs 。.精品文档输出结果如下(输出 2):Frequencies分组N增重量110210Total20Test Statisticsb,cExact Sig.Number of RunsZ(1-tailed)增重量Minimum Possible6a-2.068.019Maximum Possible8a-1.149.128a. There are 2 inter-group ties involving 4 cases.b. Wald-Wolfowitz Testc. Grouping Variable:分组由上表, P值与手算结果一致,因此也拒绝原假设,即表明两种饲料对大白鼠有显著差异。.精品文档三、 Kolmogorov-Smirnov检验为了研究两家电信运营商套餐在目标市场的年龄维度上的分布是否相同,该电信运营公司开展了一个社会调查活动。数据如下:两种通信套餐的用户年龄套餐 1套餐 218221848255122342442232626443138分析两种套餐的目标市场年龄的分布是否存在显著性差异。1、 手算建立假设:H0:两种套餐的目标市场年龄分布不存在显著差异H1:两种套餐的目标市场年龄分布存在显著差异检验统计量 D 的计算表年龄f1f2S1(x)S2(x)S1(x)- S2(x)1810101/701/71810202/702/72211313/71/920/632310414/71/929/632410515/71/938/632510616/71/947/63.精品文档26117212/97/931017313/96/934017414/95/938017515/94/942017616/93/944017717/92/948017818/91/9510179110由 上 表 , 找 出 检 验 统 计 量 D=max S1 xS2 x=7/9, m=7, n=9 ,mnD=,查表得,相应的P 值为 0.008 ,在 5%的显著性水平上, P 值足够小,因此拒绝原假设,表明两种套餐的目标市场年龄分布存在显著差异。2、 spss输入数据(数据3)在非参数检验中选择两个独立样本检验:.精品文档对话框:运营商 1 和 2 分类的变量输入到 Grouping Variable ,在 Define Groups 输入1和 2。在 Test Type 选中 Kolmogorov-Smirnov 。在点 Exact 时打开的对话框中可以选择精确方法(Exact )。输出结果如下(输出 3);Frequencies运营商N年龄1729.精品文档Frequencies运营商N年龄1729Total16Test Statisticsa年龄Most Extreme DifferencesAbsolute.778Positive.000Negative-.778Kolmogorov-Smirnov Z1.543Asymp. Sig. (2-tailed).017Exact Sig. (2-tailed).008Point Probability.006a. Grouping Variable:运营商由上表:精确计算的双尾P 值为 0.008 ,与手算结果一致,表明两种套餐的目标市场年龄分布存在显著差异。四、 k 个独立样本的Kruskal-Wallis检验为检测四种防护服对人脉搏的影响,找来20 人试穿,每种有5 人试穿,测量试穿者的脉搏,得到以下表格:试穿者防护服 1防护服 2防护服 3防护服 41130104123133211111611912831141061151304123981201125115104117110问:穿四种防护服测得的脉搏有无差异。1、 手算.精品文档建立假设:H0:测得的脉搏没有显著差异H1:测得的脉搏有显著差异脉搏等级整理如下:防护服 1防护服 2防护服 3防护服 418.52.515.5206111317849.518.515.511479.52.5125秩和57.5216467.5计算检验统计量H:查表:自由度 df=3, 显著性水平临界值卡方 =7.82 。显然,H=7.854卡方 =7.82 ,所以拒绝原假设, 表明四种防护服对脉搏的影响有显著差异。2、 spss输入 20 个观测值(数据 4)在非参数检验中选择k 个独立样本检验防护服分组定义为1 到 4操作如下图:.精品文档.精品文档输出结果如下(输出 4):Ranks防护服NMean Rank脉搏1511.50254.203512.804513.50Total20Test Statisticsa,b脉搏Chi-Square7.878df3Asymp. Sig.049a. Kruskal Wallis Testb. Grouping Variable:防护服由上表,卡方与手算十分接近, 拒绝原假设, 即表明四种防护服对脉搏的影响有显著性差异。3、 中位数检验20 个数,中位数为115.5 ,整理每个总体中大于或小于该中位数的观测值个数,如下表:1234115.5214310 Median2143 kruskal.test(x,y)Kruskal-Wallis rank sum testdata: x and yKruskal-Wallischi-squared = 7.878,df = 3, p-value = 0.0486与以上的手算和 KS检验法结果一致, 拒绝原假设,表明四种防护服防护服对脉搏的影响存在显著差异。.精品文档五、列联表卡方检验一种原料来自三个不同的地区, 原料质量被分成三个不同等级。 从这批原料中随机抽取 500 件进行检验,得样本数据如下表所示, 要求检验地区与原料质量之间有无依赖关系。一级二级三级合计地区 1526424140地区 2605952171地区 3506574189合计1621881505001、手算:建立假设:H 0:地区与原料质量无关H1:地区与原料质量相关地区等级f ijeij(f ij -eij )2 /eij115245.360.97126452.642.451324427.71216055.40.38225964.30.44235251.30.01315061.242.06326571.060.52337456.75.28合计19.82rc(f ij -eij ) 2Q=eij=19.82i=1j=1df=(r-1)(c-1)=4查表得,0.205 =9.49 ,由于 Q=19.820.205 =9.49 ,因此拒绝原假设,即认为地区与原料质量相关。2、 SPSS:操作: Data Weight CasesAnalyze Descriptive Statistics Crosstabs地区* 等级Crosstabulation等级一级二级三级Total.精品文档地区地区 1Count526424140Expected Count45.452.642.0140.0地区 2Count605952171Expected Count55.464.351.3171.0地区 3Count506574189Expected Count61.271.156.7189.0TotalCount162188150500Expected Count162.0188.0150.0500.0Chi-Square TestsAsymp. Sig.Exact Sig.Exact Sig.Valuedf(2-sided)(2-sided)(1-sided)Point ProbabilityPearson Chi-Square19.822 a4.001. bLikelihood Ratio20.7324.000.000Fishers Exact Test20.510.000Linear-by-Linear Association13.963 c1.000.000.000.000N of Valid Cases500a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 42.00.b. Cannot be computed because there is insufficient memory.c. The standardized statistic is 3.737.由输出结果可知,检验统计量为19.822,精确双尾显著性概率P 远远小于显著性水平0.05,因此拒绝原假设,即认为地区与原料质量相关。与手算结果一致。.
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 演讲稿件


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!