资源描述
精品文档非参数统计期末大作业一、 Wilcoxon符号秩检验某个公司为了争夺竞争对手的市场,决定多公司重新定位进行宣传。在广告创意中,预计广告投放后会产生效果。一组不看广告组和一组看广告,抽取16 位被调查者,让起给产品打分。现有数据如下不看广告62839699716097100看广告8792908694958291分析广告效应是否显著。1、 手算建立假设:H0:广告效应不显著H1:广告效应显著不看广告组记为x,看广告组记为y。检验统计量计算表XYD=x-y|D|D|的秩D 的符号6287-25257-8392-992.5-9690661+998613134+7194-23236-6095-35358-978215155+10091992.5+由表可知:T+=1+4+5+2.5=12.5T-=7+2.5+6+8=23.5根据 n=8,T+和T- 中较大者 T-=23.5 ,查表得,T+的右尾概率为 0.230 到 0.273 ,在显著性水平下, P值显然较大,故没有理由拒绝原假设,表明广告效应不显著。.精品文档2、Spss在spss 中输入八组数据(数据 1):选择非参数检验中的两个相关样本检验对话框中选择 Wilcoxon ,输出如下结果(输出 1):RanksNMean RankSum of Ranks看广告 - 不看广告 Negative Ranks4a3.1212.50.精品文档Positive Ranks4b5.8823.50Ties0cTotal8a. 看广告 不看广告c. 看广告= 不看广告由上表,负秩为 4,正秩也为 4,同分的情况为 0,总共 8。负秩和为 12.5,正秩和为 23.5,与手算结果一致Test Statisticsb看广告 -不看广告Z-.771 aAsymp. Sig. (2-tailed).441a. Based on negative ranks.b. Wilcoxon Signed Ranks Test由上表, Z为负,说明是以负秩为基础计算的结果,其相应的双侧渐进显著性结果为 0.441 ,明显大于 0.05 ,因此在的显著性水平下,没有理由拒绝原假设,即表明广告效应不显著,与手算的结论一致。3、R语言( R语言 1)输入语句:x=c(62,83,96,99,71,60,97,100)y=c(87,92,90,86,94,95,82,91)wilcox.test(x,y,exact=F,cor=F)输出结果:Wilcoxon rank sum testdata:x and yW = 33, p-value = 0.9164alternative hypothesis: true location shift is not equal to 0由输出结果可知, P=0.9164,远大于 =0.05 ,因此没有理由拒绝原假设,即广告效应并不显著,与以上结果一致。.精品文档二、 Wald-Wolfowitz游程检验有低蛋白和高蛋白两种料喂养大白鼠,以比较它们对大白鼠体重的增加是否有显著不同的影响,为此对m=10,n=10只大白鼠分别喂养低蛋白和高蛋白两种饲料,得增重量 X,Y(单位: g)的表如下:饲料增重量低蛋白 X64717275828384909196高蛋白 Y42526165697578787881给定显著性水平=0.05 ,试用游程检验法检验两种饲料的影响有无显著差异。1、 手算建立假设:H0:两种饲料对大白鼠无显著差异H1:两种饲料对大白鼠有显著差异将 X,Y 的数据按从小到大混合排列,得X,Y 的混合样本序列:YYYXYYXXXYYYYYXXXXXX故得游程总数 U=6, m=10,n=10,查表得, U=6的概率为 0.019,由于是双侧检验,对于显著性水平=0.05,对应的 P值为2因此拒绝原假设,即表明两种饲料对大白鼠有显著差异。2、 Spss在 spss中输入数据(数据 2).精品文档在非参数检验中选择两个独立样本检验对话框:在 Define Groups输入 1和2。在 Test Type选中 Wald-Wolfowitz runs 。.精品文档输出结果如下(输出 2):Frequencies分组N增重量110210Total20Test Statisticsb,cExact Sig.Number of RunsZ(1-tailed)增重量Minimum Possible6a-2.068.019Maximum Possible8a-1.149.128a. There are 2 inter-group ties involving 4 cases.b. Wald-Wolfowitz Testc. Grouping Variable:分组由上表, P值与手算结果一致,因此也拒绝原假设,即表明两种饲料对大白鼠有显著差异。.精品文档三、 Kolmogorov-Smirnov检验为了研究两家电信运营商套餐在目标市场的年龄维度上的分布是否相同,该电信运营公司开展了一个社会调查活动。数据如下:两种通信套餐的用户年龄套餐 1套餐 218221848255122342442232626443138分析两种套餐的目标市场年龄的分布是否存在显著性差异。1、 手算建立假设:H0:两种套餐的目标市场年龄分布不存在显著差异H1:两种套餐的目标市场年龄分布存在显著差异检验统计量 D 的计算表年龄f1f2S1(x)S2(x)S1(x)- S2(x)1810101/701/71810202/702/72211313/71/920/632310414/71/929/632410515/71/938/632510616/71/947/63.精品文档26117212/97/931017313/96/934017414/95/938017515/94/942017616/93/944017717/92/948017818/91/9510179110由 上 表 , 找 出 检 验 统 计 量 D=max S1 xS2 x=7/9, m=7, n=9 ,mnD=,查表得,相应的P 值为 0.008 ,在 5%的显著性水平上, P 值足够小,因此拒绝原假设,表明两种套餐的目标市场年龄分布存在显著差异。2、 spss输入数据(数据3)在非参数检验中选择两个独立样本检验:.精品文档对话框:运营商 1 和 2 分类的变量输入到 Grouping Variable ,在 Define Groups 输入1和 2。在 Test Type 选中 Kolmogorov-Smirnov 。在点 Exact 时打开的对话框中可以选择精确方法(Exact )。输出结果如下(输出 3);Frequencies运营商N年龄1729.精品文档Frequencies运营商N年龄1729Total16Test Statisticsa年龄Most Extreme DifferencesAbsolute.778Positive.000Negative-.778Kolmogorov-Smirnov Z1.543Asymp. Sig. (2-tailed).017Exact Sig. (2-tailed).008Point Probability.006a. Grouping Variable:运营商由上表:精确计算的双尾P 值为 0.008 ,与手算结果一致,表明两种套餐的目标市场年龄分布存在显著差异。四、 k 个独立样本的Kruskal-Wallis检验为检测四种防护服对人脉搏的影响,找来20 人试穿,每种有5 人试穿,测量试穿者的脉搏,得到以下表格:试穿者防护服 1防护服 2防护服 3防护服 41130104123133211111611912831141061151304123981201125115104117110问:穿四种防护服测得的脉搏有无差异。1、 手算.精品文档建立假设:H0:测得的脉搏没有显著差异H1:测得的脉搏有显著差异脉搏等级整理如下:防护服 1防护服 2防护服 3防护服 418.52.515.5206111317849.518.515.511479.52.5125秩和57.5216467.5计算检验统计量H:查表:自由度 df=3, 显著性水平临界值卡方 =7.82 。显然,H=7.854卡方 =7.82 ,所以拒绝原假设, 表明四种防护服对脉搏的影响有显著差异。2、 spss输入 20 个观测值(数据 4)在非参数检验中选择k 个独立样本检验防护服分组定义为1 到 4操作如下图:.精品文档.精品文档输出结果如下(输出 4):Ranks防护服NMean Rank脉搏1511.50254.203512.804513.50Total20Test Statisticsa,b脉搏Chi-Square7.878df3Asymp. Sig.049a. Kruskal Wallis Testb. Grouping Variable:防护服由上表,卡方与手算十分接近, 拒绝原假设, 即表明四种防护服对脉搏的影响有显著性差异。3、 中位数检验20 个数,中位数为115.5 ,整理每个总体中大于或小于该中位数的观测值个数,如下表:1234115.5214310 Median2143 kruskal.test(x,y)Kruskal-Wallis rank sum testdata: x and yKruskal-Wallischi-squared = 7.878,df = 3, p-value = 0.0486与以上的手算和 KS检验法结果一致, 拒绝原假设,表明四种防护服防护服对脉搏的影响存在显著差异。.精品文档五、列联表卡方检验一种原料来自三个不同的地区, 原料质量被分成三个不同等级。 从这批原料中随机抽取 500 件进行检验,得样本数据如下表所示, 要求检验地区与原料质量之间有无依赖关系。一级二级三级合计地区 1526424140地区 2605952171地区 3506574189合计1621881505001、手算:建立假设:H 0:地区与原料质量无关H1:地区与原料质量相关地区等级f ijeij(f ij -eij )2 /eij115245.360.97126452.642.451324427.71216055.40.38225964.30.44235251.30.01315061.242.06326571.060.52337456.75.28合计19.82rc(f ij -eij ) 2Q=eij=19.82i=1j=1df=(r-1)(c-1)=4查表得,0.205 =9.49 ,由于 Q=19.820.205 =9.49 ,因此拒绝原假设,即认为地区与原料质量相关。2、 SPSS:操作: Data Weight CasesAnalyze Descriptive Statistics Crosstabs地区* 等级Crosstabulation等级一级二级三级Total.精品文档地区地区 1Count526424140Expected Count45.452.642.0140.0地区 2Count605952171Expected Count55.464.351.3171.0地区 3Count506574189Expected Count61.271.156.7189.0TotalCount162188150500Expected Count162.0188.0150.0500.0Chi-Square TestsAsymp. Sig.Exact Sig.Exact Sig.Valuedf(2-sided)(2-sided)(1-sided)Point ProbabilityPearson Chi-Square19.822 a4.001. bLikelihood Ratio20.7324.000.000Fishers Exact Test20.510.000Linear-by-Linear Association13.963 c1.000.000.000.000N of Valid Cases500a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 42.00.b. Cannot be computed because there is insufficient memory.c. The standardized statistic is 3.737.由输出结果可知,检验统计量为19.822,精确双尾显著性概率P 远远小于显著性水平0.05,因此拒绝原假设,即认为地区与原料质量相关。与手算结果一致。.
展开阅读全文