资源描述
添加标题,第三章,非参数统计,单一样本的推断问题,单一样本位置的点估计、置信区间估计和假设检验是参数统计推断的基本内容,其中,t,统计量和,t,检验作为正态分布总体期望均值的推断工具是我们熟知的。,如果数据不服从正态分布,或有明显的偏态表现,应用,t,统计量和,t,检验推断,就未必能发挥较好的效果。,主要内容,第一节 符号检验和分位数推断,基本概念,符号检验是非参数统计中最古老的检验方法之一,最早可追溯到,1701,年一项有关伦敦出生的男婴性别比例是否超过,1/2,的研究。,这种检验被称为符号检验的理由是:它所关心的信息只与两类观测值有关,用符号,“,+,”“,-,”,区分,符号检验就是通过符号的个数来进行统计推断。,例,3.1,假设某地,16,座预出售的楼盘均价,单位,(,百元,/,平方米,),如下:,36 32 31 25 28 36 40 32,41 26 35 35 32 87 33 35,该地平均楼盘价格是否与媒体公布的,3700,元,/,平方米的说法相符?,解一,:,用,t,检验法,用,T,统计量,结论,:,不能拒绝,H,0,。,R,的,t,检验程序和输出结果,build.price,mean(build.price),1 36.5,var(build.price),1 200.5333,length(build.price),116,t.test(build.price-37),one-sample t-Test,data:build.price-37,t=-0.1412,df=15,p-value=0.8896,alternative hypothesis:true mean is not equal to 0,95 percent confidence interval,-8.045853 7.045853,sample estimates:,mean of x,-0.5,总结,T,检验推断过程,假定分布结构,确定假设,检验统计量在零假设下的抽样分布,由抽样分布计算拒绝域或计算,p,值与显著性比较,做出决策,如果数据分布呈现明显的非正态性,,t,检验可能会由于运用错误的假设,导致不成功的推断。,数据描述,符号检验推断过程,假设总体 ,是总体的中位数,对于假设检验问题:,是待检验的中位数取值,定义,:,,则,在零假设情况下 ,在显著性水平为 的拒绝域为,其中,k,是满足上式最大的,k,值。,解二,:,用符号检验法,在显著性水平,0.05,下,拒绝,H,0,。,符号检验与,t,检验得到了相反的结论,到底选择哪一种结果呢?,结论:符号检验在总体分布未知的情况下优于,t,检验!,binom.test(sum(build.price37),length(build.price),0.5),Exact binomial test,data:sum(build.price37)and length(build.price),number of successes=3,number of trials=16,p-value=0.02127,alternatice hypothesis:true probability of success is not equal to 0.5,95 percent confidence interval:,0.04047373 0.45645655,sample estimates:,probability of success,0.1875,k,是满足式子的最大值,单边符号检验问题,大样本结论,当,n,较大时 :,当,n,不够大的时候可用修正公式进行调整。,双边:,,p-,值,左侧:,,p-,值,右侧:,,p-,值,例,3.2,设某化妆品厂商有,A,和,B,两个品牌,为了解顾客对,A,品牌和,B,品牌在使用上的差异,将,A,品牌和,B,品牌同时交给,45,个顾客使用,一个月后得到如下数据:,喜欢,A,品牌的客户人数:,22,人,喜欢,B,品牌的客户人数:,18,人,不能区分的人数:,5,人,解:假设检验问题:,由给定的数据知:,运用大样本的性质,,结论:不能拒绝原假设。,-Z,0.05,=-1.96,Z,0.05,=1.96,Z=0.791,不在拒绝域。,符号检验在配对样本比较中的应用,配对样本,(x,1,y,1,),(x,2,y,2,),(x,n,y,n,),将 记为“,+”,,记为“,-”,,,记为“,0”,,记,P,+,为“,+”,比例,,P,-,为“,-”,比例,,那么假设检验问题:,可以用符号检验。,H,0,:P,+,=P,-,H,1,:P,+,=P,-,例,3.4,如右表是某种商品在,12,家超市促销活动前后的销售额对比表,用符号检验分析促销活动的效果如何?,连 促销前 促销后,锁 销售额 销售额 符号,店,1 42 40 +,2 57 60 -,3 38 38 0,4 49 47 +,5 63 65 -,6 36 39 -,7 48 49 -,8 58 50 +,9 47 47 0,10 51 52 -,11 83 72 +,12 27 33 -,结论:不能拒绝原假设。,-Z,0.05,=-1.96,Z,0.05,=1.96,Z=-0.9487,不在拒绝域。,根据同样原理,可以将中位数符号检验推广为任意分位点的符号检验。,例,3.1.,假设某地,16,座预出售的楼盘均价,单位,(,百元,/,平方米,),36,32,31,25,28,36,40,32,41,26,35,35,32,87,33,35,36 32 31 25 28 36 40 32 41 26 35 35 32 87 33 35,-0 -+-+-,S,+,=2,S,-,=13,P,binom,(15,0.75)minS,+,S,-,binom.test(sum(x40),length(x)-1,0.75),Exact binomial test,data:sum(x 40)out of length(x)-1,number of successes=2,n=15,p-value=,9.23e-07,alternative hypothesis:p is not equal to,0.75,R,编程计算:,95 percent confidence interval:,0.01657591 0.40460270,sample estimates:,probability of success,0.1333333,
展开阅读全文