资源描述
社会统计学社会统计学20062006年年4 4月月2828日日(C)2006 GUOH2主要内容主要内容假设检验的原理与方法单总体假设检验两类错误二总体假设检验课本映射:第七章、第八章、第九章(第一、二节、第三节第一条) (C)2006 GUOH3假设检验的原理与方法假设检验的原理与方法抽样误差(sampling error):抽样(sampling):通过一定的方法从总体中随机抽取一定量的个体的过程。非抽样误差(non-sampling error):在调查过程中产生的错误,并非由抽样方法产生。理论上可以完全消除。抽样误差:由抽样方法造成的样本统计值与总体参数值之间的差别。(C)2006 GUOH4假设检验的原理与方法假设检验的原理与方法假设检验(Hypothesis Test):假定非抽样误差为零。如果一次抽样的样本统计值与已知总体的参数值之间有差别,差别的来源有两种可能:该差别是由于抽样方法造成的,样本对应的总体与已知总体在参数值上没有差别(抽样方法造成);该差别是由于样本对应的总体参数值不同于已知总体参数值(样本有效性)。(C)2006 GUOH5假设检验的原理与方法假设检验的原理与方法 为了证明差别的来源,可以设立两个假设: 假设一:差别是抽样误差引起的,即样本对应的总体与已知总体在参数值上没有差别。 假设二:差别不是抽样误差引起的,即样本对应的总体与已知总体在参数值上有差别。 假设一与二必居其一; 假设一被称为原假设或虚无假设(Null Hypothesis) 假设二被称为备择假设(Alternative Hypothesis)(C)2006 GUOH6假设检验的原理与方法假设检验的原理与方法首先假定原假设成立,则可以根据原假设的情况构建出样本统计值的抽样分布;生活中的概率现象:如果一个现象发生的概率大,则其愈可能发生;反之,则愈不可能发生。如果本不可能发生的现象仅一次观察就发现了,我们可能怀疑原来对于该现象发生概率的假定。这个原理称为小概率原理。(C)2006 GUOH7假设检验的原理与方法假设检验的原理与方法小概率原理:小概率事件在观察中是不可能出现的;如果在一次观察中出现了小概率事件,那么就可以否定原事件具有小概率的假设。在样本统计量的抽样分布中:假定原假设成立,则一次抽样的样本统计值出现在抽样分布中的概率应该是比较大的。(C)2006 GUOH8假设检验的原理与方法假设检验的原理与方法如果一次抽样样本统计值在抽样分布中出现的概率比较大,则可以认为原假设是成立的,即差别来源于抽样误差;如果一次抽样样本统计值在抽样分布中出现的概率很小,则可以认为出现该样本统计值为小概率事件,可以否定原假设。即差别来源于样本对应总体与已知总体在参数值上的真实差别。(C)2006 GUOH9假设检验的原理与方法假设检验的原理与方法假设检验中的名词:显著性水平(显著度):在假设检验中小概率的标准,即。显著度一般是事先给定的,常用的有0.1,0.01,0.05。统计量的抽样分布:在假定原假设成立的条件下构建的抽样分布。拒绝域(Critical Region):在抽样分布中,显著度在横轴上所对应的区间。如果样本统计值处于拒绝域,则拒绝原假设。(C)2006 GUOH10假设检验的原理与方法假设检验的原理与方法接受域(Acceptance Region):在抽样分布中拒绝域以外部分所对应的横轴上的区间。临界值(Critical Value):进入拒绝域所对应的抽样分布的变量值。(C)2006 GUOH11假设检验的原理与方法假设检验的原理与方法备择假设与拒绝域的关系:如果备择假设只是假定样本对应总体与已知总体参数值之间有差别,则要考虑样本统计值既可能在抽样分布中大于也可能小于总体参数值的两种情况。所以对于给定的显著度,要除以2,才能计算出临界值。这种检验方法被称为双边检验(Two-Tailed Test)(C)2006 GUOH12假设检验的原理与方法假设检验的原理与方法如果备择假设明确假定样本对应总体的参数值大于或小于已知总体参数值,则可以直接确定拒绝域为及所对应的临界值。这种检验方法称为单边检验(One-Tailed Test)(C)2006 GUOH13假设检验的原理与方法假设检验的原理与方法单边Z双边Z/20.051.651.960.012.332.580.0013.093.30(C)2006 GUOH14假设检验的原理与方法假设检验的原理与方法 假设检验的步骤: 第一步:作出原假设H0与备择假设H1; 第二步:假定H0成立,确定样本统计值的抽样分布和在显著性水平下的拒绝域和临界值; 第三步:计算在H0成立时,统计值在抽样分布中的观测值; 第四步:比较观测值与临界值。如果观测值的绝对值大于临界值的绝对值,则拒绝原假设,接受备择假设;反之,则接受原假设。 第五步:做结论。(C)2006 GUOH15单样本假设检验单样本假设检验单总体假设检验:总体的参数值已知的条件下,对总体进行随机抽样调查得出样本的统计值。通过样本统计值构建统计量检验总体参数值是否与先前已知的总体参数不同。大样本单总体均值检验:为了检验统计报表的正确性,作了共五十人的抽样调查,人均收入的结果有:x bar=871元,s=21元。问能否证明统计报表中人均收入=880元是正确的?(=0.05)(C)2006 GUOH16单样本假设检验单样本假设检验作出原假设H0和备择假设H1;H0:=880H1:880假定H0成立,确定样本统计值的抽样分布和在显著性水平下拒绝域和临界值;N=50 大样本 Z=(x bar-)/(s/sqrt(n)N(0,1)=0.05,双边检验,Z/2=+/-1.96 (C)2006 GUOH17单样本假设检验单样本假设检验 计算在H0成立时,统计值在抽样分布中的观测值; Z=(x bar-)/(s/sqrt(n)=(871-880)/(21/sqrt(50) =-9/2.97=-3.03 比较观测值与临界值; Z=-3.03-1.96, Z在拒绝域内,拒绝H0,接受H1。 做结论:在显著度为5%时,不能证明统计报表中人均收入=880元是正确的。(C)2006 GUOH18单样本假设检验单样本假设检验大样本总体成数检验:某地区成年人中吸烟的人占75%,经过戒烟宣传之后,进行的抽样调查发现一百名被调查的成年人中,有六十三人是吸烟者。问戒烟宣传是否收到了效果?(=0.05)作出原假设H0和备择假设H1;H0:P=0.75H1:P0.75(C)2006 GUOH19单样本假设检验单样本假设检验假定H0成立,确定样本统计值的抽样分布和在显著性水平下拒绝域和临界值;n=100 大样本 Z=(P hat-P)/sqrt(P(1-P)/n)N(0,1)=0.05,单边检验,Z=-1.65计算在H0成立时,统计值在抽样分布中的观测值;Z=(0.63-0.75)/sqrt(0.75*(1-0.75)/100)=-2.79(C)2006 GUOH20单样本假设检验单样本假设检验比较观测值与临界值;Z=-2.7920(C)2006 GUOH24单样本假设检验单样本假设检验n=9, 小样本,未知,t分布t=(x bar-)/(s/sqrt(n)t(n-1)=0.1 单边检验,K=n-1=8 t=1.3968t=(23.5-20)/(3/sqrt(9)=3.5t=3.51.3968 拒绝H0,接受H1。以0.1为显著度,可以认为该地区平均初婚年龄已超过20岁。 (C)2006 GUOH25单样本假设检验单样本假设检验总体方差已知全国年均个人缴纳所得税为130元,标准差为5元,某市随机调查36名市民。发现他(她)们年均缴纳个人所得税为98元,问差别是否显著?(=0.01)H0:=130H1:130n=36 小样本, 方差已知,Z分布(C)2006 GUOH26单样本假设检验单样本假设检验=0.001 双边检验 Z/2=+/-3.30Z=(98-130)/(5/sqrt(36))=-38.4ZP2n1p15, n1(1- p1)5 大样本,正态分布n2p25, n2(1- p2)5 =0.05,单边 Z=1.65(C)2006 GUOH43二总体的假设检验二总体的假设检验 P hat=(m1+m2)/(n1+n2)= (52+23)/(1000+1000)=0.0375 1-P hat=0.9625 Z= (P1 hat-P2 hat)/sqrt(P hat(1-P hat)(1/n1+1/n2) =(0.052-0.023)=sqrt(0.0375*0.9625*(2/1000) =0.029/0.0085=3.41 Z=3.411.65 拒绝H0,接受H1。 以0.05为显著度,男性比女性更期望职业流动。(C)2006 GUOH44二总体的假设检验二总体的假设检验练习:为调查婚姻生活的满意度,设计了一份量表,得分越高表示对婚姻生活越满意。在没有孩子的被访者中(n1=78),平均得分为11.3分,标准差为0.6分;在至少有一个孩子的被访者中(n2=93),平均得分为10.8分,标准差为0.5分。问二者在婚姻满意度上是否有差别(=0.05)Z=5.5855, 拒绝H0,接受H1。(C)2006 GUOH45二总体的假设检验二总体的假设检验为了解性别对婚前性行为的态度的影响,研究者进行了随机抽样调查发现:女性样本(n1=450)中35%的人认为婚前性行为是错误的;男性样本(n2=417)中32%的人认为婚前性行为是错误的。问男性是否比女性在对待婚前性行为上更开放?(=0.05)Z=0.91,接受H0(C)2006 GUOH46二总体的假设检验二总体的假设检验小样本均值差检验:设两总体分别符合正态分布。当1与2已知,则可以根据中心极限定理:12221212(0,1)xxZNnn(C)2006 GUOH47二总体的假设检验二总体的假设检验当1与2未知,且12=22,则可以根据中心极限定理得知样本均值的差的抽样分布符合自由度为n1+n2-2的t分布。12121222121212222112212(2)11(1)(1)2xxxxtt nnsssnnnnnsnssnn(C)2006 GUOH48二总体的假设检验二总体的假设检验为研究某地两民族间家庭规模是否有所不同,各作如下独立的随机抽样:民族A:X1 bar=6.8人 S1=1.5人 n1=12户民族B:X2 bar=5.3人 S2=0.9人 n2=12户问能否认为甲民族的家庭平均人口高于乙民族的家庭平均人口?(=0.05)H0:1=2H1:12(C)2006 GUOH49二总体的假设检验二总体的假设检验 n1=12, n2=12, 小样本 总体方差未知 t分布 =0.05 单边检验 k=n1+n2-2=22, t=1.7171 S2=(n1-1)s12+(n2-1)s22/(n1+n2-2)=(12-1)*1.52+(12-1)*0.92/(12+12-2)=1.53 t=(x1 bar-x2 bar)/s*sqrt(1/n1+1/n2)=(6.8-5.3)/sqrt(1.53*(1/12+1/12)=2.97 t=2.971.7171,拒绝H0,接受H1。 以0.05为显著度,能够认为甲民族的家庭平均人口高于乙民族的家庭平均人口。(C)2006 GUOH50二总体的假设检验二总体的假设检验 练习: 为了解职业篮球队现在的得分能力是否比10年前有所提高,随机抽取最近一个赛季的每场得分情况和10年前的每场得分情况对比发现: 最近赛季:X1 bar=110分 S1=10分 n1=24场 10年前:X2 bar=102分 S2=9分 n2=23场 问现在的职业篮球队的得分能力是否有所提高?(=0.05) t=2.88 拒绝H0, 接受H1。
展开阅读全文