第4章-推断统计(参数估计与假设检验)资料课件

上传人:仙*** 文档编号:241675961 上传时间:2024-07-15 格式:PPT 页数:109 大小:7.23MB
返回 下载 相关 举报
第4章-推断统计(参数估计与假设检验)资料课件_第1页
第1页 / 共109页
第4章-推断统计(参数估计与假设检验)资料课件_第2页
第2页 / 共109页
第4章-推断统计(参数估计与假设检验)资料课件_第3页
第3页 / 共109页
点击查看更多>>
资源描述
应用统计学应用统计学Applied Statistics4-12011年8月重庆工商大学重庆工商大学应用应用统计统计应应 用用 统统 计计 学学Applied Statistics应用统计学应用统计学Applied Statistics4-2不象其他科学,统计从来不打算使自己完美无缺,统计意味着你永远不需要确定无疑。Gudmund R.Iversen统计名言统计名言应用统计学应用统计学Applied Statistics4-3怎样解决下面的问题?怎样解决下面的问题?l一个水库里有多少鱼?l一片原始森林里的木材储蓄量有多少?l一批灯泡的平均使用寿命是多少?l一批产品的合格率是多少?l怎样才能知道这些问题的答案?你不可能把一个水库里的水抽干去称鱼的重量,不可能把森林伐完去量木材有多少,不可能把一批灯泡都用完去计算它的平均寿命,也不可能把每一件产品都检测完才知道它的合格率第第 4 章章 推断统计推断统计4.1 怎样进行推断?怎样进行推断?4.2 估计总体参数估计总体参数4.3 检验总体假设检验总体假设4.1 怎样进行推断?怎样进行推断?4.1.1 用估计量估计总体参数用估计量估计总体参数 4.1.2 用什么方法进行估计?用什么方法进行估计?4.1.3 用什么样的估计量去估计?用什么样的估计量去估计?第第 4 章章 推断统计推断统计4.1.1 用估计量估计总体参数用估计量估计总体参数4.1 怎样进行推断?怎样进行推断?应用统计学应用统计学Applied Statistics4-72008年5月关心总体的哪些参数?关心总体的哪些参数?一个总体一个总体两个总体两个总体参数参数符号符号估计量估计量参数参数符号符号估计量估计量均均值值均均值值差差比例比例比例差比例差方差方差方差比方差比应用统计学应用统计学Applied Statistics4-81.估计量:用于估计总体参数的随机变量n如样本均值,样本比例,样本方差等如样本均值,样本比例,样本方差等n例如例如:样本均值就是总体均值样本均值就是总体均值 的一个估计量的一个估计量2.参数用 表示,估计量用 表示3.估计值:估计参数时计算出来的统计量的具体值n如果样本均值如果样本均值 x x =80=80,则,则8080就是就是 的估计值的估计值估计量与估计值估计量与估计值(estimator&estimated value)4.1.2 用什么方法进行估计?用什么方法进行估计?4.1 怎样进行推断?怎样进行推断?应用统计学应用统计学Applied Statistics4-10点估计点估计(point estimate)1.用样本的估计量的某个取值直接作为总体参数的估计值 例例如如:用用样样本本均均值值直直接接作作为为总总体体均均值值的的估估计计;用用两个样本均值之差直接作为总体均值之差的估计两个样本均值之差直接作为总体均值之差的估计2.无法给出估计值接近总体参数程度的信息n n虽虽然然在在重重复复抽抽样样条条件件下下,点点估估计计的的均均值值可可望望等等于于总总体体真真值值,但但由由于于样样本本是是随随机机的的,抽抽出出一一个个具具体体的样本得到的估计值很可能不同于总体真值的样本得到的估计值很可能不同于总体真值n n一一个个点点估估计计量量的的可可靠靠性性是是由由它它的的抽抽样样标标准准误误差差来来衡衡量量的的,这这表表明明一一个个具具体体的的点点估估计计值值无无法法给给出出估估计的可靠性的度量计的可靠性的度量 应用统计学应用统计学Applied Statistics4-11区间估计区间估计(interval estimate)1.1.在在点点估估计计的的基基础础上上,给给出出总总体体参参数数估估计计的的一一个个区区间间范范围,该区间由样本统计量加减估计误差而得到围,该区间由样本统计量加减估计误差而得到2.2.根根据据样样本本统统计计量量的的抽抽样样分分布布能能够够对对样样本本统统计计量量与与总总体体参数的接近程度给出一个概率度量参数的接近程度给出一个概率度量n n比如,某班级平均分数在比如,某班级平均分数在75758585之间,置信水平是之间,置信水平是95%95%样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量 (点估计点估计点估计点估计点估计点估计)置信区间置信区间置信区间置信区间置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限应用统计学应用统计学Applied Statistics4-122008年5月区间估计的图示区间估计的图示 x95%95%的样本的样本的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本的样本的样本 -2.58-2.58 x x +2.58+2.58 x x90%90%的样本的样本的样本的样本 -1.65-1.65 x x +1.65+1.65 x x应用统计学应用统计学Applied Statistics4-131.将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 2.表示为(1-n 为是总体参数未在区间内的比例3.常用的置信水平值有 99%,95%,90%n相应的相应的 为0.01,0.05,0.10置信水平置信水平(confidence level)应用统计学应用统计学Applied Statistics4-141.由样本统计量所构造的总体参数的估计区间称为由样本统计量所构造的总体参数的估计区间称为置信区间置信区间2.统计学家在某种程度上确信这个区间会包含真正统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间的总体参数,所以给它取名为置信区间 3.用一个具体的样本所构造的区间是一个特定的区用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包间,我们无法知道这个样本所产生的区间是否包含总体参数的真值含总体参数的真值n n我们只能是希望这个区间是大量包含总体参数真值的我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个值的区间中的一个n n总体参数以一定的概率落在这一区间的表述是错误的总体参数以一定的概率落在这一区间的表述是错误的置信区间置信区间(confidence interval)应用统计学应用统计学Applied Statistics4-152008年5月置信区间置信区间(95%的置信区的置信区间)重复构造出重复构造出重复构造出重复构造出 的的的的2020个个个个置信区间置信区间置信区间置信区间 点估计值点估计值点估计值点估计值我没有抓住参数!我没有抓住参数!应用统计学应用统计学Applied Statistics4-162008年5月置信区间与置信水平置信区间与置信水平 均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布(1-(1-)%)%区间包含了区间包含了区间包含了区间包含了%的区间未包含的区间未包含的区间未包含的区间未包含 1 1 /2 2/2 24.1.3 用什么样的估计量去估计?用什么样的估计量去估计?4.1 怎样进行推断?怎样进行推断?应用统计学应用统计学Applied Statistics4-18无偏性无偏性(unbiasedness)无偏性:无偏性:估计量抽样分布的数学期望等于被 估计的总体参数P P P()B BA A无偏无偏无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏应用统计学应用统计学Applied Statistics4-19有效性有效性(efficiency)有效性:有效性:对同一总体参数的两个无偏点估计 量,有更小标准差的估计量更有效 AB 的抽样分布的抽样分布的抽样分布的抽样分布 的抽样分布的抽样分布的抽样分布的抽样分布P P()应用统计学应用统计学Applied Statistics4-20一致性一致性(consistency)一致性:一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数AB较小的样本容量较小的样本容量较小的样本容量较小的样本容量较大的样本容量较大的样本容量较大的样本容量较大的样本容量P P()4.2 估计总体参数估计总体参数 4.2.1 总体均值的估计总体均值的估计 4.2.2 总体比例的估计总体比例的估计 4.2.3 总体方差的估计总体方差的估计第第 4 章章 推断统计推断统计4.2.1 总体均值的估计总体均值的估计4.2 估计总体参数估计总体参数应用统计学应用统计学Applied Statistics4-23一个总体均值的区间估计一个总体均值的区间估计总体均值总体均值 在在1-1-置信水平下的置信水平下的置信区间置信区间1.大样本大样本(n n 30)30)2.小样本小样本(n n 30)30),总体方差,总体方差()未未知知样本均值样本均值分位数值分位数值样本均值的标准误差样本均值的标准误差应用统计学应用统计学Applied Statistics4-24一个总体均值的区间估计一个总体均值的区间估计(例题分析例题分析大样本大样本)【例例例例】一一家家保保险险公公司司收收集集到到由由3636个个投投保保人人组组成成的的随随机机样样本本,得得到到每每个个投投保保人人的的年年龄龄(单单位位:周周岁岁)数数据据如如下表。试建立投保人年龄下表。试建立投保人年龄90%90%的置信区间的置信区间 3636个投保人年龄的数据个投保人年龄的数据个投保人年龄的数据个投保人年龄的数据 233539273644364246433133425345544724342839364440394938344850343945484532应用统计学应用统计学Applied Statistics4-25一个总体均值的区间估计一个总体均值的区间估计(例题分析例题分析大样本大样本)解解解解:已已知知n n=36,=36,1-1-=90%90%,z z/2/2=1.645=1.645。根根据据样样本本数数据据计算得:计算得:,总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为投保人平均年龄的置信区间为投保人平均年龄的置信区间为37.3737.37岁岁41.6341.63岁岁 统计函数统计函数统计函数统计函数CONFIDENCECONFIDENCE应用统计学应用统计学Applied Statistics4-26一个总体均值的区间估计一个总体均值的区间估计(例题分析例题分析小样本小样本)【例例例例】已已知知某某种种灯灯泡泡的的寿寿命命服服从从正正态态分分布布,现现从从一一批批灯灯泡泡中中随随机机抽抽取取1616只只,测测得得其其使使用用寿寿命命(单单位位:小小时时)如下。建立该批灯泡平均使用寿命如下。建立该批灯泡平均使用寿命95%95%的置信区间的置信区间1616灯泡使用寿命的数据灯泡使用寿命的数据灯泡使用寿命的数据灯泡使用寿命的数据 1510152014801500145014801510152014801490153015101460146014701470应用统计学应用统计学Applied Statistics4-27一个总体均值的区间估计一个总体均值的区间估计(例题分析例题分析小样本小样本)解:解:解:解:已知已知 N N(,2 2),n n=16,1-=16,1-=95%=95%,t t/2/2=2.131=2.131 根据样本数据计算得:根据样本数据计算得:,总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为该该种种灯灯泡泡平平均均使使用用寿寿命命的的置置信信区区间间为为1476.81476.8小小时时1503.21503.2小时小时应用统计学应用统计学Applied Statistics4-28两个总体均值之差的区间估计两个总体均值之差的区间估计(独立大样本独立大样本)1 1-2 2在在1-1-置信水平下的置信水平下的置信区间置信区间l独立大样本独立大样本(n n1 1 30 30,n n2 2 30)30)(x1 -x2)分位数值分位数值(x1 -x2)的标准误差的标准误差应用统计学应用统计学Applied Statistics4-29两个总体均值之差的区间估计两个总体均值之差的区间估计(独立小样本独立小样本:1 1 )l两个两个正态总体,方差正态总体,方差未知但相等:未知但相等:1 1=2 2 两个独立小样本两个独立小样本(n n1 1 3030和和n n2 2 30)30)估计估计量量 x x1 1-x x2 2的标准化的标准化总体方差的合并估计量总体方差的合并估计量应用统计学应用统计学Applied Statistics4-30两个总体均值之差的区间估计两个总体均值之差的区间估计(独立小样本独立小样本:1 1 )l两个两个正态总体,方差正态总体,方差未知且不等:未知且不等:1 1 2 2 两个独立小样本两个独立小样本(n n1 1 3030和和n n2 2 30)30)估计估计量量 x x1 1-x x2 2的标准化的标准化自由度自由度应用统计学应用统计学Applied Statistics4-31两个总体均值之差的区间估计两个总体均值之差的区间估计(匹配样本匹配样本)l两个匹配大样本(n1 30和n2 30)d 分位数值分位数值 d 的标准误差的标准误差 d d=(=(1 1-2 2)在在1-1-置信水平下的置信水平下的置信区间置信区间l两个匹配小样本(n1 30和n2 30)应用统计学应用统计学Applied Statistics4-322008年5月两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析独立小样本独立小样本)【例例例例】为为估估计计两两种种方方法法组组装装产产品品所所需需时时间间的的差差异异,分分别别对对两两种种不不同同的的组组装装方方法法各各随随机机安安排排1212名名工工人人,每每个个工工人人组组装装一一件件产产品品所所需需的的时时间间(单单位位:分分钟钟)下下如如表表。假假定定两两种种方方法法组组装装产产品品的的时时间间服服从从正正态态分分布布,且且方方差差相相等等。试试以以95%95%的的置置信信水水平平建建立立两两种种方方法法组组装装产产品品所所需平均时间差值的置信区间需平均时间差值的置信区间两个方法组装产品所需的时间两个方法组装产品所需的时间两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.52 21 1应用统计学应用统计学Applied Statistics4-33两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析独立小样本独立小样本)解解解解:根据样本数据计算得根据样本数据计算得 合并估计量为合并估计量为两种方法组装产品所需平均时间之差的置信区间为两种方法组装产品所需平均时间之差的置信区间为0.140.14分钟分钟7.267.26分钟分钟应用统计学应用统计学Applied Statistics4-34两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析匹配样本匹配样本)【例例例例】由由 1010名名学学 生生 组组 成成 一一 个个随随 机机 样样 本本,让让他他们们分分别别采采用用A A和和B B两两套套试试卷卷进进行行 测测 试试,结结 果果如如下下表表 。试试建建立立 两两 种种 试试 卷卷 分分数数 之之 差差 d d=1 1-2 2 95%95%的的置置信信区间区间 1010名学生两套试卷的得分名学生两套试卷的得分名学生两套试卷的得分名学生两套试卷的得分 学生编号学生编号试卷试卷A试卷卷B差差值d17871726344193726111489845691741754951-27685513876601698577810553916应用统计学应用统计学Applied Statistics4-35两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析匹配样本匹配样本)解解解解:根据样本数据计算得根据样本数据计算得两种试卷所产生的分数之差的置信区间为两种试卷所产生的分数之差的置信区间为6.36.3分分15.715.7分分4.2.2 总体比例的估计总体比例的估计4.2 估计总体参数估计总体参数应用统计学应用统计学Applied Statistics4-37一个总体比例的区间估计一个总体比例的区间估计(传统方法传统方法)1.1.设设总总体体服服从从二二项项分分布布,即即X X(n n,p p),P P为为n n次次独独立立伯伯努努利利试验成功的概率试验成功的概率2.2.试试验验次次数数n n非非常常大大(npnp1010;n n(1-(1-p p)10)10),否否则则该该方方法法不不能用能用3.3.当当样样本本很很小小时时,传传统统方方法法计计算算出出的的1-1-置置信信水水平平下下的的置置信区间能够覆盖总体真实比例的概率小于小于信区间能够覆盖总体真实比例的概率小于小于1-1-4.4.传统方法仍被广泛使用传统方法仍被广泛使用5.5.当当样样本本量量非非常常大大时时,传传统统方方法法与与现现代代方方法法的的结结果果几几乎乎相相同。小样本情况下,现代方法更适用同。小样本情况下,现代方法更适用总体比例总体比例 在在1-1-置信水平下的置信水平下的置信区间置信区间样本比例样本比例分位数值分位数值样本比例的标准误差样本比例的标准误差应用统计学应用统计学Applied Statistics4-38一个总体比例的区间估计一个总体比例的区间估计(传统方法传统方法)总体比例总体比例 在在1-1-置信水平下置信水平下的置信区间的置信区间 样本比例样本比例p p的标准化的标准化应用统计学应用统计学Applied Statistics4-39一个总体比例的区间估计一个总体比例的区间估计(传统方法传统方法)【例例例例】某某城城市市想想要要估估计计下下岗岗职职工工中中女女性性所所占占的的比比例例,随随机机地地抽抽取取了了100100名名下下岗岗职职工工,其其中中6565人人为为女女性性职职工工。试试以以95%95%的的置置信信水水平平估估计计该该城城市市下下岗岗职职工工中中女女性性比比例例的置信区间的置信区间解解解解:已已知知 n n=100=100,p p65%65%,1 1-=95%95%,z z/2/2=1.96=1.96该该城城市市下下岗岗职职工工中中女女性性比比例例的的置置信信区间为区间为55.65%74.35%55.65%74.35%应用统计学应用统计学Applied Statistics4-401.1.设设两两总总体体都都服服从从二二项项分分布布,即即X X1 1(n n1 1,p p1 1),X X2 2(n n2 2,p p2 2)。x x1 1为为n n1 1次次独独立立伯伯努努利利试试验验成成功功的的次次数数,P P1 1位位成成功功的的概概率率概概率率,x x2 2 为为n n2 2次独立伯努利试验成功的次数,次独立伯努利试验成功的次数,P P2 2为成功的概率为成功的概率2.2.试试验验次次数数n n1 1和和n n2 2都都非非常常大大(n n1 1p p1 11010,n n1 1(1-(1-p p1 1)10)10;n n2 2p p2 21010,n n2 2(1-(1-p p2 2)10)10),否则该方法不能用,否则该方法不能用3.3.对对于于大大样样本本,传传统统方方法法的的结结果果与与现现代代方方法法比比较较接接近近,但但对对于于小小样样本本,传传统统方方法法计计算算出出的的1-1-置置信信水水平平下下的的置置信信区区间间能能够够覆覆盖总体真实比例的概率小于小于盖总体真实比例的概率小于小于1-1-两个总体比例之差的区间估计两个总体比例之差的区间估计(传统方法传统方法)比例比例 之差之差 1 1-2 2在在1-1-置信水平下的置信水平下的置信区间置信区间(p1-p2)分位数值分位数值(p1-p2)的标准误差的标准误差应用统计学应用统计学Applied Statistics4-41lp p1 1-p p2 2的标准化的标准化两个总体比例之差的区间估计两个总体比例之差的区间估计(传统方法传统方法)l1-2在1-置信水平下的置信区间4.2.3 总体方差的估计总体方差的估计4.2 估计总体参数估计总体参数应用统计学应用统计学Applied Statistics4-43一个总体方差的区间估计一个总体方差的区间估计1.假设总体服从正态分布假设总体服从正态分布2.一个一个总体方差在总体方差在1-1-置信水平下的置信区间置信水平下的置信区间3.两个总体方差比在两个总体方差比在1-1-置信水平下的置信区间置信水平下的置信区间应用统计学应用统计学Applied Statistics4-442008年5月总体方差的区间估计总体方差的区间估计(图示图示)1-1-1-1-总体方差的总体方差的总体方差的1-1-1-的置信区间的置信区间的置信区间自由度为自由度为自由度为自由度为n n-1-1的的的的 应用统计学应用统计学Applied Statistics4-452008年5月两个总体方差比的区间估计两个总体方差比的区间估计(图示图示)F FF F1-1-1-1-F F 总体方差比的总体方差比的总体方差比的1-1-1-的置信区间的置信区间的置信区间方差比置信区间示意图方差比置信区间示意图方差比置信区间示意图方差比置信区间示意图4.3 检验总体假设检验总体假设 4.3.1 怎样提出假设?怎样提出假设?4.3.2 依据什么作出决策?依据什么作出决策?4.3.3 总体均值的检验总体均值的检验 4.3.4 总体比例的检验总体比例的检验 4.3.5 总体方差的检验总体方差的检验第第 4 章章 推断统计推断统计4.3.1 怎样提出假设?怎样提出假设?4.3 检验总体假设检验总体假设应用统计学应用统计学Applied Statistics4-48假设与假设检验假设与假设检验(hypothesis&hypothesis test)1.假设是对总体参数的具体数值所作的陈述2.假假设设检检验验是是利利用用样样本本信信息息判判断断假假设设是是否否成成立立的的过程过程3.逻逻辑辑上上运运用用反反证证法法,统统计上依据小概率原理计上依据小概率原理我认为这种新药的疗效我认为这种新药的疗效比原有的药物更有效比原有的药物更有效!应用统计学应用统计学Applied Statistics4-49原假设原假设(null hypothesis)1.研究者想收集证据予以反对的假设研究者想收集证据予以反对的假设2.表达参数没有变化或变量间没有关系表达参数没有变化或变量间没有关系3.假定样本反映的结果是由于样本与总体之间的假定样本反映的结果是由于样本与总体之间的随机差异导致的随机差异导致的4.又称又称“0 0假设假设”5.总是有符号总是有符号 ,或或 4.4.表示为表示为 H H0 0n nH H0 0:=某一数值某一数值 n n指定为符号指定为符号 =,或或 n n例如例如,H H0 0:10cm10cm应用统计学应用统计学Applied Statistics4-501.研究者想收集证据予以支持的假设2.假定样本反映的结果是真实的3.也称“研究假设”4.总是有符号 ,或 5.表示为 H1n nH H1 1:某一数值,或某一数值,或 某一数值某一数值n n例如例如,H H1 1:10cm 10cm,或,或 10cm10cm备择假设备择假设(alternative hypothesis)应用统计学应用统计学Applied Statistics4-51【例例例例】某某品品牌牌洗洗涤涤剂剂在在它它的的产产品品说说明明书书中中声声称称:平平均均净净含含量量不不少少于于500500克克。从从消消费费者者的的利利益益出出发发,有有关关研研究究人人员员要要通通过过抽抽检检其其中中的的一一批批产产品品来来验验证证该该产产品品制制造造商商的的说说明明是是否否属属实实。试试陈陈述述用用于于检验的原假设与备择假设检验的原假设与备择假设提出假设提出假设(例题分析例题分析)解解解解解解:研研研究究究者者者抽抽抽检检检的的的意意意图图图是是是倾倾倾向向向于于于证证证实实实这这这种种种洗洗洗涤涤涤剂剂剂的的的平平平均均均净净净含含含量量量并并并不不不符符符合合合说说说明明明书书书中中中的的的陈陈陈述述述 。建建建立的原假设和备择假设为立的原假设和备择假设为立的原假设和备择假设为 H H H0 0 0:500 500 500 H H H1 1 1:500 500”或“”的假设检验,称为单侧检验或单尾检验(one-tailed test)n备择假设的方向为备择假设的方向为“”,称为,称为右侧检验右侧检验右侧检验右侧检验 双侧检验与单侧检验双侧检验与单侧检验4.3.2 依据什么作出决策?依据什么作出决策?4.3 检验总体假设检验总体假设应用统计学应用统计学Applied Statistics4-561.检检验验统统计计量量:根根据据样样本本观观测测结结果果计计算算得得到到的的,并并据据以以对对原原假假设设和和备备择择假假设设作作出出决决策策的的某某个个样样本本统统计量计量2.对样本估计量的标准化结果对样本估计量的标准化结果n原假设原假设H H0 0为真为真n点估计量的抽样分布点估计量的抽样分布 用统计量决策用统计量决策(test statistic)3.3.标准化的检验统计量标准化的检验统计量标准化的检验统计量 应用统计学应用统计学Applied Statistics4-572008年5月用统计量决策用统计量决策(双侧检验双侧检验)抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H HH000临界值临界值临界值临界值临界值临界值 /2/2 /2/2/2 拒绝拒绝拒绝H HH000拒绝拒绝拒绝H HH0001-1-1-置信水平置信水平置信水平置信水平置信水平置信水平Region of RejectionRegion of RejectionRegion of RejectionRegion of NonrejectionRegion of NonrejectionRegion of NonrejectionRegion of RejectionRegion of RejectionRegion of Rejection应用统计学应用统计学Applied Statistics4-582008年5月用统计量决策用统计量决策(左侧检验左侧检验)抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H HH000临界值临界值临界值 拒绝拒绝拒绝H HH0001-1-1-置信水平置信水平置信水平置信水平置信水平置信水平Region of RejectionRegion of RejectionRegion of RejectionRegion of NonrejectionRegion of NonrejectionRegion of Nonrejection应用统计学应用统计学Applied Statistics4-592008年5月用统计量决策用统计量决策(右侧检验右侧检验)抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H HH000临界值临界值临界值2 2 拒绝拒绝拒绝H HH0001-1-1-置信水平置信水平置信水平置信水平置信水平置信水平Region of NonrejectionRegion of NonrejectionRegion of NonrejectionRegion of RejectionRegion of RejectionRegion of Rejection应用统计学应用统计学Applied Statistics4-60用用P 值决策值决策(P-value)1.如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率P P值值值值告告告告诉诉诉诉我我我我们们们们:如如果果原原假假设设是是正正确确的的话话,我我们们得得到到得得到到目目前前这这个个样样本本数数据据的的可可能能性性有有多多大大,如果这个可能性很小,就应该拒绝原假设如果这个可能性很小,就应该拒绝原假设 2.被称为观察到的(或实测的)显著性水平3.决策规则:若p值,拒绝 H0应用统计学应用统计学Applied Statistics4-612008年5月双侧检验的双侧检验的P 值值 /2 2 /2 2 Z Z拒绝拒绝拒绝拒绝H H0 0拒绝拒绝拒绝拒绝H H0 00 0 0临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值1/2 1/2 1/2 P P P 值值值1/2 1/2 1/2 P P P 值值值应用统计学应用统计学Applied Statistics4-622008年5月左侧检验的左侧检验的P 值值 Z Z拒绝拒绝拒绝拒绝H H0 00 0 0临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量1/2 1/2 1/2 P P P 值值值应用统计学应用统计学Applied Statistics4-632008年5月右侧检验的右侧检验的P 值值 Z Z拒绝拒绝拒绝拒绝H H0 00 0 0计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值1/2 1/2 1/2 P P P 值值值应用统计学应用统计学Applied Statistics4-642008年5月拒绝拒绝拒绝拒绝H H0 0P 值值决策与统计量的比较决策与统计量的比较拒绝拒绝拒绝拒绝拒绝拒绝H HH0 00的两个统计量的不同显著性的两个统计量的不同显著性的两个统计量的不同显著性的两个统计量的不同显著性的两个统计量的不同显著性的两个统计量的不同显著性 Z Z拒绝拒绝拒绝拒绝H H0 00 0 0统计量统计量统计量统计量统计量统计量1 11 P PP1 11 值值值统计量统计量统计量统计量统计量统计量2 22 P PP2 22 值值值拒绝拒绝拒绝拒绝H H0 0临界值临界值临界值临界值临界值临界值应用统计学应用统计学Applied Statistics4-65 原原原原假假假假设设设设的的的的可可可可信信信信度度度度又又又又多多多多高高高高?如如果果H H0 0所所代代表表的的假假设设是是人人们们多多年年来来一一直直相相信信的的,就就需需要要很很强强的的证证据据(小小的的P P值值)才能说服他们才能说服他们 拒拒拒拒绝绝绝绝的的的的结结结结论论论论是是是是什什什什么么么么?如如果果拒拒绝绝H H0 0而而肯肯定定H H1 1 ,你你就就需需要要有有很很强强的的证证据据显显示示要要支支持持H H1 1。比比如如,H H1 1代代表表要要花花很很多多钱钱把把产产品品包包装装改改换换成成另另一一种种包包装装,你你就就要要有有很很强强的的证证据据显显示示新新包包装装一一定定会会增增加加销销售售量量(因因为为拒拒绝绝H H0 0要花很高的成本要花很高的成本)多大的多大的P 值合适值合适?显显显著著著性性性检检检验验验的的的目目目的的的是是是要要要描描描述述述样样样本本本所所所提提提供供供不不不利利利于于于原原原假假假设设设的的的证证证据据据有有有多多多强强强。P P P值值值就就就在在在做做做这这这件件件事事事。但但但是是是,要要要证证证明明明原原原假假假设设设不不不正正正确确确,P P P值值值要要要多多多小小小,才才才能能能令令令人人人信信信服服服呢呢呢?这这这要要要根根根据据据两两两种情况来确定种情况来确定种情况来确定应用统计学应用统计学Applied Statistics4-66决策就有可能犯错误决策就有可能犯错误1.第第类错误类错误(弃真错误弃真错误)l原假设为正确时拒绝原假设原假设为正确时拒绝原假设l第第类错误的概率记为类错误的概率记为 l l被称为显著性水平被称为显著性水平2.第第类错误类错误(取伪错误取伪错误)l原假设为错误时未拒绝原假设原假设为错误时未拒绝原假设l第第类错误的概率记为类错误的概率记为 (Beta)(Beta)应用统计学应用统计学Applied Statistics4-672008年5月 错误和错误和 错误的关系错误的关系你要同时减少两类你要同时减少两类错误的惟一办法错误的惟一办法是增加样本量是增加样本量 和和和和 的关系就像的关系就像的关系就像的关系就像翘翘板,翘翘板,翘翘板,翘翘板,小小小小 就就就就大,大,大,大,大大大大 就小就小就小就小应用统计学应用统计学Applied Statistics4-68两类错误的控制两类错误的控制1.1.一般来说,对于一个给定的样本,如果犯第一般来说,对于一个给定的样本,如果犯第 类错误类错误的代价比犯第的代价比犯第类错误的代价相对较高,则将犯第类错误的代价相对较高,则将犯第类错误的概率定得低些较为合理;反之,如果犯类错误的概率定得低些较为合理;反之,如果犯第第 类错误的代价比犯第类错误的代价比犯第类错误的代价相对较低,类错误的代价相对较低,则将犯第则将犯第类错误的概率定得高些类错误的概率定得高些2.2.一般来说,发生哪一类错误的后果更为严重,就应一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于犯第该首要控制哪类错误发生的概率。但由于犯第 类错类错误的概率是可以由研究者控制的,因此在假设检验误的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第中,人们往往先控制第 类错误的发生概率类错误的发生概率应用统计学应用统计学Applied Statistics4-69怎样表述决策结果?怎样表述决策结果?(“显著显著”与与“不显著不显著”)1.当拒绝原假设时,我们称样本结果是统统计计上显著的上显著的n n拒绝原假设时结论是清楚的拒绝原假设时结论是清楚的2.当不拒绝原假设时,我们称样本结果是统统计上不显著的计上不显著的n n不不拒拒绝绝原原假假设设时时,并并未未给给出出明明确确的的结结论论,不不能能说说原原假假设设是是正正确确的的,也也不不能能说说它它不不是是正正确确的的应用统计学应用统计学Applied Statistics4-70怎样表述决策结果?怎样表述决策结果?(“接受接受”与与“不拒绝不拒绝”)1.1.你不能证明原假设是什么而只能证明它不是什么你不能证明原假设是什么而只能证明它不是什么2.2.假假设设检检验验的的目目的的在在于于试试图图找找到到证证据据拒拒绝绝原原假假设设,而而不不在在于证明什么是正确的于证明什么是正确的3.3.当当没没有有足足够够证证据据拒拒绝绝原原假假设设时时,不不采采用用“接接接接受受受受原原原原假假假假设设设设”的的表表述述,而而采采用用“不不不不拒拒拒拒绝绝绝绝原原原原假假假假设设设设”的的表表述述。“不不拒拒绝绝”的的表表述述实实际际上上意意为为着着并并未未给给出出明明确确的的结结论论,我我们们没没有有说说原假设正确,也没有说它不正确原假设正确,也没有说它不正确4.4.“接接受受”的的说说法法有有时时会会产产生生误误导导,因因为为这这种种说说法法似似乎乎暗暗示示着着原原假假设设已已经经被被证证明明是是正正确确的的了了。但但实实事事上上,H H0 0的的真真实实值值我我们们永永远远也也无无法法知知道道,H H0 0只只是是对对总总体体真真实实值值的的一一个个假假定定值值,由由样样本本提提供供的的信信息息也也就就自自然然无无法法证证明明它它是是否否正正确确应用统计学应用统计学Applied Statistics4-71怎样表述决策结果?怎样表述决策结果?(为什么不说为什么不说“接受接受”)【例】比如原假设为H0:=10,从该总体中抽出一个随机样本,得到x=9.8,在=0.05的水平上,样本提供的证据没有推翻这一假设,我们说“接受”原假设,这意为着样本提供的证据已经证明=10是正确的。如果我们将原假设改为H0:=10.5,同样,在=0.05的水平上,样本提供的证据也没有推翻这一假设,我们又说“接受”原假设。但这两个原假设究竟哪一个是“真实的”呢?我们不知道应用统计学应用统计学Applied Statistics4-721.SignificantSignificant(显显著著的的)一一词词的的意意义义在在这这里里并并不不是是“重要的重要的重要的重要的”,而是指,而是指“非偶然的非偶然的非偶然的非偶然的”2.在在假假设设检检验验中中,如如果果样样本本提提供供的的证证据据拒拒绝绝原原假假设设,我我们们说说检检验验的的结结果果是是显显著著的的,如如果果不不拒拒绝绝原假设,我们则说结果是不显著的原假设,我们则说结果是不显著的3.一一项项检检验验在在统统计计上上是是“显显显显著著著著的的的的”,意意思思是是指指:这这样样的的(样样本本)结结果果不不是是偶偶然然得得到到的的,或或者者说说,不不是靠机遇能够得到的是靠机遇能够得到的l拒拒绝绝原原假假设设,表表示示这这样样的的样样本本结结果果并并不不是是偶偶然然得得到到的的;不不拒拒绝绝原原假假设设(拒拒绝绝原原假假设设的的证证据据不不充充分分),则则表示这样的样本结果只是偶然得到的表示这样的样本结果只是偶然得到的统计显著不等于实际显著统计显著不等于实际显著 (significant)应用统计学应用统计学Applied Statistics4-73统计显著不等于实际显著统计显著不等于实际显著 (统计上显著不一定有实际意义统计上显著不一定有实际意义)1.1.当当原原假假设设被被拒拒绝绝时时,我我们们称称样样本本结结果果在在统统统统计计计计上上上上是是是是显显显显著著著著的的的的(statistically(statistically Significant)Significant),当当不不拒拒绝绝原原假假设设时时,我我们们称称样本结果在样本结果在统计上是不显著的统计上是不显著的统计上是不显著的统计上是不显著的n nP P值值越越小小,表表明明结结果果越越显显著著。但但检检验验结结果果究究竟竟是是“显显著著的的”、“中中度度显显著著的的”还还是是“高高度度显显著著的的”,需需要要由由研研究究者者自自己己根根据据P P值值大小和实际问题来决定大小和实际问题来决定 2.2.在在“显显著著”和和“不不显显著著”之之间间没没有有清清除除的的界界限限,只只是是在在P P值值越越来来越越小小时时,我我们们就就有有越越来来越越强强的的证证据据,检检验验的的结结果果也也就越来越显著就越来越显著3.3.一一个个在在统统计计上上显显著著的的结结论论在在实实际际中中却却不不见见得得很很重重要要,也也不不意意为为着着就就有有实实际际意意义义。因因为为P P值值不不仅仅和和样样本本大大小小密密切切相相关关,也和总体参数的真值有关也和总体参数的真值有关 n n样本容量越大,样本容量越大,P P值就越小值就越小n n大的样本几乎总是导致拒绝原假设大的样本几乎总是导致拒绝原假设应用统计学应用统计学Applied Statistics4-741.较大的样本会让显著性检验比较敏感 2.用小样本作的显著性检验敏感度又常常不够 3.在总体真值不变的情况下,大的样本会使P值变小,而小的P值也不一定就有实际显著性 4.无论总体的状况如何,观测值多一点,就可以让我们抓的值抓得准些5.在假设检验时,不仅要报告P值,而且也要报告样本大小统计显著不等于实际显著统计显著不等于实际显著(大样本导致结果显著大样本导致结果显著)应用统计学应用统计学Applied Statistics4-752008年5月统计显著不等于实际显著统计显著不等于实际显著(样本量对检验结果的影响样本量对检验结果的影响)投掷硬币投掷硬币投掷硬币100010001000次、次、次、404040404040次和次和次和100001000010000次时出现正面样本比例的抽样分布次时出现正面样本比例的抽样分布次时出现正面样本比例的抽样分布 0.50.50.5070.507这个结果出这个结果出乎预料吗?乎预料吗?n n=1000=1000n n n=4040=4040=4040n n n=10000=10000=100004.3.3 总体均值的检验总体均值的检验4.3 检验总体假设检验总体假设应用统计学应用统计学Applied Statistics4-772008年5月一个总体均值的检验一个总体均值的检验(作出判断作出判断)是否已是否已知知小小小小小小样本容量样本容量n大大大大大大 是否已是否已知知否否否否否否 t 检验检验否否否否否否z 检验检验是是是是是是z 检验检验 是是是是是是z 检验检验应用统计学应用统计学Applied Statistics4-78一个总体均值的检验一个总体均值的检验(例题分析例题分析大样本大样本)【例例例例】一一种种机机床床加加工工的的零零件件尺尺寸寸绝绝对对平平均均误误差差为为1.35mm1.35mm。生生产产厂厂家家现现采采用用一一种种新新的的机机床床进进行行加加工工以以期期进进一一步步降降低低误误差差。为为检检验验新新机机床床加加工工的的零零件件平平均均误误差差与与旧旧机机床床相相比比是是否否有有显显著著降降低低,从从某某天天生生产产的的零零件件中中随随机机抽抽取取5050个个进进行行检检验验。利利用用这这些些样样本本数数据据,检检验验新新机机床床加加工工的的零零件件尺尺寸寸的的平平均均误误差差与与旧旧机机床床 相相 比比 是是 否否 有有 显显 著著 降降 低低?(=0.01)=0.01)左侧检验左侧检验5050个零件尺寸的误差数据个零件尺寸的误差数据个零件尺寸的误差数据个零件尺寸的误差数据 (mmmm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86应用统计学应用统计学Applied Statistics4-79一个总体均值的检验一个总体均值的检验(例题分析例题分析大样本大样本)H H0 0 :1.351.35H H1 1 :1.351.35 =0.010.01n n =5050临界值临界值临界值临界值(c c):):检验统计量检验统计量检验统计量检验统计量:拒绝拒绝H H0 0新新机机床床加加工工的的零零件件尺尺寸寸的的平平均均误误差与旧机床相比有显著降低差与旧机床相比有显著降低决策决策决策决策:结论结论结论结论:-2.33-2.33z z0 0拒绝拒绝H H0 00.010.01应用统计学应用统计学Applied Statistics4-80一个总体均值的检验一个总体均值的检验(P 值的计算与应用值的计算与应用大样本大样本)第第第第1 1步:步:步:步:进入进入ExcelExcel表格界面,直接点击表格界面,直接点击【f f(x x)】第第第第2 2步:步:步:步:在函数分类中点击在函数分类中点击【统计统计】,并在函数名的菜单下选,并在函数名的菜单下选 择择【ZTESTZTEST】,然后,然后【确定确定】第第第第3 3步:步:步:步:在所出现的对话框在所出现的对话框【ArrayArray】框中,输入原始数据所框中,输入原始数据所 在区域在区域 ;在;在【X X】后输入参数的某一假定值后输入参数的某一假定值(这里为这里为 1.351.35);在;在【SigmaSigma】后输入已知的总体标准差后输入已知的总体标准差(若总若总 体标准差未知则可忽略不填,系统将自动使用样本体标准差未知则可忽略不填,系统将自动使用样本 标准差代替标准差代替)第第第第4 4步:步:步:步:用用1 1减去得到的函数值减去得到的函数值0.9954210230.995421023 即为即为P P值值 P P值值=1-0.995421023=1-0.995421023=0.0045790.004579 P P值值 =0.05=0.05,故不拒绝,故不拒绝H H0 0 应用统计学应用统计学Applied Statistics4-85两个总体均值之差的检验两个总体均值之差的检验(独立大样本独立大样本)1.假定条件n n两个样本是独立的随机样本两个样本是独立的随机样本n n正态总体或非正态总体大样本正态总体或非正态总体大样本(n n1 1 3030和和 n n2 2 30)30)2.检验统计量n n 1 12 2 ,2 22 2 已知:已知:n n 1 12 2 ,2 22 2 未知:未知:应用统计学应用统计学Applied Statistics4-86两个总体均值之差的检验两个总体均值之差的检验(独立小样本:独立小样本:1 12 2,2 22 2 已知已知)1.假定假定条件条件n n两个独立的小样本两个独立的小样本n n两个两个总体都是正态分布总体都是正态分布n n 1 12 2,2 22 2已知已知2.检验检验统计量统计量应用统计学应用统计学Applied Statistics4-87两个总体均值之差的检验两个总体均值之差的检验(独立小样本:独立小样本:独立小样本:独立小样本:1 12 2,2 22 2 未知但未知但未知但未知但 1 12 2=2 22 2)1.假定假定条件条件n n两个独立的小样本两个独立的小样本n n两个两个总体都是正态分布总体都是正态分布n n 1 12 2、2 22 2未知但相等,即未知但相等,即 1 12 2=2 22 22.检验检验统计量统计量其中:其中:其中:自由度:自由度:自由度:应用统计学应用统计学Applied Statistics4-88两个总体均值之差的检验两个总体均值之差的检验(独立小样本:独立小样本:独立小样本:独立小样本:1 12 2,2 22 2 未知且不等未知且不等未知且不等未知且不等 1 12 2 2 22 2)1.假定假定条件条件n n两个两个总体都是正态分布总体都是正态分布n n 1 12 2,2 22 2未知且不相等,即未知且不相等,即 1 12 2 2 22 2n n样本容量不相等,即样本容量不相等,即n n1 1 n n2 22.检验检验统计量统计量自由度:自由度:自由度:应用统计学应用统计学Applied Statistics4-892008年5月两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析独立小样本独立小样本)【例例例例】为为估估计计两两种种方方法法组组装装产产品品所所需需时时间间的的差差异异,分分别别对对两两种种不不同同的的组组装装方方法法各各随随机机安安排排1212名名工工人人,每每个个工工人人组组装装一一件件产产品品所所需需的的时时间间(单单位位:分分钟钟)下下如如表表。假假定定两两种种方方法法组组装装产产品品的的时时间间服服从从正正态态分分布布,方方差差未未知知且且不不相相等等。检检验验两两种种方方法法组组装装产产品品所所需需平平均均时时间间是是否有显著差异?否有显著差异?=0.05=0.05两个方法组装产品所需的时间两个方法组装产品所需的时间两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.52 21 1应用统计学应用统计学Applied Statistics4-90两个总体均值之差的检验两个总体均值之
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!