概率论第8章假设检验

上传人:仙*** 文档编号:171715078 上传时间:2022-11-28 格式:PPT 页数:45 大小:748KB
返回 下载 相关 举报
概率论第8章假设检验_第1页
第1页 / 共45页
概率论第8章假设检验_第2页
第2页 / 共45页
概率论第8章假设检验_第3页
第3页 / 共45页
点击查看更多>>
资源描述
数理统计数理统计 假设检验的基本思想和方法假设检验的基本思想和方法假设检验的一般步骤假设检验的一般步骤假设检验的两类错误假设检验的两类错误课堂练习课堂练习小结小结 布置作业布置作业第一节第一节 假设检验假设检验 数理统计数理统计 第八章第八章 假假 设设 检检 验验 数理统计数理统计 这类问题称作假设检验问题这类问题称作假设检验问题.在本节中,我们将讨论不同于参数估计的另一在本节中,我们将讨论不同于参数估计的另一类重要的统计推断问题类重要的统计推断问题.这就是这就是根据样本的信息检验根据样本的信息检验关于总体的某个假设是否正确关于总体的某个假设是否正确.一、假设检验的基本思想和方法一、假设检验的基本思想和方法数理统计数理统计 生产流水线上罐装可生产流水线上罐装可乐不断地封装,然后装箱乐不断地封装,然后装箱外运外运.怎么知道这批罐装怎么知道这批罐装可乐的容量是否合格呢?可乐的容量是否合格呢?例例1:罐装可乐的标准容量是罐装可乐的标准容量是355毫升毫升数理统计数理统计 例例2(医疗领域医疗领域)为了检验某种新疗法是否比传统为了检验某种新疗法是否比传统疗法更有效,对疗法更有效,对40名患者进行实验。把病人分名患者进行实验。把病人分成两组,每组成两组,每组20人,第一组采用新疗法,第二人,第一组采用新疗法,第二组采用传统疗法。从治疗结果表中,我们能否组采用传统疗法。从治疗结果表中,我们能否认为新疗法比传统疗法更有效?即第一组的康认为新疗法比传统疗法更有效?即第一组的康复人数比第二组多的原因是因为新疗法效果更复人数比第二组多的原因是因为新疗法效果更好,还是由随机因素引起的?好,还是由随机因素引起的?疗法康复未康复新疗法128传统疗法911数理统计数理统计 例例3 从某校从某校2004年年250名应届毕业生的高考成绩名应届毕业生的高考成绩中随机抽取了中随机抽取了50个,问能否根据这个,问能否根据这50个成绩判个成绩判断该校在断该校在2004年高考成绩服从正态分布?年高考成绩服从正态分布?以上实际例子的解决都需要我们根据以上实际例子的解决都需要我们根据问题本身提出假设,然后根据样本的信息问题本身提出假设,然后根据样本的信息对假设进行检验,最后作出对假设进行检验,最后作出“是是”与与“否否”的判断。的判断。数理统计数理统计 假设检验假设检验参数假设检验参数假设检验非参数假设检验非参数假设检验这类问题称作假设检验问题这类问题称作假设检验问题.总体分布已总体分布已知,检验关知,检验关于未知参数于未知参数的某个假设的某个假设总体分布未知时的假设检验问题总体分布未知时的假设检验问题 在本节中,我们将讨论不同于参数估计的另一在本节中,我们将讨论不同于参数估计的另一类重要的统计推断问题类重要的统计推断问题.这就是这就是根据样本的信息检验根据样本的信息检验关于总体的某个假设是否正确关于总体的某个假设是否正确.一、假设检验的基本思想和方法一、假设检验的基本思想和方法数理统计数理统计 让我们先看一个例子让我们先看一个例子.这一章我们讨论对参数的假设检验这一章我们讨论对参数的假设检验.数理统计数理统计 生产流水线上罐装可乐不生产流水线上罐装可乐不断地封装,然后装箱外运断地封装,然后装箱外运.怎怎么知道这批罐装可乐的容量是么知道这批罐装可乐的容量是否合格呢?否合格呢?把每一罐都打开倒入量杯把每一罐都打开倒入量杯,看看看容量是否合于标准看容量是否合于标准.这样做显然不这样做显然不行!行!罐装可乐的容量按标准应在罐装可乐的容量按标准应在350毫升和毫升和360毫升之间毫升之间.数理统计数理统计 每隔一定时间,抽查若干罐每隔一定时间,抽查若干罐.如每隔如每隔1小时,抽小时,抽查查5罐,得罐,得5个容量的值个容量的值X1,X5,根据这些值,根据这些值来判断生产是否正常来判断生产是否正常.如发现不正常,就应停产,找出原因,排除如发现不正常,就应停产,找出原因,排除故障,然后再生产;如没有问题,就继续按规定故障,然后再生产;如没有问题,就继续按规定时间再抽样,以此监督生产,保证质量时间再抽样,以此监督生产,保证质量.通常的办法是进行抽样检查通常的办法是进行抽样检查.数理统计数理统计 很明显,不能由很明显,不能由5罐容量的数据,在把握不大罐容量的数据,在把握不大的情况下就判断生产的情况下就判断生产 不正常,因为停产的损失是不正常,因为停产的损失是很大的很大的.当然也不能总认为正常,有了问题不能及时当然也不能总认为正常,有了问题不能及时发现,这也要造成损失发现,这也要造成损失.如何处理这两者的关系,假设检验面对的就如何处理这两者的关系,假设检验面对的就是这种矛盾是这种矛盾.数理统计数理统计 在正常生产条件下,由于种种随机因素的影响,在正常生产条件下,由于种种随机因素的影响,每罐可乐的容量应在每罐可乐的容量应在355毫升上下波动毫升上下波动.这些因素这些因素中没有哪一个占有特殊重要的地位中没有哪一个占有特殊重要的地位.因此,根据中因此,根据中心极限定理,假定每罐容量服从正态分布是合理的心极限定理,假定每罐容量服从正态分布是合理的.现在我们就来讨论这个问题现在我们就来讨论这个问题.罐装可乐的容量按标准应在罐装可乐的容量按标准应在350毫升和毫升和360毫升之间毫升之间.数理统计数理统计 它的对立假设是:它的对立假设是:称称H0为原假设为原假设(或零假设,解消假设);(或零假设,解消假设);称称H1为备选假设为备选假设(或对立假设)(或对立假设).在实际工作中,在实际工作中,往往把不轻易往往把不轻易否定的命题作否定的命题作为原假设为原假设.0 H0:(=355)0 H1:0 这样,我们可以认为这样,我们可以认为X1,X5是取自正态是取自正态总体总体 的样本,的样本,),(2 N是一个常数是一个常数.2 当生产比较稳定时,当生产比较稳定时,现在要检验的假设是:现在要检验的假设是:数理统计数理统计 那么,如何判断原假设那么,如何判断原假设H0 是否成立呢?是否成立呢?较大、较小是一个相对的概念,合理的界限在何较大、较小是一个相对的概念,合理的界限在何处?应由什么原则来确定?处?应由什么原则来确定?由于由于 是正态分布的期望值,它的估计量是样本是正态分布的期望值,它的估计量是样本均值均值 ,因此,因此 可以根据可以根据 与与 的差距的差距X 0 来判断来判断H0 是否成立是否成立.X-|0 较小时,可以认为较小时,可以认为H0是成立的;是成立的;当当X-|0 生产已不正常生产已不正常.当当较大时,应认为较大时,应认为H0不成立,即不成立,即-|X|0 数理统计数理统计 问题归结为对差异作定量的分析,以确定其性质问题归结为对差异作定量的分析,以确定其性质.差异可能是由抽样的随机性引起的,称为差异可能是由抽样的随机性引起的,称为“抽样误差抽样误差”或或 随机误差随机误差这种误差反映偶然、非本质的因素所引起的随机这种误差反映偶然、非本质的因素所引起的随机波动波动.数理统计数理统计 然而,这种随机性的波动是有一定限度的,然而,这种随机性的波动是有一定限度的,如果差异超过了这个限度,则我们就不能用抽样如果差异超过了这个限度,则我们就不能用抽样的随机性来解释了的随机性来解释了.必须认为这个差异反映了事物的本质差别,即必须认为这个差异反映了事物的本质差别,即反映了生产已不正常反映了生产已不正常.这种差异称作这种差异称作“系统误差系统误差”数理统计数理统计 问题是,根据所观察到的差异,如何判断问题是,根据所观察到的差异,如何判断它究竟是由于偶然性在起作用,还是生产确实它究竟是由于偶然性在起作用,还是生产确实不正常?不正常?即差异是即差异是“抽样误差抽样误差”还是还是“系统误差系统误差”所引所引起的?起的?这里需要给出一个量的界限这里需要给出一个量的界限.数理统计数理统计 问题是:如何给出这个量的界限?问题是:如何给出这个量的界限?这里用到人们在实践中普遍采用的一个原则:这里用到人们在实践中普遍采用的一个原则:小概率事件在一次试验小概率事件在一次试验中基本上不会发生中基本上不会发生.数理统计数理统计 现在回到我们前面罐装可乐的例中:现在回到我们前面罐装可乐的例中:在提出原假设在提出原假设H0后,如何作出接受和拒绝后,如何作出接受和拒绝H0的结的结论呢?论呢?在假设检验中,我们称这个小概率为在假设检验中,我们称这个小概率为显著性水显著性水平平,用,用 表示表示.常取常取 的选择要根据实际情况而定。的选择要根据实际情况而定。.05.0,01.0,1.0 数理统计数理统计 下面,我们再结合例子,进一步说明假设检验下面,我们再结合例子,进一步说明假设检验的一般步骤的一般步骤.二、假设检验的一般步骤二、假设检验的一般步骤提出提出H0在在H0成立成立时时构造构造统计量和统计量和小概率事件小概率事件A 进行1次试验或抽样试验或抽样若若A发生发生推翻推翻H0 若A没发生没发生接受接受H0基本步骤:基本步骤:数理统计数理统计 罐装可乐的容量按标准应在罐装可乐的容量按标准应在350毫升和毫升和360毫毫升之间升之间.一批可乐出厂前应进行抽样检查,现抽一批可乐出厂前应进行抽样检查,现抽查了查了n 罐,测得容量为罐,测得容量为 X1,X2,Xn,问这一批可问这一批可乐的容量是否合格?乐的容量是否合格?数理统计数理统计(1)提出假设提出假设(2)选检验统计量选检验统计量nXU0 N(0,1)|uUPH0:=355 H1:355由于由于 已知,已知,它能衡量差异它能衡量差异大小且分布已知大小且分布已知.|0 X(3)对给定的显著性水平对给定的显著性水平 ,可以在可以在N(0,1)表中查表中查到分位点的值到分位点的值 ,使,使u 数理统计数理统计(4)故我们可以取拒绝域为故我们可以取拒绝域为:也就是说也就是说,“uU|”是一个小概率事件是一个小概率事件.W:uU|(5)如果由样本值算得该统计量的实测值落入区如果由样本值算得该统计量的实测值落入区域域W,则拒绝,则拒绝H0;否则,不能拒绝;否则,不能拒绝H0.|uUP数理统计数理统计 如果如果H0 是对的,那么衡量差异大小的某个统计是对的,那么衡量差异大小的某个统计量落入区域量落入区域 W(拒绝域拒绝域)是个小概率事件是个小概率事件.如果该统如果该统计量的实测值落入计量的实测值落入W,也就是说,也就是说,H0 成立下的小概成立下的小概率事件发生了,那么就认为率事件发生了,那么就认为H0不可信而否定它不可信而否定它.否否则我们就不能否定则我们就不能否定H0(只好接受它)(只好接受它).这里所依据的逻辑是:这里所依据的逻辑是:数理统计数理统计 不否定不否定H0并不是肯定并不是肯定H0一定对,而只是一定对,而只是说差异还不够显著,还没有达到足以否定说差异还不够显著,还没有达到足以否定H0的程度的程度.所以假设检验又叫所以假设检验又叫“显著性检验显著性检验”数理统计数理统计 如果显著性水平如果显著性水平 取得很小,则拒绝域取得很小,则拒绝域 也会比较小也会比较小.其产生的后果是:其产生的后果是:H0难于被拒绝难于被拒绝.如果在如果在 很小的情况下很小的情况下H0仍被拒绝了,则说明实际情仍被拒绝了,则说明实际情况很可能与之有显著差异况很可能与之有显著差异.01.0基于这个理由,人们常把基于这个理由,人们常把 时拒绝时拒绝H0称为称为是是显著显著的,而把在的,而把在 时拒绝时拒绝H0称为是称为是高度高度显著显著的的.05.0数理统计数理统计 下面,我们再结合另一个例子,进一步说明假下面,我们再结合另一个例子,进一步说明假设检验的一般步骤设检验的一般步骤.二、假设检验的一般步骤二、假设检验的一般步骤提出提出H0在在H0成立成立时时构造构造统计量和统计量和小概率事件小概率事件A 进行1次试验或抽样试验或抽样若若A发生发生推翻推翻H0 若A没发生没发生接受接受H0基本步骤:基本步骤:数理统计数理统计 设总体设总体),(2 N关于总体参数关于总体参数2,讨论讨论4种假设检验:种假设检验:1.方差已知,检验假设方差已知,检验假设 00:H2.方差未知,检验假设方差未知,检验假设00:H3.期望已知,检验假设期望已知,检验假设2020:H4.期望未知,检验假设期望未知,检验假设2020:H三、一个正态总体的假设检验三、一个正态总体的假设检验 数理统计数理统计 例例2 某工厂生产的一种螺钉,标准要求长度是某工厂生产的一种螺钉,标准要求长度是32.5毫米毫米.实际生产的产品,其长度实际生产的产品,其长度X 假定服从正态分布假定服从正态分布 若若 =1.21,现从该厂生产的一批产品中,现从该厂生产的一批产品中抽取抽取6件件,得尺寸数据如下得尺寸数据如下:),(2 N2 32.56,29.66,31.64,30.00,31.87,31.03问这批产品是否合格问这批产品是否合格?(0.05)若若 未知,问这批产品是否合格?未知,问这批产品是否合格?2(0.01)数理统计数理统计 提出原假设和备择假设提出原假设和备择假设 5.32:5.32:10 HH第一步:第一步:第二步:第二步:取一检验统计量,在取一检验统计量,在H0成立下成立下求出它的分布求出它的分布32.5(0,1)1.16XUN 已知已知 X21.21 2(,),N 数理统计数理统计 第三步:第三步:对给定的显著性水平对给定的显著性水平 =0.05,查表确定,查表确定|PUu 可得否定域可得否定域 W:|U|1.961.96u 其中其中第四步第四步:将样本值代入算出统计量将样本值代入算出统计量 U 的实测值的实测值,最后可以下结论否定最后可以下结论否定H0,即认为这批产品是不,即认为这批产品是不合格的。合格的。31.1332.50|3.051.961.1/6u 数理统计数理统计 提出原假设和备择假设提出原假设和备择假设 5.32:5.32:10 HH第一步:第一步:已知已知 X),(2 N2 未知未知.第二步:第二步:能衡量差异大小且分布已知能衡量差异大小且分布已知取一检验统计量,在取一检验统计量,在H0成立下成立下求出它的分布求出它的分布)5(65.32tSXt(0,1)/XUNSn大大样样本本利利用用=(1)/Xtt nSn小小样样本本利利用用=数理统计数理统计 第三步:第三步:即即“”是一个是一个小概率事件小概率事件.)5(|2 tt 对给定的显著性水平对给定的显著性水平 =0.01,查表确定临,查表确定临界值界值 0322.4)5()5(005.02 tt,使使)5(|2ttP得否定域得否定域 W:|t|4.0322数理统计数理统计 故不能拒绝故不能拒绝H0,即认为是合格品。,即认为是合格品。第四步第四步:将样本值代入算出统计量将样本值代入算出统计量 t 的实测值的实测值,|t|=2.9971.645故拒绝故拒绝H0,即认为这批推进器的燃料率较以往,即认为这批推进器的燃料率较以往生产的有显著的提高。生产的有显著的提高。落入否定域落入否定域解解:提出假设提出假设:0100:40:HH645.105.00UnxU取统计量取统计量否定域为否定域为 W:05.0UU=1.645数理统计数理统计 某织物强力指标某织物强力指标X的均值的均值 =21公斤公斤.改进工艺改进工艺后生产一批织物,今从中取后生产一批织物,今从中取30件,测得件,测得 =21.55公公斤斤.假设强力指标服从正态分布假设强力指标服从正态分布 且已且已知知 =1.2公斤,公斤,问在显著性水平问在显著性水平 =0.01 下,下,新新生产织物比过去的织物强力是否有提高生产织物比过去的织物强力是否有提高?0 X),(2 N 四、课堂练习四、课堂练习数理统计数理统计 代入代入 =1.2,n=30,并由样本值计算得统计并由样本值计算得统计 量量 U 的实测值的实测值U=2.512.33故拒绝原假设故拒绝原假设H0,即新生产织物比过去的织物,即新生产织物比过去的织物的强力有提高。的强力有提高。落入否定域落入否定域解解:提出假设提出假设:21:21:10 HH)1,0(21NnXU 取统计量取统计量否定域为否定域为 W:01.0uU=2.33数理统计数理统计 提出提出假设假设 根据统计调查的目的根据统计调查的目的,提出提出原假设原假设H0 和备选假设和备选假设H1作出作出决策决策抽取抽取样本样本检验检验假设假设 对差异进行定量的分析,对差异进行定量的分析,确定其性质确定其性质(是随机误差是随机误差还是系统误差还是系统误差.为给出两为给出两者界限,找一检验统计量者界限,找一检验统计量T,在在H0成立下其分布已知成立下其分布已知.)拒绝还是不能拒绝还是不能拒绝拒绝H0显著性显著性水平水平P(T W)=-犯第一犯第一类错误的概率,类错误的概率,W为拒绝域为拒绝域五五、小小 结结数理统计数理统计 六、布置作业六、布置作业
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!