资源描述
,第,5,章,假设检验,第5章 假设检验,目录,Contents,假设检验概述,假设检验方法,均值过程,单样本,T,检验,独立样本,T,检验,配对样本,T,检验,目录Contents假设检验概述假设检验方法均值过程单样本T,假设检验概述,知识目标,:,了解假设检验的概念与种类;,能力目标,:,掌握假设检验的基本思想;,素质目标,:,具备,良好的职业道德,诚实,守信。,01,PART,假设检验概述知识目标:了解假设检验的概念与种类;01PAR,知识导入,某,豆制品生产企业试图鼓动消费者在早餐中尽量多地食用豆制品,以获得更好的市场利润。于是他们大力宣传,:,“早上要多吃豆制品,这样有助于减肥,!,”为了验证这个说法,调查者随机选取了,35,个人,询间他们早餐和午餐的通常食谱,并根据食谱将他们分为两类,:,一类为经常豆制品食用者,(A,类,),,一类为非经常豆制品食用者,(B,类,),,然后测度每人午餐的热量摄取量。经过一段时间的跟踪调查,得到的结果,如,下,所,示。,食用者类型,热量摄取量,A,568 681 636 607 555 496 540 539 529 562 589 646 596,617,584,B,650 630,628 624 711 723 569 632 688 580 569 596 706,563,480 651 709 622 637 617,“多吃豆制品有助于减肥”这一说法是否成立呢?,知识导入 某豆制品生产企业试图鼓动消费者在早餐中尽量多,概率分,布函数,概率,分布,概率,概率是反映,随机事件,出现的可能性大小,。随机事件是指在相同条件下,可能出现也可能不出现的,事件,。,概率分布是指用于表述随机事件结果取值的概率规律。,事件的概率表示了一次试验中某一个结果发生的可能性大小。,概率分布函数是描述随机变量取值分布规律的数学表示,。,例如:,统计学基础,概率分概率概率概率是反映随机事件出现的可能性大小。随机事件是,在,统计学中,正态分布是许多统计分析方法的理论基础。无论是本章所讲的假设检验还是后续的方差分析、相关与回归等内容,均要求分析的指标服从,正态分布,。因此,我们需要重点了解一下正态分布的概率密度函数及其特征。,正态分布,重点知识,正态分布的概率密度函数是,:,在统计学中,正态分布是许多统计分析方法的理论基础。无论,正态曲线呈钟型,两头低,中间高,曲线与横轴间的面积总等于,1,;,正态曲线,关于,均值,对称,,,在,均值,处,达到最大值,在正(负)无穷远处取值为,0,;,随机变量的取值,邻近,均值,的,概率越大,,远离,均值,的,概率越小;,方差,越小,,,分布越集中在,均值,附近;,方差,越大,,分布越分散。,01,02,03,04,请思考:正态分布的概率分布图具有哪些特征?,图,5-1,正态分布,概率分布图,正态曲线呈钟型,两头低,中间高,曲线与横轴间的面积总等于1;,假设检验,也叫显著性检验,是以小概率反证法的逻辑推理,判断假设是否成立的统计方法,。它首先假设样本对应的总体参数(或分布)与某个已知总体参数(或分布)相同,然后根据统计量的分布规律来分析样本数据,利用样本信息判断是否支持这种假设,并对检验假设做出取舍抉择,做出的结论是概率性的,不是绝对的肯定或否定。,假设检验,假设检验概念,【案例分析】,可口可乐标签的承诺是否可信?,假如,可口可乐生产的一种瓶装雪碧,其标签上标注的容量为,250,毫升,标准差为,4,毫升。如果从市场上随机抽取,50,瓶,发现其平均含量为,248,毫升,那么标签上的承诺是否可信?,这时,,我们就可以假设“可口可乐标签的承诺是可信”或者“可口可乐标签的承诺,不可信,”,然后通过样本数据进行检验分析来检测假设是否正确,从而做出最终的判断,这就是我们所谓的假设检验。,假设检验也叫显著性检验,是以小概率反证法的,假设检验种类,我们,都知道在数据轴上有正负方向。在某些情况下,某些假设问题是具有方向性的。通常来说,所谓的方向性有两种情况:一种是所观察的数值越大越好;另一种情况是所观察的数值越小越好。根据检验的实际需求不同,单侧检验中可能会出现不同的方向。,单侧检验,双侧检验,双侧检验,就是指当统计分析的目的是要检验样本平均数与总体平均数,或样本成数有没有显著差异,而不问差异的方向是否是正差还是负差时,所采用的一种统计检验方法。,例如,,要检验车间技术改进后的产品单位成本总体均值与技术改进前的产品单位成本总体均值是否有什么不同,。,假设检验种类我们都知道在数据轴上有正负方向。在某些情况下,某,假设检验的基本思想,假设检验,的基本思想是对总体数值设定某种假设,以,小概率事件,不发生为基准,运用,反证法思想,,按照总体数值的假设,并根据所获取的样本数据,通过样本统计量的分布,得出小概率事件在某一次试验或者观测中发生与否的现象,从而对总体数值进行分析及对其原先设定的假设作出拒绝与否的判断。,假设检验的基本思想 假设检验的基本思想是对,04,03,02,01,统计学基础知识:概率、概率分布以及概率分布函数等;,假设检验是,以小概率反证法的逻辑推理,判断假设是否成立的统计,方法;,假设检验的种类分为单侧和双侧检验;,假设检验的基本,思想。,本节课教学内容总结,04030201统计学基础知识:概率、概率分布以及概率分布函,假设检验的分析方法,知识目标,:,了解假设检验的原理;,能力目标,:,掌握假设检验的基本步骤和两类错误;,素质目标,:,具备,良好的职业道德,诚实,守信。,02,PART,假设检验的分析方法知识目标:了解假设检验的原理;02PA,案例讲解,下面将使用假设检验的分析方法来解决上述问题。,案例讲解下面将使用假设检验的分析方法来解决上述问题。,第一步,根据问题的实际情况,提出,原假设,H,0,和,备选假设,H,1,。,假设检验的基本步骤,第二,步,选取适当的显著,水平。,在假设检验中,显著性水平是指当原假设成立时,人们却把它拒绝了的概率或风险,犯这种错误的概率,用,表示,。实际检验中,通常取值为,0.05,。,第一步,根据问题的实际情况,提出原假设H0和备选假设H1。假,第三,步,选定检验统计量并分析拒绝域的,形式。,案例中可选定如下统计量:,假设检验的基本步骤,第四,步,确定接受域与拒绝域,。,由于,Z,服从标准正态分布,认为给定显著性水平,=,0.05,,过查,标准正态分布表,可知临界值为,1.96,,则拒绝域可表示,为 。,第三步,选定检验统计量并分析拒绝域的形式。案例中可选定如下统,第五,步,计算统计量的值,根据拒绝域作出决策,。,在案例,中,,如果抽样,值,|u|1.96,,则接受原假设,H,0,,拒绝备选假设,H,1,;如果抽样,值,|u|1.96,,则拒绝原假设,H,0,,接受备选假设,H,1,。,假设检验的基本步骤,根据计算结果,,|,u|=|-3.536|=3.536,1.96,,说明一次抽样的样本统计量落在拒绝域内,此时小概率事件在一次抽样中发生了,利用反证法思想得出矛盾现象,则拒绝原假设,H,0,。,第五步,计算统计量的值,根据拒绝域作出决策。在案例中,如果抽,原假设,H,0,实际是正确或者成立的,但却错误的拒绝了,H,0,,这样就犯了“误拒”的错误,通常称之为第,类错误或拒真错误,犯第,类错误的概率记为,。,误拒 错误,误受错误,原假设,H,0,实际是不正确或者不成立的,但却错误的接受了,H,0,,这样就犯了“误受”的错误,通常称之为第类错误或取伪错误,犯第类错误的概率记,为,。,假设检验,的两类错误,原假设H0实际是正确或者成立的,但却错误的拒绝了H0,这样就,假设检验,的两类错误,对原假设的判断,假设本身的真假情况,原假设,H,0,成立,原假设,H,0,不成立,接受原假设,H,0,决策,正确,“误受”,错误,拒绝原假设,H,0,“误拒”,错误,决策,正确,对原假设的判断与假设本身的真假的关系,如果减少犯第类错误的概率,就会增大犯第类错误的概率,;,如果,减少犯第类错误的概率,就会增大犯第类错误的概率。,假设检验的两类错误对原假设的判断假设本身的真假情况原假设H0,均值过程,知识目标,:,了解均值的基本概念;,能力目标,:,掌握均值过程的基本思想;,素质目标,:,具备,良好的职业道德,诚实,守信。,03,PART,均值过程知识目标:了解均值的基本概念;03PART,均值,,亦称为平均数,是表示一组数据集中趋势的量数,是指在一组数据中所有数据之和再除以这组数据的个数,。,均值是,反映数据集中趋势的一项指标,解答均值相关问题的关键在于确定“总数量”以及和总数量对应的总份数。根据“总数量”的不同,我们把均值分别确认为样本均值和总体均值。其中,样本均值是指在总体中的样本数据的均值;而总体均值又称为总体的数学期望或简称期望,是描述随机变量取值平均状况的数字特征。,均值的基本概念,均值,亦称为平均数,是表示一组数据集中趋势的量数,是,(,1,)计算思路相同:两个均值的计算思路都是用所测量的群体的某指标的总和除以群体个数;,(,2,)反映的都是数据的集中趋势。样本均值和总体均值都是反映数据集中趋势的一项指标;,(,3,)两者一般情况下不完全相等,样本是对总体的推测。,样本,只是总体的一部分,样本取自总体,可以反映总体的特征,因此样本平均值也会比较接近于总体平均值,恰好等于总体平均值的机会很少。一般情况下样本均值与总体均值之间会有些差异。,样本均值与总体均值的关系,(1)计算思路相同:两个均值的计算思路都是用所测量的,单样本,t,检验,知识目标,:,了解单样本,t,检验的基本思想;,能力目标,:,掌握,单样本,t,检验,的基本步骤;,素质目标,:,具备,良好的职业道德,诚实,守信。,04,PART,单样本t检验知识目标:了解单样本t检验的基本思想;04,单,样本,t,检验的目的是利用来自某单个总体的样本数据,推断该总体的均值是否与假设的检验值之间存在显著性差异,。,比如,,在一批产品中选取部分产品进行成本检验,以样本检验结果推断总体,再与假设检验值比较,类似审计抽样检验;或在一批产品中选取从不同地区的产品销量作为检验样本,测试样本的销售情况,以样本检验结果推断总体,再与假设检验值比较,得出是否与预期保持大致一致的结果,。,单样本,t,检验的基本思想,单样本t检验的目的是利用来自某单个总体的样本数据,推,单样本,t,检验的,基本步骤,单样本t检验的基本步骤,独立样本,t,检验,知识目标,:,了解独立样本,t,检验的,基本概念;,能力目标,:,掌握独立样本,t,检验的基本步骤;,素质目标,:,具备,良好的职业道德,诚实,守信。,05,PART,独立样本t检验知识目标:了解独立样本t检验的基本概念;,在,进行数据分析时,我们经常会遇到比较两类人或两个类别在某些观察方面是否存在差异的实际问题,这种问题从数据建模的角度讲,就是比较两个总体是否具有相同分布的问题,。,两,独立样本,t,检验(各实验处理组之间毫无相关存在,即为独立样本)的目的是利用来自两个非相关样本总体的独立样本,推断两个总体的均值是否存在显著差异,。,例如男生,和女生的高中,学习能力、产品,A,和产品,B,的销量是否有,差异等。,独立样本,t,检验的,基本思想,在进行数据分析时,我们经常会遇到比较两类人或两个类别,独立样本,t,检验,的基本步骤,情形一,独立样本t检验的基本步骤情形一,独立样本,t,检验,的基本步骤,情形二,独立样本t检验的基本步骤情形二,配对样本,t,检验,知识目标,:,了解配对样本,t,检验的基本概念;,能力目标,:,掌握配对样本,t,检验的,基本思想;,素质目标,:,具备,良好的职业道德,诚实,守信。,06,PART,配对样本t检验知识目标:了解配对样本t检验的基本概念;,匹配,样本就是两个样本是配对的,其观察值数目相同,其观察值的顺序不能随意更改。匹配样本检验的思想出发点在于对试验前后样本的差值情况进行检验,如果两个匹配总体均值不存在显著性差异,则两个匹配样本均值之差应
展开阅读全文