第三讲1应用统计

上传人:sx****84 文档编号:243358855 上传时间:2024-09-21 格式:PPT 页数:74 大小:1.50MB
返回 下载 相关 举报
第三讲1应用统计_第1页
第1页 / 共74页
第三讲1应用统计_第2页
第2页 / 共74页
第三讲1应用统计_第3页
第3页 / 共74页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第三讲,假设检验问题,虽然我们不知道一批灯管的平均使用寿命是多少,不知道一批产品的合格率是多少,不知道全校学生的生活费支出的方差是多少,但我们可以事先提取一个假设值,比如,这批灯管的平均使用寿命是1500小时,这批产品的合格率是95%,全校学生的生活费支出的方差是1000,然后从中抽取一个样本,根据样本提供的信息来判断假设是否成立。这就是统计上所说的假设检验。,1,一、假设检验的基本思路和概念1.两种统计推断,估计:求总体参数的近似值或近似值的误差范围,。基本方法是选择一个(组)合适的模型,;,检验:判断总体的某个性质是否成立,。基本方法是,检验一个(组)给定的模型。,2,2,.,假设检验的过程和思路,概率意义下的反证法类似于“无罪推定”,总体,假设总体的,平均年龄是50岁,拒绝,样本均值是,20,样本,无效假设,不可能!,3,什么是假设?,(,hypothesis,),对总体参数的具体数值所作的陈述,总体参数包括,总体均值,、,比例,、,方差,等,分析,之前,必需陈述,我认为这种新药的疗效比原有的药物更有效!,4,什么是假设检验?,(,hypothesis test,),先对总体的参数,(,或分布形式,),提出某种假设,然后利用样本信息判断假设是否成立的过程,有参数检验和,非,参数检验,逻辑上运用反证法,统计上依据小概率原理,5,假设检验的基本思想,. 因此我们拒绝假设,= 50,. 如果这是总体的真实均值,样本均值,m,= 50,抽样分布,H,0,这个值不像我们应该得到的样本均值 .,20,6,总体,假设检验的过程,抽取随机样本,均值,x,= 20,我认为人口的平均年龄是50岁,提出假设,拒绝假设,别无选择!,作出决策,7,【例】,一种零件的生产标准是直径应为,10cm,,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于,10cm,,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设,提出假设,(例题分析),解:,研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为,H,0,:,10cm,H,1,:,10cm,8,【例】,某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于,500,克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设,提出假设,(例题分析),解:,研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述 。建立的原假设和备择假设为,H,0,:,500,H,1,:, 500,500g,绿叶,洗涤剂,9,【例】,一家研究机构估计,某城市中家庭拥有汽车的比例超过,30%,。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设,提出假设,(例题分析),解:,研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过,30%,”。建立的原假设和备择假设为,H,0,:,30%,H,1,:,30%,10,原假设和备择假设是一个完备事件组,而且相互对立,在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立,先确定备择假设,再确定原假设,等号“,=,”,总是放在原假设上,因研究目的不同,对同一问题可能提出不同的假设,(,也可能得出不同的结论,),提出假设,(结论与建议),11,双侧检验与单侧检验,(假设的形式),假设,双侧检验,单侧检验,左侧检验,右侧检验,原假设,H,0,:,m,=,m,0,H,0,:,m,m,0,H,0,:,m,m,0,备择假设,H,1,:,m,m,0,H,1,:,m,m,0,12,假设检验中的两类错误,1.第类错误(弃真错误),原假设为真时拒绝原假设,第类错误的概率记为,被称为显著性水平,2.第类错误(取伪错误),原假设为假时未拒绝原假设,第类错误的概率记为,(Beta),13,H,0,: 无罪,假设检验中的两类错误,(决策结果),陪审团审判,裁决,实际情况,无罪,有罪,无罪,正确,错误,有罪,错误,正确,H,0,检验,决策,实际情况,H,0,为真,H,0,为假,未拒绝,H,0,正确决策,(1 ,a,),第类错误(,b,),拒绝,H,0,第类错误(,a,),正确决策,(1-,b,),假设检验就好像一场审判过程,统计检验过程,14,a,和,b,呈相反关系,a,b,降低一类错误的概率另一类错误的概率就会提高,15,显著性水平,(,significant level,),1.是一个概率值,2.原假设为真时,拒绝原假设的概率,被称为抽样分布的拒绝域,3.表示为,(alpha),常用的,值有,0.01, 0.05, 0.10,4.由研究者事先确定,16,拒绝域和显著性水平,拒绝域:原假设 H,0,成立条件下,统计量落入的小概率区域。统计量真的落入拒绝域你会拒绝原假设。,显著性水平,:事先给定的形成拒绝域的小概率,通常, = 0.01,、,0.05,、0.10。,建立拒绝域的根据是什么?根据抽样分布,统计量落入该区域的概率=,。,所谓检验就是选择一个拒绝域。,17,假设检验中的小概率原理,什么小概率?,1.在一次试验中,一个几乎不可能发生的事件发生的概率,2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设,3.小概率由研究者事先确定,什么是小概率?,18,根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量,对样本估计量的标准化结果,原假设,H,0,为真,点估计量的抽样分布,检验统计量,(,test statistic,),标准化的检验统计量,19,显著性水平和拒绝域,(双侧检验 ),抽样分布,0,临界值,临界值,a,/2,a,/2,样本统计量,拒绝,H,0,拒绝,H,0,1 -,置信水平,20,显著性水平和拒绝域,(双侧检验 ),0,临界值,临界值,a,/2,a,/2,样本统计量,拒绝,H,0,拒绝,H,0,抽样分布,1 -,置信水平,21,显著性水平和拒绝域,(双侧检验 ),0,临界值,临界值,a,/2,a,/2,样本统计量,拒绝,H,0,拒绝,H,0,抽样分布,1 -,置信水平,22,显著性水平和拒绝域,(双侧检验 ),0,临界值,临界值,a,/2,a,/2,样本统计量,拒绝,H,0,拒绝,H,0,抽样分布,1 -,置信水平,23,显著性水平和拒绝域,(单侧检验 ),0,临界值,a,样本统计量,拒绝,H,0,抽样分布,1 -,置信水平,24,显著性水平和拒绝域,(左侧检验 ),0,临界值,a,样本统计量,拒绝,H,0,抽样分布,1 -,置信水平,观察到的样本统计量,25,显著性水平和拒绝域,(左侧检验 ),0,临界值,a,样本统计量,拒绝,H,0,抽样分布,1 -,置信水平,26,显著性水平和拒绝域,(右侧检验 ),0,临界值,a,样本统计量,拒绝,H,0,抽样分布,1 -,置信水平,观察到的样本统计量,27,显著性水平和拒绝域,(右侧检验 ),0,临界值,a,样本统计量,抽样分布,1 -,置信水平,拒绝,H,0,28,决策规则,给定显著性水平,,查表得出相应的临界值,z,或,z,/2,,,t,或,t,/2,将检验统计量的值与,水平的临界值进行比较,作出决策,双侧检验,: |,统计量,|,临界值,拒绝,H,0,左侧检验:统计量,临界值,拒绝,H,0,29,什么是,P,值?,(,P,-value),在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率,双侧检验为分布中两侧面积的总和,反映实际观测到的数据与原假设,H,0,之间不一致的程度,被称为观察到的,(,或实测的,),显著性水平,决策规则:,若,p,值,拒绝,H,0,30,双侧检验的,P,值,/,2,/,2,Z,拒绝,H,0,拒绝,H,0,0,临界值,计算出的样本统计量,计算出的样本统计量,临界值,1/2,P,值,1/2,P,值,31,左侧检验的,P,值,0,临界值,a,样本统计量,拒绝,H,0,抽样分布,1 -,置信水平,计算出的样本统计量,P,值,32,右侧检验的,P,值,0,临界值,a,拒绝,H,0,抽样分布,1 -,置信水平,计算出的样本统计量,P,值,33,假设检验步骤的总结,陈述原假设和备择假设,从所研究的总体中抽出一个随机样本,确定一个适当的检验统计量,并利用样本数据算出其具体数值,确定一个适当的显著性水平,并计算出其临界值,指定拒绝域,将统计量的值与临界值进行比较,作出决策,统计量的值落在拒绝域,拒绝,H,0,,,否则不拒绝,H,0,也可以直接利用,P,值作出决策,34,一个总体参数的检验,z,检验,(单尾和双尾),t,检验,(单尾和双尾),z,检验,(单尾和双尾),2,检验,(单尾和双尾),均值,一个总体,比例,方差,35,总体均值的检验,(作出判断),是否已知,小,样本容量n,大,是否已知,否,t 检验,否,z 检验,是,z 检验,是,z 检验,36,总体均值的检验(,2,已知),(例题分析),【例】,一种罐装饮料采用自动生产线生产,每罐的容量是,255ml,,标准差为,5ml,。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了,40,罐进行检验,测得每罐平均容量为,255.8ml,。取显著性水平,=0.05,,检验该天生产的饮料容量是否符合标准要求?,双侧检验,绿色,健康饮品,绿色,健康饮品,255,255,37,总体均值的检验(,2,已知),(例题分析),H,0,:,= 255,H,1,:,255,= 0.05,n,= 40,临界值(,c,):,检验统计量:,z,0,1.96,-1.96,0.025,拒绝,H,0,拒绝,H,0,0.025,决策:,结论:,不拒绝,H,0,样本提供的证据还不足以推翻“该天生产的饮料符合标准要求,”的看法,38,总体均值的检验(z检验),(,P,值的计算与应用),第1步:,进入,Excel,表格界面,直接点击“,f,(,x,),”(粘贴函数),第2步:,在函数分类中点击“统计”,并在函数名的菜单下选择“,NORMSDIST,”,然后确定,第3步:,将,z,的绝对值,1.01,录入,得到的函数值为,0.843752345,P,值=2(1-,0.843752345,)=,0.312495,P,值远远大于,,故不拒绝,H,0,39,总体均值的检验(,2,未知),(例题分析),【例】,一种机床加工的零件尺寸绝对平均误差为,1.35mm,。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取,50,个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?,(,=0.01),左侧检验,50,个零件尺寸的误差数据,(,mm,),1.26,1.19,1.31,0.97,1.81,1.13,0.96,1.06,1.00,0.94,0.98,1.10,1.12,1.03,1.16,1.12,1.12,0.95,1.02,1.13,1.23,0.74,1.50,0.50,0.59,0.99,1.45,1.24,1.01,2.03,1.98,1.97,0.91,1.22,1.06,1.11,1.54,1.08,1.10,1.64,1.70,2.37,1.38,1.60,1.26,1.17,1.12,1.23,0.82,0.86,40,总体均值的检验(,2,未知),(例题分析),H,0,:,1.35,H,1,:, 1.35,= 0.01,n,= 50,临界值(,c,):,检验统计量:,拒绝,H,0,新机床加工的零件尺寸的平均误差与旧机床相比有显著降低,决策:,结论:,-2.33,z,0,拒绝,H,0,0.01,41,总体均值的检验(,z,检验),(,P,值的计算与应用),第1步:,进入,Excel,表格界面,直接点击“,f,(,x,),”(粘贴,函数),第2步:,在函数分类中点击“统计”,并在函数名的,菜单下选择“,ZTEST,”,然后确定,第3步:,在所出现的对话框,Array,框中,输入原始数据所在区,域 ;在,X,后输入参数的某一假定值(这里为,1.35,);在,Sigma,后输入已知的总体标准差(若未总体标准差未,知则可忽略不填,系统将自动使用样本标准差代替),第4步:,用1减去得到的函数值,0.995421023,即为,P,值,P,值=,1-0.995421023=,0.004579,P,值 5200,= 0.05,n,= 36,临界值(,c,):,检验统计量:,拒绝,H,0,(,P,=,0.000088 ,= 0.05),改良后的新品种产量有显著提高,决策:,结论:,z,0,拒绝,H,0,0.05,1.645,45,总体均值的检验(,z,检验),(,P,值的图示),抽样分布,P,=,0.000088,0,1.645,a,=,0.05,拒绝,H,0,1 -,计算出的样本统计量=3.75,P,值,46,2.总体均值的单边(单尾)检验,H,0,:, ,0,或,H,0,:,0,1)是否对Hilltop咖啡投诉?,联邦贸易委员会(FTC)意欲对大瓶Hilltop咖啡,进行检查,以确定是否符合其标签上注明的“容量,至少是3磅”的说法,并由此决定是否因为包装重量,的不足而对其提出投诉。,假设检验问题,H,0,:,3,H,1,:3.,给定显著水平=0.05,给出一个检验方法。,请你说出该显著水平在这一问题中有什么实际意,义?,47,总体均值的检验,(,大,样本检验方法的总结),48,总体均值的检验,(小样本),1.假定条件,总体服从正态分布,小样本(,n,=0.05,,故不拒绝,H,0,53,三、总体比率的检验,1.总体比率单边检验,H,0,: p,p,0,或,H,0,: p,p,0,例:,Pine Greek高尔夫球场的性别比率,问题。400个运动者中100个女性,能否认为女性比,率比过去的20%增加了?,解 H,0,: p,0.20, H,1,: p0.20;,拒绝域的形状:,54,当,=0.05时,拒绝域为,你的结论? =0.250.2329 拒绝,H,0,利用大样本下样本比率的抽样分布得到拒绝域为:,55,2.总体比率的双边检验,给定显著性水平,大样本情况下你能写出相应的拒绝域吗?,56,总体比例的检验,(检验方法的总结),57,总体比例的检验,(例题分析),【例】,一种以休闲和娱乐为主题的杂志,声称其读者群中有,80%,为女性。为验证这一说法是否属实,某研究部门抽取了由,200,人组成的一个随机样本,发现有,146,个女性经常阅读该杂志。分别取显著性水平,=0.05,和,=0.01,,检验该杂志读者群中女性的比例是否为,80%,?它们的值各是多少?,双侧检验,58,总体比例的检验,(例题分析),H,0,:,= 80%,H,1,:,80%,= 0.05,n,= 200,临界值(,c,):,检验统计量:,拒绝,H,0,(,P,=,0.013328 ,= 0.01),样本提供的证据还不足以推翻“该杂志声称读者群中有80%为女性”的看法,决策:,结论:,z,0,2.58,-2.58,0.025,拒绝,H,0,拒绝,H,0,0.025,60,总体方差的检验,(,2,检验,),检验一个总体的方差或标准差,假设总体近似服从正态分布,使用,2,分布,检验统计量,样本方差,假设的总体方差,61,总体方差的检验,(检验方法的总结),62,总体方差的检验,(例题分析),【例】,啤酒生产企业采用自动生产线灌装啤酒,每瓶的装填量为,640,ml,,但由于受某些不可控因素的影响,每瓶的装填量会有差异。此时,不仅每瓶的平均装填量很重要,装填量的方差同样很重要。如果方差很大,会出现装填量太多或太少的情况,这样要么生产企业不划算,要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过和不应低于,4,ml,。企业质检部门抽取了,10,瓶啤酒进行检验,得到的样本标准差为,s,=3.8,ml,。试以,0.10,的显著性水平检验装填量的标准差是否符合要求?,朝日,BEER,朝日,BEER,朝日,BEER,朝日,63,总体方差的检验,(例题分析),H,0,:,2,= 4,2,H,1,:,2,4,2,= 0.10,df,= 10 - 1 = 9,临界值(,s,):,统计量:,不拒绝,H,0,样本提供的证据还不足以推翻“装填量的标准差否符合要求”的看法,2,0,16.9190,3.32511,/2 =0.05,决策:,结论:,64,四、整理假设检验的思路,1.假设检验的过程,1)确定适当的原假设和备择假设;,2)选择检验统计量;,3)指定显著水平,即,“允许犯第一类错误的,最大,概率”;,4)根据显著水平和统计量的抽样分布来确定统计量,的临界值,从而确定拒绝域;,5)根据样本计算统计量的值并与临界值比较看是否,落入拒绝域;,6)得出结论。,65,2.原假设,H,0,和备择假设H,1,的选定,1),假设检验是概率意义下的反证法,根据N-P原则,否定,H,0,(即肯定H,1,)把握更大,犯错误只是事先控制的,小概率,所以把希望得到的结果做为备择假设.,2),把可能被推翻的标准、宣示、结论做为原假设,因此带“=”的标志(,、=、,)置于,H,0,.,3)把比较保守的论断置于,H,1。,4),原假设和备择假设的地位不对等,内容不能互换:,H,0,:,H,1,: 拒绝域:,c,0,H,0,:,H,1,: 拒绝域:,c,0,66,原假设,H,0,和备择假设H,1,的选定(续),5)如果统计量值 , 不必检验 H,0,: ,,因为,一定不在拒绝域;同理,如果统计量值 ,不必检验 H,0,: 。,6),如果实际问题要求,不,否定,H,0,就必须肯定H,0,:则只,有增大,值,=0.10、甚至,= 0.25 都不能,否定,H,0,才,接受,H,0,.,67,3.,显著水平,a,与拒绝域,H,0,:,m,3,H,1,:,m, 3,H,0,:,m,=,3,H,1,:,m,3,a,a,a,/2,拒绝域,临界值,68,4.置信区间和双边检验,总体均值的95%置信区间是什么?它和双边检验的拒绝域有什么关系?,启示-通过置信区间进行双边检验:,找出的95%置信区间为 ( ) 。,做双边检验,H,0,:, = ,0,时,如果,0,落入上述置信,区间,则相当于没有落入显著性水平= 0.05 的拒绝域, 从而没有 充分的理由否定,H,0,。相反,如果,0,落入上述置信区间之外,则相当于落入拒绝域, 从而以显著性水平= 0.05 否定,H,0,。,69,5.单个总体检验小结,假设检验的基本思路和概念,均值的双边单边检验,比率的双边单边检验,双边检验和区间估计的关系,70,更多的例子,Ford Taurus宣称在高速路上行驶的油耗为30英里/加仑。一个保护消费者利益的小组对汽车进行检验。从的50次高速路行驶组成的样本中,得到样本平均为29.5英里/加仑,样本标准差为1.8英里/加仑。取显著性水平0.01,得出你的结论。,71,72,1,一个快餐店决定计划实施一次特殊供应,使顾客能购买到专门印有著名卡通人物的杯装饮料。如果有超过15%的消费者购买这种饮料,则认为可以推行这种特殊供应。在某些地方已经进行的初步试验表明,500名消费者有88名购买了这种杯装饮料。是否应推行这种特殊杯装饮料?当显著性水平为0.01时,得出你的建议。,73,74,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!