资源描述
单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,BX-STEEL,演示文档,路漫漫其悠远,少壮不努力,老大徒悲伤,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,均值检验(T检验)规范,目标:,了解T检验及其应用,主要内容:,单个正态总体均值的Z或T检验,两个正态总体均值的T检验,成对数据T检验,T检验用于在已知变量为正态总体但未知总标准,差的情况下,对总体均值进行区间估计或假设检,验,是在现实问题中非常常用的一种检验,T检验,T检验用于均值检验。用来检验标准试样测定,结果的平均值与标准值之间是否有显著差异。,也就是将样本的平均值与目标值或与其它样本,的平均值相比较。,当影响因子为计数型,响应变量为计量型,时,可采用T检验,。,T检验有单侧检验和双侧检验之分。通,过查看P值确定样本之间均值是否存在,显著差异。,T检验,1、连续数据呈现正态分布(如果数据为非正,态分布,则需要进行数据转换,将非正态,数据转换成正态数据),2、数据来自稳定的数据源,3、数据之间彼此独立,4、数据具有代表性,T检验的前提条件,数据,类型,比较内容,工具,连,续,数,据,一组数据的平均值与目标值相比较,1样本t/Z,两组数据的平均值相比较,2样本t,两组成对数据的平均值相比较(或当数据匹配时,比较两组平均值),成对t,T检验的类型,单样本Z检验,单样本Z检验使用条件,检验整体均值是否与目标数值相等,样本量大,n=30,总体标准差已知或者用样本标准差S代替,单样本Z检验,从历史记录上得知,快递公司投送发往美国的邮件,平均投递时间为80小时,标准差为14小时。现随机抽取了40份邮件的投递时间记录,试分析发往美国的邮件的平均投递时间是否低于80小时?取显著水平,=0.05.。,数据BS-投递时间,单样本Z检验,例:,单样本Z检验,1、建立假设:,H0:,=80,H1:80,2、样本容量的确定,统计功效和样本数量1Z单样本,功效和样本数量,单样本,Z,检验,检验平均值,=,零(与,零),计算功效的平均值,=,零,+,差值,Alpha = 0.05,假定标准差,= 14,样本,差值 数量 目标功效 实际功效,7.4 47 0.95 0.951918,7.4 38 0.90 0.902920,7.4 29 0.80 0.812321,单样本Z检验,单样本Z检验,3、正态性检验,统计正态性检验,单样本Z检验,4、进行检验,单样本Z检验,单样本 Z: 投递时间,mu,= 80,与, 80,的检验,假定标准差,= 14,平均值,变量,N,平均值 标准差 标准误,95%,上限,Z P,投递时间,40 72.60 11.44 2.21 76.24 -3.34 0.000,P=0.035,0,-,单边假设检验,H,0,: ,0, Ha:,0,-,单边假设检验,单样本T检验,骤步骤2:,选择检验统计量,这里,0,是定值,n为样本容量,X与S是两个随,机变量,表示样本x,1,,x2,xn的均值与标准,差,t(n-1)是自由度为n-1的t分布。,单样本T检验,步骤3:给出检验中的显著性水平,常取=0.05,根据问题的具体情况,也可取= 0.01或0.10,步骤4:给出临界值、确定拒绝域,根据选择的检验统计量的分布,以及给定的显著性水平,可确定临界值和拒绝域,但在不同的三类假设下,拒绝域是不同的,单样本T检验,步骤5:根据样本观察值,计算检验统计量的值,并作判断,判断方法:,(1)若检验统计量的值落在拒绝域中,则拒绝原假设。,(2)由检验统计量计算P值,当P功效和样本数量1t单样本,单样本T检验,单样本 t 检验,检验平均值 = 零(与 零),计算功效的平均值 = 零 + 差值,Alpha = 0.05 假定标准差 = 0.137,样本,差值 数量 目标功效 实际功效,0.087 29 0.95 0.954539,0.087 23 0.90 0.904048,0.087 17 0.80 0.805185,单样本T检验,3、正态性检验,单样本T检验,进行T检验,单样本T检验,单样本 T: 面粉重量,平均值,变量 N 平均值 标准差 标准误 95% 置信区间,面粉重量 30 20.0870 0.1371 0.0250 (20.0358, 20.1382),单样本 T: 面粉重量,mu = 20 与 20 的检验,平均值,变量 N 平均值 标准差 标准误 95% 置信区间 T P,面粉重量 30 20.0870 0.1371 0.0250 (20.0358, 20.1382) 3.47 0.002,统计结论:P=0.0020.05则拒绝H0,业务结论:面粉平均重量已有显著变化,生产不正常,单样本T检验,MINITAB还给出非常直观的图形帮助判断,当H0,所对应的均值未落入均值的置信区间时,拒绝原假,设。本例H0未落入置信区间,即面粉重量与20kg,有显著差别,生产不正常。,某车间所加工的轴棒要求平均长度为500mm,检验员对,生产轴棒随机抽取了25根,测量结果得样本均值501mm,样本标准差为1mm。问:在显著性水平,=0.05下,这,批轴棒长度均值能认为是500mm吗?,单样本T检验,建立假设,H0:,=500 H1:,500,由于是小样本,并且,未知,选用单样本T检验,单样本T检验,单样本 T,mu = 500 与 500 的检验,平均值,N,平均值 标准差 标准误,95%,置信区间,T P,25 501.000 1.000 0.200 (500.587, 501.413) 5.00 0.000,P=0.000,2,单边假设检验,H,0,: ,1,2, H,1,: ,1,2,1、2分别代表空气和纯氧条件下的BOD含量,双样本T检验,2、计算样本量,统计功效和样本数量2t单样本,双样本,t,检验,检验平均值,1 =,平均值,2,(与,),计算平均值,1,的功效,=,平均值,2 +,差值,Alpha = 0.05,假定标准差,= 12.94,样本,差值 数量 目标功效 实际功效,17.1 16 0.95 0.951102,17.1 14 0.90 0.919923,17.1 11 0.80 0.838288,样本数量是指每个组的。,双样本T检验,3、正态性检验,统计基本统计量正态性检验 或“图形概率图”,双样本T检验,4、方差齐性检验,HO: H1:,双样本T检验,等方差检验,:,空气,氧气,N,下限 标准差 上限,空气,20 11.2178 15.3118 23.7225,氧气,20 8.4788 11.5731 17.9302,F,检验(正态分布),检验统计量,= 1.75, p,值,= 0.231,Levene,检验(任何连续分布),检验统计量,= 0.99, p,值,= 0.327,结论:两正态总体的方差在,显著性水平=0.05下无显著差异,5、检验,双样本T检验,双样本T检验,双样本 T 检验和置信区间: 空气, 氧气,空气 与 氧气 的双样本 T,平均值,N 平均值 标准差 标准误,空气 20 188.8 15.3 3.4,氧气 20 171.6 11.6 2.6,差值 = mu (空气) - mu (氧气),差值估计: 17.25,差值的 95% 置信下限: 10.01,差值 = 0 (与 ) 的 T 检验: T 值 = 4.02 P 值 = 0.000 自由度 = 38,两者都使用合并标准差 = 13.5718,统计结论:P=0.000功效和样本数量2t单样本,检验平均值,1 =,平均值,2,(与,),计算平均值,1,的功效,=,平均值,2 +,差值,Alpha = 0.05,假定标准差,= 2.245,样本,差值 数量 目标功效 实际功效,2.702 12 0.80 0.804387,2.702 16 0.90 0.908798,2.702 19 0.95 0.950427,双样本T检验,3、正态性检验,统计基本统计量正态性检验 或“图形概率图”,双样本T检验,4、方差齐性检验,HO: H1:,等方差检验,: A, B,95%,标准差,Bonferroni,置信区间,N,下限 标准差 上限,A 21 1.65614 2.24529 3.43277,B 21 0.73698 0.99916 1.52759,F,检验(正态分布),检验统计量,= 5.05, p,值,= 0.001,Levene,检验(任何连续分布),检验统计量,= 17.32, p,值,= 0.000,P=0.0010,0,成对T检验,很显然,这些都是单个正态总体均值是否为0的检验问题,成对t-检验比较数据,成对,时两个总体的平均值差异,成对T检验,为了降低变异性(部件间的差异) 并作出,更精确,的估测,(更小的置信区间)。,为何使用?,成对T检验,1、每个取样单位均采用两种计量方式。例如:,交易、打电话、员工、处理等。,2、第二组的计量方式不独立于第一组的计量方,式它们是匹配的或成对的,对,同一件试验单元,或在相似条件下进行两次测量,成对T检验,两个相关的样本必需是随机抽取的,每个抽样整体都应该大致呈正态分布,成对T检验,1、建立假设,Ho: 1 - 2 = 0,H1: 1 - 2 = 0,H1: 1 - 2 0,或H,0,:,=0 H,1,:,0,H,1,:, 0,H,1,:,基本统计量成对t检验,分别输入数据变量名,按options,输入置信水平95.0,检验均值0.0,备择假设:not equal,OK,成对T检验,成对T检验,想要比较某种减肥药物的疗效,选定了21人进行实验,,收集了每个人服用减肥药前后的体重数据(BS-配对t检,验)。在,=0.05水平上,服用药物后体重是否有显著,的降低?,1、建立假设:,H0:,=0,H1: 0,2、正态性检验,统计基本统计量正态性检验 或“图形概率图”,成对T检验,3、进行检验,配对 T 检验和置信区间: x(服药前), y(服药后),x(服药前) - y(服药后) 的配对 T,平均值,N 平均值 标准差 标准误,x(服药前) 21 91.43 8.32 1.82,y(服药后) 21 86.38 8.07 1.76,差分 21 5.05 5.21 1.14,平均差的 95% 置信区间: (2.68, 7.42),平均差 = 0 (与 0) 的 T 检验: T 值 = 4.44 P 值 = 0.000,统计结论:P=0.0000.05,拒绝原假设,业务结论:服用减肥药后体重有明显的降低。,成对T检验,配对 T 检验和置信区间: x(服药前), y(服药后),x(服药前) - y(服药后) 的配对 T,平均值,N 平均值 标准差 标准误,x(服药前) 21 91.43 8.32 1.82,y(服药后) 21 86.38 8.07 1.76,差分 21 5.05 5.21 1.14,平均差的 95% 置信区间: (2.68, 7.42),平均差 = 0 (与 0) 的 T 检验: T 值 = 4.44 P 值 = 0.000,统计结论:P=0.0000.05,拒绝原假设,业务结论:服用减肥药后体重有明显的降低。,成对T检验,实例:某团队对测量矿石中二氧化锰的两种分析,方法进行对比,随机从 过程的产品中抽样,将,同一个样品用两种实验分析分别测量二氧化锰含,量 各一次,数据记录见文件(成对数据T检验,1 ),问两种分析方法的结果有无显著差异?,(取显著性水平=0.05),成对T检验,Paired T-Test and CI: A, B,Paired T for A - B,N Mean StDev SE Mean,A 11 7.61818 3.90303 1.17681,B 11 7.40909 3.89036 1.17299,Difference 11 0.209091 0.284445 0.085763,95% CI for mean difference: (0.017998, 0.400184),T-Test of mean difference = 0 (,vs,not = 0): T-Value = 2.44 P-Value = 0.035,统计结论:,P0.0350.05,拒绝原假设,,业务结论:,两种分析方法的结果有显著差异,Two-Sample T-Test and CI: A, B,Two-sample T for A,vs,B,N Mean,StDev,SE Mean,A 11 7.62 3.90 1.2,B 11 7.41 3.89 1.2,Difference =,mu,(A) -,mu,(B),Estimate for difference: 0.209091,95% CI for difference: (-3.268591, 3.686773),T-Test of difference = 0 (,vs,not =): T-Value = 0.13 P-Value = 0.901 DF = 19,成对T检验,假设检验有助于确定差异是确实存在,还是偶然发生。,置信区间给出总体值,(,参数,),最可能的取值范围,
展开阅读全文