假设检验的概念及t.ppt

上传人:sh****n 文档编号:2816270 上传时间:2019-11-30 格式:PPT 页数:40 大小:582KB
返回 下载 相关 举报
假设检验的概念及t.ppt_第1页
第1页 / 共40页
假设检验的概念及t.ppt_第2页
第2页 / 共40页
假设检验的概念及t.ppt_第3页
第3页 / 共40页
点击查看更多>>
资源描述
第八章 假设检验的概念及t检验,统计推断,统计推断 statistical inference,如:样本均数 样本标准差S 样本率 P,如:总体均数 总体标准差 总体率,内容: 参数估计(estimation of parameters) 包括:点估计与区间估计 2. 假设检验(test of hypothesis),实例,通过以往大规模调查,已知某地一般新生儿的头围均数为34.50cm。为研究某矿区新生儿的发育状况,现从该地某矿区随机抽取新生儿55人,测得其头围均数为33.89cm,问该矿区新生儿的头围总体均数与一般新生儿头围总体均数是否不同?,假设检验的步骤及有关概念,总体间差异: 1. 个体差异,抽样误差所致; 2. 总体间固有差异 判断差别属于哪一种情况的统计学检验,就是假设检验。 小概率思想: P(0.05) 样本差别无统计学意义,假设检验(test of hypothesis):,事先对总体的特征作出某种假设,通过分析样本数据,判断该样本信息是否支持这种假设,最后作出拒绝或不拒绝这种假设的取舍抉择。此方法称作假设检验。,1、建立假设与确定检验水准() H0: 12 无效假设(null hypothesis) H1: 12 备择假设(alternative hypothesis) 检验水准(level of a test):=0.05(双侧) 2、选定方法和计算统计量: 根据统计推断目的、设计、资料组数、样本含量、等选择方法。如两组小样本比较用t检验、大样本比较u检验、方差齐性检验用F检验。 3、确定P值,作出判断 P(0.05) 样本差别有统计学意义; P (0.05) 样本差别无统计学意义 P值:指在H0成立的假设前提下,出现当前检验统计量以及更极端情况的概率。,假设检验的步骤,1.差异来源 该矿区新生儿总体均数与一般新生儿头围总体均数相同 该矿区新生儿总体均数与一般新生儿头围总体均数不同 H0:= 034.50 , H1: 034.50 单凭一份样本不可能证明哪一个正确,可考虑样本资料和哪一个假设有较大的矛盾来决定拒绝哪一个假设。一般考察样本资料是否与H0有较大的矛盾,分析思路,2. H0成立时会怎样? 所得u值因样本而异,但其绝对值多数情况下落在0附近。u的分布规律可由u界值表查出 3.当前状况如何,发生的可能性(P值)有多大? n=55, =33.89, 0 =34.50 得u=-2.273,拒绝域 接受域 拒绝域,P值系指在H0成立的假设前提下,出现当前检验统计量以及更极端情况的概率。 查u界值表,当前u值以外的双侧尾部面积 介于0.05和0.02之间 4.决策 决策者需要事先规定一个可以忽略的小概率值。如取0.05,那么上述P值可认为很小。即H0成立时,几乎不可能出现当前的状况。,于是,面临两种抉择,一是认为H0是成立的,而当前的极端情况又恰好偶然发生了;二是怀疑H0的正确性,从而接受H1。通常选择后者。本例,可认为该矿区新生儿总体均数与一般新生儿头围总体均数不同。,例8-2:1995年,某地20岁应征男青年平均身高为168.5cm。2003年在当地20岁应征男青年中随机抽取85人,平均身高为171.2cm,标准差为5.3cm,问这两年身高是否不同。 解:总体方差一般未知,当样本含量足够大时,用S作为 的估计值。 1 建立假设,确定检验水准 H0: 168.5, H1: 168.5 0.05,2 计算统计量u 3 确定P值,下结论 查u界值表, 4.70 u 0.001/2=3.2905,得P 0.001,按照 0.05水准,拒绝H0,接受H1,可认为2003年20岁应征男青年身高有变化,比1995年增高了。,例8-3:为比较某药治疗流行性 出血热疗效,将72名患者随机分为试验和对照组,结果分别为n1=32, =2.9,S1=1.9;n2=40, =5.2,S2=2.7,问试验组和对照组的平均退热天数有无差别。 解:可用两组大样本资料的u检验 H0:1=2 ,H1:1 2 0.05,二 两均数比较的u检验,u-4.23 查u界值表,4.23 u 0.001/2=3.2905,得P 0.001,按照 0.05水准,拒绝H0,接受H1,可认为试验组和对照组退热天数的总体均数不等,疗效不同。试验组比对照组平均退热天数短。 1-2 的95可信区间为-3.3-1.3天,型错误和型错误,(1b)即把握度(power of a test):两总体确有差别,被检出有差别的能力 (1a)即可信度(confidence level):重复抽样时,样本区间包含总体参数(m)的百分数,对于一般的假设检验, a定为0.05(或0.01),b的大小取决于H1。通常情况下,比较总体间有无差异并不知道,即H1不明确, b值的大小无法确定,也就是说,对于一般的假设检验,我们并不知道犯型错误的概率b有多大。,通常情况下型错误未知,a,b,减少(增加)I型错误,将会增加(减少)II型错误 增大n 同时降低a 与 b,a 与 b 间的关系,假设检验注意事项,(1)可比性(随机性抽样、分组,资料具有均衡性和可比性) (2)正确选用假设检验方法 (3)“差别”的实际意义(正确理解差别有统计学意义的涵义。有统计学意义指:样本来自不同的总体,而并非指差别很大,不能说明差别的大小.当专业上和统计学上都有“显著性意义”时,才有实用价值。),假设检验注意事项,(4)判断结论时不能绝对化(原因是存在着两类错误 写出精确P值:若对同一研究内容,A研究的结果P=0.002,B研究的结果P=0.04,虽结果均为拒绝H0,但A结果更为可信. (5)单侧检验与双侧检验 (6)报告结果应写出统计量值、具体P值(单侧时应注明);95CI既能说明差别的大小,也具有检验的作用,建议使用。(可信区间与假设检验均为统计推断方法,可信区间可以检验差值大小,假设检验可精确表示相关事件的概率。统计结果同时报告检验统计量、P值和可信区间更值得提倡。),第十章 t检验(t test),t检验,亦称student t检验(Students t test),主要用于样本含量较小(例如n30),总体标准差未知的正态分布资料。 一、样本均数与总体均数的比较 二、配对资料的比较 三、两样本均数的比较 四、两方差齐性检验,一、样本均数与总体均数的比较,推断样本所代表的未知总体均数与已知总体均数0有无差别。 已知总体均数0一般为理论值、标准值或经大量观察所得的稳定值。 统计量t的计算公式:,实 例,附表2 t界值表,二、配对资料的比较,两种情况:1.随机配对设计(randomized paired design)是将受试对象按某些混杂因素(如性别、年龄、窝别等)配成对子,每对中的两个个体随机分配给两种处理(如处理组与对照组);2.或者同一受试对象作两次不同的处理(自身对照)。 优点:配对设计减少了个体差异。 特点:资料成对,每对数据不可拆分。,表3-4 两法测定12份尿铅含量的结果,表3-3 两法测定12份尿铅含量的结果,三、两样本均数的比较,完全随机设计(completely random design) :把受试对象完全随机分为两组,分别给予不同处理,然后比较独立的两组样本均数。各组对象数不必严格相同。 目的:比较两总体均数是否相同。,条件:假定资料来自正态总体,12=22,实 例,2. 方差齐性检验,Ylog (X+a) Y Y,Y,方差齐性检验,t检验的类型,样本均数与总体均数比较的t检验 (单组设计) (one sample t test) 配对设计定量资料的t检验 (paired t-test) 成组设计定量资料的t检验 (two sample t test),小 结,三个概念,1 独立性 :指一批实验数据彼此之间是互相独立的。例如测得不同学生的身高、不同学生的考试成绩。 2 正态性:是指每个影响因素各水平组的定量资料来自于正态或近似正态分布的总体。 3 方差齐性:指每个影响因素各水平组的总体方差应当相等。,一 单组设计的特点及应满足的前提条件,1 设计特点:对一组同质的受试对象不按任何其它因素分组,直接观测或给予一种特定处理后观测这些受试对象某种或多种指标的取值。 2 已知总体均数0一般为理论值、标准值或经大量观察所得的稳定值。 3 前提条件:样本数据满足正态或近似正态分布。 4 统计量的计算:,二 配对设计的特点及应满足的前提条件,1 设计特点:A 随机配对设计(randomized paired design)是将受试对象按某些混杂因素(如性别、年龄、窝别等)配成对子,每对中的两个个体随机分配给两种处理(如处理组与对照组);B.或者同一受试对象作两次不同的处理(自身对照)。 优点:配对设计减少了个体差异。 资料成对,每对数据不可拆分。 2 前提条件:成对数据间的差值满足正态或近似正态分布。 3 统计量的计算:,三 成组设计的特点及资料应满足的前提条件,1 设计特点:完全随机设计(completely random design) :把受试对象完全随机分为两组,分别给予不同处理,然后比较两组样本均数。两组数据是独立的,两组对象数不必严格相同。 2 前提条件:两组数据间是互相独立的、两组数据分别服从正态或近似正态分布、两组资料所对应的总体方差相等。 3 统计量的计算:,五、资料不满足正态与方差齐时进行检验之对策,1 对数变换:常用于数据呈正偏态分布,较小数据多,较大数据少。 2 平方根变换:常用于服从Poisson分布的资料,算术均数=方差。 3 倒数变换:常用在数据呈极严重的正偏态分布,变换后可使特大数据变小,资料近似正态。,对策,五、资料不满足正态与方差齐时进行检验之对策,平方根反正弦 常用于百分率数据(如白血病患者的淋巴细胞转化率,脑电图波的变化率等) 当数据有负数时,作对数或平方根变换可对原始数据相加一个常数使其变为正数。 近似t检验(separate variance estimation t-test) t检验 非参数检验-秩和检验,对策,两 均 数 比 较,样本与总体,单样本t检验,配对,配对t检验,方差齐性,变量变化,两样本,t检验,两样本t检验,非配对,不齐,齐,差值呈正态,秩和检验,指标呈正态,分析思 路,讨论题,1 要比较一组肺结核病人治疗前后的淋巴细胞与白细胞总数的百分比,以评价治疗效果,可用( ) A 2检验 B t检验 C 配对2检验 D 配对t检验 2 对两样本均数进行假设检验时,P值越小,说明( ) A 两总体均数有差别的可能性越大 B 两总体均数有差别的可能性越小 C 两总体均数相差越大 D 两总体均数越小 3 两组数据中的每个变量值减同一常数后做两个均数差别的t 检验( ) A t值不变 B t值变小 C t值变大 D t值不能确定,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!