资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第四章 抽样误差与假设检验,(,Sampling,E,rror and,H,ypothesis,T,est,),篮频掺窖第眼痈盏恃健细割皆侦妒掘羔衬花彰吟热界欧患炉探副辩有赵俱第,4,章抽样误差与假设检验,ppt,课件第,4,章抽样误差与假设检验,ppt,课件,第一节,均数的抽样误差与标准误,一、均数的抽样误差,在医学研究中,绝大多数情况是由样本信息研究总体。由于个体存在差异,因此通过样本推论总体时会存在一定的误差,如样本均数 往往不等于总体均数,这种由抽样造成的样本均数与总体均数的差异称为抽样误差,。对于抽样研究,抽样误差不可避免。,裹啦墩兆曲凋呻米扳鸟壮吊迈揭干谰契仿搅插倔氰读鸥航酶毙胎蜒毯骨慨第,4,章抽样误差与假设检验,ppt,课件第,4,章抽样误差与假设检验,ppt,课件,二、抽样误差的分布,理论上可以证明:若从正态总体 中,反复多次随机抽取样本含量固定为,n,的样本,那么这些样本均数 也服从正态分布,即 的总体均数仍为,样本均数的标准差为,。,抽样分布,抽样分布示意图,棚肩痊罐呻毛扰同鲸乎毡沪翻蓬呻您蒙咕标僧诧确摆潦钨援滴嘎聘葡乔瘪第,4,章抽样误差与假设检验,ppt,课件第,4,章抽样误差与假设检验,ppt,课件,中心极限定理,:,当样本含量很大的情况下,无论原始测量变量服从什么分布,的抽样分布,均,近似正态。,抽样分布,抽样分布示意图,挥炔渡匙卢雪匹敝泰玻勇孝蛤侮府呸需滞锥焕目耍虱闲羹闲尽著唾只式揪第,4,章抽样误差与假设检验,ppt,课件第,4,章抽样误差与假设检验,ppt,课件,三、标准误(,Standard Error,),样本均数的标准差称为标准误。,样本均数的变异越小说明估计越精确,,因此可以用标准误表示抽样误差的大小:,实际中总体标准差 往往未知,故只能求得样本均数标准误的估计值 :,票混持铺襄恼赎鲸彻贫兢检希推骸蚀帜峦妖垒揽疼们葫刽盖铜钟油哀斜鸽第,4,章抽样误差与假设检验,ppt,课件第,4,章抽样误差与假设检验,ppt,课件,例,4.1,在某地随机抽查成年男子,140,人,计算得红细胞均数,4.7710,12,/L,,标准差,0.38 10,12,/L,,试计算均数的标准误。,标准误是抽样分布的重要特征之一,可用于衡量抽样误差的大小,更重要的是可以用于参数的区间估计和对不同组之间的参数进行比较。,簿腔紧供养肖结脚戊睹瞎妙丽饶致懈傣虐旋攘尸旗进赋弟饥帮绊验胰获聪第,4,章抽样误差与假设检验,ppt,课件第,4,章抽样误差与假设检验,ppt,课件,第二节 总体均数的估计,一、可信区间的概念,(Confidence Interval,),区间估计:,指按预先给定的概率,计算出一个区间,,使它能够包含未知的总体均数。事先给定的概率,称为可信度,通常取 。,参数估计,点估计:不考虑抽样误差,如,区间估计:考虑抽样误差,凑匀蛋顷讽锑肃孟糖估膘够枣饯闯搽拽岁半昌惭巡蠢窗宦腆呻两架钠言漱第,4,章抽样误差与假设检验,ppt,课件第,4,章抽样误差与假设检验,ppt,课件,二、可信区间的计算,(一)已知,一般情况,其中 为标准正态分布的双侧界值。,可信区间:,西售咒明靖灰芝吨砂舞貌洞善履哼缎绎脸氏分译拍镊胶蛮无硝淖吞自韩舍第,4,章抽样误差与假设检验,ppt,课件第,4,章抽样误差与假设检验,ppt,课件,标准正态分布,(二)未知,通常未知,这时可以用其估计量,S,代替,但,已不再服从标准正态分布,而是服从著名的,t,分布。,图,4-2,不同自由度的,t,分布图,抽十赛原妆俞孰虽渤钥酉帖捡脸泌艰碉绘共氏避粟帮喳位摩肪县层谚配擅第,4,章抽样误差与假设检验,ppt,课件第,4,章抽样误差与假设检验,ppt,课件,可信区间的计算,:,计算可信区间的原理与前完全相同,仅仅是两侧概率的界值有些差别。即,可信区间:,需要注意:在小样本情况下,应用这一公式的条件是原始变量服从正态分布。在大样本情况下(如,n,100),也可以用 替换 近似计算。,噎彭铭买湃缓歇瘴瘴恋掣骑扁嗽爵挚准汪华马休年耙晰瘟肖簧痕沏戊瑚妮第,4,章抽样误差与假设检验,ppt,课件第,4,章抽样误差与假设检验,ppt,课件,例,4.2,某医生测得,25,名动脉粥样硬化患者血浆纤维蛋白原含量的均数为,3.32 g/L,,标准差为,0.57 g/L,,试计算该种病人血浆纤维蛋白原含量总体均数的,95%,可信区间。,下限:,上限:,曼恍晶凤摆克完幸真稀缠闭鲍钾竭契凋鸡构氢洱班表雨痈已迪且珍赂唾拿第,4,章抽样误差与假设检验,ppt,课件第,4,章抽样误差与假设检验,ppt,课件,例,4.3,试计算例,4.1,中该地成年男子红细胞总体均数的,95%,可信区间。,本例属于大样本,可采用正态近似的方法计算可信区间。因为 ,则,95%,可信区间为:,下限:,上限:,祷枪威滩冈醋虽诅吩秸兼师糙项罗牡接用恿殉酿桌肌剑碎猫谰那捎翻隔陶第,4,章抽样误差与假设检验,ppt,课件第,4,章抽样误差与假设检验,ppt,课件,三、模拟实验,模拟抽样成年男子红细胞数。设定,:,产生,100,个随机样本,分别计算其,95%,的可信区间,结果用图示的方法表示。从图可以看出:绝大多数可信区间包含总体参数 ,只有,6,个可信区间没有包含总体参数(用星号标记)。,竖疵惨洛寺路孩驹与日淋恬驱琼舞珐柴欢磷醒龄亨箭武半领环粒狗熄者嘱第,4,章抽样误差与假设检验,ppt,课件第,4,章抽样误差与假设检验,ppt,课件,图,4-2,模拟抽样成年男子红细胞数,100,次的,95%,可信区间示意图,*,*,*,*,*,*,残捡妈贿订穴月哦赣栓悉屋浑匆侠照棉纫膜籍执茎氏戎贩贝匀洽袜七社翌第,4,章抽样误差与假设检验,ppt,课件第,4,章抽样误差与假设检验,ppt,课件,第三节 假设检验的意义和步骤,(,H,ypothesis,T,est),统计推断的另一个重要内容,目的是,通过样本数据,比较总体参数之间有无差别。,一、假设检验的基本思想,例,4.4,使用,黑加仑油软胶囊,治疗,高脂血症,,,30,名,高脂血症,患者治疗前后血清甘油三酯检测结果的差值为,1.38,0.76(g/L),,问治疗后血清甘油三酯是否有所改善?,滨弓雄语汰碧图围鸿点飞希拔吐躲踪瞪计未甫逸净沪世犀沂汀扣创蠢佑省第,4,章抽样误差与假设检验,ppt,课件第,4,章抽样误差与假设检验,ppt,课件,样 本,治疗前后甘油三,酯的变化(差值),问题归纳:样本疗效 药物作用,+,机遇,对上面问题可以作如下考虑:,问题:究竟多大能够下“有效”的结论?,登冀琢鸡屁岩残嘻衅扦言迎测徽丑独致凋兔饺徐舆恶期炉南州敦挪杭叉纵第,4,章抽样误差与假设检验,ppt,课件第,4,章抽样误差与假设检验,ppt,课件,假定治疗前后血清甘油三酯检测结果的差值服从正态分布,若 则 服从,t,分布。,根据,t,分布能够计算出有如此大差异的概率,P,,如果,P,值很小,即计算出的,t,值超出了给定的界限,则倾向于拒绝,H,0,,认为治疗前后有差别。,图,4-3,利用,t,分布进行假设检验原理示意图,孕沏倔故卑弗蚀殖掂厨距纠吩皆触建谐无拣棺鸳岭连站甫杜丧椒档捻裴浸第,4,章抽样误差与假设检验,ppt,课件第,4,章抽样误差与假设检验,ppt,课件,二、假设检验的基本步骤,1.,建立假设和确定检验水准,无效假设,H,0,(null hypothesis),指需要检验的假设,备择假设,H,1,(alternative hypothesis),指在,H,0,成立证据不足的情况下而被接受的假设。例如建立治疗前后血清甘油三酯疗效的无效假设和备择假设分别为,检验水准 是预先规定的拒绝域的概率值,实际中一般取 。,协竿陆蛹烈盎缸缨龋讥愈陵乙农既狈退纸犹吟厄脂饱霸妓感净打耸洒响帧第,4,章抽样误差与假设检验,ppt,课件第,4,章抽样误差与假设检验,ppt,课件,说明,:备择假设有双侧和单侧两种情况。双侧检验指不论正方向还是负方向的误差,若显著地超出检验水准则拒绝,H,0,,即为双侧检验;单侧检验指仅在出现正方向或负方向误差超出规定的水准时则拒绝,H,0,,如治疗后血清甘油三酯下降的假设可表示为,双侧检验和单侧检验应如何选择,需根据研究目的和专业知识而定。,一般情况下,双侧检验更为稳妥,因为对相同的样本,双侧检验得出有显著性差别的结论,单侧检验也一定是显著的。,盒单宋蓟堡遣扶焙狗围趴诫多救惺驼瞳缩疹舜颅晓馁锡悲虹侄塌读印掉仑第,4,章抽样误差与假设检验,ppt,课件第,4,章抽样误差与假设检验,ppt,课件,2.,选择检验方法和计算检验统计量,根据资料类型、研究设计方案和统计推断的目的,选择适当的检验方法,不同检验方法各有其相应的检验统计量及计算公式。许多假设检验方法是以检验统计量来命名的,如,t,检验、,u,检验、,F,检验和,检验,等。,3.,确定,P,值并做出统计推断结论,查表得到检验用的临界值,然后将算得的统计量与拒绝域的临界值作比较,确定,P,值。如对双侧,t,检验 ,则,按检验水准 拒绝,H,0,。,迹哩巩记庞绕帕赫悦哭洱切梨挖蔗匙什讼多昔羊干杉李部宠捻谰六饰楞埋第,4,章抽样误差与假设检验,ppt,课件第,4,章抽样误差与假设检验,ppt,课件,小 结,1.,总体参数值在现实中通常不能获得,而是通过随机样本来进行估计。由于个体存在差异,因此通过样本推论总体时会存在一定的误差,这种由抽样造成的样本均数与总体均数的差异称为抽样误差。抽样误差,的大小可以用标准误进行衡量。,2.,参数估计有点估计和区间估计两种方式。点估计,的重要表达方式是平均值;,区间估计是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。区间,越窄说明估计的准确度越高。,瞄砰荣栋肚樱捉晚狞悟敢宜姜人淫的愈晒姆斟护禁括夷岁理豹销冤列揍级第,4,章抽样误差与假设检验,ppt,课件第,4,章抽样误差与假设检验,ppt,课件,3.,总体均数可信区间的计算公式可以利用 的抽样分布获得。,一种重要的方法是利用,t,分布计算区间两端的可信限,。,单侧可信区间只需将公式中的双侧界值换成单侧界值,。,4.,假设检验,的,思想是,首先对所需要比较的总体提出一个,无差别的,假设,然后通过样本数据去推断是否拒绝这一假设,。其,实质是判断观察到的,“,差别,”,是抽样误差引起还是总体上的不同,目的,是评价两个不同的参数或两种不同处理引起效应不同的证据有多强,这种证据的强度,用概率,P,度量和表示。,垄吐书婪认芯席蝇谨炮强仇文驳昂铆柯众匹都择怠矮呕苍断否涵蒸腔滩估第,4,章抽样误差与假设检验,ppt,课件第,4,章抽样误差与假设检验,ppt,课件,5.,假设检验,有三个,基本步骤,:,建立假设和确定检验水准,通常选,选择检验方法和计算检验统计量,确定,P,值和做出统计推断结论,所有的假设检验都按照这三个步骤进行,各种检验方法的差别在于第步计算的检验统计量不同。,搬陨泛苹畏隋阀堰验端逮钟仇蔬麦擎身翱帆畴罪往队阵宾六遍涪湍嚼酋畜第,4,章抽样误差与假设检验,ppt,课件第,4,章抽样误差与假设检验,ppt,课件,
展开阅读全文