《医学统计学》11chapter课件

上传人:94****0 文档编号:242276241 上传时间:2024-08-18 格式:PPT 页数:49 大小:406.29KB
返回 下载 相关 举报
《医学统计学》11chapter课件_第1页
第1页 / 共49页
《医学统计学》11chapter课件_第2页
第2页 / 共49页
《医学统计学》11chapter课件_第3页
第3页 / 共49页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,陈峰讲稿,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,拟合优度检验及其他问题,1,拟合优度检验及其他问题1,关于事件数的比较,一般认为单位时间、空间或人群间某独立事件的发生服从Poisson分布。,当样本事件数大于50时,Poisson分布近似正态分布。,因此,事件数的比较可利用正态近似原理,采用,u,检验。,2,关于事件数的比较一般认为单位时间、空间或人群间某独立事件的发,直接概率计算法,已知全国艾滋病每千人发病人数为1人,现在河南某地1000人中发现5人,问该地发病率是否高于全国水平?,X=5,3,直接概率计算法已知全国艾滋病每千人发病人数为1人,现在河南某,直接概率计算法,基本思想:若该地水平和全国一样,那么在假设的总体中(单位人群1000人中发现1人)得到5人甚至更多人的概率应该比较大(0.05)。,4,直接概率计算法4,5,5,H,0,:,=,0,H,1,:,0,=0.05,单侧,P0.05,根据0.05的检验水准拒绝H0,差别有统计学意义,说明该地的发病率高于全国水平。,6,H0:=06,用二项分布来作,p=0.005,,0,0.001,7,用二项分布来作p=0.005,00.0017,用来描述极罕见现象的发生时,,二项分布,与,Poisson分布,是,近似,的。,Not the same!,8,8,单个事件数的比较:X较大时,某放射性粒子放射的频率是1小时100次,现考察它是否与某类粒子同源。该类粒子放射频率为每小时80次。,近似正态法。,9,单个事件数的比较:X较大时某放射性粒子放射的频率是1小时10,H,0,:,=,0,H,1,:,0,=0.05,P0.05,根据0.05的检验水准拒绝H,0,,差别有统计学意义,说明该粒子并非与已知粒子同源。,10,H0:=010,两事件数的比较,样本观察单位相同的无重复试验,样本观察单位相同的有重复试验,且重复次数相等时,样本观察单位不同,或在有重复试验中,重复次数不同(不论样本观察单位数是否相同)时,,11,两事件数的比较 样本观察单位相同的无重复试验 11,样本观察单位相同的有重复试验,且重复次数相等时,分别用甲、乙两种培养基对同一水样作细菌培养,每份水样均取1ml,得细菌个数如下:甲培养基分别为60;乙培养基分别为84。,12,样本观察单位相同的有重复试验,且重复次数相等时 分别用甲、,H,0:两培养基效果相同,,1,2;,H,1:两培养基效果不同,,1,2。,P0.05,拒绝H0。,13,H0:两培养基效果相同,12;13,分别用甲、乙两种培养基对同一水样作细菌培养,每份水样均取1ml,各培养8次,得细菌个数如下:甲培养基分别为7,5,6,7,4,5,3,6;乙培养基分别为9,8,8,10,7,7,7,9。,14,分别用甲、乙两种培养基对同一水样作细菌培养,每份水样均取1m,H,0:两培养基效果相同,,1,2;,H,1:两培养基效果不同,,1,2。,= 0.05。,故,P,0.05,拒绝,H,0,接受,H,1,差异有统计学意义,两种培养基效果不同。结合资料可认为乙培养基培养效果较好。,15,H0:两培养基效果相同,12;15,样本观察单位不同,或在有重复试验中,重复次数不同(不论样本观察单位数是否相同)时,某车间在改革生产工艺前,测取三次粉尘浓度,每升空气中分别有38、39、36颗粉尘;改革生产工艺后,测取两次,分别有25、18颗粉尘。问工艺改革前后粉尘颗粒有无差别?,16,样本观察单位不同,或在有重复试验中,重复次数不同(不论样本观,H,0:工艺改革前后粉尘颗粒无差别,,1,2;,H,1:工艺改革前后粉尘颗粒有差别,,1,2。,= 0.05。,P,0.01,故按,= 0.05水准拒绝,H,0,接受,H,1,差异有统计学意义,可认为工艺改革前后车间空气中粉尘浓度有差别,改革后粉尘浓度降低。,17,H0:工艺改革前后粉尘颗粒无差别,12;17,拟合优度检验所回答的问题,统计资料是否服从某种已知分布?,红楼梦后四十章作者的用词习惯合前八十章是否相同?,某个骰子抛出各点的次数与理论次数是否一致?,是否可以用某个分布来描述资料?,是否可以用正态分布来描述身高?,是否可以用指数分布来描述生存时间?,18,拟合优度检验所回答的问题统计资料是否服从某种已知分布?18,拟合优度检验,拟合优度的Chi2检验,组数1,s,s,为根据样本估计理论分布时所用参数的个数。,19,拟合优度检验拟合优度的Chi2检验19,拟合优度的Chi2检验,从总体中随机抽取的样本,将样本分成若干个分组,得到各组的实际频数,计算出若假设成立,各组的理论频数,Chi 2检验,20,拟合优度的Chi2检验20,ABO血型受控于A、B、O三个等位基因。据报道,汉族人的三个等位基因频率分别为:,p,=0.2019,,q,=0.2512和,r,=0.5469。则根据遗传学中Hardy-Weinberg平衡法则,估计得汉族人四种血型的理论频率为:,21,ABO血型受控于A、B、O三个等位基因。据报道,汉族人的三个,今调查507名傣族人的ABO血型分布为:O型205人,A型112人,B型150人,AB型40人。问傣族人血型的分布与汉族人血型的分布是否相同?,22,今调查507名傣族人的ABO血型分布为:O型205人,A型1,H,0:傣族人的血型分布与汉族人的血型分布相同;,H,1:傣族人的血型分布与汉族人的血型分布不同。,=0.20。,首先计算理论频数。本例中调查人数为507人,若按汉族人血型的理论频率估计,则O,A,B,AB四种血型的理论频数分别为:507,0.2991,507,0.2616,507,0.3379和507,0.1014。,(2) 计算,2统计量。,23,H0:傣族人的血型分布与汉族人的血型分布相同;23,507名傣族人血型的实际频数,f,与按汉族人理论频率计算的理论频数,f,0,O,A,B,AB,合计,f,205,112,150,40,507,f,0,151.64,132.63,171.32,51.41,507.00,24,507名傣族人血型的实际频数f与按汉族人理论频率计算的理论,本例的理论分布是已知的,不是根据样本估计的,即估计分布所用参数个数为0。因此自由度为:,4103,按,2=27.1710,自由度为3的,2,分布判断,,P,0.0001。故根据该资料,可以认为傣族人的血型分布与汉族人不同。,25,本例的理论分布是已知的,不是根据样本估计的,即估计分布所用参,2002年韩日世界杯刚刚落下帷幕,几家欢乐几家愁。在64场比赛中,各队进球数有多有少。大部分是0,1,2个进球,个别队是5个以上进球,最多的是8个进球。虽然强队大都能进球、赢球(如巴西对),弱队大都不能进球,总是输(如中国队)。但宏观上来说,各队进球数服从Poisson分布!,26,2002年韩日世界杯刚刚落下帷幕,几家欢乐几家愁。在64场比,各队进球数(不包括点球),平均进球数为 1.2578,,27,各队进球数(不包括点球),平均进球数为 1.2578,27,拟合优度检验结果,大家课后可以试试2006德国世界杯是否如此?,28,拟合优度检验结果28,连续性资料的拟合优度检验,测得某地110名7岁男童身高(cm)如下。问该地7岁男童的身高分布是否服从正态分布?,29,连续性资料的拟合优度检验测得某地110名7岁男童身高(cm),108.2,108.2,110.3,111.5,112.2,112.3,112.4,112.4,112.7,113.0,113.0,113.2,113.2,114.3,114.3,114.3,114.7,114.8,114.8,114.9,114.9,115.4,116.0,116.2,116.3,116.3,116.3,116.4,116.8,116.8,117.0,117.1,117.2,117.2,117.4,117.7,117.9,118.0,118.1,118.2,118.3,118.4,118.4,118.5,118.9,119.0,119.1,119.3,119.5,119.6,119.7,119.7,119.7,119.8,119.8,120.0,120.0,120.0,120.1,120.1,120.2,120.3,120.4,120.5,120.5,120.6,120.7,120.7,120.7,120.8,120.8,121.0,121.2,121.5,121.5,121.8,122.0,122.1,122.4,122.5,122.5,122.7,122.8,122.8,122.9,123.0,123.1,123.2,123.5,123.8,124.1,124.1,124.4,124.4,125.0,125.1,125.2,125.2,125.6,125.8,126.1,126.2,126.6,127.1,128.0,129.1,129.3,130.5,130.8,132.5,30,108.2108.2110.3111.5112.2112.3,计算该资料的均数、标准差,=119.7036,s=4.7924,分组。对观察指标的取值区间进行分组。本例最小观察值为108.2cm,最大观察值为132.5cm,取组距为2cm,最小区间下限取108cm,则分为13组,,31,计算该资料的均数、标准差31,计算理论频数。,根据正态分布面积的规律性,求得各分组对应的区间在正态分布下所得的面积,再求得理论频数。,可用计算机软件计算,X,各组上限时的累计分布,或根据标准离差查u分布表:,32,计算理论频数。 32,分 组,实际观察频数,上限u,小于上限的,累计概率,组内概率,组内理论频数,108,0,-2.4421,0.007301,0.007301,0.80,108,2,-2.0248,0.021445,0.014144,1.56,5.94,110,2,-1.6075,0.053977,0.032532,3.58,112,9,-1.1901,0.116997,0.063020,6.93,114,9,-0.7728,0.219818,0.102822,11.31,116,15,-0.3555,0.361115,0.141297,15.54,118,18,0.0618,0.524658,0.163543,17.99,120,21,0.4792,0.684093,0.159435,17.54,122,14,0.8965,0.815008,0.130915,14.40,124,10,1.3138,0.905548,0.090540,9.96,126,4,1.7312,0.958288,0.052740,5.80,10.39,128,3,2.1485,0.984162,0.025874,2.85,130,2,2.5658,0.994853,0.010691,1.18,132,1,+,1.000000,0.005146,0.56,合 计,110,1.000000,110.00,33,分 组实际观察频数上限u小于上限的组内概率组内理论频数1,在估计分布时用样本的均数和标准差作为理论分布的均数和标准差,故自由度为:,=9-1-2=6,P,=0.8739。,故可以认为,该地区7岁男童身高的分布服从正态分布。,34,在估计分布时用样本的均数和标准差作为理论分布的均数和标准差,,110名7岁男童身高的频数分布及正态分布拟合,35,110名7岁男童身高的频数分布及正态分布拟合 35,Pearson卡方检验的缺点,要求每组的理论观察频数不少于5;,当用于连续型分布时,要求先对观察值进行分组。,36,Pearson卡方检验的缺点要求每组的理论观察频数不少于5;,Kolmogorov检验,统计量,D,反映实际累积分布与理论累积分布之间的最大差距。,37,Kolmogorov检验 统计量D反映实际累积分布与理论累积,测得某地20名正常成人的血铅合量(,g/100g)。问该资料是否服从正态分布?,38,测得某地20名正常成人的血铅合量(g/100g)。问该资料,该资料的均数、标准差分别为:,=17.04,,s,=13.04809,计算实际累计频率,F,(,Xi,) 即小于等于,Xi,的观察值个数占总观察个数的比例。,计算理论分布累计概率,F,0,39,该资料的均数、标准差分别为:39,X,观察频数,累计频数,F,(,X,i,),F,(,X,i,-1,),标准正态离差,F,0,D,5,1,1,0.05,0.00,-0.9503,0.1710,0.1710,6,1,2,0.10,0.05,-0.8737,0.1911,0.1411,7,2,4,0.20,0.10,-0.7971,0.2127,0.1127,8,2,6,0.30,0.20,-0.7204,0.2356,0.0644,9,1,7,0.35,0.30,-0.6438,0.2599,0.0901,10,1,8,0.40,0.35,-0.5671,0.2853,0.1147,12,1,9,0.45,0.40,-0.4139,0.3395,0.1105,13,2,11,0.55,0.45,-0.3372,0.3680,0.1820,14,2,13,0.65,0.55,-0.2606,0.3972,0.2528,17,1,14,0.70,0.65,-0.0307,0.4878,0.2122,20,1,15,0.75,0.70,0.1993,0.5790,0.1710,25,1,16,0.80,0.75,0.5825,0.7199,0.0801,29,1,17,0.85,0.80,0.8890,0.8130,0.0370,38,1,18,0.90,0.85,1.5788,0.9428,0.0928,43,1,19,0.95,0.90,1.9620,0.9751,0.0751,50,1,20,1.00,0.95,2.4984,0.9938,0.0438,40,X观察频数累计频数F(Xi)F(Xi-1)标准正态离差F0D,20名正常成人血铅合量的Kolmogorov正态性检验,41,20名正常成人血铅合量的Kolmogorov正态性检验 41,分布拟合优度检验的正确应用,关于检验水准。,分布拟合优度检验均用双侧检验。,Pearson,2检验及Kolmogorov检验。,42,分布拟合优度检验的正确应用 关于检验水准。42,关于检验水准,即假设检验中的错误概率。,关键是看我们需要避免什么错误。,43,关于检验水准即假设检验中的错误概率。43,Guilty or Innocent?-I,法官在判罪时都有个尺度,证据及庭审结果如果超过了该尺度,就会判定此人有罪。当然,法官个人都有自己的风格。有的尺度比较严,有的比较松,相同的犯罪嫌疑人可能在前者那里被判刑,而后者那里被无罪释放。我们这里的检验尺度,也就相当于法官的判罚尺度。,44,Guilty or Innocent?-I法官在判罪时都有个,Guilty or Innocent?-II,对于谋杀案的嫌疑人,要慎重考虑,因为将一个无辜者判罪会造成非常严重的后果,尺度可以松一点;,对于一般的小偷小摸,尺度就比较紧;,在假设检验时,如果错误地不拒绝零假设的后果很严重,就需要严格尺度(尽可能拒绝H0),即选择一个较大的,;否则要选择稍小的,;,差异性检验,=0.05 0.01,等效性检验=0.10 0.20,45,Guilty or Innocent?-II对于谋杀案的嫌疑,Pearson,2检验及Kolmogorov检验。,Pearson,2检验适用于定性资料和等级资料的分布拟合,要求样本含量较大,每个组的理论频数均要大于5。,2检验也可以用于定量资料的分布拟合,但要先行分组。由于分组会损失部分信息,不同的分组又可能对结果产生影响,因此,分组的粗细要适当,要能正确反映资料的分布特征。,Kolmogorov检验适用于定量资料的分布拟合,并放宽了对样本含量的要求,因此,对定量资料分布的拟合优度检验,最好还是用Kolmogorov检验。,46,Pearson 2检验及Kolmogorov检验。Pear,正态分布的拟合,几乎所有的分布拟合优度检验方法均适用于正态分布的拟合,但最常用矩法检验和Kolmogorov检验。,Kolmogorov检验对样本含量的要求不高,对,n,50的样本效果较好;,矩法检验较适用于中等样本含量者,而对大样本,矩法检验过于灵敏,第一类错误率较大,即在同样的,水准较易得出,P,的结论。,至于小样本资料的拟合,由于其分布本身尚不稳定,应谨慎从事。,47,正态分布的拟合几乎所有的分布拟合优度检验方法均适用于正态分布,回顾,假设检验的思想,单双侧检验和单双尾检验,48,回顾假设检验的思想48,Thank You,Thank You,Thank You,Thank You,Thank You,Thank You,Thank You,Thank You,49,Thank YouThank YouThank YouTha,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!