离散型随机变量的参数估计与检验.ppt

上传人:zhu****ei 文档编号:3494268 上传时间:2019-12-16 格式:PPT 页数:37 大小:720.50KB
返回 下载 相关 举报
离散型随机变量的参数估计与检验.ppt_第1页
第1页 / 共37页
离散型随机变量的参数估计与检验.ppt_第2页
第2页 / 共37页
离散型随机变量的参数估计与检验.ppt_第3页
第3页 / 共37页
点击查看更多>>
资源描述
第六章离散型变量的参数估计与检验,第一节总体率的区间估计第二节总体率的假设检验第三节列联表中独立性的检验第四节参照单位法,1、总体率:在伯努利概型中,事件A出现的概率P(A)称为总体率,它通常是一个未知的参数。,2、样本率:在伯努利概型中,若容量为n的某样本中事件A出现m次,则事件A出现的频率的f=m/n称为样本率,它通常是一个统计量。,一、总体率的区间估计,定理若XB(n,p),则,证:,3、小样本时总体参数的估计,由定理知,样本率是总体率的无偏估计量。,可查统计用表,得到p的置信区间(p1,p2),例1用某种中医疗法治疗青少年近视15例,其中10人近期有效,求该法近期有效率95%置信区间,解:15例中的近期有效人数服从二项分布,m=10,n-m=5,1-=0.95,查表得p1=0.384,p2=0.882,近期有效总体率p的95%置信区间(0.384,0.882),A是大量伯努利试验中的稀有事件,A出现次数XP(k;),总体均数EX=,总体方差DX=,小样本时,根据n个单元的样本计数c查统计用表,可得到n的置信区间(n1,n2),上,下限分别除以n,即得总体均数的置信区间,例2用计数器测量某种放射性标本,3分钟读数45,求每分钟读数的95%置信区间,泊松概率模型的参数估计,每分钟读数服从泊松分布,c=45,n=3,1-=0.95,查表31=32.82,32=60.21,故每分钟读数即总体均数的95%置信区间为,=(10.94,20.07),3.1.2大样本时总体参数的估计,定理2XB(k;n,p),n足够大,总体率p的1-置信区间为,由定理1,n足够大时,近似有,N(0,1),用频率代替概率p,用,近似率的标准误,N(0,1),故总体率p的1-置信区间为,二项总体在样本容量n50时,总体率p的置信区间为,泊松总体在n个单元的样本计数c50时,近似有,N(0,1),从而n的1-置信区间为,例3复方当归注射液治疗脑动脉硬化症188例,显效83例,求复方当归注射液显效率的95%置信区间,188例患者中显效人数服从二项分布,n=188,m=83,得,故复方当归注射液显效率p的95%置信区间为,=(0.3705,0.5125),3.1.3单样本的假设检验,二项总体在样本容量n50时,对H0:pp0,可用u统计量,检验总体率p与常量p0的差异是否有统计意义,泊松总体在n个单元的样本计数c50时,对H0:0,可用u统计量,检验与常量0的差异是否有统计意义,例4胃溃疡患者20%发生胃出血症状,某医院观察65岁以上胃溃疡患者304例,有96例发生胃出血症状,65岁以上患者是否比较容易胃出血?,304例患者中胃出血人数服从二项分布,n=304,m=96,得,H0:p0.20,H1:p0.20,双尾概率P0.05,只能以0.05水准的单侧检验接受H0,p1与p2的差异无统计意义,认为两批首乌注射液的变质率相同,3.1.5分类资料的检验方法选择,两组小样本分类资料不能使用u检验,多组分类资料也不宜直接进行两两间的u检验,因为这可能加大犯第一类错误的概率.分类资料把数据按两个或更多属性分类编成列联表,选择相应的检验方法,例6乙型脑炎重症病人204例随机分为两组,用某中草药方剂治疗,其中一组人工牛黄.病人根据治疗方法和治疗效果进行无重复无遗漏的完全分类,把全部数据按两个分类原则进行完全分类列成的频数表格称为列联表,分类频数排成R行C列的列联表称为RC列联表,22列联表也称为四格表,3.2计数资料的分析,3.2.1RC表独立性检验,例1为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组作定性检查,双向无序,病人组阳性样本率,对照组阳性样本率,样本推断病人组,对照组的阳性总体率p1,p2是否不同,需检验假设H0:p1=p2,H0可写为“分组”对“阳性数”无影响,改写为“分组”与“阳性数”独立,双向无序表列联表独立性检验,在H0:“分组”与“阳性数”独立假设下,全部数据视为一个总体的样本,计算阳性联合样本率,作为阳性总体率的估计值,称阳性理论率,用理论率推算样本各实际频数Oij的估计值,称理论频数或经验频数Eij,病人组阳性理论频数,阴性理论频数,对照组阳性理论频数,阴性理论频数,分类变量X的分类标志为X1,XR,分类变量Y的分类标志为Y1,YC,实际频数的行合计记为O1,OR,实际频数的列合计记为O1,OC,总频数记为N,列联表双向无序,理论频数Eij等于所在行与列的合计数之积除以N,在H0:X与Y独立假设下,实际频数Oij与理论频数Eij的差异是随机误差,Pearson用卡方统计量,df(R1)(C1),反映实际Oij与理论Eij吻合程度,称Pearson卡方检验,定理1Pearson卡方统计量,df1时用定理1计算卡方统计量可不写出理论频数,若RC列联表中理论频数出现小于1或理论频数小于5的格数超过总格数1/5时,则必须增大样本例数,或把理论频数太小的行,列与性质相近的邻行,列合并,或删去理论频数太小的行,列,例2判断患鼻咽癌与血型有无关系,第一行合计数,第四列合计数最小,最小理论频数,H0:“患癌”与“血型”独立,H1:“患癌”与“血型”不独立,=1.921,df(21)(41)3,单尾概率P0.25,以0.05水准的单侧检验接受H0,两组总体率的差异无统计意义,患癌与血型没有关系,3.2.2四格表独立性检验,定理2df1,Pearson卡方,O11E11,O12E12O21E21O22E22,双向无序四格表,N40且所有理论频数大于5,用Pearson卡方统计量,若所得P,改用确切概率法,N40,理论频数小于5(但1),用校正卡方统计量,df1,N40,第一行合计数、第二列合计数最小,最小理论频数5Pearson卡方检验,H0:“中毒”与“阳率”独立,H1:“中毒”与“阳率”不独立,df1,双尾概率P40,第一行合计数、第一列合计数最小,最小理论频数0.05.以0.05水准单侧检验接受H0,,差异无统计意义,不能认为两种服的皮炎患病率不同,3.3等级资料的分析,3.3.1Ridit分析,例1中药与传统西医两种方法治疗小儿急性痢疾,单向有序24列联表,不宜用卡方检验,可用Ridit分析,relativetoanidentifieddistribution与unit,选一个大容量样本作基准称为参照组,分k个等级,第i等级频数为mi(1ik),参照组样本容量为n,第i等级的频率,定义1参照组前i1个等级的频率与第i等级频率之半的和,称第i等级的参照单位或R值,记为Ri,(2ik1),定理1参照组R值的样本均数,R值样本均数为各等级频数与相应R值的加权平均,其它样本称为对比组,均以参照组的R值为各等级的标准.对比组R值的样本均数,按各等级频数与相应参照组R值的加权平均计算,一般与0.5有差异,Bross指出,R值理论分布为0,1均匀分布,密度函数f(x)1(0x1),总体均数1/2,总体方差1/12,定理2n足够大,R值总体均数R的1-置信区间,对比组R值总体均数,样本均数的标准误,近似服从,N(0,1),R的1-置信区间,对比组R置信区间比较,称Ridit或参照单位分析,3.3.2单个对比组的分析,对比组n50,据参照组R值作R的1-置信区间.若置信区间不含0.5,则以水准拒绝H0:R=0.5.若对比组等级按“差”到“好”顺序排列,则样本均数0.5表示优于参照组,参照组的样本容量n应尽可能取大,西医组为参照组,n西1155很大,H0:中医组R值总体均数中=0.5,H1:中0.5,中医对比组样本容量n中=11250,R值样本均数,=0.5395,中95%置信区间,=(0.4860,0.5930),置信区间包含0.5,只能以0.05水准接受H0,,差异无统计意义,不能认为中医与西医组疗效不同,
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!