生物医学研究的统计学方法-课后习题答案-2014-主编-方积乾

上传人:gbs****77 文档编号:10932686 上传时间:2020-04-16 格式:DOC 页数:92 大小:3.11MB
返回 下载 相关 举报
生物医学研究的统计学方法-课后习题答案-2014-主编-方积乾_第1页
第1页 / 共92页
生物医学研究的统计学方法-课后习题答案-2014-主编-方积乾_第2页
第2页 / 共92页
生物医学研究的统计学方法-课后习题答案-2014-主编-方积乾_第3页
第3页 / 共92页
点击查看更多>>
资源描述
思考与练习参考答案第1章 绪论一、选择题1. 研究中的基本单位是指 ( D )。A样本 B. 全部对象 C影响因素D. 个体 E. 总体2. 从总体中抽取样本的目的是( B )。A研究样本统计量 B. 由样本统计量推断总体参数C研究典型案例 D. 研究总体统计量 . 计算统计指标3. 参数是指( B )。A参与个体数 B. 描述总体特征的统计指标C描述样本特征的统计指标 D. 样本的总和 E. 参与变量数 4. 下列资料属名义变量的是( E )。A白细胞计数 B住院天数C门急诊就诊人数 D患者的病情分级 E. ABO血型5关于随机误差下列不正确的是( C )。A受测量精密度限制 B无方向性 C. 也称为偏倚不可避免 E. 增加样本含量可降低其大小二、名称解释(答案略)1. 变量与随机变量 2. 同质与变异 3. 总体与样本4. 参数与统计量 5. 误差 6. 随机事件7. 频率与概率三、思考题1. 生物统计学与其他统计学有什么区别和联系? 答:统计学可细分为数理统计学、经济统计学、生物统计学、卫生统计学、医学统计学等,都是关于数据的学问,是从数据中提取信息、知识的一门科学与艺术。而生物统计学是统计学原理与方法应用于生物学、医学的一门科学,与医学统计学和卫生统计学很相似,其不同之处在于医学统计学侧重于介绍医学研究中的统计学原理与方法,而卫生统计学更侧重于介绍社会、人群健康研究中的统计学原理与方法。2. 某年级甲班、乙班各有男生50人。从两个班各抽取10人测量身高,并求其平均身高。如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么?答:不能。因为,从甲、乙两班分别抽取的10人,测量其身高,得到的分别是甲、乙两班的一个样本。样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。即使是按随机化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。因此,不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断,而应通过统计分析,进行统计推断,才能作出判断。3. 某地区有10万个7岁发育正常的男孩,为了研究这些7岁发育正常男孩的身高和体重,在该人群中随机抽取200个7岁发育正常的男孩,测量他们的身高和体重,请回答下列问题。(1)该研究中的总体是什么?答:某地区10万个7岁发育正常的男孩。(2)该研究中的身高总体均数的意义是什么? 答:身高总体均数的意义是: 10万个7岁发育正常的男孩的平均身高。(3)该研究中的体重总体均数的意义是什么? 答:体重总体均数的意义是: 10万个7岁发育正常的男孩的平均体重(4) 该研究中的总体均数与总体是什么关系? 答:总体均数是反映总体的统计学特征的指标。(5)该研究中的样本是什么? 答:该研究中的样本是:随机抽取的200个7岁发育正常的男孩。 (宇传华 方积乾) 第2章 统计描述 思考与练习参考答案一、最佳选择题1. 编制频数表时错误的作法是( E )。A. 用最大值减去最小值求全距 B. 组距常取等组距,一般分为1015组C. 第一个组段须包括最小值 D. 最后一个组段须包括最大值E. 写组段,如“1.53,35, 56.5,”2. 描述一组负偏峰分布资料的平均水平时,适宜的统计量是( A )。A. 中位数 B. 几何均数 C. 调和均数 D. 算术均数 E. 众数3. 比较5年级小学生瞳距和他们坐高的变异程度,宜采用( A )。A. 变异系数 B. 全距 C. 标准差D. 四分位数间距 E. 百分位数P2.5与P97.5的间距4. 均数和标准差S的关系是( A )。A. S越小,对样本中其他个体的代表性越好 B. S越大,对样本中其他个体的代表性越好C. 越小,S越大D. 越大,S越小E. 必小于5. 计算乙肝疫苗接种后血清抗-HBs的阳转率,分母为( B )。A. 阳转人数 B. 疫苗接种人数 C. 乙肝患者数D. 乙肝病毒携带者数 E. 易感人数6. 某医院的院内感染率为5.2人/千人日,则这个相对数指标属于( C )。A. 频率 B. 频率分布 C. 强度 D. 相对比 E. 算术均数7. 纵坐标可以不从0开始的图形为( D )。A. 直方图 B. 单式条图 C. 复式条图 D. 箱式图 E. 以上均不可二、简答题1. 对定量资料进行统计描述时,如何选择适宜的指标? 答:详见教材表2-18。教材表2-18 定量资料统计描述常用的统计指标及其适用场合描述内容指 标意 义适 用 场 合平均水平均 数个体的平均值对称分布几何均数平均倍数取对数后对称分布中 位 数位次居中的观察值非对称分布;半定量资料;末端开口资料;分布不明众 数频数最多的观察值不拘分布形式,概略分析调和均数基于倒数变换的平均值正偏峰分布资料变 异 度全 距观察值取值范围不拘分布形式,概略分析标 准 差(方 差)观察值平均离开均数的程度对称分布,特别是正态分布资料四分位数间距居中半数观察值的全距非对称分布;半定量资料;末端开口资料;分布不明变异系数标准差与均数的相对比不同量纲的变量间比较;量纲相同但数量级相差悬殊的变量间比较2. 举例说明频率和频率分布的区别和联系。 答:2005年某医院为了调查肺癌患者接受姑息手术治疗1年后的情况,被调查者150人,分别有30人病情稳定,66人处于进展状态,54人死亡。当研究兴趣只是了解死亡发生的情况,则只需计算死亡率54/150=36%,属于频率指标。当研究者关心患者所有可能的结局时,则可以算出反映3种结局的频率分别为20%、44%、36%,它们共同构成所有可能结局的频率分布,是若干阳性率的组合。两者均为“阳性率”,都是基于样本信息对总体特征进行估计的指标。不同的是:频率只是一种结局发生的频率,计算公式的分子是某一具体结局的发生数;频率分布则由诸结局发生的频率组合而成,计算公式的分子分别是各种可能结局的发生数,而分母则与频率的计算公式中分母相同,是样本中被观察的单位数之和。3. 应用相对数时应注意哪些问题?答:(1)防止概念混淆 相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。(2)计算相对数时分母不宜过小 样本量较小时以直接报告绝对数为宜。(3)观察单位数不等的几个相对数,不能直接相加求其平均水平。(4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。4. 常用统计图有哪些?分别适用于什么分析目的? 答:详见教材表2-20。教材表2-20 常用统计图的适用资料及实施方法图 形适 用 资 料实 施 方 法条 图组间数量对比用直条高度表示数量大小直 方 图定量资料的分布用直条的面积表示各组段的频数或频率百分条图构成比用直条分段的长度表示全体中各部分的构成比饼 图构成比用圆饼的扇形面积表示全体中各部分的构成比线 图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系散 点 图双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱 式 图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎 叶 图定量资料的分布用茎表示组段的设置情形,叶片为个体值,叶长为频数三、计算题1. 某内科医生调查得到100名4050岁健康男子总胆固醇(mg/dl),结果如下227190224259225238180193214195213193209172244199155208203199253181196224210220255257216249235220190203197149175236202209174184174185167235167210171248201266189222199197214199198230246209202186217206200203197161247138186156195163273178190207259186194246172234232189172235207208231234226174199278277181(1)编制频数表,绘制直方图,讨论其分布特征。答:频数表见练习表2-1。根据直方图(练习图2-1),可认为资料为基本对称分布,其包络线见练习图2-2。练习表2-1 某地100名4050岁健康男子总胆因醇/(mgdl-1)FrequencyPercentValid PercentCumulative PercentValid 130145160175190205220235250265280Total1 3 11 12 25 15 13 11 5 4 100 1.0 3.011.012.025.015.013.011.05.04.0100.0 1.0 3.011.012.025.015.013.011.05.04.0100.0 1.04.015.027.052.067.080.091.096.0100.0 练习图2-1 直方图练习图2-2 包络线图(2)根据(1)的讨论结果,计算恰当的统计指标描述资料的平均水平和变异度。答:利用原始数据,求出算术均数 mg/dl 和标准差mg/dl。(3)计算P25,P75和P95。答:利用原始数据,求出P25=186.8 mg/dl,P75=229.3 mg/dl,P95=259.0 mg/dl。2. 某地对120名微丝蚴血症患者治疗3个疗程后,用IFA间接荧光抗体试验测得抗体滴度如下,求抗体滴度的平均水平。抗体滴度1:51:101:201:401:801:1601:320例 数516273422133利用上述频数表,得平均滴度为1:36.3。3. 某地19751980年出血热发病和死亡资料如教材表2-21,设该地人口数在此6年间基本保持不变。教材表2-21 某地6年间出血热的发病与死亡情况年 份发病数病死数1975324197656519771621219782411319793301019802745试分析:(1)粗略判断发病率的变化情况怎样。答:该地人口数在此6年间基本保持不变,发病人数在1979年前逐年上升,1980年略有下降。可以认为发病率大致呈上升趋势,1980年略有下降。(2)病死率的变化情况怎样? 答: 病死率由各年度病死数除以发病数获得,病死率依次为12.5%、8.9%、7.4%、5.4%、3.0%和1.8%,呈逐年下降趋势。(3)上述分析内容可用什么统计图绘制出来? 答:由于没有给出该地人口数,故不能计算发病率,可用普通线图表示发病数变化情况。病死率的下降情况可以用普通线图表示,下降速度则可以用半对数线图表示。(4)评述该地区出血热防治工作的效果。答:随着时间的推移,预防工作做得不好,治疗水平则逐年提高(体现在病死率下降)。 (张晋昕)第3章 概率分布思考与练习参考答案一、最佳选择题1. 某资料的观察值呈正态分布,理论上有( C )的观察值落在范围内。A. 68.27% B. 90% C. 95% D. 99% E. 45%2. 正态曲线下,从均数到的面积为( A )。A. 45% B. 90% C. 95% D. 47.5% E. 99%3. 若正常人的血铅含量X近似服从对数正态分布,则制定X的95%参考值范围,最好采用(其中 , 为Y的标准差)( C )。A. B. C. D. E.4. 在样本例数不变的情况下,若( D ),则二项分布越接近对称分布。 A. 总体率越大 B. 样本率p越大 C. 总体率越小 D. 总体率越接近0.5 E. 总体率接近0.1或0.55. 铅作业工人周围血象点彩红细胞在血片上的出现数近似服从( D )。A. 二项分布 B. 正态分布 C. 偏态分布 D. Poisson分布 E. 对称分布6. Poisson分布的均数与标准差的关系是( E )。A. B. C. D. E. 二、思考题1. 服从二项分布及Poisson分布的条件分别是什么?简答:二项分布成立的条件:每次试验只能是互斥的两个结果之一;每次试验的条件不变;各次试验独立。Poisson分布成立的条件:除二项分布成立的三个条件外,还要求试验次数很大,而所关心的事件发生的概率很小。2. 二项分布、Poisson分布分别在何种条件下近似正态分布?简答: 二项分布的正态近似:当n较大,不接近0也不接近1时,二项分布B(,)近似正态分布N(, )。Poisson分布的正态近似:Poisson分布,当相当大时(20),其分布近似于正态分布。三、计算题1. 已知某种非传染性疾病常规疗法的有效率为80%,现对10名该疾病患者用常规疗法治疗,问至少有9人治愈的概率是多少?解:对10名该疾病患者用常规疗法治疗,各人间对药物的反应具有独立性,且每人服药后治愈的概率均可视为0.80,这相当于作10次独立重复试验,即=0.80,n=10的贝努利试验,因而治愈的人数X服从二项分布。至少有9人治愈的概率为: 至少有9人治愈的概率是37.58%。或者2. 据以往的统计资料,某地新生儿染色体异常率为1%,问100名新生儿中染色体异常不少于2名的概率是多少?解:=3. 调查某市2000年110名20岁男性青年的身高(cm)资料如下:173.1 166.8 172.9 175.9 172.8 170.5 174.1 174.2 175.7 173.5168.2 173.7 184.4 174.8 172.5 174.9 174.9 174.2 173.8 176.2170.9 165.0 176.3 174.2 179.8 174.5 180.5 171.5 178.9 171.5166.7 170.8 168.8 177.5 174.5 183.5 182.0 170.9 173.5 177.5181.2 177.1 172.3 176.5 174.0 174.3 174.6 172.6 171.3 173.1176.9 170.5 174.2 177.5 176.6 182.3 172.1 169.9 179.5 175.8178.6 180.6 175.6 173.3 168.7 174.5 178.5 171.3 172.0 173.2168.8 176.0 182.6 169.5 177.5 180.6 181.5 175.1 165.2 168.0175.4 169.2 170.0 171.9 176.6 178.8 177.2 173.4 168.5 177.6175.8 164.8 175.6 180.0 176.6 176.5 177.7 174.1 180.8 170.6173.8 180.7 176.3 177.5 178.3 176.0 174.8 180.8 176.5 179.2(1)试估计当年该市20岁男性青年中,身高在175.0178.0(cm)内的占多大比例?(2)估计当年该市95%以及99%的20岁男青年身高范围。(3)若当年由该市随机抽查1名20岁男青年,试估计其身高超过180 cm的概率。解:用SPSS计算本题。数据文件:data3-n.sav。数据格式:数据库2列110行,变量n为男性青年序号,x表示身高。操作步骤:操作说明Analyze Descriptive StatisticsDescriptives Options Mean Std. Deviation Continue Variables: x OK调用Descriptives过程计算得均数=174.766,标准差=4.150 9TransformCompute调用“变量计算(Compute Variable)”对话框Target Variable P 定义目标变量“P”Numeric Expression:CDF.NORMAL(178.0,174.766,4.1509)-CDF.NORMAL(175.0,174.766,4.1509) OK当年该市20岁男性青年中,身高在175.0178.0 cm内的比例Target Variable x1 该市95%以及99%的20岁男青年身高范围间的比例Numeric Expression:174.766-1.96*4.1509OKTarget Variable x2 Numeric Expression:174.766+1.96*4.1509OKTarget Variable x3 Numeric Expression:174.766-2.58*4.1509OKTarget Variable x4 Numeric Expression:174.766+2.58*4.1509OKTarget Variable p1 Numeric Expression:1-CDF.NORMAL(180.0,174.766,4.1509)OK由该市随机抽查1名20岁男青年,其身高超过180 cm的概率计算结果(练习图3-1):Descriptive StatisticsNMeanStd. Deviationx110174.7664.1509Valid N (listwise)110练习图3-1 SPSS输出结果以上是SPSS输出结果,得到均数(Mean)为174.766 cm,标准差(Std. Deviation)为4.150 9 cm。估计当年该市20岁男性青年中,身高在175.0178.0 cm内的比例为25.956%,身高在175.0178.0 cm内的约有29人。 估计当年该市95%的20岁男青年身高范围为166.63182.90 cm,99% 的20岁男青年身高范围为164.06185.48 cm。 由该市随机抽查1名20岁男青年,估计其身高超过180 cm的概率约为10%。 (祁爱琴 高 永 石德文)第4章 参数估计思考与练习参考答案 一、最佳选择题1.关于以0为中心的t分布,错误的是()A. t分布的概率密度图是一簇曲线B. t分布的概率密度图是单峰分布C. 当n时,t分布Z分布 D. t分布的概率密度图以0为中心,左右对称E. n相同时,值越大,P值越大2.某指标的均数为,标准差为S,由公式计算出来的区间常称为()。A. 99%参考值范围 B. 95%参考值范围 C. 99%置信区间D. 95%置信区间 E. 90%置信区间3.样本频率与总体概率均已知时,计算样本频率p的抽样误差的公式为()。A. B. C. D. E. 4在已知均数为, 标准差为 的正态总体中随机抽样, ()的概率为5%。A. B. C. D. E.5. ()小,表示用样本均数估计总体均数的精确度高。A. CV B. S C. D. R E. 四分位数间距6. 95%置信区间的含义为():A. 此区间包含总体参数的概率是95% B. 此区间包含总体参数的可能性是95%C. “此区间包含总体参数”这句话可信的程度是95%D. 此区间包含样本统计量的概率是95% E. 此区间包含样本统计量的可能性是95%二、思考题1. 简述标准误与标准差的区别。 答: 区别在于:(1)标准差反映个体值散布的程度,即反映个体值彼此之间的差异;标准误反映精确知道总体参数(如总体均数)的程度。(2)标准误小于标准差。(3)样本含量越大,标准误越小,其样本均数更有可能接近于总体均数,但标准差不随样本含量的改变而有明显方向性改变,随着样本含量的增大,标准差有可能增大,也有可能减小。2. 什么叫抽样分布的中心极限定理? 答: 样本含量n越大,样本均数所对应的标准差越小,其分布也逐渐逼近正态分布,这种现象统计学上称为中心极限定理(central limit theorem)。当有足够的样本含量(如)时,从任何总体中抽取随机样本的样本均数近似地服从正态分布。样本含量越大,抽样分布越接近于正态分布。正态分布的近似程度与总体自身的概率分布和样本含量有关。如果总体原本就是正态分布,那么对于所有值,抽样分布均为正态分布。如果总体为非正态分布,仅在n值较大情况下近似服从正态分布。一般说,时的抽样分布近似为正态分布;但是,如果总体分布极度非正态(如双峰分布、极度偏峰分布),即使有足够大的值,抽样分布也将为非正态。3. 简述置信区间与医学参考值范围的区别。 答: 置信区问与医学参考值范围的区别见练习表4-1。练习表4-1 置信区间与医学参考值范围的区别区别置信区间参考值范围含义用途计算公式总体参数的波动范围,即按事先给定的概率100(1-a)%所确定的包含未知总体参数的一个波动范围估计未知总体均数所在范围s未知: s已知或s未知但n30,有或个体值的波动范围,即按事先给定的范围100(1-a)%所确定的“正常人”的解剖、生理、生化指标的波动范围供判断观察个体某项指标是否“正常”时参考(辅助诊断)正态分布: 偏峰分布:PXP100-X4. 何谓置信区间准确度与精确度?如何协调两者间的关系。答:置信区间有准确度(accuracy)与精密度(precision)两个要素。准确度由置信度(1a) 的大小确定,即由置信区间包含总体参数的可能性大小来反映。从准确度的角度看,置信度愈接近于1愈好,如置信度99比95好。精密度是置信区间宽度的一半(即、),意指置信区间的两端点值离样本统计量(如、p)的距离。从精密度的角度看,置信区间宽度愈窄愈好。在抽样误差确定的情况下,两者是相互矛盾的。为了同时兼顾置信区间的准确度与精密度,可适当增加样本含量。三、计算题1.随机抽取了100名一年级大学生,测得空腹血糖均数为4.5 mmol/L,标准差为0.61 mmol/L。试估计一年级大学生空腹血糖总体均数及方差的95置信区间。答:总体均数95置信区间为(4.379,4.621),方差的95置信区间为(0.286 9, 0.502 1)。2.调查某地蛲虫感染情况,随机抽样调查了260人,感染人数为100。试估计该地蛲虫感染率的95%置信区间。 答:该地蛲虫感染率的95%置信区间为(32.55,44.38)。(宇传华) 第5章 假设检验 思考与练习参考答案一、最佳选择题1. 样本均数比较作t检验时,分别取以下检验水准,以( E )所取类错误最小。A. B. C. D. E. 2. 在单组样本均数与一个已知的总体均数比较的假设检验中,结果t=3.24,t0.05,v =2.086, t0.01,v =2.845。正确的结论是( E )。A. 此样本均数与该已知总体均数不同B. 此样本均数与该已知总体均数差异很大C. 此样本均数所对应的总体均数与该已知总体均数差异很大D. 此样本均数所对应的总体均数与该已知总体均数相同E. 此样本均数所对应的总体均数与该已知总体均数不同3. 假设检验的步骤是( A )。 A. 建立假设,选择和计算统计量,确定P值和判断结果B. 建立无效假设,建立备择假设,确定检验水准C. 确定单侧检验或双侧检验,选择t检验或Z检验,估计类错误和类错误D. 计算统计量,确定P值,作出推断结论E. 以上都不对4. 作单组样本均数与一个已知的总体均数比较的t检验时,正确的理解是( C )。A. 统计量t越大,说明两总体均数差别越大B. 统计量t越大,说明两总体均数差别越小C. 统计量t越大,越有理由认为两总体均数不相等D. P值就是aE. P值不是a,且总是比a小5. 下列( E )不是检验功效的影响因素的是:A. 总体标准差 B. 容许误差 C. 样本含量nD. 类错误 E. 类错误二、思考题1试述假设检验中与P的联系与区别。答:a值是决策者事先确定的一个小的概率值。P值是在成立的条件下,出现当前检验统计量以及更极端状况的概率。Pa时,拒绝假设。2. 试述假设检验与置信区间的联系与区别。答:区间估计与假设检验是由样本数据对总体参数作出统计学推断的两种主要方法。置信区间用于说明量的大小,即推断总体参数的置信范围;而假设检验用于推断质的不同,即判断两总体参数是否不等。 3. 怎样正确运用单侧检验和双侧检验?答:选用双侧检验还是单侧检验需要根据数据的特征及专业知识进行确定。若比较甲、乙两种方法有无差异,研究者只要求区分两方法有无不同,无需区分何者为优,则应选用双侧检验。若甲法是从乙法基础上改进而得,已知如此改进可能有效,也可能无效,但不可能改进后反不如以前,则应选用单侧检验。在没有特殊专业知识说明的情况下,一般采用双侧检验即可。4. 试述两类错误的意义及其关系。答:类错误(typeerror):如果检验假设实际是正确的,由样本数据计算获得的检验统计量得出拒绝的结论,此时就犯了错误,统计学上将这种拒绝了正确的零假设(弃真)的错误称为类错误。类错误(type error):假设检验的另一类错误称为类错误(type error),即检验假设原本不正确(正确),由样本数据计算获得的检验统计量得出不拒绝(纳伪)的结论,此时就犯了类错误。类错误的概率用b 表示。在假设检验时,应兼顾犯类错误的概率()和犯类错误的概率()。犯类错误的概率()和犯类错误的概率()成反比。如果把类错误的概率定得很小,势必增加犯类错误的概率,从而降低检验效能;反之,如果把类错误的概率定得很小,势必增加犯类错误的概率,从而降低了置信度。为了同时减小和,只有通过增加样本含量,减少抽样误差大小来实现。5试述检验功效的概念和主要影响因素。答:拒绝不正确的的概率,在统计学中称为检验功效(power of test),记为。检验功效的意义是:当两个总体参数间存在差异时(如备择假设:成立时),所使用的统计检验能够发现这种差异(拒绝零假设:)的概率,一般情况下要求检验功效应在0.8以上。影响检验功效的四要素为总体参数的差异、总体标准差、检验水准及犯类错误的概率。6简述假设检验的基本思想。答:假设检验是在H0成立的前提下,从样本数据中寻找证据来拒绝、接受的一种“反证”方法。如果从样本数据中得到的证据不足,则只能不拒绝,暂且认为成立(因为拒绝的证据不足),即样本与总体间的差异仅仅是由于抽样误差所引起。拒绝是根据某个界值,即根据小概率事件确定的。所谓小概率事件是指如果比检验统计量更极端(即绝对值更大)的概率较小,比如小于等于0.05(各种科研杂志习惯上采用这一概率值),则认为零假设的事件在某一次抽样研究中不会发生,此时有充分理由拒绝,即有足够证据推断差异具有统计学意义。三、计算题1. 一般正常成年男子血红蛋白的平均值为140 g/L,某研究者随机抽取25名高原地区成年男子进行检查,得到血红蛋白均数为155 g/L,标准差25 g/L。问:高原地区成年男子的血红蛋白是否比一般正常成年男子的高? 解: : (单侧)=3.00 t=3,可认为高原地区居民的血红蛋白比一般正常成年男子的高。2. 一般而言,对某疾病采用常规治疗,其治愈率约为45%。现改用新的治疗方法,并随机抽取180名该疾病患者进行了新疗法的治疗,治愈117人。问新治疗方法与常规疗法的效果是否有差别?解:,:,5.41Z=5.41,可认为新治疗方法与常规疗法的效果不同,新疗法优于常规疗法。 (林爱华 宇传华)第6章 两样本定量资料的比较思考与练习参考答案一、 最佳选择题1. 正态性检验,按 =0.10检验水准,认为其总体服从正态分布,此时若推断有错,其错误的概率为( D )。A. 大于0.10 B. 等于0.10 C. 小于0.10 D. 等于,而未知 E. 等于1-,而未知2. 甲、乙两人分别从同一随机数字表抽取30个(各取两位数字)随机数字作为两个样本,求得、,则理论上( C )。A. B. C. 由甲、乙两样本均数之差求出的总体均数95%可信区间,很可能包括0D. 作两样本均数比较的t检验,必然得出无统计学意义的结论E. 作两样本方差比较的F检验,必然方差齐3. 两样本均数比较时,能用来说明两组总体均数间差别大小的是( D )。 A. t值 B. P值 C. F值 D. 两总体均数之差的95%置信区间E. 上述答案均不正确4. 两小样本均数比较,方差不齐时,下列说法不正确的是( C )。A. 采用秩和检验 B. 采用t检验 C. 仍用t检验 D. 变量变换后再作决定E. 要结合正态性检验结果方能作出决定5. 两样本秩和检验的是 ( B )。A. 两样本秩和相等 B. 两总体分布相同 C. 两样本分布相同 D. 两总体秩和相等 E. 两总体均数相等6. 在统计检验中是否选用非参数统计方法( A )。 A. 要根据研究目的和数据特征作决定 B. 可在算出几个统计量和得出初步结论后进行选择 C. 要看哪个统计结论符合专业理论 D. 要看哪个值更小 E. 既然非参数统计对资料没有严格的要求,在任何情况下均能直接使用7. 配对样本差值的Wilcoxon符号秩和检验,确定P值的方法是( D )。A. T越大,P值越小B. T越大,P值越大C. T值在界值范围内,P值小于相应的D. T值界值,P值大于相应的值E. T值在界值范围上,P值大于相应的8. 成组设计两样本比较的秩和检验,其检验统计量T是( C )。A. 为了查T界值表方便,一般以秩和较小者为TB. 为了查T界值表方便,一般以秩和较大者为TC. 为了查T界值表方便,一般以例数较小者秩和为TD. 为了查T界值表方便,一般以例数较大者秩和为TE. 当两样本例数不等时,任取一样本的秩和为T都可以查T界值表二、思考题1假设检验中,P值和的含义是什么?两者有什么关系? 答:P是指H0成立时出现目前样本情形的概率最多是多大, 是事先确定的检验水准。但P值的大小和没有必然关系。2. 既然假设检验的结论有可能有错,为什么还要进行假设检验? 答:假设检验中,无论拒绝不拒绝H0,都可能会犯错误,表现为拒绝H0时,会犯类错误,不拒绝H0时,会犯类错误,但这并不能否认假设检验的作用。只要涉及到抽样,就会有抽样误差的存在,因此就需要进行假设检验。只是要注意,假设检验的结论只是个概率性的结论,它的理论基础是“小概率事件不可能原理”。3. 配对设计资料能否用完全随机设计资料的统计检验方法?为什么?答:不能。采用完全随机设计资料的t检验会使检验效能降低,从而可能会使应有的差别检验不出来。4. 对于完全随机设计两样本定量资料的比较,如何选择统计方法? 答:完全随机设计两样本定量资料比较统计方法的选择最关键的是看是否满足正态性(样本量较大时不必进行正态性检验)和方差齐性。如果资料来自正态总体且总体方差齐,采用t 检验;如果满足正态性但总体方差不齐,采用t检验;当两者都不满足时,才考虑选用秩和检验。当然,我们也可采用变量变换的方法使其满足t或t检验的条件。5. 为什么在秩和检验编秩次时不同组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次”? 答:秩和检验编秩次时不同组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次”,是因为取不取“平均秩次”对该组的总的秩和没有影响。三、计算题 1. 某单位研究饲料中维生素E缺乏对肝中维生素A含量的影响,将同种属、同年龄、同性别、同体重的大白鼠配成8对,并将每对动物随机分配到正常饲料组和缺乏维生素E的饲料组,定期将大白鼠杀死,测定其肝中维生素A的含量(教材表6-12),问饲料中维生素E缺乏对肝中维生素A的平均含量有无影响? 教材表6-12 正常饲料组与维生素E缺乏组大白鼠肝中维生素A含量/(Umg-1) 大白鼠对别12345678正常饲料组3.552.603.003.953.803.753.453.05维生素E缺乏组2.452.401.803.203.252.702.401.75解:此题是个配对设计的资料,差值的正态性检验结果表明:差值来自正态总体(检验:P=0.268),所以采用配对t检验。结果为:t=6.837,=7,P0.001,拒绝H0,可以认为维生素E缺乏对肝中维生素A含量有影响。2. 某实验室观察局部温热治疗小鼠移植性肿瘤的疗效,以生存日数作为观察指标。实验结果如下,请比较两组的平均生存日数有无差别。实验组10121415151718202680对照组2367891012121330解:此题是个完全随机设计的资料。两组资料的正态性检验结果表明,差值来自正态总体(检验:P10.001,P2=0.011),所以采用两样本比较的秩和检验。结果为:T1=150.5, T2=80.5,本例中n110,n2n11,对应双侧0.05的界值为81139,故在0.05的水平上拒绝H0,认为两组小鼠生存日数不同。 (施学忠 杨永利 赵耐青)第7章 多组定量资料的比较思考与练习参考答案一、最佳选择题1. 完全随机设计资料的方差分析中,必然有( C )。 A. B. C. =+ D. E. 2. 定量资料两样本均数的比较,可采用( D )。 A. 检验 B.检验 C. Bonferroni检验 D. 检验与检验均可 E. LSD检验3. 当组数等于2时,对于同一资料,方差分析结果与检验结果相比,( C )。A. 检验结果更为准确 B. 方差分析结果更为准确 C. 完全等价且D. 完全等价且 E. 两者结果可能出现矛盾4. 若单因素方差分析结果为,则统计推断是( D )。A. 各样本均数都不相等 B. 各样本均数不全相等 C. 各总体均数都不相等 D. 各总体均数不全相等 E. 各总体均数全相等5. 完全随机设计资料的方差分析中,组间均方表示( C )。 A. 抽样误差的大小 B. 处理效应的大小 C. 处理效应和抽样误差综合结果 D. 个数据的离散程度 E. 随机因素的效应大小6. 多样本定量资料比较,当分布类型不清时应选择( D )。A. 方差分析 B. 检验 C. Z检验 D. Kruskal-Wallis检验 E. Wilcoxon检验7. 多组样本比较的Kruskal-Wallis检验中,当相同秩次较多时,如果用值而不用校正后的值,则会( C )。A 提高检验的灵敏度 B把一些无差别的总体推断成有差别C. 把一些有差别的总体推断成无差别 D、类错误概率不变 E. 以上说法均不对二、思考题1. 方差分析的基本思想和应用条件是什么?答:方差分析的基本思想是,对于不同设计的方差分析,其思想都一样,即均将处理间平均变异与误差平均变异比较。不同之处在于变异分解的项目因设计不同而异。具体来讲, 根据试验设计的类型和研究目的,将全部观测值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用加以解释,通过比较不同变异来源的均方,借助F分布作出统计推断,从而推论各种研究因素对试验结果有无影响。其应用条件是, 各样本是相互独立的随机样本,均服从正态分布; 各样本的总体方差相等,即方差齐性。2. 多组定量资料比较时,统计处理的基本流程是什么?答:多组定量资料比较时首先应考虑用方差分析,对其应用条件进行检验,即方差齐性及各样本的正态性检验。若方差齐性,且各样本均服从正态分布,选单因素方差分析。若方差不齐,或某样本不服从正态分布,选Kruskal-Wallis秩和检验,或通过某种形式的数据变换使其满足方差分析的条件。若方差分析或秩和检验结果有统计学意义,则需选择合适的方法(如Bonferonni、LSD法等)进行两两比较。三、计算题:1. 根据教材表7-11资料,大白鼠感染脊髓灰质炎病毒后,再作伤寒或百日咳接种是否影响生存日数?若结论为“有影响”,请作多重比较(与对照组比)。教材表7-11 各组大鼠接种后生存日数/天伤寒百日咳对照 56 8 76 9 8710 9810 98101091110912111012111014121116解:本题资料可考虑用完全随机设计的单因素方差分析进行统计处理。(1)建立检验假设,确定检验水准。:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数相等。:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数不等或不全相等,=0.05。(2)方差分析应用前提条件的检验 首先进行正态性及方差齐性检验,三组均服从正态分布(P10.684,P20.591,P30.507),三个总体的方差齐(P0.715),符合单因素方差分析的条件,可行方差分析。(3)各组可分别采用均数和标准差描述其集中趋势和离散趋势,各组的统计描述及总体均数的置信区间如下:表1三组大鼠接种后生存日数的描述性统计量/天N均数标准差95%置信区间下限上限伤寒109.202.107.7010.70百日咳108.401.717.179.63对照1011.22.399.4912.91合计309.602.348.7310.47(4)资料的方差分析见方差分析表 方差分析结果,即大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数不等或不全相等。表2三组大鼠接种后生存日数差别有无统计学意义的方差分析表变异来源SSdfMSFP组间41.6220.8004.7760.017组内117.6274.356合计159.229进一步行多重比较(LSD检验),结果两实验组均与对照组有统计学差异。认为大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗对生存日数有影响,生存日数减少。表3三组大鼠接种后生存日数两两比较的结果对比组P均数差值的95置信区间下限上限伤寒组与对照组2.00.93330.041-3.92-0.09百日咳组与对照组2.80.93330.006-4.72-0.892. 将18名乙脑患者随机分为三组,分别用单克隆抗体、胸腺肽和利巴韦林三种药物治疗,观察指标为治疗后的退热时间,结果见教材表7-12。问三组治疗结果的差异是否具有统计学意义? 教材表7-12 三组乙脑患者的退热时间/天治疗分组退热时间单克隆抗体组020059胸腺肽组321367102利巴韦林组011151131解:从专业上考虑,退热时间一般不服从正态分布,可采用KraskalWallis检验分析三组乙脑患者的退热时间差异有无统计学意义。(1) 各组可分别采用四份位数描述其集中趋势和离散趋势,各组的统计描述如下:表1三组乙脑患者退热时间的描述性统计量/天组别NP25P50P75单克隆抗体组60.001.006.00胸腺肽组65.008.5017.75利巴韦林组60.757.0012.00(2)建立检验假设,确定检验水准。:三组乙脑患者的退热时间相等,:三组乙脑患者的退热时间不等或不全相等,=0.05。(3)KraskalWallis检验结果,4.799,2,P=0.0910.05。结论为,在=0.05的水平上尚不能认为三组治疗结果的差异具有统计学意义。 (王 玖 徐天和 高 永 石德文)第8章 定性资
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!