数理统计复习资料

上传人:文*** 文档编号:71324674 上传时间:2022-04-07 格式:DOC 页数:15 大小:313KB
返回 下载 相关 举报
数理统计复习资料_第1页
第1页 / 共15页
数理统计复习资料_第2页
第2页 / 共15页
数理统计复习资料_第3页
第3页 / 共15页
点击查看更多>>
资源描述
复习资料(资料总结,仅供参考)判断题1. 研究人员测量了100例患者外周血的红细胞数,所得资料为计数资料。X2. 统计分析包括统计描述和统计推断。3. 计量资料、计数资料和等级资料可根据分析需要相互转化。4. 均数总是大于中位数。X5. 均数总是比标准差大。X6. 变异系数的量纲和原量纲相同。X7. 样本均数大时,标准差也一定会大。X8. 样本量增大时,极差会增大。9. 若两样本均数比较的假设检验结果P值远远小于0.01,则说明差异非常大。X10. 对同一参数的估计,99%可信区间比90%可信区间好。X11. 均数的标准误越小,则对总体均数的估计越精密。 12. 四个样本率做比较, ,可认为各总体率均不相等。X13. 统计资料符合参数检验应用条件,但数据量很大,可以采用非参数方法进行初步分析。14. 对同一资料和同一研究目的,应用参数检验方法,所得出的结论更为可靠。X15. 等级资料差别的假设检验只能采用秩和检验,而不能采用列联表2检验等检验方法X。16. 非参数统计方法是用于检验总体中位数、极差等总体参数的方法。X17. 剩余平方和SS剩1=SS剩2,则r1必然等于r2。X18. 直线回归反映两变量间的依存关系,而直线相关反映两变量间的相互直线关系。19. 两变量关系越密切r值越大。X20. 一个绘制合理的统计图可直观的反映事物间的正确数量关系。21. 在一个统计表中,如果某处数字为“0”,就填“0”,如果数字暂缺则填“”,如果该处没有数字,则不填。X 22. 备注不是统计表的必要组成部分,不必设专栏,必要时,可在表的下方加以说明。 23. 散点图是描写原始观察值在各个对比组分布情况的图形,常用于例数不是很多的间断性分组资料的比较。 24. 百分条图表示事物各组成部分在总体中所占比重,以长条的全长为100%,按资料的原始顺序依次进行绘制,其他置于最后。X25. 用元参钩藤汤治疗80名高血压患者,服用半月后比服用前血压下降了2.8kPa,故认为该药有效( X )。26. 在实验设计中,样本含量越大,越符合其重复原则,越能降低实验误差(X )。填空题1、 1.96S表示:。2、 表示3、 配对四格表资料的2检验采用校正公式的条件为。4、 四格表资料的2检验采用校正公式的条件为。5、 横轴上,正态曲线下,从-1.96到+1.96的面积为。6、 横轴上,正态曲线下,从-1.96到+2.58的面积为。7、 随机区组设计的方差分析,可将总变异分解为:。8、 完全随机设计的方差分析,可将总变异分解为:。9、 表示计量资料集中趋势的统计指标有、。10、 表示计量资料离散趋势的统计指标有:、。11、 回归系数b的假设检验,H0表示为。12、 相关系数b的假设检验,H0表示为。13、 两样本均数比较的假设检验,H0表示为。14、 配对t 检验,H0表示为。15、 两样总体率比较的2检验,H0表示为。16、 两样本率比较的2检验,其自由度为。17、 单样本t 检验,其自由度为。18、 成组(两样本)t 检验,其自由度为。19、 回归(相关)假设检验,其自由度为。20、 四格表资料的2检验的基本条件是。21、 两个样本均数比较的u检验,其应用条件为: 。22、 检验的条件为23、 t检验的条件为24、 在直线相关分析中,用积差法计算相关系数的条件是:。25、 用百分位数法计算某指标的95%正常值范围,如取单侧界限,需计算的统计指标是。26、 用百分位数法计算某指标的99%正常值范围,如取单侧界限,需计算的统计指标是或。27、 完全随机设计多组差别比较的秩和检验的检验统计量为:。28、 常用的相对数有、。29、 医学资料的类型有、。30、 统计学中所指的误差,主要有、。31、 小表示。32、 比较甲乙两地血型的构成比有无差别,宜用检验。33、 总体。34、 概率。35、 平均数是,常用平均数有、。36、 中位数和四分位数间距适用分布资料,各反映该分布的特征。37、 变异系数用于;。38、 可信区间是指。39、 率的抽样误差。40、 是指对的离散程度;是指对的离散程度。41、 X服从N(8,)的正态分布,X的为:。42、 统计分析包括和。43、 完全随机设计多组差别比较的秩和检验,计算统计量H的公式为: 式中表示;表示;N表示。44、 用最小二乘法原理确定回归直线是使为最小。45、 两样本率比较的检验中,结果为P0)则称随机变量X服从以为参数的Poisson分布(Poisson Distribution),记为XP()。直线回归(linear regression)建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称简单回归(simple regression)。回归系数(regression coefficient)即直线的斜率(slope),在直线回归方程中用b表示,b的统计意义为X每增(减)一个单位时,Y平均改变b个单位。直线相关(linear correlation)又称简单相关(simple correlation),用于双变量正态分布资料。有正相关、负相关和零相关等关系。直线相关的性质可由散点图直观的说明。相关系数又称积差相关系数(coefficient of product-moment correlation),以符号r表示样本相关系数,表示总体相关系数。它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。方差分析:方差分析(analysis of variance,ANOVA)就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。通过各变异来源的均方与误差均方比值的大小,借助F分布作出统计推断,判断各因素对观测指标有无影响。配对四格表:配对四格表:为了控制随机误差而采用配对设计方案,将条件相似的两个受试对象配成一对,然后随机地让其中一个接受A处理,另一个接受B处理,每种处理的反应都按二项分类。全部n对实验结果的资料以表8-12表示,这样的表称为配对四格表。表8-12 配对四格表的形式A处理处理+abcd等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。等级资料又称有序资料。如患者的治疗结果可分为治愈、好转、有效、无效、死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量。正态分布:若资料的频率曲线对应于数学上的正态曲线,则称该资料服从正态分布。通常用记号表示均数为,标准差为的正态分布。5、简答题1.简述二项分布、Poisson分布和正态分布间的了解。 答:二项分布、Poisson分布和正态分布间的了解为:(1)在n很大,而很小,且n=为常数时,二项分布的极限分布为Poisson分布;(2)在n较大、不接近0也不接近1时,二项分布B(n,)近似正态分布,而相应的样本率P的分布也近似正态分布。(3)当增大时,Poisson分布渐近正态分布。一般而言,20时,Poisson分布资料可作为正态分布处理。2、假设检验中与P的区别何在?答:a和P均为概率,其中a是指拒绝了实际上成立的H0所犯错误的最大概率,是进行统计推断时预先设定的一个小概率事件标准。P值是由实际样本获得的,在H0成立的前提条件下,出现等于及大于(或/和等于及小于)现有样本获得的检验统计量值的概率。在假设检验中通常是将P与a对比来得到结论,若Pa,则拒绝H0,接受H1,有统计学意义,可以认为不同或不等;否则,若Pa,则不拒绝H0,无统计学意义,还不能可以认为不同或不等。3、均数、几何均数、和中位数的适用范围?均数:适用于对称分布,特别是正态分布资料。几何均数:适用于成等比级数的资料,特别是对数正态分布资料中位数:各种分布类型的资料,特别是偏态分布资料和开囗资料4、均数的可信区间与参考值范围有何不同?答:均数的可信区间与参考值范围的区别主要体现在含义、计算公式和用途三方面的不同,具体如下表所示。区别点均数的可信区间参考值范围意义按预先给定的概率所确定的未知参数的可能范围。实际上一次抽样算得的可信区间要么包含了总体均数,要么不包含。但可以说:该可信区间有多大(如当a=0.05时为95%)的可能性包含了总体均数。“正常人”的解剖、生理、生化某项指标的波动范围。计算公式s未知:*s已知:*s未知但n60: *正态分布:*偏态分布:PXP100-X用途估计总体均数判断观察对象的某项指标正常与否5、简述回归系数与相关系数的区别与了解。答:二者的了解:(1)对于既可作相关又可作回归分析的同一组数据,计算出的与正负号一致。(2)相关系数与回归系数的假设检验等价,即对于同一样本,。(3)同一组数据的相关系数和回归系数可以相互换算:。(4)用回归解释相关:由于决定系数=SS回/SS总,当总平方和固定时,回归平方和的大小决定了相关的密切程度,回归平方和越接近总平方和,则越接近1,说明引入相关的效果越好。二者的区别:(1)资料要求上:相关要求、服从双变量正态分布,这种资料进行回归分析称为型回归;回归要求在给定某个值时服从正态分布,是可以精确测量和严格控制的变量,称为型回归。(2)应用上:说明两变量间相互关系用相关,此时两变量的关系是平等的;而说明两变量间依存变化的数量关系用回归,用以说明如何依赖于而变化。(3)意义上:说明具有直线关系的两变量间相互关系的方向与密切程度;表示每变化一个单位所导致的平均变化量。(4)计算上:,。(5)取值范围:,。(6)单位:没有单位,有单位。6、为什么假设检验的结论不能绝对化?答:因为通过假设检验推断作出的结论具有概率性,其结论不可能完全正确,有可能发生两类错误。拒绝H0时,可能犯I型错误;“接受”H0时可能犯II型错误。无论哪类错误,假设检验都不可能将其风险降为0,因此在结论中使用绝对化的字词如“肯定”,“一定”,“必定”就不恰当。7、在完全随机设计方差分析中SS组间、SS组内各表示什么含义?答:表示组间变异,指各处理组样本均数大小不等,是由处理因素(如果有)和随机误差造成的;表示组内变异,指各处理组内变量值大小不等,是由随机误差造成的。8、随机区组设计的方差分析与完全随机设计方差分析在设计和变异分解上有什么不同? 答:区 别 点完全随机设计随机区组设计设计采用完全随机化的分组方法,将全部试验对象分配到g个处理组(水平组),各组分别接受不同的处理。随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个处理组受试对象数量相同,区组内均衡。变异分解三种变异:()四种变异:9、试举例说明均数的标准差与标准误的区别与了解。答:例如某医生从某地2000年的正常成年男性中,随机抽取25人,算得其血红蛋白的均数为138.5g/L,标准差S为5.20g/L,标准误为1.04g/L。在本例中标准差就是描述25名正常成年男性血红蛋白变异程度的指标,它反映了这25个数据对其算术均数的离散情况。因此标准差是描述个体值变异程度的指标,为方差的算术平方根,该变异不能通过统计方法来控制。而标准误则是指样本统计量的标准差,均数的标准误实质是样本均数的标准差,它反映了样本均数的离散程度,反映了样本均数与总体均数的差异,说明了均数的抽样误差。本例均数的标准误,此式将标准差和标准误从数学上有机地了解起来了,同时还可以看出:当标准差不变时,通过增加样本含量可以减少标准误。10、正态分布与标准正态分布了解与区别?答:二种分布均为连续型随机变量的分布。正态分布、标准正态分布均为对称分布。标准正态分布是一种特殊的正态分布(均数为0,标准差为1)。一般正态分布变量经标准化转换后的新变量服从标准正态分布。11、常用的相对数有哪几种?简述各种相对数指标的含义,计算方法及特点。答:有强度相对数(率)、结构相对数(构成比)、相对比三种。率的含义:某现象实际发生的例数与可能发生的总例数之比,说明某现象发生的频率或强度。其特点为:说明某现象发生的强弱。计算公式: 构成比的含义:事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总体中所占的比重或分布,通常以100为比例基数,又称为百分比。其特点为:一组构成比的总和应等于100%,即各个分子的总和等于分母;各构成部分之间是相互影响的,某一部分比重的变化受到两方面因素的影响,其一是这个部分自身数值的变化,其二是受其他部分数值变化的影响。计算公式: 相对比的含义:是两个有关指标之比,说明两指标间的比例关系。其特点为:两个指标可以是性质相同,也可以是性质不同;两个指标可以是绝对数、相对数或平均数。计算公式: 12、应用相对数时应注意哪些问题? 答:(1)算相对数时分母应该有足够数量;(2)分析时不能以构成比代替率;(3)分别将分子和分母合计求合计率或平均率;(4)相对数的比较应该注意其可比性;(5)样本率或构成比比较时应做假设检验13、对于四格表资料,如何正确选用检验方法? 答:(1)首先应分清是两样本率比较的四格表资料还是配对设计的四格表资料。(2)对于两样本率比较的四格表资料,应根据各格的理论值T和总例数n的大小选择不同的计算公式: 当且所有的时,用检验的基本公式或四格表资料检验的专用公式;当 但有时,用四格表资料检验的校正公式或,或改用四格表资料的Fisher确切概率法;当,或时,用四格表资料的Fisher确切概率法。若资料满足两样本率检验的条件,也可用检验。(3) 对于配对设计的四格表资料,若检验两种方法的检测结果有无差别时当时,;当时,。14、什么叫做非参数检验?它和参数检验有什么区别?答:非参数检验对总体分布不作严格假定,不受总体分布的限制,又称任意分布检验,它直接对总体分布(或分布位置)作假设检验。如果总体分布为已知的数学形式,对其总体参数作假设检验则为参数检验。15. I型错误与II型错误有何区别与了解?了解这两类错误有何实际意义?I型错误是指拒绝了实际上成立的H0所犯的“弃真”错误,其概率大小用a表示。II型错误则是指“接受”了实际上不成立的H0所犯的“取伪”错误,其概率大小用b表示。当样本含量n确定时,a愈小,b愈大;反之a愈大,b愈小。了解这两类错误的实际意义在于,若在应用中要重点减少a(如一般的假设检验),则取a=0.05;若在应用中要重点减少b(如方差齐性检验,正态性检验或想用一种方法代替另一种方法的检验等),则取a=0.10或0.20甚至更高。6、计算题1、某医生随机检测了某地225名健康成年男子的血清胆固醇含量,得=4.0(mmol/L),S=0.6(mmol/L),=0.04(mmol/L)。(1)、指出本研究的总体、观察单位(或研究单位)和变量。总体:所有成年男子。观察单位: 一名成年男子。变量:一个成年男子的血清胆固醇含 量 (2)、本研究的抽样误差为多少? 0.04(3)、试估计某地健康成年男子的血清胆固醇含量总体均数的95%的可信区间。 4.01.960.04(4) 试估计某地健康成年男子的血清胆固醇含量的95%的医学参考值范围。4.01.960.6(5) 已知健康成年男子的血清胆固醇含量的标准值为4.08(mmol/L),用统计学专业术语回答某地健康成年男子的血清胆固醇含量是否不同于标准值?(=0.01,u0.05=1.96,u0.01=2.58;采用t检验方法,t值为2.00。) 由u0.05=1.96,u0.01=2.58; t=2.00 得P0.01, 按=0.01水准,不拒绝H0 ,无统计学意义,尚不认为某地健康成年男子的血清胆固醇含量不同于标准值。2某市20岁男学生160人的脉搏数(次/分钟),经正态性检验服从正态分布。求得76.10,=9.32。试估计脉搏数的95%、99%参考值范围。解:脉搏数的95%正常值范围为:=76.101.96(9.32)=57.8394.37 脉搏数的99%正常值范围为:=76.102.58(9.32)=52.05100.373、某医院现有工作人员900人,其中男性760人,女性140人,在一次流感中发病者有108人,其中男性患者79人,而女性患者29人。试计算:该院总流感发病率?男、女流感发病率?男、女患者占总发病人数的百分比? 该院总流感发病率为:(108900)100%12% 男性流感发病率为:(79760)100%10.39% ;女性流感发病率为:(29140)100%20.71% 男性患者占总发病人数的百分比为:(79108)100%73.15% ;女性患者占总发病人数的百分比为:(29108)100%26.85%4、用甲乙两种方法检查已确诊的乳腺癌患者120名。甲法的检出率为60%,乙法的检出率为50%,甲、乙两法一致的检出率为35%,问:1、该资料为何种类型的资料?计数资料2、欲比较甲、乙两法何者为优,宜用何种假设检验方法?配对设计2检验3、列出计算检验统计量的计算表。甲法乙法+ab cd算出a42 b30 c18 d30 ,;4、若计算得的检验统计量小于相应于P=0.05的检验统计量的值时(检验水准=0.05),应如何下结论?即 P0.05,按=0.05水准,不拒绝H0 ,无统计学意义,尚不认为两种方法有差别。5、据你所作的结论,可能犯何种类型的统计错误?型5、测得8名健康人和8名期矽肺病人血清粘蛋白含量(毫克/100亳升)如下所示:健康人 期矽肺病人64.26 69.6342.84 69.7352.48 65.6548.19 96.3469.61 95.2048.61 80.4458.90 80.4480.22 74.971、 指出该研究的总体、样本含量、变量、和资料类型。总体:所有健康人 样本含量: 8 资料类型:计量资料 所有期矽肺病人 82、描述健康人(8名)血清粘蛋白含量的集中趋势,该计算哪种平均数?比较健康人与 期矽肺病人血清粘蛋白含量的变异度,该计算哪种统计指标?均数 标准差3、欲比较健康人和期矽肺病人血清粘蛋白含量是否有差别,如采用成组t检验,请指出其适用条件?各样本来自正态分布 各样本均数方差齐性4、若计算得到的检验统计量大于相应于P=0.01的检验统计量的值时(检验水准=0.01), 此时如果拒绝H0,可能犯何种类型的统计错误?犯错误的概率有多大? 型 0.015、健康人组的样本含量增加到16人,计算的总体参数的1可信区间的估计精度该如何变化?为什么? 精度提高,样本含量增加,可信区间变窄。6.为了解某一新降血压药物的效果,将28名高血压病患者随机分为试验组和对照组,试验组采用新降压药,对照组则用标准药物治疗,测得治疗前后的舒张压(mmHg)如下表: 两种药物治疗前后的舒张压(mmHg)新药病人号1234567891011121314治疗前102100929811810010211610911692108102100治疗后9090859011495868498103881008886标准药病人号1234567891011121314治疗前9810311011011094104921081101129210490治疗后1009410010511096941001041091009510085问:(1) 新药是否有效? (2)新药和标准药的疗效是否不同?(要求:1.写出统计假设检验步骤;2.正确选定假设检验方法公式;) 3.不必计算出统计量的精确值,可就假定的统计量的值作出结论.) 7、用某中药预防流感,用药组与对照组的流感发病情况如下表: 组别 观察人数 发病人数 用药组 100 14 对照组 120 30 (1) 每组流感的发病率是多少(10分)用药组 14/100*100%=14%对照组 30/120*100%=25%(2) 欲比较两组的发病率,可以选用哪些统计方法?(5分)2检验(3) 若计算得到的检验统计量小于相应检验水准=0.05时该检验统计量的临界值时,你如何作判断?(5分)即P0.05, 按=0.05水准,不拒绝H0 ,无统计学意义,尚不认为对照组与用药组的发病率不同。1、 参数:总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。2、 变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较,用c表示。3、 标准备正态分布:均数为0,标准差为1的正态分布称为标准正态分布,记为N(0,12)4、 计量资料:由一群个体的数值变量值构成的资料,即一群变量值。5、 计数资料:一群个体按无序分类变量的类别清点每类有多少个个体,即分类个体。6、 统计描述:用统计指标来表示,对集中趋势和离散趋势的描述。7、 假设检验:依据样本提供的有限信息对总体作推断的统计学方法,后对研究总体的两种对立的判断之间作选取择的决策程序。8、 p:是频率P的标准差,又称频率的标准误,反映阳性频率的抽样误差的大小。9、 样本标准差(S):是描述一组变量值离散程度的统计指标,常用于正态分布或近似正态分布的资料,标准差小,均数的代表性好10、 什么叫秩转换的非参数检验?它适用于哪些情况?答:秩转换的非参数检验是先将数值变量从小到大,或等级从弱到强转换成秩后,再计算检验统计量,其特点是假设检验的结果对总体分布的形状差别不敏感,只对总体分布的位置差别敏感。它适用于:不满足正态和(或)方差齐性的小样本计量资料;分布不知是否正态的小样本资料;一端或两端是不确切数值的资料;等级资料。友情提示:部分文档来自网络整理,供您参考!文档可复制、编制,期待您的好评与关注!15 / 15
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 大学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!