九章1节-计量统计描述ppt课件

上传人:20****08 文档编号:240675242 上传时间:2024-04-29 格式:PPT 页数:69 大小:481.98KB
返回 下载 相关 举报
九章1节-计量统计描述ppt课件_第1页
第1页 / 共69页
九章1节-计量统计描述ppt课件_第2页
第2页 / 共69页
九章1节-计量统计描述ppt课件_第3页
第3页 / 共69页
点击查看更多>>
资源描述
第九章第九章 数值变量资料的数值变量资料的统计分析统计分析第一节第一节 数值变量资料的统计描述数值变量资料的统计描述第九章 数值变量资料的统计分析第一节 1 对数值变量资料进行统计分析的对数值变量资料进行统计分析的一般步骤,是先对观察测量得到的变量一般步骤,是先对观察测量得到的变量值(即观察值)进行统计描述,再在此值(即观察值)进行统计描述,再在此基础上进行深入的统计推断。基础上进行深入的统计推断。统计描述的工作主要是在编制频数统计描述的工作主要是在编制频数表的基础上描述资料的集中位置和离散表的基础上描述资料的集中位置和离散程度。程度。对数值变量资料进行统计分析的一般步2一、数值变量资料的频数分布一、数值变量资料的频数分布二、平均水平指标二、平均水平指标三、离散程度指标三、离散程度指标一、数值变量资料的频数分布3一、数值变量资料的频数分布一、数值变量资料的频数分布频数分布表频数分布表:频数频数:不同组别内的观察值个数称为频数,不同组别内的观察值个数称为频数,表示观察值在各组内出现的频繁程度表示观察值在各组内出现的频繁程度 频数表频数表:将分组标志和相应的频数列成表格,:将分组标志和相应的频数列成表格,即为频数分布表,简称频数表即为频数分布表,简称频数表频数分布图频数分布图:根据频数分布表可以绘制频数分布图根据频数分布表可以绘制频数分布图 一、数值变量资料的频数分布频数分布表:4(一)编制频数分布表和绘制频数分布图6.005.283.905.304.203.905.605.664.104.004.503.774.344.304.225.305.133.794.805.204.702.945.904.502.105.605.902.854.904.225.633.214.663.005.963.453.504.233.903.884.244.434.882.483.403.263.213.602.734.154.604.354.965.615.875.014.335.744.873.963.003.933.155.003.443.502.854.874.603.404.793.026.234.982.895.826.305.205.403.002.804.434.505.526.404.865.904.703.474.664.785.702.664.103.705.403.704.374.206.104.805.105.552.975.113.263.046.015.074.225.395.344.473.585.264.544.073.833.976.054.022.692.525.216.554.284.455.154.455.373.803.734.492.442.763.333.016.433.552.63表表9-1 某地某地140名健康成年男性血清尿素氮浓度(名健康成年男性血清尿素氮浓度(mmol/L)(一)编制频数分布表和绘制频数分布图6.005.283.905频数表的编制步骤频数表的编制步骤1、求全距:R=6.55-2.10=4.45(mmol/L)2、按全距的大小决定组数,组段和组段。习惯上分习惯上分10101515组,组,组距组距 i=R/10=i=R/10=4.45/10=0.445/10=0.445将将 i i 取整取整,i=0.4,i=0.4(mmol/L)频数表的编制步骤1、求全距:R=6.55-2.10=4.46划分组段:第一组段(第一组段(2.002.00)包含最小值。)包含最小值。最后一个组段(最后一个组段(6.406.406.806.80)包含最大值。)包含最大值。除最后一个组段外,其余各组段均不标出上限。除最后一个组段外,其余各组段均不标出上限。Min=2.10Min=2.10Max=6.55Max=6.55划分组段:Min=2.10Max=6.5573、列表划记:统计各组段内的数据频列表划记:统计各组段内的数据频数得出表的数得出表的“频数频数”栏,该表称之为栏,该表称之为频数表频数表。3、列表划记:统计各组段内的数据频数得出表的“频数”栏,该表8尿素氮浓度尿素氮浓度划记划记频数频数 累计频数累计频数频率()频率()累计频率()累计频率()2.0022 1.43 1.432.40 正正79 5.00 6.432.80 正正正正1322 9.2915.713.20 正正正正143610.0025.713.60 正正正正正正155110.7136.434.00 正正正正正正197013.5750.004.40 正正正正正正188812.8662.864.80 正正正正正正1610411.4374.295.20 正正正正1411810.0084.295.60 正正正正13131 9.2993.576.00 正正6137 4.2897.866.40 6.803140 2.14100.00合计140100.00表9-2 140名健康成年男性血清尿素氮浓度(mmol/L)频数表 尿素氮浓度划记频数 累计频数频率()累计频率()2.009频数分布图(直方图)频数分布图(直方图)频数分布图(直方图)10(二)频数表和频数分布图用途1.1.揭示频数的分布特征揭示频数的分布特征。2.2.揭示频数的分布类型揭示频数的分布类型。3.3.便于发现可疑值便于发现可疑值。4.4.便于进一步计算统计指标和进行统计便于进一步计算统计指标和进行统计分析。分析。(二)频数表和频数分布图用途1.揭示频数的分布特征。11(1 1)、集中趋势:频数向中央部分集中。)、集中趋势:频数向中央部分集中。(2 2)、离散趋势:从中央部分到两侧频数)、离散趋势:从中央部分到两侧频数分布逐渐减少。分布逐渐减少。(1)、集中趋势:频数向中央部分集中。12n2描述频数分布的类型 n(1)对称分布:若各组段的频数以频数最多组段为中心左右两侧大体对称,就认为该资料是对称分布 2描述频数分布的类型 13九章1节-计量统计描述ppt课件14 n(2)偏峰分布:n1)正偏峰分布(skewed positive distribution):频数分布的高峰向左偏移,右侧的组段数多于左侧的组段数,频数向右侧拖尾 (2)偏峰分布:15 n2)负 偏 峰 分 布(negative skewness distribution):频数分布的高峰向右偏移,左侧的组段数多于右侧的组段数,频数向左侧拖尾 2)负偏峰分布(negative skewness dis16 对称分布:集中位置居中对称分布:集中位置居中频数分布频数分布 正偏峰正偏峰 偏峰分布偏峰分布 负偏峰负偏峰频数分布的类型频数分布的类型 对称分布:集中位置17 n3便于发现一些特大或特小的可疑值n 3便于发现一些特大或特小的可疑值18 n4便于进一步计算统计指标和进行统计处理 4便于进一步计算统计指标和进行统计处理19二、计量资料集中趋势的描述n平均数(average):是一类描述数据分是一类描述数据分布集中趋势或平均水平的统计指标。布集中趋势或平均水平的统计指标。二、计量资料集中趋势的描述平均数(average):是一类描20平均水平指标平均水平指标常用的描述指标:常用的描述指标:常用的描述指标:常用的描述指标:一、算术均数一、算术均数一、算术均数一、算术均数(arithmetic mean),(arithmetic mean),二、几何均数二、几何均数二、几何均数二、几何均数(geometric mean)G(geometric mean)G三、中位数三、中位数三、中位数三、中位数(median)M(median)M平平平平均均均均数数数数平均水平指标常用的描述指标:平均数21(一(一)、算术均数、算术均数算术均数简称均数均数(mean),描述一组同质资料的平均水平。总体均数:样本均数:(一)、算术均数22应用n 适用于对称分布,特适用于对称分布,特别是正态分布资料。别是正态分布资料。应用 适用于对称分布,特别是正态分布资料。23计算方法n(1)直接计算法:适用于观察单位较少时n公式:计算方法(1)直接计算法:适用于观察单位较少时24例例:有有8 8名正常成年女子的血清甘油三酯名正常成年女子的血清甘油三酯(mmol/Lmmol/L)的测定值分别为)的测定值分别为1.341.34,0.960.96,1.111.11,1.521.52,1.121.12,0.910.91,1.331.33,1.241.24,求其算术均数。,求其算术均数。例:有8名正常成年女子的血清甘油三酯(mmol/L)的测定25 n(2)加权法:频数表资料n公式:(2)加权法:频数表资料26组段组段频数(频数(f fi i)组中值(组中值(x xi i)f fi ix xi if fi ix xi i2 22.0022.204.409.682.40 72.6018.2047.322.80 133.0039.00117.003.20 143.4047.60161.843.60 153.8057.00216.604.00 194.2079.80335.164.40 184.6082.80380.884.80 165.0080.00400.005.20 145.4075.60408.245.60 135.8075.40437.326.00 66.2037.20230.646.40 6.8036.6019.80130.68合计合计140(f fi i)616.80(f fi ix xi i)2875.36(f fi ix xi i2 2)140名成年男子的名成年男子的BUN浓度(浓度(mmol/L)均数与标准差计算用表)均数与标准差计算用表组段频数(fi)组中值(xi)fixifixi22.0027(2)加权法(适用于大样本,频数表资料)加权法(适用于大样本,频数表资料)(2)加权法(适用于大样本,频数表资料)28(二)、几何均数(二)、几何均数(geometric meangeometric mean,G)G)n适用于等比资料或对数正态分布资料,如血清抗体滴度、细菌计数等。(二)、几何均数(geometric mean,G)适用于等29(二)、几何均数(二)、几何均数(geometric meangeometric mean,G)G)计算方法计算方法 1.1.直接法直接法:适用于样本量较小的计量资料。或 (二)、几何均数(geometric mean,G)30n例9-3 有8份血清的某种抗体效价分别为1:200、1:25、1:400、1:800、1:50、1:100、1:50、1:25,求平均抗体效价。将各抗体效价取倒数,代入公式9-3这8份血清的抗体平均效价为1:100例9-3 有8份血清的某种抗体效价分别为1:200、1:2312.2.加权法:加权法:适用于样本量较大的计量资料,如频数表资料。2.加权法:适用于样本量较大的计量资料,如频数表资料。32例9-4 某地对112名儿童接种某种疫苗一个月后,测定了各儿童血清抗体的滴度,结果如表9-4第(1)、(2)栏,试求平均滴度。112名儿童接种疫苗后血清抗体滴度为1:48例9-4 某地对112名儿童接种某种疫苗一个月后,测定了各33(二)几何均数的应用注意事项(二)几何均数的应用注意事项 1.几何均数常用于等比资料或对数正态分布资料,如血清抗体滴度、细菌计数等。2.观察值中不能有观察值中不能有0。3.观察值一般不能同时有正值和负值。若全是负值,计算时可先将负号去掉,得出结果后再加上负号。(二)几何均数的应用注意事项34(三三)、中位数(、中位数(M M)与百分位数)与百分位数1、M:是指将一组观察值从小到大排列,位次是指将一组观察值从小到大排列,位次是指将一组观察值从小到大排列,位次是指将一组观察值从小到大排列,位次居中的观察值就是中位数。居中的观察值就是中位数。居中的观察值就是中位数。居中的观察值就是中位数。小小大大(三)、中位数(M)与百分位数1、M:是指将一组观察值从小到35计算n公式:n n为奇数时 n nn为偶数时 计算公式:36例9-5 8名患者食物中毒的潜伏期分别为1,2,3,3,4,5,8,16小时,求其中位数。本例n=8,为偶数,该8名食物中毒患者潜伏期的中位数为3.5小时例9-5 8名患者食物中毒的潜伏期分别为1,2,3,3,437n 例9-6 某传染病11名患者的潜伏期(天)分别为1、2、2、3、3、4、5、6、7、7、9,求中位数。本例n=11,为奇数,该11名传染病患者潜伏期的中位数为4天 例9-6 某传染病11名患者的潜伏期(天)分别为1、2、38中位数的应用注意事项 1.中位数可用于各种分布的资料。2.中位数不受极端值的影响,因此,实际工作中主要用于:(1)偏峰分布资料 (2)端点无确切值的资料 (3)分布不明确的资料中位数的应用注意事项392.百分位数定义:百分位数(percentile)是指将观察值从小到大排列后处于第x百分位置上的数值。用符号表示为 ,它是个位置指标。计算公式:2.百分位数定义:百分位数(percentile)是指将观察40 PX X%(100-X)%41308308名名6 6岁以下儿童的尿铅值中位数及百分位数的计算表岁以下儿童的尿铅值中位数及百分位数的计算表P P2525=25+(25/54)=25+(25/54)(3082530825%-27-27)=48.15=48.15(mmol/Lmmol/L)尿铅值尿铅值(mmol/L)(1)例数例数f(2)累计频数累计频数f(3)累计频率累计频率(%)(4)=(3)/n027 27 8.772554 81 26.305095176 57.147555231 75.0010039270 87.6612521291 94.4815012303 98.38175 5308100.00合计合计308(f)求:求:P25P25、P P5050、P P9595308名6岁以下儿童的尿铅值中位数及百分位数的计算表P25=42 三、计量资料离散趋势的描述 三、计量资料离散趋势的描述43三、离散趋势的指标(一)全距(二)四分位数间距(三)方差(四)标准差(五)变异系数三、离散趋势的指标(一)全距(二)四分位数间距(三)方差(四44 盘编号盘编号 甲甲乙乙丙丙1 14404804902 24604904953 35005005004 45405105055 5560520510合计合计250025002500250025002500均数均数500500500500500500 例例:设设甲甲、乙乙、丙丙三三人人,采采某某人人的的耳耳垂垂血血,然然后后红红细细胞胞计数,每人数计数,每人数5个计数盘,得结果如下(万个计数盘,得结果如下(万/mm3)甲乙丙 盘编号甲乙丙144048049024604904953545(一一)全距全距(Range(Range)优点:简便缺点:1.只利用了两个 端点值 2.n大,R也会大 3.不稳定1204020(一)全距(Range)优点:简便120402046(二)(二)四分位数间距(四分位数间距(quartile rangequartile range)四分位间距四分位间距:QP75 P25P100(max)P75P50(中位数中位数)P25P0(min)Px(二)四分位数间距(quartile range)四分位间470 P25 P50 P75 100%0 P25 48(三三)方方 差差(variance)(variance)方差方差:样本观察值的离均差平方和的均值。表示样本观察值的离均差平方和的均值。表示一组数据的平均离散情况。一组数据的平均离散情况。(三)方 差(variance)方差:样本观察值的离均差49 方差性质:方差越大说明数据的变异越大 自由度(degree of freedom,简记为df或)(1)定义:随机变量能自由取值的个数(2)计算公式:=n-限制条件个数 50例:有一四个(n=4)数据样本,受到 的条件限制,在自由确定4,2,5三个数据 后,第四个数只能是9,因而 =n-1=3。例:有一四个(n=4)数据样本,受到51n公式:n样本标准差用 表示 n公式:(四)标准差(standard deviation)为方差的正平方根,其单位与X一致(四)标准差(standard deviation)52 n标准差的公式还可以写成:n利用频数表计算标准差的公式为 标准差的公式还可以写成:53 盘编号盘编号 甲甲乙乙丙丙1 14404804902 24604904953 35005005004 45405105055 5560520510合计合计250025002500250025002500均数均数500500500500500500 例例:设设甲甲、乙乙、丙丙三三人人,采采某某人人的的耳耳垂垂血血,然然后后红红细细胞胞计数,每人数计数,每人数5个计数盘,得结果如下(万个计数盘,得结果如下(万/mm3)甲乙丙 盘编号甲乙丙144048049024604904953554标准差的计算标准差的计算盘编号盘编号 甲甲乙乙丙丙甲甲2 2乙乙2 2丙丙2 21 14404804901936002304002401002 24604904952116002401002450253 35005005002500002500002500004 45405105052916002601002550255 5560520510313600270400260100合计合计25002500 25002500 25002500 1260400 1251000 1250250标准差标准差50.9915.817.91标准差的计算盘编号甲乙丙甲2乙2丙21440480490155例:三组同龄男孩的身高值(cm)例:三组同龄男孩的身高值(cm)56例,计算三组资料的标准差。n甲组:例,计算三组资料的标准差。甲组:57n标准差的用途:描述数据的离散程度用于计算变异系数用于计算标准误估计参考值范围标准差的用途:58(五)变异系数变异系数(coefficient of variation)记为CV,多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。(五)变异系数变异系数(coefficient of v59 某地40名7岁男孩身高的均数为121.48cm,标准差为4.65cm;体重均数为22.18kg,标准差为2.35kg,比较其该40名男童身高和体重的变异程度?(观察指标单位不同)某地40名7岁男孩身高的均数为121.48cm,标准60均数相差较大时:均数相差较大时:九章1节-计量统计描述ppt课件61离散程度指标总结离散程度指标总结1全距,适合于任何分布全距,适合于任何分布2标准差标准差与均数的单位相同,最常用,适合于与均数的单位相同,最常用,适合于近似正态分布近似正态分布3变异系数主要用于单位不同或均数相差悬殊资料变异系数主要用于单位不同或均数相差悬殊资料4集中趋势指标和离散趋势指标分别反映资料的不同特征,集中趋势指标和离散趋势指标分别反映资料的不同特征,常配套使用常配套使用 如如 正态分布正态分布:均数、标准差;:均数、标准差;偏态分布偏态分布:中位数、四分位间距:中位数、四分位间距离散程度指标总结1全距,适合于任何分布62n1.用均数与标准差可全面描述下列哪种资料的特征nA、正偏态分布nB、负偏态分布nC、正态分布和近似正态分布nD、对称分布nE、任意分布1.用均数与标准差可全面描述下列哪种资料的特征63n2.比较身高和体重两组数据变异度大小宜采用nA、变异系数nB、方差nC、极差nD、标准差nE、四分位数间距2.比较身高和体重两组数据变异度大小宜采用64n3.当原始数据分布不明时,表示其集中趋势的指标nA、用几何均数合理nB、用均数合理nC、用中位数和均数都合理nD、用几何均数和中位数都合理nE、用中位数合理3.当原始数据分布不明时,表示其集中趋势的指标65n4.频数分布的两个重要特征是nA、总体和样本nB、总体均数和样本均数nC、总体标准差和样本标准差nD、集中趋势和离散趋势nE、参数与统计量4.频数分布的两个重要特征是66n5.均数是表示变量值的nA、平均水平nB、变化范围nC、频数分布nD、相互间差别大小nE、离散趋势5.均数是表示变量值的67n6.描述一组偏态分布资料的变异度,以下列哪个指标为好。nA、全距nB、四分位数间距nC、标准差nD、变异系数nE、方差6.描述一组偏态分布资料的变异度,以下列哪个指标为好。68n7.设同一组7岁男童身高的均数是110cm,标准差是5cm,体重的均数是25kg,标准差是3kg,则比较二者变异程度的结论为nA、身高的变异程度小于体重的变异程度nB、身高的变异程度等于体重的变异程度nC、身高的变异程度大于体重的变异程度nD、单位不同,无法比较nE、身高的变异程度与体重的变异程度之比为5:37.设同一组7岁男童身高的均数是110cm,标准差是5cm,69
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!