第2章定量资料的统计描述课件

上传人:沈*** 文档编号:241627340 上传时间:2024-07-11 格式:PPT 页数:98 大小:1.02MB
返回 下载 相关 举报
第2章定量资料的统计描述课件_第1页
第1页 / 共98页
第2章定量资料的统计描述课件_第2页
第2页 / 共98页
第2章定量资料的统计描述课件_第3页
第3页 / 共98页
点击查看更多>>
资源描述
医学统计学医学统计学流行病与卫生统计学系流行病与卫生统计学系1第二章第二章 定量资料的统计描述定量资料的统计描述定量资料的定量资料的统计描述统计描述统计图表:频数分布表(图)统计图表:频数分布表(图)统计指标:统计指标:集中趋势指标集中趋势指标离散趋势指标离散趋势指标利用统计表对数据进行概括,用统计图对分布形态利用统计表对数据进行概括,用统计图对分布形态及分布间的关系做直观的表达,用于描述定量资料的统及分布间的关系做直观的表达,用于描述定量资料的统计指标的意义与计算。计指标的意义与计算。2第一节第一节频数与频数分布频数与频数分布频数频数(frequency):对一个随机变量做重复观察,:对一个随机变量做重复观察,其中某变量值出现的次数。其中某变量值出现的次数。频数分布表频数分布表(frequencydistributiontable):将各变:将各变量值及其相应的频数列成表格的形式。量值及其相应的频数列成表格的形式。例例2-2抽样调查某地抽样调查某地120名名18岁岁35岁健康男性居岁健康男性居民血清铁含量民血清铁含量(mol/L)见见P12,试编制频数分布表。试编制频数分布表。频数表的编制:频数表的编制:一、连续型定量变量的频数分布一、连续型定量变量的频数分布3步骤:步骤:(1)求全距:(极差)求全距:(极差)R=29.64-7.42=22.22(2)定组段数与组距定组段数与组距:815个组段,组距个组段,组距i=全距全距/组段数组段数(3)划组段:以一个稍小于或等于最小值的整数作为第一个划组段:以一个稍小于或等于最小值的整数作为第一个组段的起点数据。组段的起点数据。下限:每个组段的起点下限:每个组段的起点(最小值最小值)。上限:每个组段的终点上限:每个组段的终点(近似最大值)。近似最大值)。注:最后一个组段应同时写出上限和下限来。注:最后一个组段应同时写出上限和下限来。(4)绘制整理表绘制整理表“下限下限x上限上限”注:各组段的频数之和应等于总的观察例数。注:各组段的频数之和应等于总的观察例数。两两端端的的组组段段应应分分别别包包含含最最小小值值或或最大值;最大值;尽尽量量取取较较整整齐齐的的数数值值作作为为组组段段的的端点,便于对数据进行表述;端点,便于对数据进行表述;组距以相等为宜。组距以相等为宜。4步骤:步骤:(1)求全距:(极差)求全距:(极差)R=29.64-7.42=22.22(2)定组段数与组距定组段数与组距:815个组段,组距个组段,组距i=全距全距/组段数组段数(3)划组段:以一个稍小于或等于最小值的整数作为第一个划组段:以一个稍小于或等于最小值的整数作为第一个组段的起点数据。组段的起点数据。下限:每个组段的起点下限:每个组段的起点(最小值最小值)。上限:每个组段的终点上限:每个组段的终点(近似最大值)。近似最大值)。注:最后一个组段应同时写出上限和下限来。注:最后一个组段应同时写出上限和下限来。(4)绘制整理表绘制整理表“下限下限x上限上限”注:各组段的频数之和应等于总的观察例数。注:各组段的频数之和应等于总的观察例数。两两端端的的组组段段应应分分别别包包含含最最小小值值或或最大值;最大值;尽尽量量取取较较整整齐齐的的数数值值作作为为组组段段的的端点,便于对数据进行表述;端点,便于对数据进行表述;组距以相等为宜。组距以相等为宜。5步骤:步骤:(1)求全距:(极差)求全距:(极差)R=29.64-7.42=22.22(2)定组段数与组距定组段数与组距:815个组段,组距个组段,组距i=全距全距/组段数组段数(3)划组段:以一个稍小于或等于最小值的整数作为第一个划组段:以一个稍小于或等于最小值的整数作为第一个组段的起点数据。组段的起点数据。下限:每个组段的起点下限:每个组段的起点(最小值最小值)。上限:每个组段的终点上限:每个组段的终点(近似最大值)。近似最大值)。注:最后一个组段应同时写出上限和下限来。注:最后一个组段应同时写出上限和下限来。(4)绘制整理表绘制整理表“下限下限x上限上限”注:各组段的频数之和应等于总的观察例数。注:各组段的频数之和应等于总的观察例数。两两端端的的组组段段应应分分别别包包含含最最小小值值或或最大值;最大值;尽尽量量取取较较整整齐齐的的数数值值作作为为组组段段的的端点,便于对数据进行表述;端点,便于对数据进行表述;组距以相等为宜。组距以相等为宜。6编制频数表的注意事项编制频数表的注意事项l第一组段应包含最小值,最后一组段应包第一组段应包含最小值,最后一组段应包含最大值;含最大值;l最后一个组段应同时写出上下限(如果可最后一个组段应同时写出上下限(如果可能);能);l每个组段只包含下限、不包含上限;每个组段只包含下限、不包含上限;l组距可以相等也可以不等;组距可以相等也可以不等;l最后的组数可能与事先想分得组数不等。最后的组数可能与事先想分得组数不等。7表表2120名正常成年男子血清铁含量的频数分布表名正常成年男子血清铁含量的频数分布表681012141618202224262830合计合计一上正一正上正正丅正正正正正正正正正丅正正正上正正丅正上止一13681220271812841组段划记频数12089二、离散型定量变量的频数分布二、离散型定量变量的频数分布10离散型变量的频数分布图离散型变量的频数分布图直条图直条图横坐标为产前检查次数;纵坐标为频率,即产前检查K次的妇女在被统计妇女中所占的比例%。图中等宽矩形长条的高度与相应检查次数的频率呈正比。11频率:各组的频数除以总例数频率:各组的频数除以总例数n所得的比值。频所得的比值。频率描述了各组频数在全体中所占的比重,各组率描述了各组频数在全体中所占的比重,各组频率之和等于频率之和等于100%。累计频数:本组段的频数与以前各组段的频数累计频数:本组段的频数与以前各组段的频数相加;相加;累计频率:每组段的累计频数除以总例数。累计频率:每组段的累计频数除以总例数。121314连续变量的频数分布图连续变量的频数分布图连续型变量的频数分布图,以直方的面积大小表连续型变量的频数分布图,以直方的面积大小表示频数的多少。示频数的多少。等距分组等距分组以横轴表示被观察变量,纵轴表示以横轴表示被观察变量,纵轴表示频率密度频率密度,以,以各矩形(宽度为组距)的面积代表各组段的频数。各矩形(宽度为组距)的面积代表各组段的频数。直方图直方图15图中横轴为血清铁含量,纵轴为频率密度,直条面积等于相应组段的频率。16三、三、频数分布的两个特征频数分布的两个特征集中趋势:血清铁含量向中央部分集中,集中趋势:血清铁含量向中央部分集中,即中等含量者居多,集中在即中等含量者居多,集中在18这个组段,这种现象为集中趋势。这个组段,这种现象为集中趋势。离散趋势:从中央部分到两侧的频数分布离散趋势:从中央部分到两侧的频数分布逐渐减少,而且逐渐减少,而且血清铁含量血清铁含量的值参差不齐,的值参差不齐,最低的接近最低的接近6,最高的接近,最高的接近30,这种现象称为离散趋势。这种现象称为离散趋势。由由于于同同质质性性,所所有有实实测测值值趋趋向向同一数值的趋势称为集中趋势。同一数值的趋势称为集中趋势。离离散散趋趋势势或或变变异异程程度度是是指指观观察察值之间参差不齐的程度。值之间参差不齐的程度。17频数分布频数分布四、频数分布的类型四、频数分布的类型对称分布型:指集中位置在正中,左右对称分布型:指集中位置在正中,左右两侧频数分布大体对称两侧频数分布大体对称。偏态分布型:指集中位置偏向一侧,频数偏态分布型:指集中位置偏向一侧,频数分布不对称。分布不对称。偏态分布型偏态分布型正偏态分布:集中位置偏向数值小的一侧。正偏态分布:集中位置偏向数值小的一侧。负偏态分布:集中位置偏向数值大的一侧负偏态分布:集中位置偏向数值大的一侧。18频数表的用途频数表的用途1.揭示频数分布的分布特征和分布类型揭示频数分布的分布特征和分布类型。文献中常将频数表作为陈述资料的形式陈述资料的形式。2.便于进一步计算统计指标和进行统计分析处理。便于进一步计算统计指标和进行统计分析处理。3.便于发现某些特大或特小的可疑值。便于发现某些特大或特小的可疑值。199019209409609801000110112114116118120122124126128130132134136139915182114104321110名名7岁男童身高(岁男童身高(cm)的频数分布)的频数分布20第二节第二节定量变量的特征数定量变量的特征数 总体中的某些个体总是具有某些同质性,同一地区、同总体中的某些个体总是具有某些同质性,同一地区、同一年度、同一民族、同一年龄段、相同的性别与类似的健康一年度、同一民族、同一年龄段、相同的性别与类似的健康状况,这些共同点使得该人群的血清铁含量应趋向同一数值,状况,这些共同点使得该人群的血清铁含量应趋向同一数值,即即集中趋势集中趋势。不同总体间比较的方式之一就是对他们的集中。不同总体间比较的方式之一就是对他们的集中趋势进行比较。另一方面,同一总体中的个体之间又普遍存趋势进行比较。另一方面,同一总体中的个体之间又普遍存在着各种差别,也就是说由于遗传、营养、行为、发育、心在着各种差别,也就是说由于遗传、营养、行为、发育、心理的各种因素在个体之间都不会完全相同,即个体间存在差理的各种因素在个体之间都不会完全相同,即个体间存在差异,因此导致某地异,因此导致某地18-3518-35岁健康男性居民血清铁含量不会完全岁健康男性居民血清铁含量不会完全相同,而是呈现或大或小的相同,而是呈现或大或小的离散趋势离散趋势。21平均数平均数:描述一组同质计量资料的集中趋势;反映一组观察值:描述一组同质计量资料的集中趋势;反映一组观察值的平均水平。的平均水平。常用的平均数有算术均数,几何均数和中位数。常用的平均数有算术均数,几何均数和中位数。(一)算术均数(一)算术均数(mean)(mean):简称均数,总体均数用希腊字母:简称均数,总体均数用希腊字母 表示,样本均数用拉丁字母表示,样本均数用拉丁字母 表示。表示。1.1.计算方法计算方法 1 1)直接法:适用于样本例数直接法:适用于样本例数n n较少的资料。较少的资料。其中其中X X1 1,X X2 2XXn n为各变量值,为各变量值,n n为样本例数。为样本例数。一、描述集中趋势的统计指标一、描述集中趋势的统计指标222)加权法:适用于变量值较多的资料。加权法:适用于变量值较多的资料。f1,f2fn分别为各组段的频数,X1,X2X0为各组段的组中值,组中值=(本组段下限+下组段下限)/2。即频数多,权数大,作用也大,频数小,权数小,作即频数多,权数大,作用也大,频数小,权数小,作用也小。用也小。23例例2-3测得测得8只正常大白鼠总酸性磷酸酶只正常大白鼠总酸性磷酸酶(TACP)含量()含量(U/L)为)为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试求其算术均数。试求其算术均数。求例求例2-2中某地中某地120名正常成年男子的血清铁名正常成年男子的血清铁含量的均数。含量的均数。24120名成年男子血清铁含量均数计算(加权法)名成年男子血清铁含量均数计算(加权法)组段组段频数(频数(f)组中值(组中值(X0)fX0(1)(2)(3)(4)=(2)(3)(5)=(3)(4)681012141618202224262830合计合计120(f)2228(fX0)43640()13681220271210841727661041803405133782762001082979111315171921232527294924372613522700578097477938634850002916841252.均数的两个重要特性均数的两个重要特性1).各离均差的总和等于各离均差的总和等于0。(总体中各变量值总体中各变量值X与均与均数之差称为离均差数之差称为离均差)2).离均差的平方和小于各观察值离均差的平方和小于各观察值X与任何数与任何数a之差的之差的平方和平方和。()即即设:a,则a=d,d0由于263.均数的应用均数的应用但它最适用于但它最适用于对称分布资料对称分布资料,尤其是,尤其是正态正态分布资料分布资料。因为这时均数位于分布的中心,最。因为这时均数位于分布的中心,最能反映资料的集中趋势。能反映资料的集中趋势。27(二)几何均数二)几何均数(geometricmean):(几何均数也称为倍数均数,用(几何均数也称为倍数均数,用G表示)表示)1.几何均数的计算方法几何均数的计算方法1)直接法:直接法:适用于样本例数n较少的资料。将n个观察值X1,X2,X3Xn的乘积开n次方对数形式:G=lg-1(lgX1+lgX2+lgX3+lgXn)/n=lg-1(lgX/n)28例例2-57名慢性迁延性肝炎患者的名慢性迁延性肝炎患者的HBsAg滴度资滴度资料为料为1:16,1:32,1:32,1:64,1:64,1:128,1:512。求其平均效价。求其平均效价。7份份HBsAg的平均滴度为的平均滴度为1:64292)加权法:加权法:适用于样本例数例数n较多较多的资料。X1,X2Xn为各组段的滴度或滴度倒数。为各组段的滴度或滴度倒数。f1,f2fn分别为各组段的频数。分别为各组段的频数。30例例2-652例慢性迁延性肝炎患者的例慢性迁延性肝炎患者的HBsAg滴度滴度数据数据见表见表2-4,求其平均滴度求其平均滴度。52例慢性肝炎患者的例慢性肝炎患者的HBsAg滴度的几何均数为滴度的几何均数为1:119.7470531二)几何均数应用的注意事项:二)几何均数应用的注意事项:1)几何均数常用于)几何均数常用于等比级数资料或资料等比级数资料或资料呈倍数关系呈倍数关系或或对数正态分布资料对数正态分布资料。2)直接计算时,观察值中不能有)直接计算时,观察值中不能有0。3)直接计算时,观察值中不能同时有正)直接计算时,观察值中不能同时有正值和负值。值和负值。32 中位数(中位数(median,median,M):将一组变量值从小到大按顺序排列,将一组变量值从小到大按顺序排列,位次居中的那个变量值就是中位数。位次居中的那个变量值就是中位数。百分位数(百分位数(percentile,percentile,Px):指把数据从小到大排列后位指把数据从小到大排列后位于于第第X%X%位置的数值位置的数值。有n个观察值X1,X2Xn,把他们由小到大按顺序排列成X1X2X3Xn,将这n个观察值平均的平均的分为100等份,对应于每一等份的数值就是一个百分位数,对应于前面对应于前面X%X%个位置的数值称为第个位置的数值称为第X X百分位数,用百分位数,用P Px x表示。表示。一个百分位数Px将总体或样本的全部观察值分为两部分,理论上,在不包括Px的全部数据中有X%的观察值比它小,有(100-X)%的观察值比它大。(三)中位数和百分位数(三)中位数和百分位数331.中位数和百分位数的计算中位数和百分位数的计算1)直接法:直接法:适用于样本例数n较少的资料。将观察值按大小顺序排列,当n为奇数奇数时,中间那个数就是中位数。当n为偶数偶数时,中间两个数的平均数就是中位数。例例2-7某药厂观察某药厂观察9只小鼠口服高山红景天醇只小鼠口服高山红景天醇提物(提物(RSAE)后在乏氧条件下的生存时间(分钟)后在乏氧条件下的生存时间(分钟)如下:如下:49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0n为奇数,为奇数,M=63.6(cm)342)频数表法计算中位数和百分位数:频数表法计算中位数和百分位数:适用于样本例数n较多的资料。累计频数累计频数:本组段的频数与以前各组段的频数:本组段的频数与以前各组段的频数相加;相加;累计频率累计频率:每组段的累计频数除以总例数。:每组段的累计频数除以总例数。公式为公式为L为百分位数所在组段的下限,i为该组段的组距,fx为该组段的频数,fL为百分位数所在组段的前一组段前一组段前一组段前一组段的累计频数,n为总例数。35例2-8利用表2-2的频数表求血清铁含量的中位数。组段组段频数频数累计频数累计频数累计频率累计频率681012141618202224262830合计合计120110.83343.336108.3381815.00123025.00205041.67277764.17189579.171210789.17811595.83411999.171120100.0036例例某市大气中某市大气中SO2的日平均浓度见表的日平均浓度见表2.5,求,求P25,P50,P75。37例例某市大气中某市大气中SO2的日平均浓度见表的日平均浓度见表2.5,求中位数,求中位数,P25,P50,P75。382.中位数和百分位数的应用中位数和百分位数的应用1)中位数常用于描述)中位数常用于描述偏态分布资料偏态分布资料的集中趋势,反映位次居的集中趋势,反映位次居中的观察值的平均水平。在对称分布的资料中,中位数和均数在中的观察值的平均水平。在对称分布的资料中,中位数和均数在理论上是相同的理论上是相同的,(但在使用过程中不能混用但在使用过程中不能混用)。2)百分位数可用于确定医学参考值范围(详后)百分位数可用于确定医学参考值范围(详后)。3)分布在中部的百分位数相当稳定,具有较好的代表性,但)分布在中部的百分位数相当稳定,具有较好的代表性,但靠近两端的百分位数,只有在样本例数足够多时才比较稳定。靠近两端的百分位数,只有在样本例数足够多时才比较稳定。39应用平均数的注意事项应用平均数的注意事项1.平均数的计算和应用必须具备平均数的计算和应用必须具备同质同质基础基础,必须先必须先合理合理分组分组。不同质的事物要分别求平均数,以便分析比较。不同质的事物要分别求平均数,以便分析比较。2.根据资料的分布选用适当的平均数根据资料的分布选用适当的平均数。对称分布资料,尤其是正态分布资料正态分布资料正态分布资料正态分布资料,宜用算术均数,而偏态分偏态分布资料布资料则中位数中位数的代表性较好,对数正态分布及等比对数正态分布及等比对数正态分布及等比对数正态分布及等比级数资料级数资料级数资料级数资料宜用几何均数。40411.极差极差(range,R)也称为全距,用R表示,即一组资料中,最大值与最小值之差。缺点:1)除了最大、最小值外,不能反映组内其他数据的变异度。2)样本例数越多,抽到较大或较小变量值的可能性越大,因而极差可能越大。3)即使样本含量相同,极差也不够稳定。二、描述离散趋势的特征数二、描述离散趋势的特征数例例2-11试观察试观察3组数据的离散情况。组数据的离散情况。A组组2628303234B组组2427303336C组组2629303134422.四分位数间距四分位数间距(quartilerange,Q)简记为简记为Q,可看为特定的百分位数。P25表示全部观表示全部观察值中有察值中有25%(1/4)的观察值比它小,记为下四分位数)的观察值比它小,记为下四分位数QL,P75表示全部观察值中有表示全部观察值中有25%(1/4)的观察值比它大,记为上)的观察值比它大,记为上四分位数四分位数QU。Q适用于适用于各种各种类型的连续型变量类型的连续型变量,特别是偏态分布,特别是偏态分布的资料。的资料。43例例据表据表2.5资料求某市大气中资料求某市大气中SO2日平均浓日平均浓度分布度分布的四份位数间距。的四份位数间距。443.方差方差(variance)A组2628303234C组2629303134分析:分析:考虑总体中每个变量值X与总体均数之差,称为离均差(X-)(离均差平方和)总体方差方差只取正值。同类资料比较时,方差越大意味着数据间变异越大。样本方差45(二)标准差(二)标准差(standarddeviation,S)总体标准差样本标准差式中式中n-1是是自由度自由度,为随机变量能自由取值的个数。它描述,为随机变量能自由取值的个数。它描述了当了当选定时选定时n个变量值中能自由变动的变量值的个数个变量值中能自由变动的变量值的个数。46SS=lxx=X2-(X)2/n1.直接法:适用于n较小的资料求例题中A组数据的标准差。2.加权法:适用于n较大的资料47120名成年男子血清铁含量均数、标准差计算表(加权法)名成年男子血清铁含量均数、标准差计算表(加权法)组段频数(f)组中值(X0)fX0fX02(1)(2)(3)(4)=(2)(3)(5)=(3)(4)681012141618202224262830合计120(f)2228(fX0)43640(fX02)13681220271210841727661041803405133782762001082979111315171921232527294924372613522700578097477938634850002916841483.标准差的应用:标准差的应用:1)表示变量分布的离散程度表示变量分布的离散程度。2)结合均数计算变异系数。结合均数计算变异系数。3)结合样本含量计算标准误。结合样本含量计算标准误。4)结合均数描述正态分布特征。)结合均数描述正态分布特征。495.变异系数变异系数(coefficientofvariation,CV)公式为:常用于:1 1)比较度量衡单位不同的多组资料的变异度比较度量衡单位不同的多组资料的变异度比较度量衡单位不同的多组资料的变异度比较度量衡单位不同的多组资料的变异度。例2-161985年通过10省调查得知,农村刚满周岁的女童体重均数为8.42kg,标准差为0.98kg;身高均数为72.4cm,标准差为3.0cm,试比较二者变异度。体重CV=0.98/8.42100%=11.64%身高CV=3.0/72.4100%=4.14%502).2).比较均数相差悬殊的几组资料的变异度。比较均数相差悬殊的几组资料的变异度。比较均数相差悬殊的几组资料的变异度。比较均数相差悬殊的几组资料的变异度。运用变异系数的注意事项:运用变异系数的注意事项:1.有关的事物才能比较有关的事物才能比较。2.均数小于标准差时要考虑其实际运用价值均数小于标准差时要考虑其实际运用价值。某地不同年龄段男子身高的变异度年龄组(岁)人数均数标准差变异系数(%)3-3.510096.13.13.2330-35100170.24.02.3551 偏度系数偏度系数(coefficientofskewness,SKEW)理论上,总体偏度系数为理论上,总体偏度系数为0 0时,分布是时,分布是对称分布对称分布对称分布对称分布;取;取正值时,分布为正值时,分布为正偏峰正偏峰正偏峰正偏峰;取负值时,分布为;取负值时,分布为负偏峰负偏峰负偏峰负偏峰。三、描述分布形态的特征数三、描述分布形态的特征数52峰度系数峰度系数(coefficientofkurtosis,KURT)理论上,理论上,正态分布正态分布正态分布正态分布的总体峰度系数为的总体峰度系数为0;取负值时,;取负值时,其分布较正态分布的其分布较正态分布的峰平阔峰平阔峰平阔峰平阔;取正值时,其分布较正;取正值时,其分布较正态分布的态分布的峰尖峭峰尖峭峰尖峭峰尖峭。三、描述分布形态的特征数三、描述分布形态的特征数5354统计表(统计表(statistical tablestatistical table)和统计图)和统计图(statistical chartstatistical chart)是统计描述的重要工具。医)是统计描述的重要工具。医学科学研究资料经过整理和计算各种必要的统计指学科学研究资料经过整理和计算各种必要的统计指标后,所得结果除了用适当文字说明以外,常用统标后,所得结果除了用适当文字说明以外,常用统计表和统计图表达分析结果。统计图表可以对于数计表和统计图表达分析结果。统计图表可以对于数据进行概括、对比或做直观的表达。统计表和统计据进行概括、对比或做直观的表达。统计表和统计图不仅便于阅读,而且便于分析比较图不仅便于阅读,而且便于分析比较。第三节第三节常用统计图表常用统计图表551概念:指在科技报告中,常将统计分析的事物概念:指在科技报告中,常将统计分析的事物及其指标用表格列出,以反映事物的内在规律性和及其指标用表格列出,以反映事物的内在规律性和关联性。关联性。2作用:作用:1)避免繁杂的文字叙述2)便于计算3)便于事物间的比较分析 一、一、统计表统计表563.3.统计表的结构统计表的结构 从外形上看,统计表由标题、标目(包括横标目、纵标目)、线条、数字及必要的文字说明和备注5部分构成。其基本格式如表1:571)标题:)标题:概括说明表的中心内容,要求用词简练、确切。必要时注明资料的时间、地点,写在表的上端中央。注意:注意:防止标题过于简略或过于繁杂,有的甚至不写标题。2)标目:)标目:要求文字简明,有单位的标目要注明单位。横标目位于表的左侧,说明各横行数字的含义。纵标目位于表的右侧,向下说明各纵行数字的含义。注意:注意:防止标目过多,层次不清。58593线条:线条:只需要顶线、底线及纵标目下面与合计上面的横线。注意:注意:线条不宜过多,表的左上角不宜有斜线,表内不能有纵线。4数字:数字:表内数字一律用阿拉伯数字表示,同一个指标的数字精确度应当一致,表内不宜有空格,无数字用“”表示,数字为0,则填写0。5备注:备注:表格一般不列备注或其他文字说明,如有特殊情况需要说明时可用“*”标出,将文字说明写在表格的下面。60 从内容上看,每张表都有主语和谓语。主语指被研究的事物,如表2-5中的药物分组,一般置于表的左侧;谓语指说明主语的各项统计指标,如表2-5中的“治愈”和“未愈”、“合计”,一般置于表的右侧,主语和谓语结合起来构成一个完整的句子。如表 2-5可读成用替硝唑治疗组治愈25例,未愈4例,合计29例。614.统计表的种类 根据说明事物的主要标志(主语)的复杂程度,统计表可以分成简单表和复合表。l.简单表:只有一种主要标志,即主语按一个标志分组。2.复合表:有两种或两种以上的标志,即主语按多个标志分组。在安排上可以将部分主语放在表的上方与谓语配合起来。6263645.5.编制统计表的基本要求编制统计表的基本要求 1 1)重点突出,简单明了)重点突出,简单明了。即一张表只包括一个中心内容,表达一个主题。2 2)主谓分明,层次清楚)主谓分明,层次清楚。即主谓语的位置准确,标目的安排及分组要层次清楚,符合专业逻辑。简单表只有一个分组标志,一般作为横标目,而纵标目就是统计指标名称。复合表有两个以上分组标志,一般把其中主要的和分项较多的一个作为横标目,而其余的则安排在纵标目上。3 3)数据准确、可靠)数据准确、可靠。656.6.统计表的审查与修改统计表的审查与修改 统计表制作是否良好,可以从以下几方面统计表制作是否良好,可以从以下几方面检查:检查:1)标题是否正确2)主谓语的排列是否合适,标目是否组合重复。3)表线是否过多过密。66某地1974年111例钩端螺旋体病患者发病季节、年龄和职业构成资料如表124所示,请按照编制统计表的基本要求,检查此表编制的是否合适,如不合适,请指出并修改成正确表。67 表12-4的缺点是:1)标题不确切,并且未注明时间与地点。2)发病季节、年龄、职业三项指标放在一起,内容繁杂,不能突出重点。3)标目设计不合理。人数、%多次重复,不便于比较分析。4)表内文字和线条过多。68697071某医院对麦牙根糖浆治疗急性慢性肝炎161例的疗效,资料如表12-8,指出缺点并加以改进。缺点是:1)标题过于简单,不能概括表的内容。2)标目组合重复。3)主谓语排列不当。72731.1.概念:利用点的位置、线段的升降、直条概念:利用点的位置、线段的升降、直条的长短和面积的大小等各种几何图形来表达统的长短和面积的大小等各种几何图形来表达统计资料和指标计资料和指标.2.2.作用:作用:它将研究对象的特征、内部构成、相互关系、对比情况、频数分布等情况形象而生动地表达出来,更直观地反映出事物间的数量关系,更易于比较和理解。但对数量的表达较粗略,从图中不能获得确切数字。二、统计图二、统计图医学中常用的统计图有:医学中常用的统计图有:直条图、百分条图、圆图、直条图、百分条图、圆图、普通线图、半对数线图、普通线图、半对数线图、直方图、箱式图、散点图、直方图、箱式图、散点图、统计地图统计地图743.制图的基本要求 统计图通常由标题、标目、刻度、图域和图例5部分组成。1)标题:简明扼要地说明资料的内容、时间和地点.一般写在图的下方中央。2)图域:即制图空间。除圆图外,一般用直角坐标系第一象限的位置表示图域,或者用长方形的框架表示。不同事物用不同线条(实线、虚线、点线)或颜色表示。图域的高:宽比例习惯上为5:7。75 3)标目:分为纵标目和横标目,表示纵轴和横轴数字的意义,一般有度量衡单位。4)图例:在对比关系较为复杂的统计图中,为使读者易于分辨各种图形的意义,可以设置图例。图例通常放在横轴与标题之间。5)刻度:即纵轴与横轴上的坐标。排列方法与直角坐标系的排法一致,刻度数值按从小到大的顺序,纵轴由下向上,横轴由左向右,一律用等距表明。764.常用统计图的绘制方法及要求常用统计图的绘制方法及要求绘制统计图时要根据资料的性质和分析的目的选择适当的图形。1 1)直条图)直条图直条图(直条图(bargraph):适用于性质相似):适用于性质相似而不连续的资料。而不连续的资料。用等宽的直条的长短来表示各独立指标数值大小和它们之间的对比关系。指标既可以是绝对数,也可以是相对数。为便于比较,被比较的指标一般按大小顺序排列。77A)单式直条图只有一个统计指标,一个分组因素。如根据表2-6绘制成图2-6。78B)复式条图具有两个统计指标,两个及以上分组因素。如根据表2-7绘制成的图2-7。79绘制直条图时应注意绘制直条图时应注意1坐标坐标:一般以横轴为基线,表示各个调查项目。纵轴尺度必须从0开始,表示各个项目相应的数据,而且要等距,否则会改变各对比组间的比例关系。2宽度:宽度:各直条的宽度应相等,各直条的间隔也应一致。条间隔应为条宽的一半或等宽。3排列:排列:直条一般可按高低顺序排列,以便于比较。但如果各指标间需要有一定的顺序时,也可按规定的顺序排列。注意:复式条图中组内各直条排列次序要前后一致,注意:复式条图中组内各直条排列次序要前后一致,并加以并加以图例图例。802).2).百分条图百分条图(percent bar graph)(percent bar graph)百分条图:适用于构成比资料。百分条图:适用于构成比资料。用矩形长条的面积表示事物全部,而用其中各段表示各构成部分。绘制百分条图时应注意以下几点绘制百分条图时应注意以下几点:1将全体数量绘制成一长条,长度和宽度可以任意选择,将长条全长分为10格,每格代表10%,总长为100%。813将直条全长按构成比分为几段,在图上标出各部分构成比的数值,并用图例说明各部分的名称。4两种或多种类似的构成比资料相互比较时,可以绘制两个或多个长度、宽度都相等的直条,在同一起点上依次平行排列,各直条之间留有一定空隙,一般为直条宽度的一半。82效果嵌入性脱位牙构成比(%)脱落牙构成比(%)成功1230.002040.00良好1230.00714.00较好1230.001326.00失败410.001020.00合计40100.0050100.00表2-8两种脱落牙再植效果833).3).圆图圆图(circle graph or pie(circle graph or pie graph)graph)圆图:是一种构成图,适用于构成比资料。圆图:是一种构成图,适用于构成比资料。注意以下几点:1)先绘圆,将构成比乘以3.60,即得各构成部分所占的圆心角的度数。2)以相当于时钟的9点或12点的位置为起点依次排列各个扇形。3)扇形内要注明简要文字和百分比。4)两种或多种类似的构成比资料相互比较时,可在同一水平线或同一竖线上作直径相等的圆图,并注意各构成部分排列次序要一致。8485864.4.线图(普通线图线图(普通线图 line graph line graph)线图:适用于连续性变量的资料。线图:适用于连续性变量的资料。用线段的升降来表示统计指标的变化趋势,如某事物在时间上的发展变化,或某现象随另一现象变迁的情况。绘制线图时应注意以下几点:绘制线图时应注意以下几点:1)横轴代表分组标志,纵轴代表统计指标。横轴和纵轴都是算术尺度。87 2)相邻两点用直线连接,也就是说图线应按实际数字绘制成折线,而不能任意修改为光滑曲线。3)同一图内不应绘制太多的曲线,一般不宜超过4-5条。若有几根线,应用不同颜色或不同图线表示,并附图例说明。4)在绘图时,一定要注意纵横轴比例,由于比例不同,给人的印象也不同。8889905.5.半对数线图半对数线图(semi-logarithmiclineargraph)半对数线图用来比较两种或多种事物的相对变化速度。绘制半对数线图时应注意以下几点:绘制半对数线图时应注意以下几点:1)在半对数坐标纸上作图:如无半对数坐标纸,也可将数据转换成对数值,然后在普通坐标纸上作图。2)纵轴和横轴:横轴用算数尺度表示各分组标志,纵轴用对数尺度表示指标数值的大小。91926.6.直方图直方图 (histogram)适用于连续变量的频数分布资料。常用横轴表示变量(即被观察对象),纵轴表示频数或频率。直方图用矩形面积代表各组频数或频率,各矩形面积总和代表各组频数或频率的总和。绘制直方图应注意以下几点绘制直方图应注意以下几点:1纵轴的刻度必须从“0”开始,而横轴的刻度可按实际范围制定。2作图时,各直条的宽度应等于组距,高度应等于该组的频数或频率。如果各组段的组距不同,必须换算成等距后才能作图。937.箱图(boxplot)箱图用于比较两组或多组数据的直观比较分析,描述其分布特征。一般选用5个描述统计量(最小值、P25、中位数、P75、最大值)来绘制。94951.用图表示某地区近用图表示某地区近30年三种疾病的发病率,在各年年三种疾病的发病率,在各年度的动态发展速度情况,宜绘制(度的动态发展速度情况,宜绘制()2.A普通线图普通线图B直方图直方图C直条图直条图D半对数线图半对数线图3.2.某地区两年的三种死因别死亡率,若用统计图表某地区两年的三种死因别死亡率,若用统计图表示出来可选用(示出来可选用()4.A复式线图复式线图B百分条图百分条图C复式直条图复式直条图D直方图直方图5.3.反映定量变量观察数据集中位置的指标是(反映定量变量观察数据集中位置的指标是()6.A标准差标准差B标准误标准误C频率频率D均数均数7.6.在正态分布条件下,表示变量值变异情况的指标在正态分布条件下,表示变量值变异情况的指标最常用的是(最常用的是()8.A标准差标准差B标准误标准误C变异系数变异系数D百分位数百分位数96p经常不断地学习,你就什么都知道。你知道得越多,你就越有力量pStudyConstantly,AndYouWillKnowEverything.TheMoreYouKnow,TheMorePowerfulYouWillBe写在最后97谢谢大家荣幸这一路,与你同行ItS An Honor To Walk With You All The Way演讲人:XXXXXX 时 间:XX年XX月XX日 98
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!