数据特征与统计描述

上传人:xt****7 文档编号:189232511 上传时间:2023-02-21 格式:PPT 页数:105 大小:904.50KB
返回 下载 相关 举报
数据特征与统计描述_第1页
第1页 / 共105页
数据特征与统计描述_第2页
第2页 / 共105页
数据特征与统计描述_第3页
第3页 / 共105页
点击查看更多>>
资源描述
s第一节第一节 频数分布表与频数分布图频数分布表与频数分布图s第二节第二节 计量资料的常用统计指标计量资料的常用统计指标s第三节第三节 计数资料的计数资料的常用统计指标常用统计指标s第四节第四节 统计图表统计图表第一节第一节 频数分布表与频数分布图频数分布表与频数分布图 一、频数分布表一、频数分布表(frequency table)用途:用途:用于描述资料的分布特征用于描述资料的分布特征频数:在一批样本中,相同情形出现的次数称为频数:在一批样本中,相同情形出现的次数称为该情形的频数。该情形的频数。资料类型资料类型组段组段频数频数计数和等级计数和等级观察结果的所有观察结果的所有分类分类相同类别出现的相同类别出现的次数次数计量计量根据观察结果重根据观察结果重新划分新划分分组统计分组统计P44 表4-1,4-2,4-3表表4-3 某地某地150名正常成年男子红名正常成年男子红细胞数(细胞数(1012/L)编号编号红细胞数红细胞数编号编号红细胞数红细胞数1 13.983.982 24.544.541431434.674.673 34.744.741441445.405.404 45.135.131451455.295.295 54.434.431461464.774.776 64.814.811471475.385.387 74.984.981481485.155.158 83.793.791491494.644.641501505.195.191.频数表的编制步骤频数表的编制步骤(1)求)求极差极差(range):即最大值与最小值之差):即最大值与最小值之差,又称为全距。,又称为全距。本例极差:本例极差:R (1012/L)(2)决定决定组数组数、组段组段和和组距组距:根据研究目的和:根据研究目的和样本含量样本含量n确定。组距确定。组距=极差极差/组数,通常分组数,通常分10-15个组,为方便计,组距参考极差的十分之一个组,为方便计,组距参考极差的十分之一,再再略加调整。略加调整。本例本例i。(3)列出组段:第一组段的列出组段:第一组段的下限略下限略小于最小值小于最小值,最后一个组段,最后一个组段上限必须上限必须包含最大值包含最大值,其它组段上限值忽略。,其它组段上限值忽略。(4)划记计数划记计数:用划记法将所有数:用划记法将所有数据归纳到各组段,得到各组段的频数据归纳到各组段,得到各组段的频数。组段组段 (1)频数,频数,f(2)组中值,组中值,X(3)fX(4)=(2)(3)3.713.83.83.944.016.04.1114.246.24.3174.474.84.5264.6119.64.7324.8153.64.9265.0130.05.1185.293.65.3105.454.05.545.622.45.75.9 合计合计15.85.8150719.8三、频数分布图P47二、频数表和频数分布图用途 1描述频数分布的类型*(1)对称分布:若各组段频数的分布以频数最多的组段为中心左右两侧大体对称(总体则完全对称),就认为该资料是对称分布(图4-2)(2)偏态分布:右偏态分布(正偏态分布):频数最多组段右侧的组段数多于左侧的组段数,高峰向左偏移,频数向右侧拖尾。转氨酶含量 人 数 12 2 15 9 18 14 21 23 24 19 27 14 30 11 33 9 36 7 39 4 4245 3 表4-115名正常成年女子血清转氨酶(mmol/L)含量分布左偏态分布(负偏态分布):左侧的组段数多于右侧的组段数,频数向左侧拖尾。肌红蛋白含量 人 数 0 2 5 3 10 7 15 9 20 10 25 22 30 23 35 14 40 9 4550 2 表4-101名正常人的血清肌红蛋白()含量分布g/m L 血 清 肌 红 蛋 白(g/m L)05101520252.512.522.532.542.552.5图 2-3 101 名 正 常 人 血 清 肌 红 蛋 白 的 频 数 分 布人 数2.描述计量资料分布的描述计量资料分布的 集中趋势和离散趋势集中趋势和离散趋势集中趋势集中趋势(central tendency):变量值集中变量值集中位置。本例在组段位置。本例在组段“”。平均水平指标平均水平指标离散趋势离散趋势(tendency of dispersion):变量变量值围绕集中位置的分布情况。离值围绕集中位置的分布情况。离“中心中心”位位置越远,频数越小;且围绕置越远,频数越小;且围绕“中心中心”左右对左右对称。称。变异水平指标变异水平指标 3便于发现一些特大或特小的可疑值*组 段 频数 f(1)(2)2.30 1 2.60 0 2.90 0 3.20 0 3.50 17 3.80 20 4.10 17 4.40 12 4.70 9 5.00 0 5.30 0 5.605.90 8 合 计 101 4便于进一步做统计分析和处理第二节第二节 计量资料的常用统计指标计量资料的常用统计指标s描述集中趋势的特征数描述集中趋势的特征数s描述离散趋势的特征数描述离散趋势的特征数计量资料(定量资料、数值变量资料)计量资料(定量资料、数值变量资料)总体:总体:有限或无限个(定量)变量值 样本:样本:从总体随机抽取的n个变量值:X1,X2,X3,Xn n为样本例数(样本大小、样本含量)一、一、描述集中趋势的特征数描述集中趋势的特征数(平均指标平均指标)总称为总称为平均数平均数(average)反映了资料的集)反映了资料的集中趋势(中趋势(central tendency)。常用的)。常用的有:有:1.算术均数算术均数(arithmetic mean),简称,简称均数均数(mean)2.几何均数几何均数(geometric mean)3.中位数中位数(median)均数(均数(meanmean)nXnXXXXn21112233123kkikif Xf Xf Xf XfXXfffff为求和符号,读成sigma,k,X,f 意义例4-2“权数”例4-3X符号:总体 样本适用条件:资料呈对称分布,尤其是正态或近似正态。计算:(1)直接法(2)频数表法p49,例,例4-3:均数:均数2.2.几何均数(几何均数(geometric meangeometric mean)nXXnXXXXnXXXXXGnGnnGlglglg)lglg(lg1lg12121为正值,为底的反对数表示以为底的对数;表示以010lg10lg1X几何均数几何均数:变量变量对数值的对数值的算术均算术均数数的反对数的反对数。几何均数的适用条件与实例几何均数的适用条件与实例适用条件适用条件:呈倍数关系的等比资料或对数正态分:呈倍数关系的等比资料或对数正态分布(正偏态)资料;如抗体滴度资料布(正偏态)资料;如抗体滴度资料 例例 血清的抗体效价滴度的倒数倒数分别为:10、100、1000、10000、100000,求几何均数。1000510lg10lg10lg10lg10lglg543211G此例的算术均数为此例的算术均数为22222,显然不能代表滴度的,显然不能代表滴度的平均水平。同一资料,平均水平。同一资料,几何均数几何均数中位数中位数负偏态分布时:均数均数中位数中位数小结:集中趋势的描述平均数 平均数:描述一组变量值的集中位置或平均水平的指标体系。不同的分布使用不同的指标 (算术)均数:正态或近似正态或观察值相差不大的小样本资料 几何均数:对数正态分布或等比级数资料 中位数:一般偏态分布(传染病发病的潜伏期)二、二、描述离散趋势的特征数描述离散趋势的特征数(变异(变异(variationvariation)指标)指标)反映数据的离散度(反映数据的离散度(Dispersion)。即)。即个体观察值的变异程度。常用的指标有:个体观察值的变异程度。常用的指标有:1.极差极差(Range)(全距全距)2.百分位数与四分位数间距百分位数与四分位数间距 Percentile and Quartile range 3.方差方差 Variance 4.标准差标准差Standard Deviation 5.变异系数变异系数 Coefficient of Variation 盘编号盘编号 甲甲乙乙丙丙1 14404804902 24604904953 35005005004 45405105055 5560520510合计合计250025002500250025002500均数均数500500500500500500 例:设甲、乙、丙三人,采每人的耳垂血,然后红细例:设甲、乙、丙三人,采每人的耳垂血,然后红细胞计数,每人数胞计数,每人数5个计数盘,得结果如下(万个计数盘,得结果如下(万/mm3)甲乙丙1.1.极差极差(Range(Range)(全距全距)minmaxXXR 1204020符号:R意义:反映全部变量值的变动范围。优点:简便,如说明传染病、食物中毒的最长、最短潜伏期等。缺点:1.只利用了两个 极端值 2.n大,R也会大 3.不稳定适用范围:任何计量资料;是参考变异指标2.2.百分位数与四分位数间距百分位数与四分位数间距 Percentile and quartile rangePercentile and quartile range百分位数百分位数:数据从:数据从小到大小到大 排列排列;在百分在百分尺度下,所占百分比尺度下,所占百分比对应的值。记为对应的值。记为Px。四分位间距四分位间距:(定义定义:P53)QP75 P25 四分位半间距四分位半间距quartile deviation:QDQR/2P100(max)P75P50(中位数中位数)P25P0(min)Px频数表资料的百分位数频数表资料的百分位数mLxxffxniLPxnP)%()%(值间的频数所在组段下限值至上限至该下限值的累计频数组距所在组段下限值下限值下限值L上限值上限值Ui;fm百分位数百分位数Px)%(LfxnP256+6x(145x25%17)/468.51(h)P7518+6x(145x75%101)/3219.45(h)Q19.45-8.5110.94(h)潜伏期潜伏期/h (1)频数,频数,f(2)累计频数累计频数 f(3)0171764663123810118321332461393001393641434248 合计合计2145145百分位数的应用百分位数的应用确定医学确定医学参考值范围参考值范围(reference range):):如如95参考值范围参考值范围PP;表示有表示有95正常正常个体个体的测量值在此范围。的测量值在此范围。中位数中位数Md与与四分位半间距四分位半间距QD一起使用,描一起使用,描述偏态分布资料的特征述偏态分布资料的特征3.3.方差方差 方差方差(variance)也称)也称均方差均方差(mean square deviation),样本观察值的离均差平方),样本观察值的离均差平方和的均值。表示一组数据的平均离散情况。和的均值。表示一组数据的平均离散情况。NXXlSSXxx222)-()-()square of sum(0)-(总体方差离均差平方和离均差和11)(2222nnXXnXXS样本方差样本方差为什么要除以(样本方差为什么要除以(n n1 1)22()XN 总 体 方 差数理统计证明,n代替N后,计算出的样本方差对总体方差的估计偏小。对于样本资料,对离均差平方和取平均时分母用n-1代替n。分母为n-1,称为自由度(能自由取值的变量的个数)。2222()11XXnXXSnn 样本方差4.4.标准差标准差222()11XXnXXSnn样本标准差 标准差标准差(standard deviation)即方差的正平)即方差的正平方根;其单位与原变量方根;其单位与原变量X的单位相同。的单位相同。(p54)122fffXfXS频数表样本标准差2()XXN总体标准差标准差的计算标准差的计算盘编号盘编号 甲甲乙乙丙丙甲甲2 2乙乙2 2丙丙2 21 14404804901936002304002401002 24604904952116002401002450253 35005005002500002500002500004 45405105052916002601002550255 5560520510313600270400260100合计合计25002500 25002500 25002500 1260400 1251000 1250250标准差标准差50.9915.817.9199.50155/250012604001222甲的标准差nnXXS方差2/150)/(150-1)标准差0.39(1012/L)(例例4-12)4-12)组段组段 (1)频数,频数,f(2)组中值,组中值,X(3)fX(4)=(2)(3)3.713.83.83.944.016.04.1114.246.24.3174.474.84.5264.6119.64.7324.8153.64.9265.0130.05.1185.293.65.3105.454.05.545.622.45.75.9 合计合计15.85.8150719.85.变异系数变异系数(coefficient of variation)%100XSCV符号符号:CV适用条件适用条件:观察指标单位不同,如身高、体重观察指标单位不同,如身高、体重 同单位资料,但均数相差悬殊同单位资料,但均数相差悬殊均数均数 标准差标准差变异系数变异系数青年男子青年男子 身高身高170 cm6 cm3.5体重体重60 kg7 kg11.7 意义:意义:挑选指标时变异系数越小,指标越好。P56 例4-13变异指标小结变异指标小结1极差较粗,适合于任何分布极差较粗,适合于任何分布2标准差标准差与均数的单位相同,最常用,适合于近似正态分布与均数的单位相同,最常用,适合于近似正态分布3变异系数主要用于单位不同或均数相差悬殊资料变异系数主要用于单位不同或均数相差悬殊资料4平均指标和变异指标分别反映资料的不同特征,平均指标和变异指标分别反映资料的不同特征,常配套使用常配套使用 如如 正态分布正态分布:均数、标准差;:均数、标准差;偏态分布偏态分布:中位数、四分位半间距:中位数、四分位半间距练习题练习题p67第第1题。题。p68第第3题。题。第三节第三节 计数资料的计数资料的常用统计指标常用统计指标一、计数资料的数据整理一、计数资料的数据整理二、二、常用相对数指标常用相对数指标三、三、应用注意事项应用注意事项 计数资料(分类资料):计数资料(分类资料):总体:总体:有限或无限个定性(分类)变量值有限或无限个定性(分类)变量值样本:样本:从总体中抽取的从总体中抽取的n n个定性(分类)变量值个定性(分类)变量值整理为:整理为:分类个体数,即:计数资料频数表分类个体数,即:计数资料频数表 绝对数绝对数一、计数资料的数据整理一、计数资料的数据整理 计数资料:计数资料:按某种属性分类,然后清点每类按某种属性分类,然后清点每类的数据(以下是:孕妇分娩资料)的数据(以下是:孕妇分娩资料)住院号住院号年龄年龄职业职业文化程度文化程度分娩方式分娩方式妊娠结局妊娠结局202565527无无中学中学顺产顺产足月足月202565322无无小学小学助产助产足月足月202583025管理人员管理人员大学大学顺产顺产足月足月202567724知识分子知识分子中学中学顺产顺产早产早产202564730管理人员管理人员大学大学顺产顺产足月足月202584832无无小学小学剖宫产剖宫产足月足月201991527无无中学中学顺产顺产死产死产202586129无无大学大学剖宫产剖宫产足月足月202460125农民农民中学中学顺产顺产足月足月200038626无无小学小学顺产顺产足月足月按年龄(按年龄(2岁一组)与职业整理岁一组)与职业整理年龄年龄工人工人管理人员管理人员农民农民商业服务商业服务无无知识分子知识分子总计总计1818 2 2 0 0 0 0 0 0 3 3 0 0 5 52020 9 9 2 2 6 61010 18 18 0 0 45 4522222828 7 710102424 70 70111115015024245050343428285252153153444436136126265050434325254545133133707036636628283434353510103434 78 78575724824830301111141411112222 39 39171711411432321414 2 2 3 31414 24 24 3 3 60 603434 4 4 2 2 5 5 3 3 12 12 2 2 28 283636 2 2 1 1 1 1 4 4 5 5 1 1 14 143838 3 3 1 1 1 1 0 0 2 2 1 1 8 84040 0 0 0 0 2 2 0 0 0 0 0 0 2 2合计合计 207 207 141 14110210220820853753720620614011401二、常用相对数二、常用相对数v 绝对数:通过调查或实验得到的原始数据。如某病的出院人数、治绝对数:通过调查或实验得到的原始数据。如某病的出院人数、治愈人数、死亡人数等。愈人数、死亡人数等。但绝对数通常不具有可比性:但绝对数通常不具有可比性:1.如甲、乙两个医院某病出院人数不同时,比较两医院该病的死亡如甲、乙两个医院某病出院人数不同时,比较两医院该病的死亡人数没有意义人数没有意义 2.如如2002级附二院五年制一、二大班学生人数不同时,比较两班医级附二院五年制一、二大班学生人数不同时,比较两班医学统计学的及格人数没有意义学统计学的及格人数没有意义,因此需要在绝对数的基础上计算相对因此需要在绝对数的基础上计算相对数。数。v 相对数:两个有联系的指标之比相对数:两个有联系的指标之比,常用的相对数有:常用的相对数有:一、比一、比 二、比率二、比率 三、速率三、速率v相对比简称比相对比简称比,是两个有关指标之比,说明是两个有关指标之比,说明两指标间的比例关系。两指标间的比例关系。v计算公式为计算公式为v式中两指标可以是绝对数、相对数或平均数式中两指标可以是绝对数、相对数或平均数。(一)比(一)比(ratio)ARB指标指标 (一一)两个绝对数之比:两个绝对数之比:如某年某医院出生婴儿中,男性婴儿为如某年某医院出生婴儿中,男性婴儿为370人人,女性婴儿为,女性婴儿为358人,则出生婴儿性别比例为人,则出生婴儿性别比例为370/358100=103,说明该医院该年每出生,说明该医院该年每出生100名女婴儿,就有名女婴儿,就有103名男性婴儿出生,它反映了男名男性婴儿出生,它反映了男性婴儿与女性婴儿出生的对比水平。性婴儿与女性婴儿出生的对比水平。ARB类发生例数类发生例数 (二二)两个率之比:两个率之比:如相对危险度(如相对危险度(RR)。)。例例 如某地某年龄组男性吸烟和非吸烟的冠心病如某地某年龄组男性吸烟和非吸烟的冠心病 死亡资料如表死亡资料如表7-2,试分析其相对危害度。,试分析其相对危害度。12pRp240.52.139112.4R 说明男性吸烟组的冠心病死亡率是非吸烟组的倍。说明男性吸烟组的冠心病死亡率是非吸烟组的倍。吸烟组 非吸烟组 死 亡 数 104 12 观 察 人 年 数 43248 10673 死亡率(1/10万人年)240.5 112.4 表表7-2 某地某年龄组男性吸烟和非吸烟的冠心病死亡资料某地某年龄组男性吸烟和非吸烟的冠心病死亡资料 (三三)两个相对比之比:两个相对比之比:如流行病学常用的比数比(如流行病学常用的比数比(OR)。)。例例 服用反应停与肢体缺陷关系病例对照研究资料如表所示:服用反应停与肢体缺陷关系病例对照研究资料如表所示:服 用 反 应 停 畸 形 儿 组 对 照 组 合 计 有 34(a)2(b)36 无 16(c)88(d)104 合 计 50 90 140 /348893.5()/2 16a cORb d疾病组的暴露比数倍对照组的暴露比数比率比率(P57):分子分母都是绝对数,且分子必须是分母的一部分。无量纲,0,1。1.1.率率(raterate)(强度相对数)(强度相对数)说明某现象或某事物说明某现象或某事物发生发生的的频率频率或或强度强度。率率=(实际发生数(实际发生数/可能发生总数)可能发生总数)比例基数比例基数如如:治愈率、病死率、阳性率、人群患病率等:治愈率、病死率、阳性率、人群患病率等比例基数比例基数:100%100%、10001000、10000/10000/万、万、100000100000(1/101/10万)万)等等 (按习惯,使结果保留(按习惯,使结果保留1-21-2位小数)位小数)例如:患病率通常用百分率、婴儿死亡率用千分率、肿瘤死亡率以例如:患病率通常用百分率、婴儿死亡率用千分率、肿瘤死亡率以十万分率表示。十万分率表示。(二)比率(二)比率(proportion)2.2.构成比构成比(结构相对数结构相对数)(proportionproportion):):n表示事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总体中所占的比重或分布。n通常以100%为比例基数。其计算公式为 如如:教研室:教研室1616人人高级职称有高级职称有4 4人,占人,占2525;中级职称有中级职称有8 8人,占人,占5050;初级职初级职称有称有4 4人,占人,占2525。100%(5-2)某一组成部分的观察单位数构成比 同一事物各组成部分的观察单位总数(三)速率(三)速率(raterate):):分母中含有时间量纲。分母中含有时间量纲。P58 例4-14是反映单位时间内某事件出现的可是反映单位时间内某事件出现的可能性大小,多用于面向人群的出生能性大小,多用于面向人群的出生、死亡和发病资料的统计、死亡和发病资料的统计.人口出生率人口出生率=(=(某年中活产总数某年中活产总数/该该 年平均人口数年平均人口数)100%100%三、应用注意事项三、应用注意事项1 1、不能以构成比代替率。、不能以构成比代替率。率与构成比容易误用率与构成比容易误用 年龄组 受检人数白内障例数 患者年龄构成比(%)患病率(%)=(3)/(2)4050607080合计560441296149 2268129135 97 1915.1828.7930.1321.65 4.2412.1429.2545.6165.1086.36 1468448100.0030.522 2、计算相对数的、计算相对数的分母不宜过小分母不宜过小。小则。小则直接叙述直接叙述。3 3、进行率的对比分析时,应注意资料、进行率的对比分析时,应注意资料可比性可比性。如。如 比较疗效时,比较组间比较疗效时,比较组间应病情轻重相同,性别影响,应按性应病情轻重相同,性别影响,应按性别分组后再作比较。别分组后再作比较。(1)观察对象是否同质,研究方法是否相同,观察时间是)观察对象是否同质,研究方法是否相同,观察时间是否相等,以及地区、周围环境、风俗习惯和经济条件是否一否相等,以及地区、周围环境、风俗习惯和经济条件是否一致或相近等。致或相近等。(2)观察对象内部结构是否相同,若两组资料的年龄、)观察对象内部结构是否相同,若两组资料的年龄、性别等构成不同,可以分别进行同年龄别、同性别的小组率性别等构成不同,可以分别进行同年龄别、同性别的小组率比较或对总率(合计率)进行标准化后再作比较。比较或对总率(合计率)进行标准化后再作比较。4 4、正确求、正确求平均率平均率。例:例:若若P1=x1/n1,P2=x2/n2 P3=x3/n3 P(x1+x2+x3)/n1+n2+n3)(正确正确)P(P1+P2+P3)/3 (错误错误)5.5.样本率样本率(或构成比)同样存在(或构成比)同样存在抽样误差抽样误差,故,故应进行样本率(或构成比)差别的假设检验。应进行样本率(或构成比)差别的假设检验。第四节第四节 统计图表统计图表 统计表统计表(statistical table)(statistical table)数据数据代替文字描述,便于统计结果的代替文字描述,便于统计结果的精精确、简洁的表达确、简洁的表达和和对比分析对比分析 统计图统计图(statistical chart)(statistical chart)用用图形图形代替数据,获得代替数据,获得直观直观、形象形象的效的效果果定义:定义:将统计分析的事物及指标 将统计分析的事物及指标用表格列出。用表格列出。特点:特点:1.避免长篇文字叙述,便于1.避免长篇文字叙述,便于阅读和对比分析。阅读和对比分析。2.数据具体。2.数据具体。定义:定义:用点的位置,线段 用点的位置,线段的升降,直条的长短或的升降,直条的长短或面积的大小等 形式表达面积的大小等 形式表达统计资料。统计资料。特点:特点:直观、醒目,常给人直观、醒目,常给人以深刻印象。以深刻印象。一、一、统计表统计表 1.1.统计表的结构统计表的结构 2.2.统计表的种类统计表的种类 v标题:标题:v标目:标目:v线条:线条:v数字:无数字用数字:无数字用“”表示,缺失数字用表示,缺失数字用“”表示,数值为表示,数值为0 0者记为者记为“0”0”,不要留空项。,不要留空项。v备注:备注:1 1、统计表的基本结构、统计表的基本结构 横横 标标 目目 名名 称称 纵纵 标标 目目 名名 称称 合合 计计 横横 标标 目目 数数 据据 区区 合合 计计 顶顶 线线底底 线线表表 名名 标标 题题 表表4-8 某省某工厂某省某工厂 1994、1998年四项检测指标异常检出率年四项检测指标异常检出率检测检测指标指标1994年年1998年年受检人数受检人数 异常人数异常人数 检出率检出率(%)受检人数受检人数异常人数异常人数 检出率检出率(%)血压血压 心率心率 TTT GPT 5195195195195544362010.16 0.48 6.94 3.85582582582582383923166.526.703.952.75 :TTT(麝香草酚浊度试验),:GPT(谷丙转氨酶)。2.统计表的种类统计表的种类 根据分组标目的复杂程度,统计表可大致分为简单表根据分组标目的复杂程度,统计表可大致分为简单表和复合表。和复合表。简单表简单表(simple table)(simple table):只按一个特:只按一个特征或标志分组。如表征或标志分组。如表4-1 4-1。组合表组合表(combinative table)(combinative table):按两:按两个或两个以上特征或标志结合起来分组。个或两个以上特征或标志结合起来分组。如表如表4-84-8。表表 2-8 某某医医院院用用两两种种疗疗法法矫矫治治假假性性近近视视眼眼的的近近期期有有效效率率 矫矫治治方方法法 观观察察人人数数 近近期期有有效效人人数数 近近期期有有效效率率(%)新新医医疗疗法法 眼眼保保健健操操 32 32 16 9 50.0 28.1 简单表示例简单表示例分组标志为矫治方法分组标志为矫治方法 表表4-8 某省某工厂某省某工厂 1994、1998年四项检测指标异常检出率年四项检测指标异常检出率检测检测指标指标1994年年1998年年受检人数受检人数 异常人数异常人数 检出率检出率(%)受检人数受检人数异常人数异常人数检出率检出率(%)血压血压 心率心率 TTT GPT 5195195195195544362010.16 0.48 6.94 3.85582582582582383923166.526.703.952.75 :TTT(麝香草酚浊度试验),:GPT(谷丙转氨酶)。(丁建生等.中国卫生统计 1999;16(3):166)复合表示例复合表示例 分组标志:不同年份分组标志:不同年份 不同检测指标不同检测指标例例 下表是复方猪胆胶囊治疗两型老年性慢性支气管下表是复方猪胆胶囊治疗两型老年性慢性支气管炎的疗效比较,请对该表的绘制进行评价,并指出所炎的疗效比较,请对该表的绘制进行评价,并指出所存在的问题。存在的问题。表表 两个组的疗效观察两个组的疗效观察 分型及疗效分型及疗效 单纯型慢性支气管炎单纯型慢性支气管炎 喘息型慢性支气管炎喘息型慢性支气管炎 指标指标 治愈治愈 显效显效 好转好转 无效无效 治愈治愈 显效显效 好转好转 无效无效 例数例数 60 98 51 12 23 83 65 11 合计合计 209 12 171 11 疗疗效效 94.6 94.0 疗疗效效 类类型型 例例数数 治治愈愈 显显效效 好好转转 无无效效 有有效效率率 单单纯纯型型 221 60 98 51 12 94.6%喘喘息息型型 182 23 83 65 11 94.0 表表 复方猪胆胶囊治疗两型老年慢性支气管炎患者的疗效比较复方猪胆胶囊治疗两型老年慢性支气管炎患者的疗效比较 一、一、统计图统计图 统计图统计图(statistical chart(statistical chart 或或statistical graph)statistical graph)是用点、线、面等几是用点、线、面等几何图形,直观形象地表达、描述数据或结何图形,直观形象地表达、描述数据或结果。果。1.1.统计图的结构统计图的结构 2.2.统计图的种类与绘制注意事项统计图的种类与绘制注意事项 1、统计图的结构、统计图的结构s标题:标题:用于简明扼要地说明资料的内容,一般位于图的用于简明扼要地说明资料的内容,一般位于图的下方中央位置。下方中央位置。s图域:图域:即制图空间,是整个统计图的视觉中心。除圆图即制图空间,是整个统计图的视觉中心。除圆图外,一般都是存在于特定的坐标体系下。外,一般都是存在于特定的坐标体系下。s标目:标目:分为纵标目和横标目,表示坐标系下纵轴与横轴分为纵标目和横标目,表示坐标系下纵轴与横轴的含义。的含义。s图例:图例:用于识别比较的统计图中各种图形所代表的含义用于识别比较的统计图中各种图形所代表的含义。s刻度:刻度:即纵轴和横轴上的坐标。刻度数值按从小到大的即纵轴和横轴上的坐标。刻度数值按从小到大的顺序,纵轴由下向上,横轴由左向右排列。顺序,纵轴由下向上,横轴由左向右排列。2.统计图的种类与绘制注意事项统计图的种类与绘制注意事项s直条图直条图s百分条图百分条图s圆图圆图s线图与半对数线图线图与半对数线图s直方图直方图s箱图箱图s散点图散点图s统计地图统计地图 1.1.概念概念 条图用等宽长条的高度表示按性质分类资料各条图用等宽长条的高度表示按性质分类资料各类别的数值大小,用于表示他们之间的对比关系。类别的数值大小,用于表示他们之间的对比关系。2.2.适用资料:相互独立的资料(资料有明确分适用资料:相互独立的资料(资料有明确分 组,不连续)。组,不连续)。3.3.分类分类(1)(1)单式条图单式条图 具有一个统计指标,一个分组因素具有一个统计指标,一个分组因素。(2)(2)复式条图复式条图 具有一个统计指标,两个分组因素具有一个统计指标,两个分组因素。1998 年世界不同地区爱滋病流行情况 北非及中东 西欧 北美洲 拉丁美洲 南亚及东南亚 成人感染率(%)0.8 0.7 0.6 0.5 0.44 0.3 0.22 0.11 0 表表4-8 某省某工厂某省某工厂 1994、1998年四项检测指标异常检出率年四项检测指标异常检出率检测检测指标指标1994年年1998年年受检人数受检人数 异常人数异常人数 检出率检出率(%)受检人数受检人数异常人数异常人数检出率检出率(%)血压血压 心率心率 TTT GPT 5195195195195544362010.16 0.48 6.94 3.85582582582582383923166.526.703.952.75 :TTT(麝香草酚浊度试验),:GPT(谷丙转氨酶)。(丁建生等.中国卫生统计 1999;16(3):166)绘制条图注意事项绘制条图注意事项 纵轴的刻度纵轴的刻度必须从必须从“0”0”开始开始,否则会改变各对比组间的比例关系。否则会改变各对比组间的比例关系。(2)(2)横轴各直条一般按统计指标横轴各直条一般按统计指标由由大到小排列大到小排列,也可按事物本身的,也可按事物本身的自然自然顺序排列顺序排列。(3)(3)各直条的宽度要一致,各直条各直条的宽度要一致,各直条应有相等的间隔,其宽度一般与直条应有相等的间隔,其宽度一般与直条的宽度的宽度相等相等或为直条宽度的或为直条宽度的一半一半。1.1.概念概念 以圆形的总面积代表以圆形的总面积代表100%100%,把面积按,把面积按比例分成若干部分,以角度大小来表示各比例分成若干部分,以角度大小来表示各部分所占的比重。部分所占的比重。2.2.适用资料:构成比资料适用资料:构成比资料2002年某医院年某医院1402例孕妇分娩结果例孕妇分娩结果分娩结果分娩结果例数例数 构成比()构成比()过期产过期产2121 1 1 死产死产2121 1 1 早产早产212212 15 15 足月足月11481148 83 83 总计总计14021402100 100(3)百分条图()百分条图(percentage chart)百分条图百分条图的作用与圆图相同。但更适用于多组百的作用与圆图相同。但更适用于多组百分比的比较。分比的比较。25.70%25.70%16.07%16.07%15.04%15.04%11.56%11.56%11.41%11.41%20.22%20.22%020406080100呼吸系呼吸系统病统病脑血脑血管病管病恶性恶性肿瘤肿瘤损伤与损伤与中毒中毒心脏心脏疾病疾病其其它它图图2-18 我国部分县我国部分县1988年的死因构成比年的死因构成比不同性别某癌三种类型的构成不同性别某癌三种类型的构成分化型癌分化型癌低分化腺癌低分化腺癌未分化型未分化型合计合计男男52.352.327.827.819.919.9100100女女30.230.218.118.151.751.7100100一、普通线图(线图)一、普通线图(线图)1.1.概念概念线图线图(line graph)(line graph)是用线段的升降来表示是用线段的升降来表示统计指标的变化趋势。如某事物随时间的统计指标的变化趋势。如某事物随时间的发展变化,或某现象随另一现象变迁的情况。发展变化,或某现象随另一现象变迁的情况。2.2.适用资料适用资料 适用于随时间变化的连续性资料。适用于随时间变化的连续性资料。.分析目的:分析目的:用线段的升降表示某事物在时间上的发展用线段的升降表示某事物在时间上的发展变化趋势。变化趋势。某市 19491957 年儿童结核病和白喉死亡率 年份 1957 1956 1955 1954 1953 1952 1951 1950 1949 死亡率(1/10 万)160 140 120 100 80 60 40 20 0 结核病 白喉 1.概念概念是一种特殊的线图,其坐标纵轴是对数尺是一种特殊的线图,其坐标纵轴是对数尺度,特别适宜作不同指标变化速度的比较。度,特别适宜作不同指标变化速度的比较。2.适用资料适用资料 适用于随时间变化的连续性资料,尤其比适用于随时间变化的连续性资料,尤其比 较数值相差悬殊的多组资料时采用。较数值相差悬殊的多组资料时采用。.分析目的:分析目的:半对数线图中线段的升降是用来表示某事物半对数线图中线段的升降是用来表示某事物发展速度(或者说是相对比)。发展速度(或者说是相对比)。图 某市 19491957 年儿童结核病和白喉死亡率 年份 1957 1956 1955 1954 1953 1952 1951 1950 1949 死亡率之对数值 2.5 2.0 1.5 1.0 0.5 0 结核病 白喉 普通线图(线图):纵横轴均为算术尺度,普通线图(线图):纵横轴均为算术尺度,半对数图:纵轴为对数尺度,横轴为算术半对数图:纵轴为对数尺度,横轴为算术 尺度。尺度。图 2-14 某市 19491957 年儿童结核病和白喉死亡率年份195719561955195419531952195119501949死亡率之对数值2.52.01.51.0 0.5 0结核病白喉图 2-13 某市 19491957 年儿童结核病和白喉死亡率年份195719561955195419531952195119501949死亡率(1/10 万)160140120100806040200结核病白喉注意:注意:在普通线图中,结核病死亡率线条的坡度比白在普通线图中,结核病死亡率线条的坡度比白喉死亡率线条下降的陡峭,只能说明两种疾病的死亡喉死亡率线条下降的陡峭,只能说明两种疾病的死亡率逐年变化幅度不同,不能错认为结核病死亡率的下率逐年变化幅度不同,不能错认为结核病死亡率的下降速度比白喉死亡率的下降速度快。在半对数线图中降速度比白喉死亡率的下降速度快。在半对数线图中就不会出现这种错觉。就不会出现这种错觉。在比较事物间的变化速度时,在比较事物间的变化速度时,应选择半对数线图。应选择半对数线图。1.1.概念概念是以直方面积描述各组频数的多少,面积的总是以直方面积描述各组频数的多少,面积的总和相当于各组频数之和。和相当于各组频数之和。2.2.适用资料:适用资料:直方图用于表达连续性资料的频数分布。直方图用于表达连续性资料的频数分布。3.3.制图要求:制图要求:(1 1)一般纵轴表示被观察现象的频数(或频)一般纵轴表示被观察现象的频数(或频 率),横轴表示连续变量,以各矩形(宽率),横轴表示连续变量,以各矩形(宽 为组距)的面积表示各组段频数。为组距)的面积表示各组段频数。(2 2)直方图的各直条间不留空隙;各直条间)直方图的各直条间不留空隙;各直条间 可用直线分隔,但也可不用直线分隔。可用直线分隔,但也可不用直线分隔。(3 3)组距不等时,横轴仍表示连续变量,但)组距不等时,横轴仍表示连续变量,但 纵轴是每个横轴单位的频数。纵轴是每个横轴单位的频数。箱式图:箱式图:使用使用5 5个统计量反映原始数据的个统计量反映原始数据的分布特征,即数据分布中心位置、分布、分布特征,即数据分布中心位置、分布、偏度、变异范围和异常值。偏度、变异范围和异常值。箱式图的箱子两端分箱式图的箱子两端分别是别是上四分位数上四分位数(P75P75)和)和下四分位数下四分位数(P25P25),中间横线是,中间横线是中位中位数数(P50P50)两端连线分)两端连线分别是除异常值外的别是除异常值外的最小最小值值和和最大值最大值。另外标记。另外标记可能的异常值。显然箱可能的异常值。显然箱子越长,数据变异程度子越长,数据变异程度越大。中间横线在箱子越大。中间横线在箱子中点表明分布对称,否中点表明分布对称,否则不对称。则不对称。160N=血清甘油三酯(mmol/L)X2.01.81.61.41.21.0.8.6.4例例 某地调查不同类型化妆品厂车间内粉尘数,结果某地调查不同类型化妆品厂车间内粉尘数,结果绘制成图绘制成图2-202-20。图中显示粉尘数的分布呈偏态分布,。图中显示粉尘数的分布呈偏态分布,净化厂粉尘数较少,非净化厂粉尘数较多。净化厂粉尘数较少,非净化厂粉尘数较多。工厂类 型 粉 类 非 净 化 净 化 尘粒数(亿)2.0 1.8 1.6 1.4 1.2 1.0.8.6.4.2 0.0 1.1.概念概念 散点图以直角坐标系中各点的密集程度和散点图以直角坐标系中各点的密集程度和趋势来表示两现象间的关系。常在对资料趋势来表示两现象间的关系。常在对资料进行相关分析之前使用。进行相关分析之前使用。2.2.适用资料:双变量资料。适用资料:双变量资料。12名女大学生身高与体重散点图名女大学生身高与体重散点图统计地图统计地图(statistical map)(statistical map):是用不同:是用不同的颜色和花纹表示统计量的值在地理分布的颜色和花纹表示统计量的值在地理分布上的变化,适宜描述研究指标的地理分布。上的变化,适宜描述研究指标的地理分布。例例 调查广东省四会市鼻咽癌高发区调查广东省四会市鼻咽癌高发区1990-19991990-1999年年十年间鼻咽癌的发病数,按镇区计算十年间鼻咽癌的发病数,按镇区计算标化发病比标化发病比(SMR)(SMR),标志在四会市行政地图上。,标志在四会市行政地图上。图图 1990-1999年某市鼻咽癌年某市鼻咽癌标化发病比标化发病比的地区分布的地区分布 The end The end
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!