资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,主讲:陈维,第四章 统计表与统计图,统计表(statistical table)和统计图(statistical chart)是统计描述的重要工具。医学科学研究资料经过整理和计算各种必要的统计指标后,所得结果除了用适当文字说明以外,常用统计表和统计图表达分析结果。统计图表可以对于数据进行概括、对比或做直观的表达。统计表和统计图不仅便于阅读,而且便于分析比较。,第一节 统计表,概念:,指在研究报告和科言论文中,常将统计分析的指标及其结果用表格的形式列出,以反映事物的内在规律性和关联性。,作用:,避免繁杂的文字叙述,便于计算,便于事物间的比较分析,一、统计表的结构,从外形上看,统计表由标题、标目(包括横标目、纵标目)、线条、数字及必要的文字说明和备注5部分构成。其基本,格式如表:,疾 病,病例数,百分比(%),指定传染病(包括性病),393,17.18,严重遗传性疾病,87,3.80,精神病,9,0.39,生殖系统疾病,1149,50.25,内科系统疾病,649,28.38,合计,2287,100.00,表4-1 某地区2004年婚前检查检出疾病情况,指定传染病指我国法定的甲、乙、丙三类传染病,横标目,标题,纵标目,顶线,底线,隔,线,1.标题:概括说明表的中心内容,要求用词简练、确切。必要时注明资料的时间、地点,写在表的上端中央。,注意:,防止标题过于简略或过于繁杂,有的甚至不写标题。,2.标目:要求文字简明,有单位的标目要 注明单位。横标目位于表的左侧,说明各横行数字的含义。纵标目位于表的右侧,向下说明各纵行数字的含义。,注意:,防止标目过多,层次不清。,表4-2 某地区40岁以上男女居民常见慢性病的患病率(%),疾病,男性,女性,2004年,2006年,2004年,2006年,高血脂症,33.65,28.61,34.50,25.92,高血压,24.37,25.76,18.60,20.20,脂肪肝,19.87,22.76,17.50,18.08,糖尿病,9.85,8.66,8.67,7.85,胆结石,5.88,5.16,6.85,6.46,冠心病,6.70,5.89,4.59,4.03,3线条:,只需要顶线、底线及纵标目下面与合计上面的横线。,注意:,线条不宜过多,表的左上角不宜有斜线,表内不能有纵线。,4数字:,表内数字一律用阿拉伯数字表示,同一个指标的数字精确度应当一致,表内不宜有空格,数字暂缺或未纪录用“”表示,无数字用“”表示,数字为0,则填写0。,5备注:,表格一般不列备注或其他文字说明,如有特殊情况需要说明时可用“*”标出,将文字说明写在表格的下面。,从内容上看,每张表都有主语和谓语。主语指被研究的事物,如表4-2中的疾病分组,一般置于表的左侧;谓语指说明主语的各项统计指标,如表4-2中的“男性”和“女性”,一般置于表的右侧,主语和谓语结合起来构成一个完整的句子。如表 4-2可读成高血脂症患病率男性2004年为33.65、2006年为28.61,女性2004年为34.50、2006年为25.92。,二、统计表的种类,根据说明事物的主要标志(主语)的复杂程度,统计表可以分成简单表和复合表。,1.,简单表,:只有一种主要标志,即主语按一个标志分组。,如表4-1,2.,复合表,:有两种或两种以上的标志,即主语按多个标志分组。在安排上可以将部分主语放在表的上方与谓语配合起来。,如表4-2,某年某地城乡各年龄组居民乙型肝炎病毒抗原携带率分析,请分别指出城乡25组的发生率和构成比。,三、编制统计表应注意的事项,1.简明扼要,重点突出,即一张表只包括一个中心内容,表达一个主题。,2.主谓分明,层次清楚。,即主谓语的位置准确,标目的安排及分组要层次清楚,符合专业逻辑。简单表只有一个分组标志,一般作为横标目,而纵标目就是统计指标名称。复合表有两个以上分组标志,一般把其中主要的和分项较多的一个作为横标目,而其余的则安排在纵标目上。,3.数据准确、可靠。,表4-3 代谢综合征发生与否两组人群部分基线指标比较,基线指标,无代谢综合征组(N=4071),有代谢综合征组(N=708),P值,年龄(岁),33.1(2.4),33.5(2.6),0.001,体重指数(BMI,kg/m,2,),22.8(2.5),25.6(2.5),0.001,总胆固醇(mg/dl),188.8(32.6),205.9(36.8),0.001,甘油三酯(mg/dl),101(74,138),137(112,192,),0.001,高血压(%),12.0,18.8,0.001,经常锻炼(%),8.7,9.0,0.834,吸烟(%),47.2,50.5,0.103,糖尿病家族史(%),0.5,0.4,0.691,均数(标准差);中位数(下-上四分位数),经常锻炼指每周一次以上,不同心理分值的冠心病危险因素水平比较,问 题,将太多的内容放在一个表里,特别是将两种不同类型资料(计量资料和计数资料)的统计量放在同一表中。,互不相容的内容分别占了不同的列,导致表中有许多空格。,纵横标目倒置。,内容较多,层次复杂,表格中数据罗列无条理,较难读懂。,处理办法:,将该表资料分别制成两个统计表,某年某地居民不同心理分值的冠心病危险因素水平比较(,X,S,),某年某地居民不同心理分值的冠心病危险因素水平比较,第二节 统计图,概念:利用点的位置、线段的升降、直条的长短和面积的大小等各种几何图形来表达统计资料和指标。,作用:它将研究对象的特征、内部构成、相互关系、对比情况、频数分布等情况形象而生动地表达出来,更直观地反映出事物间的数量关系,更易于比较和理解。但对数量的表达较粗略,从图中不能获得确切数字。,根据资料类型和统计分析目的不同,需要用不同的统计图表达数据和统计指标值。,医学中常用的统计图有:,直条图、百分条图、圆图、普通,线图、半对数线图、直方图、箱,式图、散点图、统计地图。还有,在数据探索性分析中应用的茎叶,图、残差图、箱式图,序贯分析,的检验区域图,判别分析的类别,分布图,聚类分析的谱系图等特,殊分析图等。,一、绘制统计图的基本要求 统计图通常由标题、标目、刻度、图域和图例5部分组成。,1.标题:简明扼要地说明资料的内容、时间和地点.一般写在图的下方中央。,2.图域:即制图空间。除圆图外,一般用直角坐标系第一象限的位置表示图域,或者用长方形的框架表示。不同事物用不同线条(实线、虚线、点线)或颜色表示。,图域的高:宽比例习惯上为5:7。,3.标目:分为纵标目和横标目,表示纵轴和横轴数字的意义,一般有度量衡单位。,4.图例:在对比关系较为复杂的统计图中,为使读者易于分辨各种图形的意义,可以设置图例。图例通常放在横轴与标题之间。,5.刻度:即纵轴与横轴上的坐标。排列方法与直角坐标系的排法一致,刻度数值按从小到大的顺序,纵轴由下向上,横轴由左向右,一律用等距表明。,二、常用统计图的绘制方法及注意事项 绘制统计图时要根据资料的性质和分析的目的选择适当的图形。,1.直条图,直条图(bar chart):适用于性质相似而不连续的资料。,用等宽的直条的长短来表示各独立指标数值大小和它们之间的对比关系。指标既可以是绝对数,也可以是相对数。为便于比较,被比较的指标一般按大小顺序排列。,单式直条图,只有一个统计指标,一个分组因素。如图4-1。,复式条图,具有两个统计指标,两个及以上分组因素。如图4-2。,某年某地主要死因的死亡率(/10万),直条图的纵轴尺度起点必须为零示意图,绘制直条图时应注意,坐标:,一般以横轴为基线,表示各个调查项目。,纵轴尺度必须从0开始,,表示各个项目相应的数据,而且要等距,否则会改变各对比组间的比例关系。,宽度:,各直条的宽度应相等,各直条的间隔也应一致。,条间隔应为条宽的一半或等宽,。,排列:,直条一般可按高低顺序排列,以便于比较。但如果各指标间需要有一定的顺序时,也可按规定的顺序排列。,注意:,复式条图中组内各直条排列次序要前后一致,并加以,图例,。,2.百分条图:,适用于构成比资料。,用矩形长条的面积表示事物全部,而用其中各段表示各构成部分。,绘制百分条图时应注意以下几点,:,将全体数量绘制成一长条,长度和宽度可以任意选择,将长条全长分为10格,每格代表10%,总长为100%。,将直条全长按构成比分为几段,在图上标出各部分构成比的数值,并用,图例,说明各部分的名称。,两种或多种类似的构成比资料相互比较时,可以绘制两个或多个长度、宽度都相等的直条,在同一起点上依次平行排列,各直条之间留有一定空隙,,一般为直条宽度的一半。,图4-4 2003年某省各类卫生技术人员构成情况(%),单式,复式,3.圆图:,是一种构成图,适用于构成比资料。,注意以下几点:,先绘圆,将构成比乘以3.60,即得各构成部分所占的圆心角的度数。,以相当于时钟的,9点,或,12点,的位置为起点依次排列各个扇形。,扇形内要注明简要文字和百分比。,两种或多种类似的构成比资料相互比较时,可在同一水平线或同一竖线上作直径相等的圆图,并注意各构成部分排列次序要一致。,图4-5 2003年某省主要死因构成情况(%),恶性肿瘤,其他,消化系统疾病,损伤与中毒,呼吸系统疾病,脑血管病,心脏病,4.线图,适用于连续性变量的资料。,用线段的升降来表示统计指标的变化趋势,,如某事物在时间上的发展变化,或某现象随另一现象变迁的情况。,绘制线图时应注意以下几点:,横轴代表分组标志,纵轴代表统计指标。横轴和纵轴都是,算术尺度,。,相邻两点用直线连接,也就是说图线应按实际数字绘制成,折线,,而不能任意修改为光滑曲线。,同一图内不应绘制太多的曲线,一般不宜超过4-5条。若有几根线,应用不同颜色或不同图线表示,并附,图例,说明。,在绘图时,一定要注意纵横轴比例,由于比例不同,给人的印象也不同。,某地1950-1964年伤寒和结核病死亡率变化情况,1950,1954,1952,1956,1960,1958,1964,1962,某地1950-1964年伤寒和结核病死亡率变化情况,1950,1954,1952,1956,1960,1958,1964,1962,6.散点图,用于双变量资料,表示两种现象之间的相互关系。,体重(kg),x,肺活量(,),Y,L,十名女中学生体重与肺活量散点图,7.直方图(histogram),适用于连续变量的频数分布资料。,常用横轴表示变量(即被观察对象),纵轴表示频数或频率。直方图用矩形面积代表各组频数或频率,各矩形面积总和代表各组频数或频率的总和。,绘制直方图应注意以下几点:,纵轴的刻度必须从“0”开始,而横轴的刻度可按实际范围制定。,作图时,各直条的宽度应等于组距,高度应等于该组的频数或频率。如果各组段的组距不同,必须换算成等距后才能作图。,8.统计地图(statistical map),表示某现象的数量在地域上的分布,可用不同的点、线、颜色等在地图上表现出来。,四川省部分县男性居民食管癌死亡率地图,2003年广东省某急性传染病发病数的地理分布图例中括号内是发生相同病例数的行政区频数,其余指数据缺失的行政区,9.箱式图(box plot),用于比较两组或多组数据的直观比较分析,描述其分布特征。,一般选用5个描述统计量(最小值、P25、中位数、P75、最大值)来绘制。,显然箱子越长,数据变异程度越大。中间横线在箱子中点表明分布对称,否则不对称。,树立质量法制观念、提高全员质量意识。,11月-24,11月-24,Saturday,November 30,2024,人生得意须尽欢,莫使金樽空对月。,07:26:46,07:26:46,07:26,11/30/2024 7:26:46 AM,安全象只弓,不拉它就松,要想保安全,常把弓弦绷。,11月-24,07:26:46,07:26,Nov-24,30-Nov-24,加强交通建设管理,确保工程建设质量。,07:26:46,07:26:46,07:26,Satur
展开阅读全文