资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,卫生统计学,方积乾,中山大学公共卫生学院,医学统计与流行病学系,2012.11,第一章,绪,绪,论,论,什么是,统,统计学(statistics)?,“Abranchofmathematicsdealingwith the,collection,analysis,interpretation, and,presentationofmassesofnumericaldata.”,(Websters InternationalDictionary),“Thescience andartofcollecting,summarizing,andanalyzingdatathat aresubject to randomvariation,.,.”,(,(ADictionary of Epidemiology),.,.,什么是,统,统计学(statistics)?,内容:收集、,分,分析、,解,解释和,表,表达数,据,据,统计学:处理数,据,据中变,异,异性的,科,科学与,艺,艺术,目的:求得可,靠,靠的结,果,果,统计学,的,的现实,地,地位:,合,合作、,审,审稿、,基,基金申,请,请(NIH)、药,物,物开发,与,与申报,(,(FDA)、卫,生,生决策,统计学,的,的若干,概,概念,1.总体与,样,样本,总体(population),:,:大同小,异,异的对,象,象全体,。,。,抽样(sampling,),):从研,究,究总体,抽,抽取部,分,分个体,样本(sample):抽取,的,的部分,个,个体,数据(data):观察,所,所得资,料,料,information datadata,knowledge,推断(inference):分析,样,样本数,据,据,获,得,得关于,总,总体的,知,知识,统计推,断,断的工,具,具:有关,概,概率的,理,理论。,推断的,结,结论:,不,不是完,全,全肯定,或,或完全,否,否定。,关键与,核,核心:,抽,抽样方,法,法、样,本,本的代,表,表性和,推,推断的,方,方法,同,质,质与变,异,异,同质性(homogeneity,),)共性,,大,大同小,异,异,变异(variation)个体间,差,差异,,多,多样性,没有同,质,质性就,构,构不成,一,一个总,体,体;,总体内,没,没有变,异,异性就,无,无需统,计,计学。,统计学,的,的任务,:,:,在变异,的,的背景,上,上,,描述同,一,一总体,的,的同质,性,性,,揭示不,同,同总体,的,的异质,性,性(heterogeneity)。,.变量的,类,类型,变量(variable,),):个体,特,特性的,数,数量描,述,述,(1)定性变,量,量,(i)分类变,量,量(categoricalvariable,),),或,名,名义,变,变量(nominativevariable)。,分类变,量,量的水,平,平(level,),):,用1、2、3、4、5等代码(code)表示水,平,平。,二分类,变,变量(binaryvariable),也称0-1变量,或假变,量,量(dummyvariable),分类变,量,量与二,分,分类变,量,量相比,信息较,丰,丰富。,(ii,),)有序变,量,量(ordinalvariable),种种可,能,能的“,取,取值”,中,中自然,地,地存在,着,着次序,。,。,有序变,量,量与分,类,类变量,相,相比,信息较,丰,丰富。,(2)定量变,量,量,(i)离散型,变,变量,只,只能取,整,整数值,。,。,例如,,手,手术病,人,人数;新生儿,数,数,(ii,),)连续型,变,变量可以取,实,实数轴,上,上的任,何,何数值,。,。,由测量,而,而得到,的,的大多,属,属于连,续,续型变,量,量,例如,,血,血压、,身,身高、,体,体重等,“连续,”,”指该,变,变量可,在,在实数,轴,轴上连,续,续变动,。,。,连续型,变,变量信,息,息最丰,富,富,离散型,变,变量次,之,之。,变通:红细胞,记,记数也,视,视为连,续,续型变,量,量。,(数值,很,很大,个位数,之,之间的,差,差别并,不,不重要,),),变量类,型,型的转,化,化:,连续型,有序,分类,二值,只能由,信,信息丰,富,富的(高级)向信息,不,不丰富,的,的(低级),转化,不能作,相,相反方,向,向的转,化,化,离散型,变,变量常,常,常通过,适,适当的,变,变换或,连,连续性,校,校,正后,借用连,续,续型变,量,量的统,计,计方法,来,来分析,;,;,连续型,变,变量常,常,常有意,识,识地转,化,化为离,散,散型变,量,量,以,便,便于解,释,释和理,解,解某些,现,现象。,4.因果与,联,联系,公共卫,生,生领域,常,常常要,探,探究危,险,险因素,与,与疾病,之间的,因,因果关,系,系(causation)。,首先应,当,当问存在不,存,存在联,系,系(association,),),然而,存在联,系,系未必,有,有因果,关,关系,在解释,统,统计分,析,析的结,果,果以及,下,下结论,时,时,务必对,“,“因果,”,”二字,慎,慎之又,慎,慎。,5.设计与,分,分析,统计学,方,方面的,设,设计(design)是医药,卫,卫生科,研,研设计,不,不可或,缺,缺的部,分,分。,设计不,仅,仅要符,合,合统计,学,学原则,,,,运用,统,统计学,方,方法和,技,技术,,而,而且,,在,在设计,的,的时候,要,要明确,日,日后用,什,什么统,计,计方法,处,处理数,据,据。,只有明,确,确了设,计,计的样,式,式和分,析,析的方,法,法才得,以,以进一,步,步考虑,数,数据应,当,当如何,收,收集、,样,样本量,应,应当多,大,大。,学习目,的,的与方,法,法,(1)统计,思,思维享,用,用一生,事件的,不,不确定,性,性-,-,-概率,由样本,推,推断总,体,体,结,论,论的不,确,确定性,-,-,-有可能,犯,犯错误,统计学,任,任务,-,-,-限定犯,错,错误概,率,率的大,小,小,,在此前,提,提下,,作,作决策,(2)理解,概,概念是,首,首位,研究设,计,计的原,则,则,确定样,本,本量的,依,依据,参数估,计,计的精,度,度,决策的,两,两类错,误,误,案例辨,析,析:在,辨,辨析中,提,提高,,从,从反面,吸,吸取教,训,训,-,-,-平时争,论,论、课,堂,堂讨论,(3)重在,理,理解和,解,解释结,果,果,通过计,算,算,体,验,验统计,概,概念和,思,思想,正确理,解,解、解,释,释和表,达,达计算,结,结果,中英文,结,结果报,告,告:内,容,容齐全,,,,表达,规,规范,-,-,-作业要,按,按照规,格,格撰写,(4)电脑,实,实验,用电脑,模,模拟现,实,实世界,,,,从实,验,验中看,随,随机现,象,象,统计软,件,件:反,复,复实践,,,,灵活,运,运用,-,-,-机房开,放,放,勤动手!,(5)考试,* 笔,试,试:理,论,论、方,法,法,不记公,式,式,无,数,数学推,导,导,无,复,复杂计,算,算,* 上,机,机考试,:,:已做,过,过的电,脑,脑实验,;,;,不编程,序,序,第二章,定,定,量,量变量,的,的统计,描,描述,把握数,据,据的基,本,本特征,为统计,分,分析打,下,下基础,统计表,、,、统计,图,图,描述性,统,统计量,统计描,述,述,-,-,-从数据,中,中获取,知,知识最,直,直观的,方,方法,第一节,频,频率,分,分布表,与,与频率,分,分布图,频数分,布,布表(frequencydistributiontable),又称频,数,数表,1.离散型,定,定量变,量,量的频,数,数分布,例2-11998年某山,区,区96名孕妇,产,产前检,查,查次数,资,资,料如下,:,:,0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,4,7,直条图,(,(barchart),横坐标,:,:产前,检,检查次,数,数;,纵坐标,:,:频率,检查k次的妇,女,女所占,的,的比例,(,(%),等宽矩,形,形长条,:,:高度相当于,检,检查次,数,数的频,率,率,2连续,型,型定量,变,变量的,频,频率分,布,布,例2-2抽样调,查,查某地120名18岁35岁健康,男,男性居,民,民血清,铁,铁含量,(,(mol/L),数,据,据如下:,直方图,(1)频率直,方,方图,横轴:,血,血清铁,含,含量,纵轴:,频,频率,矩形直,条,条高度=频率,直条高,度,度之和= 100%,(2)频率密,度,度直方,图,图,横轴:,血,血清铁,含,含量,纵轴:频率密,度,度=频率/组距,矩形直,条,条的面,积,积=频率,直条面,积,积之和= 100%,注:组,距,距相等,时,时,两,种,种直方图,形,形状相,同,同,图2-2某年某,地,地120名1835岁健康,男,男性居,民,民,血清铁,含,含量频,率,率分布,图2-3某地居,民,民238人发汞,含,含量(mol/kg)分布,正偏峰,分,分布(positively skeweddistribution),负偏峰,分,分布(negatively skeweddistribution),频率密,度,度,第二节,描,描述,平,平均水,平,平的统,计,计指标,定量地,描,描述集,中,中趋势,与,与离中,趋,趋势是,统,统计描,述,述,的重要,内,内容,对于连,续,续型定,量,量变量,,,,描述,集,集中趋,势,势常用,统计量,为,为算术,均,均数、,几,几何均,数,数和中,位,位数。,1.算术均,数,数,简称均,数,数(mean),适,合,合描述,对,对称分,布,布资料,的,的集中,位,位置(,也,也称为,平,平均水,平,平)。,其,其计算,公,公式为,n:样本,含,含量,X1,X2,Xn:观察,值,值,或,:,:观,察,察值之,和,和,例2-3测得8只正常,大,大鼠血,清,清总酸,性,性磷酸,酶,酶(TACP)含量,(,(U/L)为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试求,其,其算术,均,均数。,按式(2-1),算,术,术均数,为,为,加权平,均,均,表2-31835岁健康,男,男性居,民,民血清,铁,铁含量,算,算术均,数,数的近,似,似计算,对于偏,峰,峰分布,资,资料算,术,术均数,不,不能较,好,好地反,映,映分布,的,的集中,趋,趋势。,频率密,度,度,2.几何均,数,数(geometricmean),适用于,观,观察值,变,变化范,围,围跨越,多,多个数,量,量级的,资,资料频数图,一,一般呈,正,正偏峰,分,分布,例2-57名慢性,迁,迁延性,肝,肝炎患,者,者的HBsAg滴度资,料,料为1:16,1:32,1:32,1:64,1:64,1:128,1:512。试计,算,算其几,何,何均数,。,。,3.中位数,(,(median),可用于,各,各种分,布,布的定,量,量资料,总体中,有,有一半,个,个体的,数,数值低,于,于这个,数,数,一,半,半个体,的,的数,值高于,这,这个数,。,。,基于样,本,本资料,将n例数据,按,按升序,排,排列,,第,第i个数据,记,记为,n为奇数,时,时,n为偶数,时,时,例2-7某药厂,观,观察9只小鼠,口,口服高,山,山红景,天,天醇提,取,取物,(RSAE)后在乏,氧,氧条件,下,下的生,存,存时间,(,(分钟,),)如下:,49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0。,试求其,中,中位数,。,。,百分位,数,数(percentile),总体中,数值小,于,于它的,个,个体恰,有,有X%,大于,它的个,体,体恰有1-X%,中位数=,样本估,计,计:按,照,照升序,排,排列的,数,数列里,其左侧,(即小,于,于它),的,的个体,数,数在整,个,个样本,中,中所占,百,百,分比为X%。,第三节,描,描述,变,变异程,度,度的统,计,计指标,同一总,体,体中不,同,同个体,之,之间的,离,离散趋,势,势又称,为,为变异,(variation),例2-10试观察,三,三组数,据,据,A组:24,27,30,33,36,B组:26,28,30,32,34,C组:26,29,30,31,34,三组均,数,数都是30,1.极差(range),R=最大值,最小,值,值,计算简,便,便,但,仅,仅利用,了,了两个,数,数据的,信,信息,一般,,样,样本量n越大R也往往,会,会越大,不够稳,定,定,例2-12计算上,述,述三组,数,数据的,极,极差,A组R=36,-,-24,=,=12,B组R=34,-,-26,=,=8,C组R=34,-,-26,=,=8,2.四分位,数,数间距,(,(quartilerange),Q=P75-P25,P25与P75之间恰,好,好包含50%的个体,四分位,数,数间距Q是总体,中,中数值,居,居中的50%,个体散,布,布的范,围,围,Q越大意,味,味着数,据,据间变,异,异越大,3.方差(variance),与,与标准,差,差(standarddeviation),用于反,映,映一组,对,对称分,布,布的观,察,察值在,数,数量上,的,的变异,程,程度。,总体中,:,:,样本中,:,:,例2-13计算例2-10中三组,数,数据的,标,标准差,。,。,A组:24,27,30,33,36,B组:26,28,30,32,34三组均,数,数都是30,C组:26,29,30,31,34,C组数据,的,的变异,最,最小,A组的最,大,大,5.变异系,数,数(coefficientofvariation,CV),例2-151985年通过,十,十省调,查,查得知,,,,农村,刚,刚满周,岁,岁的女,童体重,均,均数为8.42kg,标准,差,差为0.98kg;身高,均,均数为,72.4cm,标准,差,差为3.0cm。体重,的,的变异,大,大还是,身,身高的,变,变,异大?,体重的,变,变异系,数,数,身高的,变,变异系,数,数,用于,量,量纲不,同,同的变,量,量间变,异,异程度,的,的比较,或,均,均数,差,差别较,大,大的变,量,量间变,异,异程度,的,的比较,第四节,描,描,述,述分布,形,形态的,统,统计指,标,标,1.偏度系,数,数(coefficientofskewness,SKEW),总体偏,度,度系数,为,为0时,分,布,布是对,称,称的;,取正值,时,时,分,布,布为正,偏,偏峰;,取负值,时,时,分,布,布为负,偏,偏峰。,例2-2中血清,铁,铁含量,(,(mol,/,/L)数据,偏度系,数,数SKEW= -0.19389,2.峰度系,数,数(coefficientofkurtosis,KURT),正态分,布,布的总,体,体峰度,系,系数为0;,取负值,时,时,其,分,分布较,正,正态分,布,布的峰,平,平阔;,取正值,时,时,其,分,分布较,正,正态分,布,布的峰,尖,尖峭。,例2-2中血清,铁,铁含量,(,(mol,/,/L)数据,的,的峰度,系,系数,KURT= -0.01783,第五节,统,统,计,计表和,统,统计图,统计表,(,(statisticaltable)和统,计,计图(statisticalchart)是呈,现,现数据,分,分析结,果,果的重,要,要工具,之,之一。,好的统,计,计表可,代,代替冗,长,长的文,字,字描述,,,,简明,扼,扼要地,表,表达分,析,析结果,;,;,一个合,适,适的统,计,计图能,够,够准确,、,、直观,地,地呈现,数,数据特,征,征,给,读,读者留,下,下深刻,印,印象。,-,-,-请自学,,,,考试,一,一定会,涉,涉及!,第六节,统,统,计,计内容,的,的报告,与,与中英,文,文表达,医学论,文,文中,,统,统计学,内,内容主,要,要出现,于,于:,摘要(Abstract,),),材料与,方,方法(MaterialandMethods),结果(Results),讨论(Discussion),国际医,学,学杂志,规,规定,,统,统计学,内,内容的,表,表达必,须,须规范,化,化。本,课,课程要,求,求学生,自,自学每,一,一章后,面,面的“,统,统计内,容,容的报,告,告与中,英,英文表,达,达”;,并,并要求,学,学生作,业,业应尽,量,量按照,规,规范表,达,达,养,成,成良好,习,习惯。,小结,1.频数表,、,、频率,分,分布图,:,:,描述资,料,料的分,布,布特征,(,(集中,趋,趋势与,离,离散趋,势,势),分布类,型,型(对,称,称或偏,峰,峰),2.描述性,统,统计量,:,:定量,地,地刻画,统,统计分,布,布的特,征,征。,(1)集中,趋,趋势:,算,算术均,数,数、几,何,何均数,、,、中位,数,数;,(2)离散,趋,趋势:,极,极差、,四,四分位,数,数间距,、,、方差(标,准差)和变异,系,系数;,(3)分布,形,形态:,偏,偏度、,峰,峰度,3.百分位,数,数是一,种,种位置,参,参数,描述集,中,中趋势,:,:P50;描述离,散,散趋势P75-P25,小结,4.统计表,和,和统计,图,图是医,学,学论文,必,必不可,少,少的部,分,分,必,须,须学会,正,正确选,用,用和相,应,应的软,件,件技术,。,。,5.关于统,计,计学规,范,范表达,,,,针对,不,不同类,型,型的医,学,学论文,,,,国际,上,上存在,公,公认的,“,“指南,”,”;,卫生统,计,计学(第7版)随,书,书光盘,提,提供了,相,相应的,网,网站,,请,请同学,们,们自行,关,关注。,谢谢,
展开阅读全文