《医学统计学》课件医学统计学-绪论

上传人:考试不挂****2941... 文档编号:242972948 上传时间:2024-09-13 格式:PPT 页数:69 大小:1.04MB
返回 下载 相关 举报
《医学统计学》课件医学统计学-绪论_第1页
第1页 / 共69页
《医学统计学》课件医学统计学-绪论_第2页
第2页 / 共69页
《医学统计学》课件医学统计学-绪论_第3页
第3页 / 共69页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,医学统计学,(,Medical Statistics,),实习课要求,每人准备一个能够进行,统计运算,和,相关回归,运算功能的计算器。,最好准备一台笔记本电脑,如何学习医学统计学,?,(特点:抽象,),理解基本的统计学原理,培养统计思维能力:,抽象的逻辑推理,阳性结果是否是虚假联系,(如治疗感冒药有效),阴性结果是否真是阴性,(可能样本含量小),多练习:,课堂认真听讲 ,课下多做习题,(要求:上课带计算器),联系实际:,阅读文献,联系工作和生活实际,统计学发展及有关问题,20世纪20年代,,英国统计学家,R.A.,Fisher,爵士,(1890-1962)创立了,实验设计方法和统计分析,技术,奠定现代生物统计的基础。,1948年,,英国发表了评价链霉素治疗肺结核疗效的,随机对照的临床试验,报告,第一次采用生物统计方法进行临床干预试验。,1948年,,,郭祖超,教授(19121999)编著的医学与生物统计方法,是我国第一部医学统计方法的教科书。,1. 实例,遗传学家,F. Galton,爵士(1822-1911)对上千家庭父亲身高和儿子身高的观察发现遗传的“回归”现象,1960年英国医生,Doll,Hill,等发现吸烟与肺癌有关,2.,医学论文中的统计学问题,60年代到80年代,国外医学杂志调查结果:,有统计错误,的论文,20%72%,。,1996年对4586篇论文统计(中华医学会系列杂志占6.9%),,数据分析方法误用,达,55.7%,。,3.,伪造统计数据违反科学道德,1976年,New Science,杂志关于,科研舞弊,行为的调查,(1)74%的调查表反映有,不正当修改数据,的情况,(2)17%,拼凑实验结果,(3)7%,凭空捏造数据,(4)2%,故意曲解结果,绪 论,一、 医学统计学定义,(,medical statistics,),医学统计学是运用数理统计的原理和方法,研究医学领域中数据的收集、整理与分析的一门应用科学。它是认识医学现象,数量特征,的重要,工具。,二、 统计学研究的对象,统计学所要研究的对象是在性质相同基础上有变异的事物或现象,有关概念:,同质与变异,同质,(,homogeneity,),同质是指被研究的指标(变量)的,影响因素相同。,同质是相对的。,在统计学中,同质可以理解为:,影响被研究指标较大的、可以控制的主要因素尽可能相同即可视为同质。,研究对象的同质是使研究结果反映事物客观规律的基础。,变异,(,variation,),变异是指由于已知的或未知的多种因素的综合影响,使,看起来,同质(即具有可比性)的个体的某项指标存在差异。,变异使得观察研究或实验研究的结果具有不确定性,但在一定数量观察的基础上,不确定性现象能够呈现事物的规律性。,同质与变异的例子,例1 调查2003年青岛市7岁男童的身高和体重,同质,:2003年、青岛市、7岁、男童,变异,:每位儿童身高和体重各不相同,例2 研究某降压药的疗效,同质,:高血压患者、用某药治疗,变异,:疗效各不相同,例3:调查某地,2005,年正常成年女性的糖化血红蛋白,(,HbA1C),研究对象,:该地,2005,年的正常成年女性,同质,:同一地区、同一年份、同为正常成年人和同为女性构成了研究对象同质的要素。,变异,:每个人的糖化血红蛋白测量值不相同。,同质的要求与研究目的有关,如,调查某地,2005,年正常成年女子的雌性激素水平,,尽管研究对象是同一地区、同一年份、同为正常成年人和同为女性,由于女性在绝经后的雌性激素水平有较大下降,如果研究者把绝经和未绝经的研究对象混合在一起,并且不加区分,则对于研究雌性激素水平而言,这些研究对象显然是异质的。,三、几个基本概念,例:,研究,1998,年某地,7,岁男孩的身高情况,假如该地在,1998,年的,7,岁男孩有,10,万人。,普查,:调查这,10,万名儿童,测量他们的身高,然后进行统计分析。但是工作量非常大。,随机抽样:,如调查,200,名儿童,测量他们的身高,通过分析这,200,名儿童的身高推断该地,10,万名,7,岁男孩身高情况。,研究目的,:了解,1998,年某地,7,岁男孩的身 高发育情况。,研究对象,:该地在,1998,年的,10,万名,7,岁男孩。,观察单位,(,个体,),:每名,7,岁男孩。,观察指标,:身高,(,观察指标又称为变量,),;身高的测量值,(,观察值又称为变量取值或变量值,),。,总体,:,该地,19,98,年的,10,万名,7,岁男孩身高观察值的全体,(,即:,10,万个身高观察值构成的一个集合,),。这,10,万名,7,岁男孩的身高平均数在这个研究中称为身高的,总体均数,,,样本,:,随机抽样所得到的,200,名,7,岁男孩身高观察值。这,200,名,7,岁男孩的身高平均数在这个抽样研究中称为身高的,样本均数,。,抽样研究的目的,:,通过样本的信息,了解推断总体的情况。即:通过分析,200,名,7,岁男孩的身高了解,10,万名,7,岁男孩身高情况。,(一),观察单位,(,observation unit,),根据研究目的所确定的,最基本的研究对象单位。,根据不同的研究目的,观察单位可以是一个人、一只大白鼠、一个家庭、一个地区、一个检测样品、一个采样点等。例如,观察单位是一个人,则100个观察单位就是100个人;又如观察单位是检测样品,则50个观察单位就是50个检测样品。,(二),变量,(,variable,),对观察单位(即个体:一个人、一个家庭或一个地区等)的某项特征或属性进行观察和测量,所得指标称为,变量,。,观察和测量的结果称为变量值或观察值(,value of variable)。,观察值可以是,定量,、,半定量,或,定性,的,.,1,、,定量变量(数值变量),(,numerical variable,),是指观察单位所具有的变量值是定量的,表现为数值的大小,一般有度量衡单位。,如身高、体重、血红蛋白、血压。,又可分为两类:,连续变量,,如,年龄,、,身高、体重,。,离散变量,,如,住院天数、脉搏(次,/,分钟)。,2、,定性变量(分类变量),(,categorical variable,),是指观察单位所具有的变量值是定性的,表现为互不相容的类别或属性。,如性别、职业、文化程度、疗效,。,又可分为两类:,名义变量(无序分类),,即分类之间没有顺序、等级、大小关系,类别只代表名称或标签的含义,没有数量的意义,如血型、职业、民族。,两项分类,如性别,多项分类,如血型、职业、民族等,。,有序变量(有序分类),,即分类之间有一定顺序或分类的排列有程度差别。,如文化程度、疾病严重程度等。,3、变量的转化,不同类型的资料采用不同的统计分析方法。实际应用中,根据分析的需要,各类变量间可以互相转化。,如:,血红蛋白量(,g/L,),:,疗效,:,正常:,0,无效:0,重度贫血 好转:1,异常:,1,中度贫血 控制:2,轻度贫血 治愈:3,血红蛋白增高,(三)统计资料的类型*,定量资料,定性资料,名义分类(无序分类)变量资料,有序分类变量资料,1、,定量资料,又称为,数值变量资料,,计量资料,对每个观察单位用,定量的方法测定某项指标数量的大小,所收集的资料,观察单位之间只有,量,的差别,没有,质,的不同,。,如患者的身高(,cm)、,体重(,kg)、,血压(,mmHg)、,脉搏(次/分)、红细胞计数(10,/,L),。,2、定性资料,2.1,名义分类变量资料,又称,无序分类变量资料,计数资料,将观察单位按照,某种性质或类别进行分组,,然后计数各组的观察单位数所得到的资料,观察单位之间只有,质,的不同,没有,量,的差别。,如肤色(黑、白)、血型,(,ABO)、,职业(工农兵)、性别(男女)、民族、国籍。,2.2,有序分类变量资料,又称,等级资料,将观察单位按照某种性质或属性的不同程度分组,然后计数各组的观察单位数所得到的资料。,与无序分类变量资料的不同点为:属性分组有程度的差别,各组间按不同程度顺序排列;,与定量资料的不同点为:每个观察单位没有进行确切定量。,如:,癌症分期:早、中、晚。 药物疗效:治愈、好转、无效、 死亡。 尿蛋白:,,,+,+,及以上,住院号,年龄,身高,体重,住院,天数,职业,文化,程度,分娩,方式,妊娠,结局,2025655,27,165,71.5,5,无,中学,顺产,足月,2025653,22,160,74.0,5,无,小学,助产,足月,2025830,25,158,68.0,6,管理员,大学,顺产,足月,2022543,23,161,69.0,5,无,中学,剖宫产,足月,2022466,25,159,62.0,11,商业,中学,剖宫产,足月,2024535,27,157,68.0,2,无,小学,顺产,早产,2025834,20,158,66.0,4,无,中学,助产,早产,2019464,24,158,70.5,3,无,中学,助产,足月,2025783,29,154,57.0,7,干部,中学,剖宫产,足月,观察单位,observations,变量,variables,定量资料,(数值变量资料),定性资料,(分类变量资料),Units;elements,4. 三类资料间关系,例:一组,20,40,岁成年人的血压,以12,kPa,为界分为正常与异常两组,统计每组例数,8,低血压,8,正常血压,12,轻度高血压,15,中度高血压,17,重度高血压,数值变量资料,无序分类变量资料,有序分类变量资料,(四)、总体与样本,population and sample,总体,(,population),根据,研究目的确定,的性质相同的观察单位的全体,即性质相同的所有观察单位某一变量值的集合。,总体又可分为:,有限总体,和,无限总体,。,样本,(,sample),在抽样研究中,从总体中,随机抽取,一部分有,代表性,的观察单位,称为样本。或从研究的总体中,随机抽取,一部分有,代表性,的观察单位,某一变量值的集合。,研究样本的目的是通过样本来推论总体,。,随机化,random,ization,为了保证样本的可靠性和代表性,需要采用随机化的抽样方法(在总体中每个观察单位被抽到的机会相等),。,(五),参数与统计量,parameter and statistic,样本,随机抽取部分观察单位,统计量,参 数,推断,inference,总体,参数,(,parameter),在统计学中,把描述,总体的统计指标,,或描述,总体特征的指标,称为参数。,总体参数一般用,希腊字母,表示,如总体均数、,总体标准差记为,和,、,总体率记为,等。,总体参数一般是,未知,的,而且是固定不变的。,统计量,(,statistic),在抽样研究中,根据样本变量值计算出来的描述,样本的统计指标,或描述,样本特征的指标,称为统计量。,样本统计量用,拉丁字母,表示,如样本均数和样本标准差记为,、,样本率记为,p,等。,样本统计量随样本不同在参数附近随机波动。,抽样研究的目的,是要由样本统计量来推断总体参数,包括区间估计和假设检验。,(六)误差(,error,),概念,误差:一般指实测值与真实值之差,样本指标与总体指标之差。,种类,系统误差(非抽样误差):,仪器未校正、测量者偏差、标准不统一(偏高或偏低)等引起的误差。,偏倚:,观察性研究组间不可比引起的系统误差。,随机误差(主要是抽样误差):,排除系统误差后存在的误差。包括,抽样误差和随机测量误差。,误差的特点,系统误差:,有方向性、系统性、周期性,是错误与不足,应避免。,通常用,准确度,描述,随机误差:,随机性、无方向性和系统性,无法消除的机会,应减少,。,通常受,精确度,限制。,抽样误差,(,sampling error,),从总体中,随机抽样时,总体,参数与样本统计量或样本统计量与样本统计量之间的差异,称为,抽样误差,。,产生抽样误差的,原因,是因为总体中的个体之间存在差异。,抽样误差是不可避免的,但它有一定的规律性。,(七) 概率,(,probability,),又称作机率,是对,总体,而言。反映某,随机事件,发生,可能性大小,的量称为概率,以符号,P,表示。,P,值的取值范围为,0,P,1,。,随机试验,根据研究的目的,在一定的条件下,对某一随机现象所进行的观察或试验。,确定性现象,:,在一定条件下,,一定,会发生或一定不会发生某种结果的现象。,其表现结果为两种事件:,必然事件:,肯定发生某种结果;,P,= 1,不可能事件:,肯定不发生某种结果。,P,= 0,随机现象,:,在同样条件下,可能,会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。其表现结果称为,随机事件,。,0 ,P, 1,必然事件,P,= 1,不可能事件,P,= 0,随机事件 0 ,P, 1,P, 0.05(5),或,P, 0.01(1),称为,小概率事件,(习惯),统计学上认为不大可能发生。,小概率事件,尽管发生了“挑战者”号爆炸和“哥伦比亚”号解体这样严重的事故,但美国航天飞机从总体看还是非常可靠的。,2005,年,9,月,美国白宫批准,NASA,提出的用新一代航天运载工具,“,乘员探索飞行器”,(CEV),替代航天飞机的计划,可使航天飞机的飞行事故发生率从以往的,1/220,(,0.0045,),降低为,1/2000,(,0.0005,),,安全系数比航天飞机提高,10,倍。,频率,(,frequency),频率是对,样本,而言,样本中某事物或现象发生的可能性大小称为频率。,设在相同条件下,独立重复进行,n,次试验,事件,A,出现,f,次,则事件,A,出现的频率为,f,/,n,。,频率与概率间的关系:,样本频率总是围绕概率上下波动,样本含量,n,越大,波动幅度越小,频率越接近概率。,当样本含量,n,足够大时,常以频率作为概率的估计值。,由上述表可以看到频率,f,呈某种随机性。但随着抽样人数,n,的增大,频率,(,患病率,),f,随机波动的幅度越来越小并且趋向常数,10%,。可以证明:当观察次数,n,越来越大,频率,f,的随机波动幅度越来越小,并最终趋向于一个常数,这个常数被称为随机事件,A,发生的概率,(,又称为统计学上的概率定义,),。,四、统计工作基本步骤,1. 研究,设计,2. 收集资料,3. 整理资料,4. 分析资料,(一)研究设计,设计是后三个步骤的依据,是统计工作中最关键的一步。,医学研究有观察研究和实验研究。,医学科研设计,有调查设计和实验设计。,调查设计,包括专业设计和统计设计,统计设计应包括数据搜集整理与分析全过程的统计设想和安排;,实验设计,包括动物实验、临床试验、社区干预试验。应遵循随机、对照、重复、均衡的原则。,(二)资料的搜集,目的:取得准确可靠的原始资料,要求,:,原始数据准确、完整、及时。,医学统计资料的主要来源,:,1.常规保存记录,报告卡(单),报告卡,2.实验记录,3.专题调查,调查表,(三),4.,其它,,如,统计报表,公开发表的有关数据;,(三)资料的整理,目的:,是使原始资料系统化、条理化,便于进一步计算和分析,方法:,1.检查、核对、纠错,2.设计分组,3.设计整理表,归纳汇总,整理表,(二),四、资料的分析,按设计的要求,根据研究目的和资料的类型,对整理的基础数据作进一步的统计,计算和分析处理,,并用适当的,统计图表,表达出来,最后结合,专业,做出,结论,。,1.,某年级甲班、乙班各有男生50人。从两个班各抽取10人测量身高,如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高也大于乙班?为什么?,2,用,A,B,两种药物分别治疗一批患者。如果,A,药的治愈率高于,B,药,,证明,A,药的疗效优于,B,药。这种说法对吗?为什么?,思考题,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!