医学统计学第1讲-绪论-课件

上传人:494895****12427 文档编号:242409031 上传时间:2024-08-22 格式:PPT 页数:55 大小:504.39KB
返回 下载 相关 举报
医学统计学第1讲-绪论-课件_第1页
第1页 / 共55页
医学统计学第1讲-绪论-课件_第2页
第2页 / 共55页
医学统计学第1讲-绪论-课件_第3页
第3页 / 共55页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,生物医学统计学,1,生物医学统计学1,几个问题?,医学和统计学是什么关系?,医学统计学由哪几个部分组成?,当今医学统计学的应用情况如何?,医学统计学学习的难点是什么?,2,几个问题?医学和统计学是什么关系?2,第一章 绪论,一、什么是生物医学统计学,学习生物医学统计学的重要性,二、统计工作的步骤,三、统计资料的类型,四、统计学的几个基本概念,3,第一章 绪论一、什么是生物医学统计学3,工作生活中常见的统计学问题,中国股民股票投资状况问卷调查与分析,中国工业生产发展的预测分析,中国城镇居民消费结构分析,年龄、文化程度、婚姻状况、职业对人口死亡率的影响,财政收入多元线性回归分析,区域城市化水平差异的定量分析,统计学就是设法在令人困惑费解的数字中找出规律,并提出统计学解决方案,4,工作生活中常见的统计学问题中国股民股票投资状况问卷调查与分析,一 、什么是,生物医学统计学,统计学,研究数据及其存在规律的科学,生物医学统计学,用统计学原理和方法研究生物医学问题的一门学科,医学统计学:20世纪40年代逐渐形成的,学科,特点,:不讨论,数学理论,,而偏重于,统计原理,的介绍和具体,分析方法,的应用,对象:人体、健康相关因素、疾病相关因素,研究特点:变异性强、影响因素多、必须有一定数量的研究对象,5,一 、什么是生物医学统计学统计学研究数据及其存在规律的科,根据研究领域和研究对象,统计学又分为:数理统计、经济统计、生物统计、,医学统计、卫生统计.,生物医学统计学(biomedical statistics),:用统计学的原理和方法研究生物医学中的问题。,卫生统计学(health statistics):与医学统计学基本相同,但更侧重于社会、人群的卫生问题。,6,根据研究领域和研究对象,统计学又分为:数理统计,统计学在生物医学中的应用,调查10例男性矽肺患者的,血红蛋白的均数,为,12.59,(g/dl),标准差为1.63(g/dL),已知男性健康成人的血红蛋白的正常值为,14.02,(g/dL),问矽肺患者的血红蛋白是否与健康人不同。,某医院用某新药与常规药物治疗,婴儿贫血,,将20名患儿随机分成二组,分别接受两种药物治疗,测得血红蛋白增加量如下,问新药和常规药物疗效有无差别。,增加量,( g/L ),新药组,24,36,25,14,26,34,23,20,15,19,常规药组,14,18,20,15,22,24,21,25,27,23,23.6,20.9,7,统计学在生物医学中的应用调查10例男性矽肺患者的血红蛋白的均,1.,采用统计学方法,发现不确定现象背后隐藏的规律。,变异,(variation)是社会和生物医学中的普遍现象。,变异使得实验或观察的结果具有,不确定性,,如每个人的身高、体重、血压等各有不同。,为什么要学统计学?,8,1. 采用统计学方法,发现不确定现象背后隐藏的规律。为什么要,2.,用统计学思维方式考虑有关医学研究中的问题,“阳性”结果是否是虚假联系?,某感冒药治疗1周后,治愈率为90%,能否说该感冒药十分有效?,“阴性”结果是否是样本含量不足?,有人曾对发表在Lancet(柳叶刀),N Engl J Med,JAMA等著名医学杂志上的71篇阴性结果的论文作过分析,发现其中有62篇( 93%)可能是由于,样本含量,不足造成的假阴性。,9,2. 用统计学思维方式考虑有关医学研究中的问题 9,3.,保证你的研究论文能通过统计学审查,据国外6080年代对不同医学杂志发表论文的调查,有,统计错误的论文的百分比最高达72%,最低也有20%,。,国内八十年代年对中华医学杂志、中华内科杂志、中华外科杂志、中华妇产科杂志、中华儿科杂志等刊物中的595篇论文的调查结果,相对数误用为11.2%,抽样方法误用15.9%,统计图表误用11.7%。,某研究者对某年的4586篇论文统计,医学数据分析方法误用达55.7%。,10,3. 保证你的研究论文能通过统计学审查10,4,.,获得循证医学证据的主要手段,“良好愿望的医学”(,well-meaning medicine,)转入“以证据为基础的医学” (,evidence-based medicine,EBM,)需要有统计学方法的支持。,全世界的医学期刊每年大约刊登600万学术论文,但能作为可靠“证据”的论文并不多。,11,4. 获得循证医学证据的主要手段11,医学论文中的统计学错误,甲疗法,乙疗法,病情,病人数,治愈数,治愈率,病人数,治愈数,治愈率,轻型,80,72,0.9,60,54,0.9,重型,120,84,0.7,40,28,0.7,合计,200,156,0.78,100,82,0.82,效果一样的疗法,?,12,医学论文中的统计学错误甲疗法乙疗法病情病人数治愈数治愈率病人,生物医学统计学很重要,怎样做?,13,生物医学统计学很重要怎样做?13,二、统计工作的步骤,研究设计:,依据目的制定计划,对整个过程进行安排,是整个工作的,关键,搜集资料:,根据计划取得可靠、完整的资料。收集资料方法有:统计报表、日常性工作、专题调查。注重资料的真实性(,基础,),整理、分析资料:,原始资料的整理、清理、核实、查对,使其条理化、系统化便于计算和分析。可借助于计算机(常用软件:Excel, SPSS, SAS),(环节),解释结果:,统计学的目的所在。运用统计学、医学的基本原理和方法,分析计算有关的指标和数据,揭示事物内部的规律。,(目的),14,二、统计工作的步骤研究设计:依据目的制定计划,对整个过程进行,研究设计,非常重要,研究设计,:直接影响研究结果,设计缺陷:,不能事后弥补,严格区分,:科学研究、日常工作,分析方法,:设计中必须明确,事半功倍,事倍功半,怎样设计?,15,研究设计 非常重要研究设计:直接影响研究结果事半功倍事倍,统计学的,研 究 设 计,研究类型,(横向、纵向),研究设计的基本内容,实验设计的3原则,(重复、对照、随机化),常用随机分组的方法,16,统计学的 研 究 设 计研究类型(横向、纵向)16,医学论文中的统计学错误,“,奇妙的,”实验设计:,为研究A、B两种药物的疗效,设计了下面实验。分4组,每组小白鼠20只,观察定量指标为血小板、白细胞。分组如下:,第1组:空白对照;,第2组:单用A药;,第3组:A、B药联合使用;,第4组:第3组的空白对照组。,2,2析因对照,17,医学论文中的统计学错误“奇妙的”实验设计:22析因对照17,Fisher 在著作中多次强调:统计学家与科学研究者的合作应该在实验设计阶段,而不是在需要数据处理的时候。,“试验完成后再找统计学家,无异于请统计学家为试验进行“尸体解剖”。 统计学家或许只能告诉你试验失败的原因。”,18,Fisher 在著作中多次强调:统计学家与,研究类型,纵向研究(longitudinal study),由于是指动态地、持续地提供信息,称,横断面研究(cross-section study),又称现况研究,提供静态的、瞬时的即某一时点的观察信息。,19,研究类型纵向研究(longitudinal study)1,前瞻性研究(prospective study),又称,组群研究(cohort study)。,把范围明确的人解分为两组,一组暴露于某因素之下,另一组不暴露,,用一段时间观察两组的发病(死亡)率,进行比较。即,由因寻果。,20,前瞻性研究(prospective study)又称组群研究,回顾性研究(retrospective study),又称,病例对照研究(case-control study)。,要求选好,有代表性,的病例组,同时设立对照组。,两组对象用同样方法回顾有无暴露于某因素及暴露程度,然后统计研究,,寻找疾病与原因联系,即,由果找因,。,21,回顾性研究(retrospective study)又称病例,举 例,例:,研究孕妇妊娠期服用塞利多米,与婴儿四肢缺失之间是否有关。,回顾性研究,前瞻性研究,a,-苯肽茂二酰亚胺,反应停,22,举 例例:研究孕妇妊娠期服用塞利多米,与婴儿四肢缺失之间是否,实验设计三要素,实验因素,:,实验对象,:人、动物、细菌、细胞,实验效应,:,23,实验设计三要素实验因素:23,实验设计三原则,在“有利条件”下获得实验结果,在排除非干预措施因素的影响后,推论干预措施的因果效应,Fisher三原则:,重复,、,对照,、,随机化,24,实验设计三原则在“有利条件”下获得实验结果24,实验设计原则:,重复,样本量,:有一定数量的重复观测结果。,也叫,样本容量,、样本含量,样本量不能太多,不能太少,直接影响结论的可靠性、可行性、控制难度;,“够用”的问题:必须考虑,样本量的估计很重要。,25,实验设计原则:重复样本量:有一定数量的重复观测结果。25,原始,计量资料,26,原始计量资料26,实验设计原则:,对照,基于未“暴露”因素上的“暴露”因素的效应,前后对照;,平行对照;,除“暴露”因素外,其他非暴露因素应基本相同,使暴露因素具有科学性;,随机对照;,非随机对照;,27,实验设计原则:对照基于未“暴露”因素上的“暴露”因素的效应2,对照-常用的,干预方式,空白对照,实验对照:假干预对照,安慰剂对照:单盲、双盲、三盲,标准对照,28,对照-常用的干预方式空白对照28,实验设计原则:,随机化,分组时,每个观察对象具有相同的概率被分到,实验组/对照组,,,主要作用,:,保证各种,已知/未知,的特征在各组均衡性;,避免主观愿望破坏各组均衡性;,是所有统计假设检验推论结果的基础,29,实验设计原则:随机化分组时,每个观察对象具有相同的概率被分到,常用随机分组方法,完全随机的实验设计:,P23,例2-5,由随机数据表附15,配对实验设计:,P19, 图2-3、2-4,随机区组的实验设计:,P167, 例11-3,拉丁方试验设计:,双重局部控制,精确度最高,正交试验设计:L4 (2,3,),多、快、好、省,。,A,B,B,A,2,2,A B C,B C A,C A B,3,3,30,常用随机分组方法完全随机的实验设计:P23,例2-5由随机数,三,、,统计资料的类型,三种基本类型:,计量资料、计数资料、等级资料,基本概念:,变量、变量值,研究者对每个观察单位的,某项特征,进行观察和测量,这种特征称为变量,变量的测得值叫变量值(也叫,观察值,),称为资料。,*按变量值性质,定量资料和定性资料。,31,三、统计资料的类型 三种基本类型:31,1. 计量资料,得到的资料是每一个观察单位的某项研究指标的,量的大小,。例如:体重、身高、血压等。,特点:,a.,有度量单位,b. 多为连续性数据,c. 往往通过测量得到,32,1. 计量资料得到的资料是每一个观察单位的某项研究指标的量,将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的,个数,。如患病人数、型血型的人数等。,特点:,无,度量衡,单位,为,间断性,资料,通过,记数,得来,2. 计数资料,33,将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察,介于计量资料和计数资料之间的一种资料,通过,半定量,方法测量得到。,特点:,每一个观察单位,没有确切值,各组之间有大小、,程度上的差别,。,3. 等级资料,34,介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到,(二)三类数据间的关系,例:一组,20,40,岁成年人的血压,以12kPa为界分为正常与异常两组,统计每组例数,8,低血压,8,正常血压,12,轻度高血压,15,中度高血压,17,重度高血压,定量数据,等级数据,定性数据,(二)三类数据间的关系 例:一组2040岁成年人的血压以1,(三)三类数据的,编码,与计算(1),例:一组,20,40,岁成年人的血压,以12kPa为界分为正常(,0,)与异常(,1,)两组,统计每组例数,8,低血压,4 1,8,正常血压,10 2,12,轻度高血压,13 3,15,中度高血压,16 4,17,重度高血压,18 5,定量数据,等级数据,定性数据,(三)三类数据的编码与计算(1) 例:一组2040岁成年人,医学论文中的统计资料错误,令人惊讶的资料表达:,在一个96孔板上做实验。板上每行有12个孔。在某个孔中加入某细胞液,再加入一种特定药物,观察其反应。若反应为阳性,记为“1”;若反应为阴性记为“0”。得实验结果如下,: (仅给出前3组),第1组:0,0,0,0,0,0,1,0,0,0,0,0,第2组:0,0,1,0,0,0,1,0,0,1,0,0,第3组:0,1,0,0,1,0,1,0,0,1,0,1,表达结果如下:,第1组:0.0830.289,第2组:0.2500.452,第3组:0.4170.515,37,医学论文中的统计资料错误令人惊讶的资料表达: 表达结果,四,、,统计学中的几个基本概念,1、同质,与,变异,2、总体,与,样本,3、普查,与,抽样,4、参数,与,误差,5、频率,与,概率(小概率事件),38,四、统计学中的几个基本概念1、同质与变异38,1.,同 质,与,变 异,同质(homogeneity),指事物某方面的性质、影响条件或背景相同或相近,变异(variation),同质个体,间的差异。,来源于一些未加控制、或无法控制的、甚至不明原因的因素,是统计学存在的基础,从本质上说:,统计学就是通过对个体变异的研究,揭示同质事物的本质特征与规律,39,1. 同 质 与 变 异 39,总体,参数(parameter),根据研究目的确定的研究对象的全体,即,性质相同,的所有观察对象的集合;分为有限总体和无限总体,样本,统计量(statistics),总体中的部分;研究对象,总体与样本的关系,统计学解决的问题:正确从样本特征推测总体水平,抽样:,从总体中选择样本的过程,样本量(sample size),:,样本所包含的个体数目,2.,总 体,与,样 本,40,总体参数(parameter) 2. 总 体 与,2.,总 体,与,样 本,参数:,总体统计学特性的数字,包括总体均数、总体方差、总体标准差;,大多数得不到总体数据,参数是未知的,估计总体结果是统计学的目的之一,41,2. 总 体 与 样 本参数:总体统计学特性的数字,包,3. 普查 与 抽样,普查:,全面调查,根据研究目的确定总体,如,人口普查,、,肿瘤普查,是社会学/卫生防疫的指标确定的依据,注意时效性、变化性,传染病报告制度,地震伤亡等都属于普查,42,3. 普查 与 抽样普查:全面调查,根据研究目的确定总,3. 普查 与 抽样,选择样本的方法:,概率抽样,和,非概率抽样,等概率抽样,非等概率抽样,单纯随机抽样,系统抽样,分层抽样,整群抽样,43,3. 普查 与 抽样选择样本的方法:概率抽样和非概率抽,概率抽样,、,非概率抽样,概率抽样,:每个对象被抽中的概率是已知/可计算的,其样本统计量是参数估计和计算误差的基础;,等概率抽样:随机抽样,不等概率抽样:多单位被抽取的概率不同,可能会得到更有效的估计量,非概率抽样,:抽样概率未知/无法计算,按主观、有目的、为方便进行抽样;,不能计算抽样误差,或一般按简单随机抽样计算误差,。配额抽样、滚雪球/识别抽样,44,概率抽样、非概率抽样概率抽样:每个对象被抽中的概率是已知/可,A 单 纯 随 机 抽 样,*,将调查总体的全部观察单位编号,,*用抽签法或随机数字表法进行抽样。*它是最基本的抽样方法,也是其他抽样方法的基础。,45,A 单 纯 随 机 抽 样 *将调查总体的全部观察单,B 系 统 抽 样,* 按照一定顺序机械地每隔若干个单位抽取一个单位,又称,机械抽样、等距抽样,。,*其,抽样间隔,(总体数量样本含量),一般是随机找一个单位为起点,以后按抽样间隔进行抽样。,46,B 系 统 抽 样 * 按照一定顺序机械地每隔若干, 分 层 抽 样,*先将总体中所有观察单位按主要特征(如年龄、性别、病情轻重等)分为若干层次,*在各层次中进行随机抽样,*要求,层内,个体,差异越小越好,,,层间差异越大越好,*,优点,是抽样,误差小,,不同层可采用不同抽样方法,各层可独立进行分析,47, 分 层 抽 样*先将总体中所有观察单位按主要特征(,D、整群抽样,整群抽样不是按个体进行抽样,而是抽取由个体组成的,群体,的抽样方法。如抽取的是该地区若干个县的全体居民。整群抽样的主要持点是以“群”为基本抽样单位。,抽样误差由,小到大,的依次为,:,分层,抽样,系统,抽样,单纯随机,抽样,整群,抽样。,48,D、整群抽样 整群抽样不是按个体进行抽样,而是抽取由个体组成,4. 误 差,误差:,统计上泛指,测量值,与,真值之差,样本指标,与,总体指标,之差。主要有二种:,系统误差和随机误差(随机测量误差,抽样误差)。,(1),系统误差,:指数据搜集和测量过程中由于,仪器不准确,、,标准不规范,等人为原因,造成观察结果呈倾向性的偏大或偏小。,特点,:具有累加性、方向性、可避免性,(2).随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。,特点,:无方向性、不能避免。,49,4. 误 差误差:统计上泛指测量值与真值之,在消除了系统误差的前提下,由于非人为的偶然因素,对于同一样本多次测定结果不完全一样,结果,有时偏大有时偏小,,没有倾向性,这种误差叫,随机测量误差,。,特点,:,没有倾向性,,多次测量计算,平均值,可以减小甚至消除随机测量误差。,A、 随机测量误差,50,在消除了系统误差的前提下,由,由于抽样原因造成的样本指标与总体指标之间的差别。,特点,:有抽样,抽样误差就不可避免。但抽样误差有规律,统计上往往可以计算并在一定范围内控制抽样误差。,B、 抽样误差,51,由于抽样原因造成的样本指标与总体指标之,4. 频 率 与 概 率,抛一枚硬币,是否国徽面一定向上?明天的股市升还是降?某患者痊愈的可能性?这些问题的答案都不可能绝对。,描述随机事件发生的可能性大小的数值,常用大写字母P来表示,。,P的大小在01之间,越接近于1,说明发生的可能性越大,越接近于0,说明发生的可能性越小。,通常一个事件的发生小于5%,就叫,小概率事件,。,频率:在实际工作中,当观察单位的例数足够多时,可以用频率来代替概率。频率是概率的估计值。,52,4. 频 率 与 概 率 抛一枚硬币,是否国徽,1. 统计工作的基本步骤是什么?,2. 统计资料分为几类? 特点?,判断:大学教授的年收入,欧洲的国家数,血红蛋白含量,患者的资料情况。,3. 什么是总体? 什么是样本?,4. 基本的概率抽样方法是什么?,5. 什么是抽样误差? 如何减小? 能否避免?,小 结,53,1. 统计工作的基本步骤是什么?小 结 53,思 考 题,为了了解某地2029岁健康女性血红蛋白的正常值范围,现随机调查了该地2000名2029岁的健康女性,并对其血红蛋白进行测量,请问本次调查的总体是( ),A该地所有2029的健康女性,B该地所有2029的健康女性的血红蛋白测量值 C抽取的这2000名2029岁女性 D抽取的这2000名2029岁女性的血红蛋白测量值。,54,思 考 题为了了解某地2029岁健康女性血红蛋白的正常值范,P27: 练一;,P42: 练一,练二 8、11,思考题,下次课: “计量资料统计描述” 教材第4章,55,P27: 练一;思考题下次课: “,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!