写出假设检验的基本步骤课件

上传人:20****08 文档编号:241765100 上传时间:2024-07-22 格式:PPT 页数:99 大小:3.68MB
返回 下载 相关 举报
写出假设检验的基本步骤课件_第1页
第1页 / 共99页
写出假设检验的基本步骤课件_第2页
第2页 / 共99页
写出假设检验的基本步骤课件_第3页
第3页 / 共99页
点击查看更多>>
资源描述
预防医学基础课件预防医学基础课件(第二版)(第二版)制作:太原市卫生学校制作:太原市卫生学校 石海兰石海兰 预防医学基础课件(第二版)制作:太原市卫生学校 石海1学习目标学习目标1 1说说出出统统计计中中几几个个基基本本概概念念和和统统计计工工作作的的基基本本步骤步骤2 2学学会会根根据据不不同同的的资资料料选选择择适适宜宜的的集集中中趋趋势势和和离散趋势指标,并会进行计算。离散趋势指标,并会进行计算。3 3写出假设检验的基本步骤,会作常用的写出假设检验的基本步骤,会作常用的t t检验检验4 4简述常用相对数的种类及应用时的注意事项简述常用相对数的种类及应用时的注意事项5 5能能够够根根据据资资料料的的性性质质正正确确选选择择检检验验方方法法,会会作常用的检验作常用的检验6 6统统计计表表和和统统计计图图的的意意义义和和制制作作方方法法,会会根根据据不同资料选择合适的统计图不同资料选择合适的统计图第第4章人群健康研究的统计方法章人群健康研究的统计方法学习目标第4章人群健康研究的统计方法2一、统计中的基本概念一、统计中的基本概念 (一)同质和变异(一)同质和变异 同质同质(homogeneity)(homogeneity)是指事物的性质、影响条件或背是指事物的性质、影响条件或背景相同或相近。例如,研究儿童生长发育情况,应选取同景相同或相近。例如,研究儿童生长发育情况,应选取同性别、同年龄儿童进行观察。性别、同年龄儿童进行观察。同质个体间的差异,称为同质个体间的差异,称为变异变异(variation)(variation)。如研究儿童。如研究儿童的身体发育,即使同质的身体发育,即使同质(同性别、同年龄同性别、同年龄)儿童的身高,也儿童的身高,也有高有低,各不相同,称为身高的变异。同一种药物,同有高有低,各不相同,称为身高的变异。同一种药物,同样的剂量治疗同样病种的病人,其疗效亦不一样。样的剂量治疗同样病种的病人,其疗效亦不一样。同质观察单位之间的个体变异,是生物的重要特征。统计同质观察单位之间的个体变异,是生物的重要特征。统计的任务就是在同质分组的基础上,通过对个体变异的研究,的任务就是在同质分组的基础上,通过对个体变异的研究,透过偶然现象,反映同质事物的本质特征和规律。透过偶然现象,反映同质事物的本质特征和规律。第第1节卫生统计的基本概念和步骤节卫生统计的基本概念和步骤一、统计中的基本概念第1节卫生统计的基本概念和步骤3 总总体体(population)(population)是是根根据据研研究究目目的的所所确确定定的的同同质的观察单位的全体。质的观察单位的全体。样样本本(sample)(sample)是是从从总总体体中中随随机机抽抽出出的的部部分分有有代代表性的个体。表性的个体。所所谓谓随随机机,即即总总体体中中的的每每一一个个个个体体均均有有同同等等的的机机会会被被抽抽取取。这这种种从从总总体体中中抽抽取取部部分分个个体体的的过过程程称称为为抽样抽样(sampling)(sampling)。样样本本所所包包含含的的个个体体数数目目,称称为为样样本本含含量量或或样样本本大小,用大小,用n n表示。表示。(二)总体和样本(二)总体和样本 总体(population)是根据研究目的所确定的同质的4(三)抽样误差(三)抽样误差由于总体中各观察单位间存在个体差异由于总体中各观察单位间存在个体差异 ,抽样,抽样研究中抽取的样本研究中抽取的样本 ,只包含总体的一部分观察单位,只包含总体的一部分观察单位,因而,样本指标不可能恰好等于相应的总体指标。这因而,样本指标不可能恰好等于相应的总体指标。这种由于抽样而引起的样本指标与总体指标、样本指标种由于抽样而引起的样本指标与总体指标、样本指标与样本指标之间的差异,统计学上称为与样本指标之间的差异,统计学上称为抽样误差抽样误差(samplingerror)(samplingerror)。一般说来,样本越大,则抽样误差越小一般说来,样本越大,则抽样误差越小 ,越和,越和总体的情况相接近总体的情况相接近 ,用样本推断总体的精确度越高,用样本推断总体的精确度越高,反之亦然。由于个体变异是客观存在的,因而抽样误反之亦然。由于个体变异是客观存在的,因而抽样误差是不可避免的,但可以通过增加样本含量来减小抽差是不可避免的,但可以通过增加样本含量来减小抽样误差。样误差。(三)抽样误差由于总体中各观察单位间存在个体差异,抽样研究5(四)资料的类型(四)资料的类型 1 1数值变量资料数值变量资料 对每个观察单位用定量方法测定某项指标的数值对每个观察单位用定量方法测定某项指标的数值大小,所得的资料称为数值变量资料,亦称为大小,所得的资料称为数值变量资料,亦称为计量资计量资料料(measurementdatameasurementdata)。)。2 2分类变量资料分类变量资料 将观察单位按某种属性或类别不同进行分类计数将观察单位按某种属性或类别不同进行分类计数所得的资料,称为分类所得的资料,称为分类变量资料变量资料。分类变量资料分为。分类变量资料分为无序分类变量即计数资料无序分类变量即计数资料(enumerationdata)(enumerationdata)和有序分和有序分类变量即类变量即等级资料等级资料(rankeddatarankeddata)。)。(四)资料的类型 1数值变量资料6 实实际际上上,资资料料的的类类型型可可以以根根据据研研究究分分析析的的需需要要进进行行相相互互转转化化。例例如如,观观察察每每个个人人的的血血红红蛋蛋白白含含量量(g/L),属属计计量量资资料料;若若按按血血红红蛋蛋白白正正常常与与异异常常分分为为两两组组,清清点点各各组组人人数数,则则为为计计数数资资料料;若若将将血血红红蛋蛋白白含含量量(gL)的的多多少少分分为为五五个个等等级级:重重度度贫贫血血、中中度度贫贫血血、较较度度贫贫血血、正正常常、血血红红蛋蛋白白增增高高,清清点点各等级人数,则成为各等级人数,则成为等级资料等级资料。3资料的转化资料的转化 实际上,资料的类型可以根据研究分析的需要进行7 概率概率(probability)是描述某事件或某现象发生是描述某事件或某现象发生的可能性大小的一个度量,用符号的可能性大小的一个度量,用符号P来表示来表示。根据事件。根据事件发生可能性的大小,将所有事件分为三类:在一定条发生可能性的大小,将所有事件分为三类:在一定条件下,肯定发生的事件称为必然事件,肯定不发生的件下,肯定发生的事件称为必然事件,肯定不发生的事件称为不可能事件事件称为不可能事件,可能发生也可能不发生的事件,可能发生也可能不发生的事件,称为随机事件或偶然事件。必然事件的概率等于称为随机事件或偶然事件。必然事件的概率等于1,不不可能事件的概率等于可能事件的概率等于0,随机事件的概率介于随机事件的概率介于0与与1之间。之间。(五)概(五)概 率率 概率(probability)是描述某事8二、统计工作的基本步骤二、统计工作的基本步骤 统统计计工工作作一一般般分分四四个个步步骤骤,即即先先有有一一个个周周密密的的设设计计、然然后后根根据据设设计计的的要要求求搜搜集集资资料料、整整理理资资料料和和分分析析资资料料。这这四四个个步步骤骤是是相相互互联联系系、前前后后呼呼应应、不不可可分分割割的整体。的整体。(一)统计设计(一)统计设计设设计计是是统统计计工工作作的的第第一一步步,也也是是最最关关键键的的一一步步,是是对对统统计计工工作作全全过过程程的的设设想想和和计计划划,是是今今后后研研究究工工作作应应遵循的依据。遵循的依据。二、统计工作的基本步骤 统计工作一般分四个步骤,即先有一个周9(二)搜集资料(二)搜集资料 搜集资料(搜集资料(collectionofdatacollectionofdata)是根据统计设计)是根据统计设计的要求,及时取得完整、准确的原始数据的过程。的要求,及时取得完整、准确的原始数据的过程。1 1医学研究资料的来源医学研究资料的来源 (1 1)日常医疗卫生工作记录)日常医疗卫生工作记录 (2 2)统计报表与报告卡)统计报表与报告卡 (3 3)专题调查和实(试)验资料)专题调查和实(试)验资料 2 2搜集资料的注意事项搜集资料的注意事项 搜集资料时应注意资料的完整、准确、及时。搜集资料时应注意资料的完整、准确、及时。(二)搜集资料 搜集资料(collectionof10(三)整理资料(三)整理资料整整理理资资料料(sortingdatasortingdata)是是根根据据设设计计的的要要求求,对对原原始始资资料料进进行行科科学学的的加加工工、整整理理,使使其其条条理理化化、系系统统化化,以以便便进进一一步步进进行行统统计计分分析析的的过过程程。一一般般来来说说,整整理理资资料料首先应检查核对资料,检查核对资料要注意以下几点:首先应检查核对资料,检查核对资料要注意以下几点:1 1资料的逻辑检查资料的逻辑检查2 2从专业角度对资料的合理性进行检查从专业角度对资料的合理性进行检查3 3从专业角度对资料的一致性进行检查从专业角度对资料的一致性进行检查(三)整理资料整理资料(sortingdata)是根据设计的11(四)分析资料(四)分析资料分分析析资资料料(analysisofdataanalysisofdata),就就是是将将整整理理好好的的资资料料,按按照照设设计计的的要要求求,进进行行统统计计描描述述和和统统计计推推断断,阐阐明明事物的内在规律。事物的内在规律。统统计计描描述述(descriptivestatisticsdescriptivestatistics)是是将将计计算算得得到到的的统统计计指指标标与与统统计计图图表表结结合合,来来描描述述数数据据的的分分布布特特征征、变化趋势等,为进一步进行统计推断奠定基础。变化趋势等,为进一步进行统计推断奠定基础。统统计计推推断断(inferentialstatisticsinferentialstatistics)是是根根据据研研究究目目的的和和资资料料性性质质,利利用用样样本本信信息息对对总总体体特特征征进进行行估估计计和和推推断的统计方法,包括参数估计和假设检验。断的统计方法,包括参数估计和假设检验。分分析析资资料料时时应应注注意意,不不同同资资料料类类型型,不不同同分分析析目目的的,使用的统计分析方法不同,本章后几节将作详细介绍。使用的统计分析方法不同,本章后几节将作详细介绍。(四)分析资料分析资料(analysisofdata),就是12第第2 2节节 数值变量资料的统计数值变量资料的统计计量资料经过整理后,可以计算一系列统计指标,计量资料经过整理后,可以计算一系列统计指标,以说明资料的特征,便于对资料作进一步的统计分析。以说明资料的特征,便于对资料作进一步的统计分析。平均数描述其集中趋势或平均水平,标准差描述平均数描述其集中趋势或平均水平,标准差描述其离散程度或变异程度。其离散程度或变异程度。当例数较多时,可先编制成频数表,了解变量值当例数较多时,可先编制成频数表,了解变量值的分布情况,然后再计算其统计指标。的分布情况,然后再计算其统计指标。第2节 数值变量资料的统计计量资料经过整理后,可以计算一系13一、数值变量资料的频数分布一、数值变量资料的频数分布 所谓频数就是观察值的个数。频数表所谓频数就是观察值的个数。频数表(frequencytable),即同时列出观察值在其取值范围,即同时列出观察值在其取值范围内,于各组段中频数分布情况的表格。内,于各组段中频数分布情况的表格。1频数表的编制频数表的编制现举例说明数值变量资料的频数表编制方法。现举例说明数值变量资料的频数表编制方法。例例4-1某某年年某某市市100名名成成年年男男子子血血清清总总胆胆固固醇醇测测定定结果如表结果如表4-1,试编制频数表。,试编制频数表。一、数值变量资料的频数分布 所谓频数就是观察值的个数。频数表14表表4-1某年某市某年某市100名成年男子血清名成年男子血清总胆固醇总胆固醇(mmol/L)测定结果测定结果3.37 4.79 5.10 4.77 5.32 4.50 5.10 4.70 4.44 5.164.37 6.25 5.55 4.56 3.35 4.08 4.63 3.61 4.97 4.175.77 5.09 4.38 5.18 4.79 5.15 4.79 5.30 4.77 4.404.89 5.86 3.40 3.38 4.55 5.15 4.24 4.32 5.85 3.245.85 3.04 3.89 6.16 4.58 5.72 4.87 5.17 4.61 4.124.43 4.31 6.14 4.88 2.70 4.60 6.55 4.76 4.48 6.515.18 3.91 5.39 4.52 4.47 3.64 4.09 5.96 6.14 4.696.36 4.60 5.09 4.47 3.56 4.23 4.34 5.18 5.69 4.256.30 3.95 4.03 5.38 5.21 7.22 4.31 4.71 5.21 3.975.12 4.55 4.90 3.05 5.20 4.74 5.54 3.93 3.50 6.38表4-1某年某市100名成年男子血清总胆固醇(mmol/L15 (1)求全距:)求全距:全全距距(range)又又称称极极差差,是是观观察察值值中中最最大大值值与与最最小小值值之差,用之差,用R表示。即:表示。即:R=Xmax-Xmin (公式(公式4-1)式中式中:R全距全距Xmax最大值最大值Xmin最小值最小值 本例最大值本例最大值Xmax=7.22mmol/L,最最小小值值Xmin=2.70mmol/L,R=7.22-2.70=4.52(mmol/L)。(2)定组段数、组距:)定组段数、组距:组组段段数数一一般般分分815个个组组为为宜宜,根根据据全全距距和和组组段段数数确确定组距定组距(i)。组距可用公式。组距可用公式4-2进行估算。进行估算。i=R/k (公式(公式4-2)本本 例例 i=4.52/10=0.452(mmol/L),为为 方方 便便 计计 算算,取取0.5mmol/L作为组距。作为组距。(1)求全距:16 (3 3)划分组段:)划分组段:各各组组段段的的界界限限应应清清晰晰分分明明,第第一一组组段段应应包包括括最最小小值值,最最后后一一组组段段应应包包括括最最大大值值。每每一一组组段段的的起起始始值值称称下下限限,终终止止值值称称上上限限。为为了了避避免免交交叉叉,各各组组段段从从下下限限开开始始(不不包包括括下下限限),到到本本组组段段上上限限为为止止(包包括括上上限限),各各组组段段上上限限、下下限限之之间间用用“”连连接接。注注意意:最最后后一一组组段段应应同同时写出上下限。时写出上下限。本本例例第第一一组组段段可可为为2.502.50开开始始,包包括括最最小小值值,第第二二组组段段3.003.00,第第三三组组段段3.503.50,第第十十组组段段7.007.007.507.50 (3)划分组段:17 (4 4)归组汇总:)归组汇总:将将原原始始数数据据进进行行归归纳纳计计数数,可可用用划划“正正”字字的的方方式式(见见表表4-24-2第第2 2列列),并并给给出出各各组组段段的的频频数数f f(见见表表4-4-2 2第第3 3列),频数表的编制即完成。列),频数表的编制即完成。(4)归组汇总:18表表4-2 某年某地某年某地100名成年男子血清名成年男子血清总胆固醇(总胆固醇(mmol/L)频数表)频数表表4-2 某年某地100名成年男子血清总胆固醇(mmo19频数表的用途频数表的用途 1.1.揭示变量值的频数分布类型揭示变量值的频数分布类型 2.2.确定变量值的两个重要特征确定变量值的两个重要特征 3.3.便于发现某些特大和特小的可疑值便于发现某些特大和特小的可疑值 4.4.便于进一步进行统计分析和处理便于进一步进行统计分析和处理 频数表的用途 1.揭示变量值的频数分布类型 20二、集中趋势指标二、集中趋势指标集中趋势指标又称平均数集中趋势指标又称平均数(average)(average),它反映一,它反映一组观察值的集中位置和平均水平,常作为一组资料平组观察值的集中位置和平均水平,常作为一组资料平均水平的代表值,可用于不同组间的分析比较。常用均水平的代表值,可用于不同组间的分析比较。常用的平均数有算术均数、几何均数和中位数。应用中要的平均数有算术均数、几何均数和中位数。应用中要根据不同的资料分布类型选择合适的平均数指标。根据不同的资料分布类型选择合适的平均数指标。二、集中趋势指标集中趋势指标又称平均数(average),它21(一)算术均数(一)算术均数 1.适用条件:适用于频数分布呈对称分布资料,适用条件:适用于频数分布呈对称分布资料,特别正态分布资料。特别正态分布资料。2.计算方法计算方法 直接法直接法 加权法加权法(一)算术均数 1.适用条件:适用22直直 接接 法法 直 接 法 23加加 权权 法法 加 权 法 24(二)几何均数(二)几何均数 1.1.适用条件:适用于等比数列资料、对数正态分适用条件:适用于等比数列资料、对数正态分布资料(即原始数据呈偏态分布,但经对数转换后呈布资料(即原始数据呈偏态分布,但经对数转换后呈正态分布的资料)及近似对数正态分布资料。正态分布的资料)及近似对数正态分布资料。2.2.计算方法计算方法 直接法直接法 加权法加权法 (二)几何均数 1.适用条件:适用于等比数列资料、25直直 接接 法法直 接 法26加 权 法加 权 法27(三)中位数(三)中位数 1.1.适用条件适用条件 中位数表示平均水平,不受资料中位数表示平均水平,不受资料分布类型的影响,因此应用范围较广。常用于:分布类型的影响,因此应用范围较广。常用于:(1 1)偏态分布资料;)偏态分布资料;(2 2)数据的一端或两端无明确界值的资料,即)数据的一端或两端无明确界值的资料,即开口资料;开口资料;(3 3)分布类型不清楚的资料。)分布类型不清楚的资料。2.2.计算方法计算方法 直接法直接法 频数表法频数表法(三)中位数 1.适用条件 中位数表示平均水平28直直 接接 法法将观察值按大小排序,当观察值例数为奇数时,将观察值按大小排序,当观察值例数为奇数时,中位数就是位次居中的那个数,即位次为中位数就是位次居中的那个数,即位次为(n n+1)/2+1)/2的那的那个数;当观察值例数为偶数时,中位数就是中间两个个数;当观察值例数为偶数时,中位数就是中间两个数相加再除以数相加再除以2 2,即位次为,即位次为n n/2/2和和(n n/2+1)/2+1)的两个数的均的两个数的均数。数。直 接 法将观察值按大小排序,当观察值例数为奇数时,中位数就29频数表法频数表法 当为频数表资料时,可先分别计算累计频数和累当为频数表资料时,可先分别计算累计频数和累计频率(表计频率(表4-44-4第第3 3列、第列、第4 4列),然后按公式列),然后按公式4-4-8 8计算计算中位数。中位数。频数表法 当为频数表资料时,可先分别计算累计频数和30三、离散趋势指标三、离散趋势指标集中趋势是数值变量资料的一个重要特征,但仅集中趋势是数值变量资料的一个重要特征,但仅有集中趋势指标还不能很好地描述数值变量资料的分布有集中趋势指标还不能很好地描述数值变量资料的分布规律,还要有离散趋势指标。规律,还要有离散趋势指标。为了比较全面地描述数值变量资料的分布规律,为了比较全面地描述数值变量资料的分布规律,除了需要有描述集中趋势的指标外,还需要有描述离散除了需要有描述集中趋势的指标外,还需要有描述离散趋势的指标。离散趋势又称离散程度、变异程度。常用趋势的指标。离散趋势又称离散程度、变异程度。常用的离散趋势指标有全距、方差、标准差、变异系数等。的离散趋势指标有全距、方差、标准差、变异系数等。三、离散趋势指标集中趋势是数值变量资料的一个重要特征,但仅有31(一)全距(一)全距全距又称极差,用符号全距又称极差,用符号R R表示,是观察值中最大值表示,是观察值中最大值与最小值的差值。如例与最小值的差值。如例4-94-9中,中,R R甲甲=4=4,R R乙和乙和R R丙均丙均=8=8,甲组的全距小,乙、丙两组的全距大,说明甲组的,甲组的全距小,乙、丙两组的全距大,说明甲组的离散程度小,乙、丙两组的离散程度大。全距的优点离散程度小,乙、丙两组的离散程度大。全距的优点是计算方便,容易理解;缺点是其大小仅与最大值、是计算方便,容易理解;缺点是其大小仅与最大值、最小值有关,不能客观地反映其它观察值的变异情况。最小值有关,不能客观地反映其它观察值的变异情况。如本例,乙、丙两组资料的离散程度何者更大,全距如本例,乙、丙两组资料的离散程度何者更大,全距无法反映。无法反映。(一)全距全距又称极差,用符号R表示,是观察值中最大值与最小32(二)方差(二)方差 为了克服全距的缺陷,必须考虑每一个观察值对为了克服全距的缺陷,必须考虑每一个观察值对离散程度的影响。方差离散程度的影响。方差(variance)(variance)是常用的离散趋势是常用的离散趋势指标,用指标,用2 2表示,计算公式为:表示,计算公式为:(二)方差 为了克服全距的缺陷,必须考虑每一个观察33由于医学研究中常用抽样研究由于医学研究中常用抽样研究,总体方差往往是,总体方差往往是未知的,常用样本方差来估计,样本方差用未知的,常用样本方差来估计,样本方差用s2表示。统表示。统计研究发现,用样本资料计算出的样本方差往往比总体计研究发现,用样本资料计算出的样本方差往往比总体方差偏小,为了得到较为准确的结果,将样本方差分母方差偏小,为了得到较为准确的结果,将样本方差分母中中n减去减去1,则计算公式为:,则计算公式为:由于医学研究中常用抽样研究,总体方差往往是未知的,常用样本34(三)标准差(三)标准差方差因计算方便的原因方差因计算方便的原因,原有的计量单位被平方,原有的计量单位被平方,这不利于进一步统计处理,因此人们常用方差的平方这不利于进一步统计处理,因此人们常用方差的平方根根标准差(标准差(standard deviationstandard deviation)替代方差描述)替代方差描述资料的离散程度。总体标准差(用资料的离散程度。总体标准差(用表示)、样本标表示)、样本标准差(用准差(用s s表示)计算公式分别为:表示)计算公式分别为:(三)标准差方差因计算方便的原因,原有的计量单位被平方,这不351标准差的计算标准差的计算直接法直接法 未分组的资料,可用公式未分组的资料,可用公式4-12直接计直接计算。但此公式计算先得求出均数,在实际工作中这算。但此公式计算先得求出均数,在实际工作中这样运算很不方便,经数学推导,公式样运算很不方便,经数学推导,公式4-12可转变为:可转变为:1标准差的计算直接法 未分组的资料,可用公式4-12直接36加权法加权法 与加权法计算均数一样,当相同观察值与加权法计算均数一样,当相同观察值较多或频数表资料时,可按公式较多或频数表资料时,可按公式4-14计算:计算:加权法 与加权法计算均数一样,当相同观察值较多或频数表资料372 2标准差的应用标准差的应用 表示变量值的离散程度表示变量值的离散程度 标准差表示变量值的变标准差表示变量值的变异程度时,要求单位相同,均数相近。标准越大,异程度时,要求单位相同,均数相近。标准越大,表示变量值的变异程度越大;反之标准差越小,表表示变量值的变异程度越大;反之标准差越小,表示变量值的变异程度越小。示变量值的变异程度越小。根据正态分布原理,应用于概括估计观察值的根据正态分布原理,应用于概括估计观察值的频数分布和医学参考值范围。频数分布和医学参考值范围。可以计算变异系数和标准误。可以计算变异系数和标准误。2标准差的应用 表示变量值的离散程度 标准差表示38(四)变异系数(四)变异系数当所比较的两组或多组资料的单位不同或均数相当所比较的两组或多组资料的单位不同或均数相差悬殊时差悬殊时,不能用标准差直接比较其离散程度,而应用不能用标准差直接比较其离散程度,而应用变异系数变异系数 (coefficient of variation(coefficient of variation,用,用CVCV表示表示 )。变异系数又称离散系数,是标准差与均数的比值变异系数又称离散系数,是标准差与均数的比值,常用常用百分数表示,计算公式为:百分数表示,计算公式为:(四)变异系数当所比较的两组或多组资料的单位不同或均数相差悬39变异系数没有单位,常用于:变异系数没有单位,常用于:计量单位不同的资料间的比较计量单位不同的资料间的比较 均数相差悬殊资料间的比较均数相差悬殊资料间的比较 变异系数没有单位,常用于:计量单40四、假设检验四、假设检验tt检验检验(一一)假设检验的概念假设检验的概念假设检验假设检验(hypothesis testhypothesis test)是统计推断的另一)是统计推断的另一重要内容,亦称显著性检验(重要内容,亦称显著性检验(significant testsignificant test)。假)。假设检验是对所检验的总体先提出一个假设,然后通过统设检验是对所检验的总体先提出一个假设,然后通过统计分析去推断是否拒绝这一假设计分析去推断是否拒绝这一假设 。如两组。如两组1 1岁婴儿的头岁婴儿的头围均数,甲组为围均数,甲组为4545cm cm,乙组为,乙组为4242 cm cm,这两组均数不,这两组均数不同可能是抽样误差引起,也可能是本质不同。在下结论同可能是抽样误差引起,也可能是本质不同。在下结论前首先要区别两组均数间差异的性质和来源。若是由于前首先要区别两组均数间差异的性质和来源。若是由于抽样误差引起的差异,统计上认为无显著意义,如果这抽样误差引起的差异,统计上认为无显著意义,如果这种差异超出了抽样误差的范围,那么很可能是本质原因种差异超出了抽样误差的范围,那么很可能是本质原因引起的差异,统计上称这种差异有显著意义。判断两个引起的差异,统计上称这种差异有显著意义。判断两个均数之差有无显著意义的假设检验,常用均数之差有无显著意义的假设检验,常用t t检验。检验。四、假设检验t检验(一)假设检验的概念41(二)假设检验的基本步聚(二)假设检验的基本步聚 1.1.建立假设和确定检验水准建立假设和确定检验水准 2.2.选定检验方法并计算统计量选定检验方法并计算统计量 3.3.确定确定P P值值 4.4.判断结果判断结果 (二)假设检验的基本步聚 1.建立假设和确定检42(三)常用的(三)常用的t检验检验假设检验的具体方法,通常用检验统计量来命假设检验的具体方法,通常用检验统计量来命名。如检验统计量为名。如检验统计量为t t则称则称t t检验,检验统计量为检验,检验统计量为u u则则称称u u检验。实际应用时应注意各种检验方法的用途、检验。实际应用时应注意各种检验方法的用途、适用条件和注意事项。常用的两均数假设检验的方法适用条件和注意事项。常用的两均数假设检验的方法有:有:(三)常用的t检验假设检验的具体方法,通常用检验统计量来命名431样本均数与总体均数比较的样本均数与总体均数比较的t检验检验 一般把标准值、理论值或经大量调查所得的稳定一般把标准值、理论值或经大量调查所得的稳定值作为已知的总体均数值作为已知的总体均数0。样本均数与总体均数比较。样本均数与总体均数比较的目的是推断样本所代表的总体均数(的目的是推断样本所代表的总体均数(未知的未知的)与已)与已知总体均数知总体均数0有无差别。有无差别。t值计算公式如下:值计算公式如下:1样本均数与总体均数比较的t检验 一般把标准值、理论值或经442配对计量资料比较的配对计量资料比较的t检验检验 在医学研究中,为了减少误差,提高检验效率,常在医学研究中,为了减少误差,提高检验效率,常采用配对设计采用配对设计(paired design)(paired design)。配对设计主要有:。配对设计主要有:将试验对象按照一定的条件配成若干对,然后随将试验对象按照一定的条件配成若干对,然后随机将每对中的两个观察单位分配到实验组和对照组中去,机将每对中的两个观察单位分配到实验组和对照组中去,给以不同的处理,观察某种指标的变化;给以不同的处理,观察某种指标的变化;同一组试验对象在处理前后观察某种指标的变化;同一组试验对象在处理前后观察某种指标的变化;对同一样品用两种方法检测结果的比较等。其假对同一样品用两种方法检测结果的比较等。其假设检验的目的是推断两种处理或处理前后的结果有无差设检验的目的是推断两种处理或处理前后的结果有无差别。计算公式如下:别。计算公式如下:2配对计量资料比较的t检验 在医学研究中,为了减少误差,提45写出假设检验的基本步骤课件463两个小样本均数比较的两个小样本均数比较的t检验检验 在医学研究中,能够进行配对比较的资料较少,在医学研究中,能够进行配对比较的资料较少,更多的是两组资料的比较。目的是推断两样本各自代更多的是两组资料的比较。目的是推断两样本各自代表的总体均数表的总体均数1 与与2 是否相等。当两个样本含量较小是否相等。当两个样本含量较小时,时,n1+n2100,用,用t检验,检验,t值的计算公式如下:值的计算公式如下:3两个小样本均数比较的t检验 在医学研究中,能够进行配对比47写出假设检验的基本步骤课件484 4假设检验的注意事项假设检验的注意事项 要注意用单侧还是双侧检验要注意用单侧还是双侧检验 要注意每种方法的应用条件要注意每种方法的应用条件 要注意资料的可比性要注意资料的可比性 要注意判断结果不能绝对化要注意判断结果不能绝对化 要注意实际差别大小与统计意义的区别要注意实际差别大小与统计意义的区别 4假设检验的注意事项 要注意用单侧还是双侧检验 49第第3节节 分类变量资料的统计分类变量资料的统计在医疗卫生工作中,通过日常医疗卫生工作记录、在医疗卫生工作中,通过日常医疗卫生工作记录、统计报表、现场调查、实验研究所搜集来的一些数据,统计报表、现场调查、实验研究所搜集来的一些数据,如人口数、出生数、治愈数、阳性数、阴性数等都是绝如人口数、出生数、治愈数、阳性数、阴性数等都是绝对数。绝对数可以反映事物在某时某地出现的实际情况,对数。绝对数可以反映事物在某时某地出现的实际情况,是统计分析和制订计划的基础。但绝对数的大小,常受是统计分析和制订计划的基础。但绝对数的大小,常受基数多少的影响,不便于进行深入的分析比较。要比较基数多少的影响,不便于进行深入的分析比较。要比较资料的情况,必须计算相对数,再进行比较,才能得出资料的情况,必须计算相对数,再进行比较,才能得出正确的结论。正确的结论。一、相对数常用指标一、相对数常用指标第3节 分类变量资料的统计在医疗卫生工作中,通过日常医疗卫501相对数的概念相对数的概念 相对数(相对数(relative number)是两个有联系指标的)是两个有联系指标的比值,常用于分类变量即计数资料的统计分析。比值,常用于分类变量即计数资料的统计分析。1相对数的概念 相对数(rela512相对数的种类及计算方法相对数的种类及计算方法(1)率)率(rate):又称频率指标):又称频率指标,说明某现象发,说明某现象发生的频率或强度。常以百分率(生的频率或强度。常以百分率(%)、千分率()、千分率()、)、万分率(万分率(1/万)、万)、10万分率(万分率(1/10万)等表示。计算公万)等表示。计算公式为:式为:2相对数的种类及计算方法(1)率(rate):又称频率指标52计算时比例基数的选择计算时比例基数的选择,主要依据习惯用法或使,主要依据习惯用法或使算得的率至少保留一位整数,以便于阅读、比较。如有算得的率至少保留一位整数,以便于阅读、比较。如有效率、治愈率,习惯上用百分率;出生率、死亡率、人效率、治愈率,习惯上用百分率;出生率、死亡率、人口自然增长率,习惯上用千分率;某病死亡专率、恶性口自然增长率,习惯上用千分率;某病死亡专率、恶性肿瘤发病率,习惯上用万分率、肿瘤发病率,习惯上用万分率、10万分率等。万分率等。计算时比例基数的选择,主要依据习惯用法或使算得的率至少保留53(2)构成比()构成比(proportion)又称构成指标,它表示某一事物内部各组成部分又称构成指标,它表示某一事物内部各组成部分所占的比重或分布。常用所占的比重或分布。常用100为基数,以百分比表示,为基数,以百分比表示,计算公式为:计算公式为:(2)构成比(proportion)54 一般来说一般来说,构成比的总和为构成比的总和为100%(亦可表示为(亦可表示为1),但有时由于计算尾数取舍的关系,其总和不一定),但有时由于计算尾数取舍的关系,其总和不一定恰好等于恰好等于100%,需对各构成比的尾数作适当调整,使,需对各构成比的尾数作适当调整,使构成比的总和等于构成比的总和等于100%。事物各构成部分构成比的大小,受两方面因素的事物各构成部分构成比的大小,受两方面因素的影响,一是该部分自身数值变化的影响影响,一是该部分自身数值变化的影响,这一影响易这一影响易被人们所察觉;二是其它部分数值变化的影响被人们所察觉;二是其它部分数值变化的影响,这一这一影响往往被人们所忽视。影响往往被人们所忽视。一般来说,构成比的总和为100%(亦55(3)相对比()相对比(relative ratio)相对比是两个有关指标之比。例如,不同地区、不相对比是两个有关指标之比。例如,不同地区、不同单位或不同时期的两个有关指标(可以是绝对数、同单位或不同时期的两个有关指标(可以是绝对数、相对数或平均数)之比,可反映两者之间的差别变化相对数或平均数)之比,可反映两者之间的差别变化情况。相对比通常用百分数(情况。相对比通常用百分数(%)或倍数表示。其计算)或倍数表示。其计算公式为:公式为:(3)相对比(relative ratio)563医疗卫生工作中常用相对数指标医疗卫生工作中常用相对数指标1.死亡率或称粗死亡率死亡率或称粗死亡率 2.病死率:病死率:3.发病率:发病率:4.患病率(或称现患率)患病率(或称现患率)3医疗卫生工作中常用相对数指标1.死亡率或称粗死亡率 57死亡率或称粗死亡率死亡率或称粗死亡率 死亡率或称粗死亡率:表示某地某年每千人口中死亡率或称粗死亡率:表示某地某年每千人口中的死亡人数。常受各地人口、年龄、性别等构成因素的死亡人数。常受各地人口、年龄、性别等构成因素的影响,需进行标准化后才能进行相互比较。的影响,需进行标准化后才能进行相互比较。同年平均人口数以上年末人口数加本年末人口数同年平均人口数以上年末人口数加本年末人口数除以除以2 2。死亡率或称粗死亡率 死亡率或称粗死亡率:表示某地某58病病 死死 率率 指在观察期内,某病患者中因该病而死亡的频率。指在观察期内,某病患者中因该病而死亡的频率。应与死亡率相区别。两者分母不同,计算结果的意义应与死亡率相区别。两者分母不同,计算结果的意义也不同。也不同。病 死 率 指在观察期内,某病患者中因59发发 病病 率率 表示一定时期(通常为表示一定时期(通常为 1 年)内某人群发生某病年)内某人群发生某病新病例的频率。所谓新病例指每发生一种病算一种新新病例的频率。所谓新病例指每发生一种病算一种新病例,如某病治愈后再次发作,算两个新病例。病例,如某病治愈后再次发作,算两个新病例。发 病 率 表示一定时期(通常为 1 年)60患病率(或称现患率)患病率(或称现患率)表示某一时点(一般不超过一个月)某人群中患表示某一时点(一般不超过一个月)某人群中患某病的频率。一般用于表示病程长的慢性病存在或流某病的频率。一般用于表示病程长的慢性病存在或流行的频率。行的频率。患病率(或称现患率)表示某一时点(一般不超过一个614应用相对数的注意事项应用相对数的注意事项 不要混淆率与构成比。不要混淆率与构成比。计算相对数时分母不宜过小。计算相对数时分母不宜过小。要注意平均率的计算。要注意平均率的计算。两个率或构成比比较时应作假设检验。两个率或构成比比较时应作假设检验。要注意资料的可比性。要注意资料的可比性。4应用相对数的注意事项 不要混淆率与构成比。62 构成比说明某部分占全体的比重,率说明事物发构成比说明某部分占全体的比重,率说明事物发生的概率,两者计算不同,说明的问题也不同,但由生的概率,两者计算不同,说明的问题也不同,但由于两指标同属于相对数范畴,有时又都用于两指标同属于相对数范畴,有时又都用100作基数,作基数,所以易于混淆。常见的错误是把构成比当作率来应用。所以易于混淆。常见的错误是把构成比当作率来应用。构成比说明某部分占全体的比重,率说明事63 一般说来,调查和实验观察单位应有足够的数量。一般说来,调查和实验观察单位应有足够的数量。观察单位足够时,计算的相对数比较稳定,能够正确观察单位足够时,计算的相对数比较稳定,能够正确反映实际情况。如果观察例数过少,计算的相对数可反映实际情况。如果观察例数过少,计算的相对数可靠性较差,此时应以绝对数直接表示为好。例如靠性较差,此时应以绝对数直接表示为好。例如 4 名名患者患者2名治愈,最好用绝对数表示。名治愈,最好用绝对数表示。一般说来,调查和实验观察单位应有足够64 计算率的平均值时,不能将各组率相加,然后除计算率的平均值时,不能将各组率相加,然后除以组数。如计算表以组数。如计算表4-8资料各年龄组人群平均患病率时,资料各年龄组人群平均患病率时,不能将各年龄组患病率相加后求平均率,而应该将各不能将各年龄组患病率相加后求平均率,而应该将各年龄组检查人数与病人数分别相加,然后以总病人数年龄组检查人数与病人数分别相加,然后以总病人数除以总检查人数。除以总检查人数。计算率的平均值时,不能将各组率相加,65 两个率或构成比比较时应作假设检验两个率或构成比比较时应作假设检验 在抽样研究中,率和构成比也存在抽样误差,所在抽样研究中,率和构成比也存在抽样误差,所以比较构成比或率时,不能仅凭表面数据直接下结论,以比较构成比或率时,不能仅凭表面数据直接下结论,应进行差别的显著性检验。应进行差别的显著性检验。两个率或构成比比较时应作假设检验 66 所谓可比性,即除了两者被比较的因素不同以外,所谓可比性,即除了两者被比较的因素不同以外,其余可能影响结果的因素应尽可能相同或相近。一般其余可能影响结果的因素应尽可能相同或相近。一般应注意:应注意:所要比较资料的时间、地点、方法等是否所要比较资料的时间、地点、方法等是否相同;相同;所要比较对象的年龄、性别所要比较对象的年龄、性别等因素的构成是等因素的构成是否相同,如果要比较组的年龄、性别等构成不同,应否相同,如果要比较组的年龄、性别等构成不同,应计算分年龄组、分性别的率,或者计算标准化率。计算分年龄组、分性别的率,或者计算标准化率。所谓可比性,即除了两者被比较的因素不同以67二、二、检验检验 x2检验是一种用途较广的假设检验方法,常用检验是一种用途较广的假设检验方法,常用于计数资料的统计分析。于计数资料的统计分析。x2检验最常用于比较两个或检验最常用于比较两个或多个率(或构成比)差别有无显著性。按照设计类型多个率(或构成比)差别有无显著性。按照设计类型不同,可将不同,可将x2检验分为四格表资料检验分为四格表资料x2检验、配对资料检验、配对资料x2检验等。检验等。二、检验 x2检验是一种用途较广68(一)四格表资料(一)四格表资料 检验检验 比较比较2个样本率之间差别有无统计意义,除了可个样本率之间差别有无统计意义,除了可以用率的以用率的u检验外,还可以用四格表资料检验外,还可以用四格表资料x2检验。四格检验。四格表指表指2行行2列组成的的表格,其基本数据只有列组成的的表格,其基本数据只有4个。个。(一)四格表资料 检验 比较2691 检验公式检验公式1 检验公式702应用范围和注意事项应用范围和注意事项 2应用范围和注意事项 71表表4-10 界值表界值表自由度自由度概率概率P0.050.050.010.011 13.843.846.636.632 25.995.999.219.213 37.817.8111.3411.344 49.499.4913.2813.285 511.0711.0715.0915.096 612.5912.5916.8116.817 714.0714.0718.4818.488 815.5115.5120.0920.099 916.9216.9221.6721.67 10 1018.3118.3123.2123.21表4-10 界值表自由度概率P0.050.01172写出假设检验的基本步骤课件73(二)配对资料的(二)配对资料的 检验检验 配对计数资料的两个样本中,实验单位一一配配对计数资料的两个样本中,实验单位一一配对,或同一实验单位先后给以两种不同处理。对,或同一实验单位先后给以两种不同处理。1配对配对x2检验公式检验公式(二)配对资料的 检验 配对计数资料的两个样本中,实742应用范围和注意事项应用范围和注意事项2应用范围和注意事项75第第4节节 统计表与统计图统计表与统计图一、统计表一、统计表统计表统计表(statistical table)是用表格的形式来表是用表格的形式来表达统计分析的事物及其指标。广义的统计表包括调查资达统计分析的事物及其指标。广义的统计表包括调查资料所用的调查表、整理资料所用的整理汇总表以及分析料所用的调查表、整理资料所用的整理汇总表以及分析资料所用的统计分析表等;狭义的统计表仅指统计分析资料所用的统计分析表等;狭义的统计表仅指统计分析表。表。第4节 统计表与统计图一、统计表76(一一)统计表的结构统计表的结构 一张统计表的必备部分通常包括标题、标目、一张统计表的必备部分通常包括标题、标目、数字和线条,基本格式如下所示:数字和线条,基本格式如下所示:(一)统计表的结构 一张统计表的必备部分77(二二)制表的基本要求制表的基本要求 1.标题标题(title)标题位于表格的上方中央,标题要标题位于表格的上方中央,标题要求简明扼要地说明表的中心内容,必要时注明资料的时求简明扼要地说明表的中心内容,必要时注明资料的时间和地点。标题不能过于简略,也不能过于繁琐,更不间和地点。标题不能过于简略,也不能过于繁琐,更不能无标题或标题不确切。若有两个以上的统计表,在标能无标题或标题不确切。若有两个以上的统计表,在标题的前面应有表序,以备查找。题的前面应有表序,以备查找。2.标目标目(heading)标目是说明表中数字含义的部分,标目是说明表中数字含义的部分,分横标目和纵标目。横标目是用来说明表中被研究事物分横标目和纵标目。横标目是用来说明表中被研究事物或对象的主要标志,是表的主语,列在表的左侧,说明或对象的主要标志,是表的主语,列在表的左侧,说明表内同一横行的含义;纵标目用来说明横标目各种统计表内同一横行的含义;纵标目用来说明横标目各种统计指标结果,是表的谓语,列在表的右侧上方,说明表内指标结果,是表的谓语,列在表的右侧上方,说明表内同一纵列数字的含义。标目不能过多,层次一定要清楚。同一纵列数字的含义。标目不能过多,层次一定要清楚。(二)制表的基本要求 1.标题(78 3.线条线条(line)表内只有横线,竖线和斜线一律不要。表内只有横线,竖线和斜线一律不要。横线也不宜过多,常用三条基本线表示,即顶线和底线,横线也不宜过多,常用三条基本线表示,即顶线和底线,以及隔开纵标目和数字的一条横线。如有合计,再加一以及隔开纵标目和数字的一条横线。如有合计,再加一条隔开合计与数字的线。通常顶线和底线略粗一点,另条隔开合计与数字的线。通常顶线和底线略粗一点,另两条线可略细一点。两条线可略细一点。4.数字数字(figure)表内数字必须准确,一律用阿拉伯表内数字必须准确,一律用阿拉伯数字来表示,所有数字位次对齐,同一指标的小数位数数字来表示,所有数字位次对齐,同一指标的小数位数应一致,表内不得留有空格。资料暂缺或未记录用应一致,表内不得留有空格。资料暂缺或未记录用“”表示,未调查、无数字用表示,未调查、无数字用“”表示,数字若为表示,数字若为“0”,则写,则写“0”。5.备注备注(footnate)不是表的必备部分,当有需要说不是表的必备部分,当有需要说明的问题时,用明的问题时,用“*”号标出,列在表的下方。号标出,列在表的下方。3.线条(line)表内79(三)统计表的种类(三)统计表的种类 1.简单表简单表(simple table)按一种特征或标志分组,按一种特征或标志分组,即由一组横标目和一组纵标目组成的统计表。如表即由一组横标目和一组纵标目组成的统计表。如表4-14。2.复合表复合表(combinative table)按两种或两种以按两种或两种以上特征或标志分组,即由两组及两组以上的横标目上特征或标志分组,即由两组及两组以上的横标目和纵标目组成的统计表。和纵标目组成的统计表。(三)统计表的种类 180(四)统计表的修改(四)统计表的修改 完整的统计表要从表达资料的目的、标题、纵横完整的统计表要从表达资料的目的、标题、纵横标目、线条、数字等方面来评价,力求做到简明、直标目、线条、数字等方面来评价,力求做到简明、直观,便于比较。观,便于比较。(四)统计表的修改 完整的统计表要从表达资料81 二、统计图二、统计图 统计图统计图(statistical chart)是用点的位置、线段是用点的位置、线段升降、直条长短、面积大小等形式来表达统计分析的升降、直条长短、面积大小等形式来表达统计分析的结果,反映事物及其指标间的数量关系。统计图比较结果,反映事物及其指标间的数量关系。统计图比较形象、直观,使读者一目了然,印象清晰。但统计图形象、直观,使读者一目了然,印象清晰。但统计图只能给出概括的印象,不能非常准确地表达数据,一只能给出概括的印象,不能非常准确地表达数据,一般需要结合文字进行描述。医学统计中常用的有条图、般需要结合文字进行描述。医学统计中常用的有条图、百分条图、圆图、线图、半对数线图、直方图、散点百分条图、圆图、线图、半对数线图、直方图、散点图和统计地图等。图和统计地图等。二、统计图 统计图(statistical c82(一)制作统计图的基本要求(一)制作统计图的基本要求 1.1.选图选图 根据资料的性质和分析目的选择合适的根据资料的性质和分析目的选择合适的图形。图形。2.2.标题标题 要简明扼要,概括说明资料的主要内容,要简明扼要,概括说明资料的主要内容,必要时注明时间、地点;有两个以上图时,标题前面必要时注明时间、地点;有两个以上图时,标题前面加上图号,编号一般用图加阿拉伯数字表示,标题及加上图号,编号一般用图加阿拉伯数字表示,标题及图号写在图的正下方。图号写在图的正下方。3.3.标目标目 纵横两轴应有标目,并应注明标目单位。纵横两轴应有标目,并应注明标目单位。(一)制作统计图的基本要求 1.选图 根据资83 4.4.尺度尺度 横轴尺度自左而右,纵轴尺度自下而上,横轴尺度自左而右,纵轴尺度自下而上,数值一律由小到大,等距或有一定的规律性地标明。数值一律由小到大,等距或有一定的规律性地标明。5.5.比例比例 除圆形图外,图形的纵横轴比例一般以除圆形图外,图形的纵横轴比例一般以5 5:7 7为宜,过大或过小易造成错觉。为宜,过大或过小易造成错觉。6.6.图例图例 当比较不同地区或同一地区不同时间某当比较不同地区或同一地区不同时间某一事物的变化情况时,须用不同的线条或颜色表示,一事物的变化情况时,须用不同的线条或颜色表示,并附图例说明。并附图例说明。4.尺度 横轴尺度自左而右,纵轴尺度自下而上,84(二)常用统计图的种类和绘制方法(二)常用统计图的种类和绘制方法1.直条图直条图(bar chart)简称条图,是用等宽直条的简称条图,是用等宽直条的长短来表示相互独立的各指标的数值大小。如不同的地长短来表示相互独立的各指标的数值大小。如不同的地区、不同的病种、不同的科室、
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!