预防医学04抽样误差与假设检验课件

上传人:磨石 文档编号:240737984 上传时间:2024-05-04 格式:PPT 页数:46 大小:895.50KB
返回 下载 相关 举报
预防医学04抽样误差与假设检验课件_第1页
第1页 / 共46页
预防医学04抽样误差与假设检验课件_第2页
第2页 / 共46页
预防医学04抽样误差与假设检验课件_第3页
第3页 / 共46页
点击查看更多>>
资源描述
第四章抽样误差与假设检验第四章抽样误差与假设检验Sampling error&Hypothesis test预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验本章结构本章结构均数的抽样误差与标准误均数的抽样误差与标准误t分布分布总体均数的估计总体均数的估计假设检验的意义和步骤假设检验的意义和步骤预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验均数的抽样误差与标准误均数的抽样误差与标准误Standard error预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验统计推断统计推断(statistical inference)总体总体样本样本 sampling sampling 统计量统计量统计量统计量 参参参参 数数数数 inference预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验抽样误差的概念抽样误差的概念l l定义:由抽样引起的样本统计量与总体参数定义:由抽样引起的样本统计量与总体参数间、以及样本统计量与样本统计量之间的差间、以及样本统计量与样本统计量之间的差别。别。l l原因:个体变异随机抽样原因:个体变异随机抽样l l表现:表现:样本统计量与总体参数间的差别样本统计量与总体参数间的差别样本统计量与总体参数间的差别样本统计量与总体参数间的差别不同样本统计量间的差别不同样本统计量间的差别不同样本统计量间的差别不同样本统计量间的差别预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验假设一个已知总体,从该总体中抽样,对每个假设一个已知总体,从该总体中抽样,对每个样本计算样本统计量样本计算样本统计量(均数、方差等均数、方差等),观察样,观察样本统计量的分布规律本统计量的分布规律抽样分布规律。抽样分布规律。考察:考察:l l不同的分布不同的分布不同的分布不同的分布l l不同的样本含量不同的样本含量不同的样本含量不同的样本含量抽样试验抽样试验预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验 从正态分布总体从正态分布总体N N(5.00,0.505.00,0.502 2)中,每次)中,每次随机抽取样本含量随机抽取样本含量n n5 5,并计算其均数与标准,并计算其均数与标准差;重复抽取差;重复抽取10001000次,获得次,获得10001000份样本;计算份样本;计算10001000份样本的均数与标准差,并对份样本的均数与标准差,并对10001000份样本份样本的均数作直方图。的均数作直方图。按上述方法再做样本含量按上述方法再做样本含量n n1010、样本含、样本含量量n n3030的抽样实验;比较计算结果。的抽样实验;比较计算结果。预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验抽样试验(抽样试验(n n=5=5)预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验抽样试验(抽样试验(n n=10=10)预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验抽样试验(抽样试验(n n=30=30)预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验3 3个抽样实验结果图示个抽样实验结果图示预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验样本均数的抽样分布特点样本均数的抽样分布特点各样本均数未必等于总体均数;各样本均数未必等于总体均数;各样本均数未必等于总体均数;各样本均数未必等于总体均数;样本均数之间存在差异;样本均数之间存在差异;样本均数之间存在差异;样本均数之间存在差异;样本均数的分布很有规律,围绕着总体均数,样本均数的分布很有规律,围绕着总体均数,样本均数的分布很有规律,围绕着总体均数,样本均数的分布很有规律,围绕着总体均数,中间多、两边少,左右基本对称,也服从正态中间多、两边少,左右基本对称,也服从正态中间多、两边少,左右基本对称,也服从正态中间多、两边少,左右基本对称,也服从正态分布;分布;分布;分布;样本均数的变异较原变量的变异大大缩小。样本均数的变异较原变量的变异大大缩小。样本均数的变异较原变量的变异大大缩小。样本均数的变异较原变量的变异大大缩小。随着样本含量的增加,样本均数的变异范围逐随着样本含量的增加,样本均数的变异范围逐随着样本含量的增加,样本均数的变异范围逐随着样本含量的增加,样本均数的变异范围逐渐缩小。渐缩小。渐缩小。渐缩小。预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验标准误的概念标准误的概念(standard error)样本均数的样本均数的样本均数的样本均数的标准差称为均数的标准误。标准差称为均数的标准误。标准差称为均数的标准误。标准差称为均数的标准误。均数的标准误表示样本均数的变异度。均数的标准误表示样本均数的变异度。均数的标准误表示样本均数的变异度。均数的标准误表示样本均数的变异度。当总体标准差未知时,用样本方差代替,当总体标准差未知时,用样本方差代替,当总体标准差未知时,用样本方差代替,当总体标准差未知时,用样本方差代替,预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验标准误的概念标准误的概念 抽样的样本量越大,抽样的样本量越大,抽样的样本量越大,抽样的样本量越大,标准误标准误标准误标准误就越小;就越小;就越小;就越小;原来总体变异度小,原来总体变异度小,原来总体变异度小,原来总体变异度小,标准误标准误标准误标准误就越小。就越小。就越小。就越小。标准误反映了样本均数间的离散程度,也反映了样本均标准误反映了样本均数间的离散程度,也反映了样本均标准误反映了样本均数间的离散程度,也反映了样本均标准误反映了样本均数间的离散程度,也反映了样本均数与总体均数之间的差异。当标准误大时,用样本均数数与总体均数之间的差异。当标准误大时,用样本均数数与总体均数之间的差异。当标准误大时,用样本均数数与总体均数之间的差异。当标准误大时,用样本均数对总体均数的估计的可靠程度就小;反之亦然。对总体均数的估计的可靠程度就小;反之亦然。对总体均数的估计的可靠程度就小;反之亦然。对总体均数的估计的可靠程度就小;反之亦然。预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验标准差与标准误标准差与标准误意义意义:标准差用于描述个体值之间的变异,即观察值间的离散度,:标准差用于描述个体值之间的变异,即观察值间的离散度,标准差小,表明观察值围绕均数的波动小;标准误描述统计量的抽标准差小,表明观察值围绕均数的波动小;标准误描述统计量的抽样误差,即样本统计量与总体参数的接近程度。标准误小,表明抽样误差,即样本统计量与总体参数的接近程度。标准误小,表明抽样误差小,则统计量稳定,与参数接近。样误差小,则统计量稳定,与参数接近。用途用途:标准差表示观察值间波动的大小,用于医学参考值范围;标:标准差表示观察值间波动的大小,用于医学参考值范围;标准误表示抽样误差的大小,用于参数估计。准误表示抽样误差的大小,用于参数估计。关系关系:随着样本含量增加,都减小。:随着样本含量增加,都减小。联系联系:都是表示变异度的指标,当样本量一定时,两者成正比。:都是表示变异度的指标,当样本量一定时,两者成正比。预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验中心极限定理中心极限定理(central limit theorem)预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验中心极限定理中心极限定理(central limit theorem)预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验t-分布分布t-distribution预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验t 分布的概念分布的概念用样本方差代替总体方差,此时不再服从正态分布。而服从 t 分布。记为:预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验t t分布曲线分布曲线 t t 分布分布有如下性质:有如下性质:单峰分布,曲线在单峰分布,曲线在t t0 0 处最高,并以处最高,并以t t0 0为中心为中心左右对称左右对称与正态分布相比,曲线与正态分布相比,曲线最高处较矮,两最高处较矮,两尾部翘得尾部翘得高高(见绿线)(见绿线)随自由度增大,曲线逐随自由度增大,曲线逐渐接近正态分布;分布的渐接近正态分布;分布的极限为标准正态分布。极限为标准正态分布。预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验t t分布曲线下面积(附表分布曲线下面积(附表2 2)双侧双侧t t0.05/20.05/2,9 92.2622.262 单侧单侧t t0.0250.025,9 9单侧单侧t t0.050.05,9 91.8331.833双侧双侧t t0.01/20.01/2,9 93.2503.250 单侧单侧t t0.0050.005,9 9单侧单侧t t0.010.01,9 92.8212.821双侧双侧t t0.05/20.05/2,1.961.96 单侧单侧t t0.0250.025,单侧单侧t t0.050.05,1.641.64预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验总体均数的估计总体均数的估计Parameter estimation预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验总体均数估计方法总体均数估计方法预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验区间估计区间估计(interval estimation)interval estimation)也称置信区间。利用样本信息给出一个区间,并同也称置信区间。利用样本信息给出一个区间,并同时给出按预先给定的时给出按预先给定的概率概率估计该区间包含总体均数估计该区间包含总体均数的可能范围。的可能范围。可信度:给定的概率称为可信度。用可信度:给定的概率称为可信度。用 表表示。通常取示。通常取99%、95%。预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验t分布方法分布方法应用条件:总体方差未知,样本量小应用条件:总体方差未知,样本量小预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验例例4.2 某医师侧的某医师侧的40名老年性慢性支气管炎病人尿中名老年性慢性支气管炎病人尿中17-酮类固酮类固醇排出量均数为醇排出量均数为15.19umol/d,标准差为,标准差为5.03umol/d,试估计该,试估计该种病人尿种病人尿17-酮类固醇排出量总体均数的酮类固醇排出量总体均数的95%可信区间。可信区间。分析条件:总体方差未知,样本量小分析条件:总体方差未知,样本量小预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验正态分布近似法正态分布近似法应用条件:当总体标准差已知时;或总体标准差未知,而应用条件:当总体标准差已知时;或总体标准差未知,而样本量较大时样本量较大时(n50)0-11-1.961.96-2.582.5868.27%95.00%99.00%预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验例例4.3 某市随机抽查某市随机抽查12岁男孩岁男孩100人,得身高均数人,得身高均数139.6cm,标准,标准差差6.85cm。计算该地。计算该地12岁男孩身高均数的岁男孩身高均数的95%的可信区间。的可信区间。分析条件:总体方差未知,但样本量大,用正态分布法分析条件:总体方差未知,但样本量大,用正态分布法预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验9595可信区间可信区间:从总体中作随机抽样,作:从总体中作随机抽样,作100100次抽样,每个样本可算得一个可信区间,得次抽样,每个样本可算得一个可信区间,得100100个可信区间,平均有个可信区间,平均有9595个可信区间包括个可信区间包括(估计正确估计正确),只有,只有5 5个可信区间不包括个可信区间不包括(估计估计错误错误)。可信区间的涵义可信区间的涵义预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验可信度实验可信度实验预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验可信区间的两个基本要素可信区间的两个基本要素准确度:可信区间包含总体均数的概率。准确度:可信区间包含总体均数的概率。精密度:反映区间的长度。精密度:反映区间的长度。预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验假设检验假设检验Hypothesis test预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验让我们先看一个例子让我们先看一个例子.例例4.4 根据大量调查,已知健康成年男根据大量调查,已知健康成年男子的脉搏均数为子的脉搏均数为72次次/分。某医生在某分。某医生在某山区随机调查山区随机调查30名健康男子,求得脉搏名健康男子,求得脉搏均数为均数为74.2次次/分,标准差为分,标准差为6.5次次/分。分。能否认为该山区的成年男子的脉搏均数能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数?高于一般成年男子的脉搏均数?预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验对差别的可能原因分析对差别的可能原因分析山区男子脉搏的总体均数与一般成年男子的脉搏均山区男子脉搏的总体均数与一般成年男子的脉搏均山区男子脉搏的总体均数与一般成年男子的脉搏均山区男子脉搏的总体均数与一般成年男子的脉搏均数相等,差异是由抽样误差引起的数相等,差异是由抽样误差引起的数相等,差异是由抽样误差引起的数相等,差异是由抽样误差引起的提示山区男提示山区男提示山区男提示山区男子是一般男子总体的一部分(研究总体)。子是一般男子总体的一部分(研究总体)。子是一般男子总体的一部分(研究总体)。子是一般男子总体的一部分(研究总体)。山区男子脉搏的总体均数与一般成年男子的脉搏均山区男子脉搏的总体均数与一般成年男子的脉搏均山区男子脉搏的总体均数与一般成年男子的脉搏均山区男子脉搏的总体均数与一般成年男子的脉搏均数不相等,差异可能是由地域等因素引起的数不相等,差异可能是由地域等因素引起的数不相等,差异可能是由地域等因素引起的数不相等,差异可能是由地域等因素引起的提提提提示山区男子与一般男子是两个不同的总体。示山区男子与一般男子是两个不同的总体。示山区男子与一般男子是两个不同的总体。示山区男子与一般男子是两个不同的总体。预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验假设检验假设检验通过对假设作出取舍抉择来达到解决问题的目的通过对假设作出取舍抉择来达到解决问题的目的通过对假设作出取舍抉择来达到解决问题的目的通过对假设作出取舍抉择来达到解决问题的目的A.A.山区男子脉搏的总体均数与一般成年男子的脉搏均数山区男子脉搏的总体均数与一般成年男子的脉搏均数山区男子脉搏的总体均数与一般成年男子的脉搏均数山区男子脉搏的总体均数与一般成年男子的脉搏均数相等相等相等相等 无差异假设、零假设无差异假设、零假设无差异假设、零假设无差异假设、零假设 H0 H0(null hypothesisnull hypothesis)B.B.山区男子脉搏的总体均数与一般成年男子的脉搏均数山区男子脉搏的总体均数与一般成年男子的脉搏均数山区男子脉搏的总体均数与一般成年男子的脉搏均数山区男子脉搏的总体均数与一般成年男子的脉搏均数不相等不相等不相等不相等 对立假设、备择假设对立假设、备择假设对立假设、备择假设对立假设、备择假设H1H1(alternative alternative hypothesishypothesis)预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验证明证明A还是证明还是证明B?在在H0 0成立的条件下,均数之间的差异是由抽样误成立的条件下,均数之间的差异是由抽样误差引起的,有规律可循;差引起的,有规律可循;在在H1 1成立的条件下,均数间的不同包含种种未知成立的条件下,均数间的不同包含种种未知情形,无规律可循。情形,无规律可循。故从故从H0 0成立的角度出发,寻求其成立的概率。成立的角度出发,寻求其成立的概率。预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验 变量值(脉搏)变量值(脉搏)变量值(脉搏)变量值(脉搏)X X服从正态分布,且为小样本,服从正态分布,且为小样本,服从正态分布,且为小样本,服从正态分布,且为小样本,假定假定假定假定H H0 0成立,样本均数服从成立,样本均数服从成立,样本均数服从成立,样本均数服从t-t-分布,则分布,则分布,则分布,则在在在在H H0 0成立的前提下,当前成立的前提下,当前成立的前提下,当前成立的前提下,当前t t值出现的概率有多大值出现的概率有多大值出现的概率有多大值出现的概率有多大?预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验如何给出这个量的界限?如何给出这个量的界限?小概率事件在一次试验小概率事件在一次试验中基本上不会发生中基本上不会发生!从附表从附表2中查出在显著性水平中查出在显著性水平=0.05(双侧),自由度为(双侧),自由度为所对应的所对应的t界值,即为拒绝域与界值,即为拒绝域与接受域的界限。如果计算出的接受域的界限。如果计算出的t统计量大于相应的统计量大于相应的t界值,则落界值,则落在拒绝域中,该统计量出现的在拒绝域中,该统计量出现的概率小于概率小于5%,为小概率事件。,为小概率事件。预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验常取常取 的选择要根据实际情况而定的选择要根据实际情况而定通常取通常取0.05检验水准的概念检验水准的概念在假设检验中,称预先规定的小概率值为检在假设检验中,称预先规定的小概率值为检验水准,也称为显著性水准,用表示。验水准,也称为显著性水准,用表示。预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验这里所依据的逻辑是:这里所依据的逻辑是:如果如果H0 是成立的,那么衡量差异大小的某是成立的,那么衡量差异大小的某个统计量落入区域个统计量落入区域 拒绝域拒绝域 是个小概率事件。如是个小概率事件。如果该统计量的实测值落入拒绝域,也就是说,果该统计量的实测值落入拒绝域,也就是说,H0 成立下的小概率事件发生了,那么就认为成立下的小概率事件发生了,那么就认为H0不可信而否定它。不可信而否定它。否则我们就不能否定否则我们就不能否定H0(只(只好接受它)好接受它).预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验1.1.1.1.建立检验假设,确定检验水准;建立检验假设,确定检验水准;建立检验假设,确定检验水准;建立检验假设,确定检验水准;H H H H0 0 0 0:零假设、无效假设。是与研究假设有关的、被推断特:零假设、无效假设。是与研究假设有关的、被推断特:零假设、无效假设。是与研究假设有关的、被推断特:零假设、无效假设。是与研究假设有关的、被推断特征某种确定的关系;征某种确定的关系;征某种确定的关系;征某种确定的关系;H H H H1 1 1 1:备择假设、对立假设。是被推断总体特征的另一种关:备择假设、对立假设。是被推断总体特征的另一种关:备择假设、对立假设。是被推断总体特征的另一种关:备择假设、对立假设。是被推断总体特征的另一种关系或状况,与系或状况,与系或状况,与系或状况,与H0H0H0H0既有联系又互相对立。既有联系又互相对立。既有联系又互相对立。既有联系又互相对立。检验水准,将小概率事件具体化,即规定概率不超过检验水准,将小概率事件具体化,即规定概率不超过检验水准,将小概率事件具体化,即规定概率不超过检验水准,将小概率事件具体化,即规定概率不超过 就是小概率。就是小概率。就是小概率。就是小概率。2.2.2.2.根据试验设计、资料类型、统计方法的条件选择根据试验设计、资料类型、统计方法的条件选择根据试验设计、资料类型、统计方法的条件选择根据试验设计、资料类型、统计方法的条件选择检验方法,计算相应的统计量;检验方法,计算相应的统计量;检验方法,计算相应的统计量;检验方法,计算相应的统计量;3.3.3.3.确定确定确定确定P P P P值,下结论。值,下结论。值,下结论。值,下结论。假设检验的基本步骤:假设检验的基本步骤:预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验P 值的概念值的概念指从指从H0规定的总体中规定的总体中随机抽样抽得等于或大于随机抽样抽得等于或大于(或等于或小于)现有样本统计量的(或等于或小于)现有样本统计量的概率概率。预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验本章总结本章总结conclusion预防医学预防医学0404抽样误差与假设检验抽样误差与假设检验
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 压缩资料 > 基础医学


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!