抽样误差和统计推断.ppt

上传人:tian****1990 文档编号:11534881 上传时间:2020-04-27 格式:PPT 页数:30 大小:592.50KB
返回 下载 相关 举报
抽样误差和统计推断.ppt_第1页
第1页 / 共30页
抽样误差和统计推断.ppt_第2页
第2页 / 共30页
抽样误差和统计推断.ppt_第3页
第3页 / 共30页
点击查看更多>>
资源描述
第三章抽样误差与统计推断,第一节抽样研究与抽样误差,抽样误差:抽样造成的这种样本均数与样本均数之间、样本均数与总体均数之间的差异标准误:用于表示均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。,均数的分布及其标准误,数理统计的中心极限定理和大数定理表明:从正态总体N(,2)中随机抽取含量为n的样本,其样本均数服从正态分布;即使从偏态总体中随机抽样,当n足够大时(如n30),样本均数也近似正态分布;从均数为,标准差为的总体中随机抽取含量为n的样本,则样本均数的均数也为,样本均数的标准差为。,例3-1某地随机抽取20岁健康男性20名,求得其血中葡萄糖样本均数=39.5mg/100ml,标准差S=0.69mg/100ml,问其抽样误差是多少?本例:s=0.69mg/100ml,n=20,将其代入公式得即该研究的抽样误差为0.15mg/100ml。,t值的分布与自由度有关(实际是样本含量n不同)。t分布的图形不是一条曲线,而是一簇曲线。,t分布的图形有如下特征:单峰分布,以0为中心,左右对称,类似于标准正态分布。自由度越小,则越大,t值越分散,曲线的峰部越矮,尾部越高;随着自由度逐渐增大,t分布逐渐逼近标准正态分布;当趋于时,t分布就完全成为标准正态分布,故标准正态分布是t分布的特例。,统计学家将t分布曲线下的尾部面积(即概率P)与横轴t值间的关系编制了不同自由度下的t界值表(附表2)。t界值表:横标目为自由度,纵标目为概率P。t临界值:表中数字表示当和P确定时,对应的值。单侧概率(one-tailedprobability):用t,表示双侧概率(two-tailedprobability):用t/2,表示,例如,当=16,单侧概率P=0.05时,由表中查得单侧t0.05,16=1.746;而当=16,双侧概率P=0.05时,由表中查得双侧t0.05/2,16=2.120。按t分布的规律,理论上有单侧:P(tt0.05,16)=0.05和P(tt0.05,16)=0.05双侧:P(tt0.05/2,16)P(tt0.05/2,16)=0.05,更一般的表示方法如图(a)和(b)中阴影部分所示为:单侧:P(tt,)=和P(tt,)=双侧:P(tt/2,)P(tt/2,)=,统计推断,统计推断statisticalinference,如:样本均数样本标准差S样本率P,如:总体均数总体标准差总体率,内容:参数估计(estimationofparameters)包括:点估计与区间估计2.假设检验(testofhypothesis),参数估计,参数估计的概念参数估计:指用样本指标(统计量)估计总体指标(参数)。参数估计有点估计(pointestimation)区间估计(intervalestimation),参数估计,点估计:用样本统计量直接作为总体参数的点估计值,即直接用随机样本的样本均数作为总体均数的点估计值,用样本频率p作为总体概率的点估计值缺点:没有考虑抽样误差,无法评价其可信度估计值它与真值之间的差距。,参数估计,95%CL:1252.056=(119.06,130.94)g/L99%CL:1252.779=(116.98,133.02)g/L该市健康成年男子血红蛋白平均含量:95%置信区间为(119.06,130.94)g/L,99%置信区间为(116.98,133.02)g/L。,二、假设检验的基本步骤,1建立检验假设、确定检验水准检验假设有两种:一种是无效假设(nullhypothesis),符号为H0,即假设均数来自同一总体,它们的总体均数相同,样本均数间无本质的不同,差别仅由抽样误差引起;另一种是备择假设(alternativehypothesis),符号为H1,即假设均数来自不同总体,它们之间的差别存在本质的不同,并非仅由抽样误差引起。检验水准(sizeofatest)亦称显著性水准(significancelevel),符号为。,2.选择和计算统计量根据统计推断的目的和资料的性质、特点选择合适的检验统计量。3确定P值P值是指由H0所规定的总体中随机抽样,获得等于及大于(或等于及小于)现有样本所获得的检验统计量值的概率。求得检验统计量后,一般可通过特别的统计表直接查出P值。例如t值可查t界值表,u值可查u界值表,4判断结果当P时,结论为按所取检验水准拒绝H0,接受H1,两均数差别有统计意义(或称显著性意义),即它们之间存在着本质的不同(数学上认为小概率事件在一次实验中不可能发生。P,即被推断为小概率事件);当P时,结论为按所取检验水准尚不能拒绝H0,可认为两均数差别无统计意义,即它们之间无本质的不同,差别仅由抽样误差引起。,三、t检验,概念:选用检验统计量t进行假设检验的方法,称t检验。用途:样本均数与总体均数的比较配对计量资料的比较两样本均数的比较应用条件:正态分布:当样本含量较小时,要求样本来自正态总体。方差齐性:两样本均数比较时,要求两总体方差相等。,、单个样本均数的t检验,目的:推断样本所代表的未知总体均数与已知总体均数0是否相等。例经产科大量调查得知某市婴儿体重均数为3.20kg,今随机测得25名难产儿平均出生体重为3.42kg,标准差为0.42kg。问该市难产儿出生体重与一般婴儿是否不同?,配对类型:配在对子的同对受试对象分别给予两种不同处理;同一受试对象分别接受两种不同处理;同一受试对象处理前后的比较。目的:推断某种处理有无作用或两种处理效应有无差别,即推断样本差值的总体均数d是否等于零。,配对资料的比较,四、u检验,概念:选用检验统计量u值进行假设检验的方法称u检验。用途:同t检验。应用条件:大样本(如n50);小样本,已知且样本来自正态总体。检验目的:同t检验。统计量的计算公式:,五、两类错误,假设检验是以样本推断总体,作出的结论是概率性的,并非绝对正确,可能发生两类错误:1)如果无效假设H0为真,拒绝了它,称第一类错误或型错误(typeerror).2)如果无效假设H0不真,不拒绝它,称第二类错误或型错误(typeerror)。,两类错误的关系图,六、假设检验注意事项,1假设检验的前提是要有严密的抽样设计,保证样本是从同质总体中随机抽取。并且,组间的均衡性和资料的可比性应予特别注意,除了对比的因素外,其它影响结果的因素应尽可能相同或基本相同。2选用的检验方法应符合其应用条件。3.正确理解差别有无统计意义的涵义。4.结论不能绝对化。5正确选用单侧还是双侧检验。6报告结论时,应列出现有样本检验统计量值,说明采用的单侧还是双侧检验,并列出P值的确切范围。,
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!