区间估计和假设检验课件

上传人:2127513****773577... 文档编号:240909658 上传时间:2024-05-17 格式:PPT 页数:43 大小:1.27MB
返回 下载 相关 举报
区间估计和假设检验课件_第1页
第1页 / 共43页
区间估计和假设检验课件_第2页
第2页 / 共43页
区间估计和假设检验课件_第3页
第3页 / 共43页
点击查看更多>>
资源描述
区间估计和假设检验区间估计和假设检验 赵耐青赵耐青复旦大学卫生统计教研室复旦大学卫生统计教研室区间估计和假设检验赵耐青2内容内容假设检验假设检验2可信区间与假设检验的关系可信区间与假设检验的关系3STATA命令命令4区间估计区间估计12内容假设检验2可信区间与假设检验的关系3STATA命令4区3统计推断统计推断点值估计点值估计参数估计参数估计区间估计区间估计统计推断统计推断假设检验:均数间的比较假设检验:均数间的比较比例、率的比较比例、率的比较3统计推断4点估计和区间估计点估计和区间估计v参数估计可以分为点估计和区间估计参数估计可以分为点估计和区间估计v点估计就是估计某个参数为某个数值点估计就是估计某个参数为某个数值(如样如样本均数,样本率等本均数,样本率等)v由于随机抽样存在抽样误差,由于点估计由于随机抽样存在抽样误差,由于点估计无法评价抽样误差的大小,而区间估计可无法评价抽样误差的大小,而区间估计可以在以在95%可信度的尺度上估计参数的范围,可信度的尺度上估计参数的范围,范围越小,说明参数估计的抽样误差就越范围越小,说明参数估计的抽样误差就越小。小。4点估计和区间估计参数估计可以分为点估计和区间估计5总体均数的区间估计总体均数的区间估计v假定资料假定资料近似服从正态分布近似服从正态分布。v对于随机抽样而言,计算统计量对于随机抽样而言,计算统计量v因此因此v基于随机抽样而言和基于随机抽样而言和成立的概率为成立的概率为0.95前提下前提下v总体均数的区间估计总体均数的区间估计v这个区间称为总体均数的这个区间称为总体均数的95%可信区间可信区间总体均数的区间估计总体均数的区间估计总体均数的区间估计总体均数的区间估计总体均数的区间估计总体均数的区间估计总体均数的区间估计总体均数的区间估计总体均数的区间估计总体均数的区间估计总体均数的区间估计总体均数的区间估计总体均数的区间估计总体均数的区间估计5总体均数的区间估计假定资料6总体均数的总体均数的95%可信区间举例可信区间举例v例如:在某地区例如:在某地区7岁男孩的人群中随机抽样,抽岁男孩的人群中随机抽样,抽取取200人,测量其身高,得到样本均数为人,测量其身高,得到样本均数为121cm,样本标准差为,样本标准差为5.4cm,估计该地区,估计该地区7岁男孩人群的平均身高在什么范围内岁男孩人群的平均身高在什么范围内。6总体均数的95%可信区间举例例如:在某地区7岁男孩的人群中7(1-)100%可信区间及其意义可信区间及其意义v更一般而言,可以计算(更一般而言,可以计算(1-)100%可信区间,称可信区间,称(1-)为可信度。)为可信度。v可信度的意义:在同一正态总体中随机抽可信度的意义:在同一正态总体中随机抽100个样本,每个样本可以计算一个个样本,每个样本可以计算一个95%可信区间,平均有可信区间,平均有95个可信区间包含该总个可信区间包含该总体的总体均数。体的总体均数。7(1-)100%可信区间及其意义更一般而言,可以计算(8(1-)100%可信区间及其意义可信区间及其意义v可信度可信度1-越大,计算可信区间包含总体均数的越大,计算可信区间包含总体均数的正确率就越高,但可信区间的宽度就越大,也就正确率就越高,但可信区间的宽度就越大,也就是估计总体均数的精度就越差。是估计总体均数的精度就越差。v一般而言,一般而言,95%可信区间是兼顾了正确性和估计可信区间是兼顾了正确性和估计精度,对于特殊情况,可以计算精度,对于特殊情况,可以计算90%可信区间可信区间或或99%可信区间。可信区间。v对于随机抽样前而言,随机抽取一个样本量为对于随机抽样前而言,随机抽取一个样本量为n的的样本,计算样本,计算95%可信区间,则该区间将包含总可信区间,则该区间将包含总体均数的概率为体均数的概率为95%,不包含其总体均数的概,不包含其总体均数的概率为率为0.05,这是一个小概率事件,对于一次随机,这是一个小概率事件,对于一次随机抽样而言,一般是不会发生的,所以抽样而言,一般是不会发生的,所以95%可信可信区间一般被认为就是总体均数的范围。区间一般被认为就是总体均数的范围。8(1-)100%可信区间及其意义可信度1-越大,计算9假设检验假设检验(hypothesis testing)v样本均数与总体均数不等或两样本均数不等,有两样本均数与总体均数不等或两样本均数不等,有两种可能:种可能:v 由抽样误差所致由抽样误差所致v 两者来自不同的总体两者来自不同的总体9假设检验(hypothesistesting)样本均数与10总体总体随机抽样随机抽样不是抽样误差?不是抽样误差?即:即:0?样本样本总体总体0=0?即:抽样误差?即:抽样误差?假设检验问题假设检验问题总体总体总体总体总体总体总体总体0总体总体不是抽样误差?不是抽样误差?即:即:0?总体总体0总体总体=0?即:抽样误差?即:抽样误差?不是抽样误差?不是抽样误差?即:即:0?总体总体0总体总体10总体随机抽样不是抽样误差?样本总体=0?假设检验问题11总体总体2 2样本样本2随随机机抽抽样样样本均数不等的原因样本均数不等的原因统计推断统计推断抽样误差抽样误差即:即:1=2?样本样本1假设检验问题假设检验问题总体总体1 1不是抽样误差不是抽样误差即:即:12?11总体2样本2随样本均数不等的原因抽样误差样本1假设检验问12假设检验一般思想v小小概概率率思思想想是是指指小小概概率率事事件件(P0.01P0.01或或P0.05P0.05)在一次试验中基本上不会发生。在一次试验中基本上不会发生。v假假设设检检验验的的反反证证法法思思想想:先先根根据据检检验验假假设设H H0 0,建建立立适适当当的的统统计计量量,确确定定假假设设H H0 0成成立立情情况况下下服服从从某某个个概概率率分分布布,定定一一个个范范围围。H H0 0成成立立时时,统统计计量量进进入入这这个个范范围围,是是一一个个小小概概率率事事件件(P(P 0.050.05或或更更小小),H H0 0不不成立时,统计量进入这个范围的概率较大。成立时,统计量进入这个范围的概率较大。v如如果果实实际际的的抽抽样样样样本本统统计计量量进进入入这这个个范范围围,对对H H0 0成成立立情情况况下下是是一一个个小小概概率率事事件件,一一般般不不会会发发生生,由由此推断假设此推断假设H H0 0不成立。这就是小概率反证法思想。不成立。这就是小概率反证法思想。12假设检验一般思想小概率思想是指小概率事件(P0=72为真,在大多数情况下,应该远离72,应该比较大。注意:X的总体均数不一定为72,只有H0为真时,X的总体均数为72,25样本均数与总体均数比较.确定临界值,判断是否应该拒绝26样本均数与总体均数比较样本均数与总体均数比较可以证明:当0为真时,检验统计量服从自由度为24的t分布(即:df=24),查t分布表,临界值t0.025=2.064,检验统计量t=3.52.064是小概率事件,对于一次随机抽样而言,一般是不会发生的,因此拒绝0,并且可以认为该山区成年男性的脉搏均数高于一般成年男性。26样本均数与总体均数比较可以证明:当0为真时,检验27定义值和应用定义值和应用v以下以单侧检验为例:v即:在0为真的情况下,检验统计量大于样本计算的统计量数值的概率。也就是值=样本统计量数值开始的尾部面积(示意见图)。v意义:如果t检验统计量样本值t=t0.05,则P=t0.05尾部的面积,故=0.05。27定义值和应用值=P(检验统计量检验统计量样本值28定义值和应用定义值和应用v如果检验统计量样本值tt0.05(u值比U0.05更右侧),则P=t尾部的面积t0.05尾部的面积,则P0.05。v如果检验统计量样本值tt0.05尾部的面积,则P0.05。综合上述,综合上述,P 检验统计量值检验统计量值临界值临界值,不拒绝不拒绝H0。P临界值,拒绝临界值,拒绝H0。28定义值和应用如果检验统计量样本值tt0.05(u值比29值示意图值示意图在实际研究中,只需计算值并判断是否在实际研究中,只需计算值并判断是否P 决定是否拒绝决定是否拒绝0。29值示意图在实际研究中,只需计算值并判断是否P30假设检验的基本步骤假设检验的基本步骤若若P值值小小于于预预先先设设定定的的检检验验水水准准,则则H0成成立立的的可可能能性性小,即拒绝小,即拒绝H0。若若P值值不不小小于于预预先先设设定定的的检检验验水水准准,则则H0成成立立的的可可能能性还不小,还不能拒绝性还不小,还不能拒绝H0。P值的大小一般可通过查阅相应的界值表得到。值的大小一般可通过查阅相应的界值表得到。30假设检验的基本步骤若P值小于预先设定的检验水准,则H31定义值和应用定义值和应用v确定概率,作出判断确定概率,作出判断v以自由度v=n-1查t界值表,0.025P 1v=0.05v计算计算t检验统计量检验统计量v查查t检验的单侧界值检验的单侧界值,如果检验统计量,如果检验统计量v则拒绝则拒绝H0,反之不能拒绝,反之不能拒绝H0。v单侧的单侧的P值值=t分布中大于分布中大于t的右侧尾部面积的右侧尾部面积32单侧t检验H0:=0H1:33两类错误两类错误33两类错误34两类错误示意图两类错误示意图34两类错误示意图35检验效能检验效能35检验效能H1是真的,实际拒绝H0的概率=1-称为P36进行假设检验应注意的问题进行假设检验应注意的问题v做假设检验之前,应注意资料本身是否有可比性。v当差别有统计学意义时应注意这样的差别在实际应用中有无意义。v根据资料类型和特点选用正确的假设检验方法。v根据专业及经验确定是选用单侧检验还是双侧检验。36进行假设检验应注意的问题做假设检验之前,应注意资料本身是37进行假设检验应注意的问题进行假设检验应注意的问题v当检验结果为拒绝无效假设时,应注意有发生I类错误的可能性,即错误地拒绝了本身成立的H0,发生这种错误的概率预先是知道的,即检验水准那么大;v当检验结果为不拒绝无效假设时,应注意有发生II类错误的可能性,即仍有可能错误地接受了本身就不成立的H0,发生这种错误的可能性预先是不知道的,但与样本含量和I类错误的大小有关系。v当第一类错误增大时,第二类错误减小。37进行假设检验应注意的问题当检验结果为拒绝无效假设时,应注38进行假设检验应注意的问题进行假设检验应注意的问题v判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性。v报告结论时是应注意说明所用的统计量,检验的单双侧及P值的确切范围。38进行假设检验应注意的问题判断结论时不能绝对化,应注意无论39进行假设检验应注意的问题进行假设检验应注意的问题vt检验和u检验就是统计量为t,u的假设检验,两者均是常见的假设检验方法。当样本含量n较大时,样本均数符合正态分布,故可用u检验进行分析。当样本含量n小时,若观察值x符合正态分布,则用t检验(因此时样本均数符合t分布)当x为未知分布时应采用秩和检验。39进行假设检验应注意的问题t检验和u检验就是统计量为t,u40可信区间与假设检验的关系可信区间与假设检验的关系v不同:不同:可信区间可信区间量的问题量的问题假设检验假设检验质的问题质的问题40可信区间与假设检验的关系不同:可信区间量的问题可信41可信区间与假设检验的关系可信区间与假设检验的关系41可信区间与假设检验的关系42STATA命令命令正态分布总体均数的正态分布总体均数的9595可信区间可信区间命令为:命令为:cii cii 样本量样本量 样本均数样本均数 样本标准差样本标准差例4.1 cii 12 0.896 0.0549090可信区间可信区间例4.2 cii 110 121.72 4.74,level(90)level 括号中的数字表示可信度42STATA命令正态分布总体均数的95可信区间ThankYou!
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!