统计学之参数估计和假设检验课件

上传人:痛*** 文档编号:241705314 上传时间:2024-07-17 格式:PPT 页数:58 大小:5.04MB
返回 下载 相关 举报
统计学之参数估计和假设检验课件_第1页
第1页 / 共58页
统计学之参数估计和假设检验课件_第2页
第2页 / 共58页
统计学之参数估计和假设检验课件_第3页
第3页 / 共58页
点击查看更多>>
资源描述
17 七月 2024统计学之参数估计和假统计学之参数估计和假设检验设检验抽样分布抽样分布简单随机抽样和简单随机样本的性质简单随机抽样和简单随机样本的性质无限总体有有限总限总体体不放回不放回放放 回回样样本本样样本本放回放回不放不放 回回样样本本样样本本独立性和同一性独立性和同一性同一性同一性当当n/N5%时,时,有限总体不放回有限总体不放回抽样等同于放回抽样等同于放回抽样抽样无限总体P-121统计量与抽样分布统计量与抽样分布统计量:即统计量:即样本指标样本指标。样本均值样本均值样本成数样本成数样本方样本方差差如:如:抽样分布:抽样分布:某一统计量所有可能的样本的取值形成某一统计量所有可能的样本的取值形成的概率分布。的概率分布。性性 质质数字特征数字特征0P(Xi)1P(Xi)=1均值均值E(X)方差方差Ex-E(x)2样本均值的抽样分布(简称均值的分布)样本均值的抽样分布(简称均值的分布)抽样抽样总总体体样样本本 均值均值X,X,(N)(N)均值均值=Xi/Nx x,(,(n)n)样本均值是样本的函数,样本均值是样本的函数,故样本均值是一个故样本均值是一个统计量统计量,统计量是一个统计量是一个随机变量随机变量,它的概率分布称为样本均它的概率分布称为样本均值的抽样分布。值的抽样分布。样本均值的抽样分布【例例例例】设一个总体,含有4个元素(个体),即总体单位数N=4。4 个个体分别为X1=1、X2=2、X3=3、X4=4。总体的均值、方差及分布如下 均值和方差均值和方差均值和方差均值和方差 总体分布总体分布总体分布总体分布 1 1 4 4 2 2 3 3 0 0.1 1.2 2.3 3样本均值的抽样分布 现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n=2 的样本(共的样本(共16个)个)样本均值的抽样分布 计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值观察值16个样本的均值(个样本的均值(x)样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布 1.1.0 0 0 0.1.1.2.2.3.3 P P(x x)1.1.5 5 3.3.0 0 4.4.0 0 3.3.5 5 2.2.0 0 2.2.5 5 x x所有样本均值的均值和方差式中:M为样本数目比较及结论:1.样本均值的均值(数学期望)等于总体均值 2.样本均值的方差等于总体方差的1/n均值分布的数学期望和方差均值分布的数学期望和方差抽抽 样样 方方 法法 均均 值值 方方 差差 标标 准差准差(1)从无)从无限总体抽限总体抽 样样和有限总体和有限总体放回抽样放回抽样(2)从有限)从有限总体不放回总体不放回抽样抽样抽样误差抽样误差抽样误差抽样误差样本均值的抽样分布与中心极限定理 =50=50 =10=10 X X 总体分布总体分布总体分布总体分布n=4 抽样分布抽样分布抽样分布抽样分布n=16当当总总体体服服从从正正态态分分布布N (,2)时时,来来自自该该总总体体的的所所有有容容量量为为n的的样样本本的的均均值值 X也也服服从从正正态态分分布布,X 的的数学期望为数学期望为,方差为,方差为2/n。即。即 XN(,2/n)中心极限定理(图示)当样本容量足够大时(n 30),样本均值的抽样分布逐渐趋于正态分布中中心心极极限限定定理理:设设从从均均值值为为,方方差差为为 2的的一一个个任任意意总总体体中中抽抽取取容容量量为为n的的样样本本,当当n充充分分大大时时,样样本本均均值值的的抽抽样分布近似服从均值为样分布近似服从均值为、方差为、方差为2/n的正态分布的正态分布一个任意分布的总体 X X关于均值的抽样分布有如下的一些结论关于均值的抽样分布有如下的一些结论:1.对对于于多多数数总总体体分分布布来来说说,不不论论其其形形态态如如何何,如如果果样样本本观观察察值值超超过过30个个,那那么么均均值值的的抽抽样样分分布将布将近似于正态分布近似于正态分布。2.2.如果总体是正态分布的,则不管样本大小如如果总体是正态分布的,则不管样本大小如何,均值的抽样分布一定是何,均值的抽样分布一定是正态分布。正态分布。两个样本均值之差的抽样分布两个样本均值之差的抽样分布抽样抽样总总体体样样本本X X1,1,(N(N1)1)x x1,1,(n(n1)1)抽样抽样总总体体样样本本X X2,2,(N(N2)2)x x2 2,(n n2 2)估计估计(1)如:两个正态总体)如:两个正态总体(2如果两个总体都是非如果两个总体都是非正态总体,只要正态总体,只要n1、n2足够足够大,根据中心极限定理,可大,根据中心极限定理,可知:知:样本成数(即比例)的抽样分布(简称成数的分布)样本成数(即比例)的抽样分布(简称成数的分布)抽样抽样总总体体样样本本 成数成数X,X,(N)(N)成数成数P=Ni/N x x,(,(n)n)所有可能的样本的成数(所有可能的样本的成数()所形成的分布,称)所形成的分布,称为样本成数的抽样分布。为样本成数的抽样分布。成数分布的数学期望和方成数分布的数学期望和方差差抽抽 样样 方方 法法 均均 值值 方方 差差 标标 准差准差(1)从无)从无限总体抽限总体抽 样样和有限总体和有限总体放回抽样放回抽样(2)从有限)从有限总体不放回总体不放回抽样抽样根据中心极限定理,只要样本足够大,根据中心极限定理,只要样本足够大,的分布就近的分布就近似正态分布。(似正态分布。(np和和nq大于大于5时)时)抽样误差抽样误差抽样误差抽样误差两个样本成数之差的抽样分布两个样本成数之差的抽样分布抽样抽样总总体体样样本本X X1,1,(N(N1)1)x x1,1,(n(n1)1)抽抽样样总总体体样样本本X X2,2,(N(N2)2)x x2 2,(n n2 2)估计估计 当当n1、n2都都足足够够大大时时,样样本本成成数数 都都近近似似服服从从正正态态分分布布,两两个个样样本本成成数数之之差差()也也近似服从正态分布。近似服从正态分布。P1-P2=?一个样本方差的抽样分布一个样本方差的抽样分布抽抽样样总总体体样样本本从一个正态总体中抽样所得到的样本方差的分布从一个正态总体中抽样所得到的样本方差的分布n,S2则则 当当 两个样本方差之比的抽样分布两个样本方差之比的抽样分布抽抽样样总总体体样样本本从两个正态总体中分别独立抽样所得到的两个从两个正态总体中分别独立抽样所得到的两个样本方差之比的抽样分布。样本方差之比的抽样分布。n1,S12则则 抽抽样样总总体体样样本本n2,S22参数估计参数估计点估计点估计以样本指标直接估计总体参数。以样本指标直接估计总体参数。评价准则评价准则的数学期的数学期望等于总体望等于总体参数,即参数,即该估计量称为该估计量称为无偏估计。无偏估计。无偏性无偏性有效性有效性当当 为为 的的无偏估计时,无偏估计时,方差方差 越越小,无偏估计小,无偏估计越有效。越有效。一致性一致性对于无限总体,对于无限总体,如果对任意如果对任意则称则称的一致估计。的一致估计。是是充分性充分性一个估一个估计量如能计量如能完全地包完全地包含未知参含未知参数信息,数信息,即为充分即为充分量量估计量估计量点估计点估计常用的求点估计量的方法常用的求点估计量的方法 1.1.数字特征法数字特征法:当样本容量增大时当样本容量增大时,用样本的数字特征用样本的数字特征去估计总体的数字特征。去估计总体的数字特征。例例如如,我我们们可可以以用用样样本本平平均均数数(或或成成数数)和和样样本本方方差差来来估计总体的均值估计总体的均值(或比率或比率)和方差。和方差。区间估计区间估计估计未知参数所在的可能的区间。估计未知参数所在的可能的区间。评价准则评价准则随机区间随机区间置信度置信度精确度精确度随机区间随机区间包含包含(即可靠程度)(即可靠程度)越大越好。越大越好。的概率的概率的平均长度的平均长度(误差范(误差范围)越小越围)越小越好好一般形式一般形式或或总体参数总体参数点估计值点估计值误差范围误差范围:一定倍数的抽样误差:一定倍数的抽样误差例如:例如:抽样误差抽样误差 一定时,一定时,越大,越大,概率(可靠性)大;概率(可靠性)大;随之增大,随之增大,精确度就差。精确度就差。参数的区间估计参数的区间估计简单随机抽样简单随机抽样待估计参数待估计参数已知条件已知条件置信区间置信区间正态总体,正态总体,2已知已知正态总体,正态总体,2未知未知非正态总体,非正态总体,n30有限总体,有限总体,n30(不放回抽样)(不放回抽样)总体均值总体均值()未知时,用未知时,用S未知时,用未知时,用S两个正态总体两个正态总体已知已知两个正态总体两个正态总体未知但相等未知但相等两个非正态总体两个非正态总体,n1,n230两个总体两个总体均值之差均值之差1-2简单随机抽样简单随机抽样待估计参数待估计参数已知条件已知条件置信区间置信区间无限总体,无限总体,np和和nq都大于都大于5总体成数总体成数(p)无限总体,无限总体,N1P15,n1q15N2P25,n2q25两个总体两个总体成数之差成数之差(P1-P2)有限总体,有限总体,np和和nq都大于都大于5有限总体,有限总体,N1P15,n1q15N2P25,n2q25简单随机抽样简单随机抽样待估计参数待估计参数已知条件已知条件置信区间置信区间正态总正态总体体总体方差总体方差 两个正态总体两个正态总体两个总体两个总体方差之比方差之比样本数的确定样本数的确定待估计参数待估计参数已知条件已知条件样本数的确定样本数的确定正态总体,正态总体,2已知已知总体均总体均值(值()例:误差范围例:误差范围简简单单随随机机抽抽样样有限总体,不放回抽样,有限总体,不放回抽样,2已知已知总体成数总体成数(P)服从正态分布服从正态分布有限总体,不放回抽样有限总体,不放回抽样 假设检验假设检验 基本思想基本思想 检验规则检验规则 检验步骤检验步骤 常见的假设检验常见的假设检验 方差分析方差分析 基本思想基本思想小概率原理:小概率原理:如果对总体的某种假设是如果对总体的某种假设是真实真实真实真实的,那么不利于的,那么不利于或不能支持这一假设的事件或不能支持这一假设的事件A(小概率事件)(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中几乎不可能发生的;要是在一次在一次在一次在一次试验试验试验试验中中中中A A竟然发生了竟然发生了竟然发生了竟然发生了,就有理由怀疑该假设的,就有理由怀疑该假设的真实性,真实性,拒绝拒绝拒绝拒绝这一假设。这一假设。总总 体体(某种假设)(某种假设)抽样抽样样样 本本(观察结果)(观察结果)检验检验(接受)(接受)(拒绝)(拒绝)小概率事件小概率事件未未 发发 生生小概率事件小概率事件发发 生生假设的形式:假设的形式:H0原假设,原假设,H1备择假设备择假设 双尾检验:双尾检验:H0:=0,H1:0单尾检验:单尾检验:H0:=0,H1:0 H0:=0,H1:0 假设检验就是根据样本观察结果对原假设(假设检验就是根据样本观察结果对原假设(H0)进行检验,)进行检验,不拒绝不拒绝H0,就否定,就否定H1;拒绝;拒绝H0,就接受,就接受H1。检验规则检验规则 确定检验规则确定检验规则确定检验规则确定检验规则检验过程是比较样本观察结果与总体假设的差异。差异显著,检验过程是比较样本观察结果与总体假设的差异。差异显著,超过了临界点,拒绝超过了临界点,拒绝H0;反之,差异不显著,不拒绝;反之,差异不显著,不拒绝H0差差 异异 临界点临界点临界点临界点 拒绝拒绝拒绝拒绝HH0 0 接受接受接受接受HH0 0c cc c 判判判判 断断断断两类错误两类错误不拒绝或拒绝不拒绝或拒绝H0,都可能犯错误,都可能犯错误I类错误类错误弃真错误,弃真错误,发生发生 的概率为的概率为 II类错误类错误取伪错误,发取伪错误,发生生 的概率为的概率为检验决策检验决策 H0为真为真 H0非真非真拒绝拒绝H0 犯犯I类错误(类错误()正确正确接受接受H0 正确正确 犯犯II类错误(类错误()怎样确定怎样确定c?大大就小,就小,小小就大就大 基本原则:力求在控制基本原则:力求在控制基本原则:力求在控制基本原则:力求在控制 前提下减少前提下减少前提下减少前提下减少 显著性水平,取值:显著性水平,取值:0.1,0.05,0.001,等。如果犯等。如果犯I类错误类错误损失更大,为减少损失,损失更大,为减少损失,值取小;如果犯值取小;如果犯II类错误损失更,类错误损失更,值取大。值取大。确定确定,就确定了临界点,就确定了临界点c。设有总体:设有总体:设有总体:设有总体:XNXN(,2 2),),),),2 2已知。已知。已知。已知。随机抽样:样本均值随机抽样:样本均值随机抽样:样本均值随机抽样:样本均值 标准化:标准化:标准化:标准化:确定确定确定确定 值,值,值,值,查概率表,知临界值查概率表,知临界值查概率表,知临界值查概率表,知临界值 计算计算计算计算Z Z值,作出判断值,作出判断值,作出判断值,作出判断0 不拒绝区不拒绝区不拒绝区不拒绝区 拒绝区拒绝区拒绝区拒绝区 拒绝区拒绝区拒绝区拒绝区 当检验判断为不拒绝原假设当检验判断为不拒绝原假设H0时,就有可能犯取伪的错误时,就有可能犯取伪的错误即即II类错误。类错误。确定犯第确定犯第类错误的概率类错误的概率比较困难比较困难,具体计算可,具体计算可根据书上的例子。根据书上的例子。统计上把统计上把 称为统计检验的势,它是原假设实际上是错误称为统计检验的势,它是原假设实际上是错误的应该被拒绝的概率。的应该被拒绝的概率。II类错误的概率类错误的概率的计算的计算 检验步骤检验步骤根据具体问题的要求,根据具体问题的要求,建立总体假设建立总体假设H0,H112选择统计量选择统计量确定确定H0为真时的抽样分布为真时的抽样分布3给定显著性水平给定显著性水平,当原假设,当原假设H0为真时,求出临界值。为真时,求出临界值。计算检验统计量的数计算检验统计量的数值与临界值比较值与临界值比较4 几种常见的假设检验几种常见的假设检验总体均值的检验总体均值的检验条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1)H0:=0 H1:0z(2)H0:=0 H1:0(3)H0:=0 H1:0z0z0正态正态总体总体2已知已知总体均值的检验总体均值的检验条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1)H0:=0 H1:0t(2)H0:=0 H1:0(3)H0:=0 H1:0t0t00正态正态总体总体2未知未知(n30)总体均值的检验总体均值的检验条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1)H0:=0 H1:0z(2)H0:=0 H1:0(3)H0:=0 H1:0z0z00非正态非正态总体总体n302已知已知或未知或未知两个总体均值之差两个总体均值之差的检验的检验条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1)H0:1=2 H1:1 2 z(2)H0:1=2 H1:1 2(3)H0:1=2 H1:1 2 z0z00两个两个正态总正态总体体已知已知两个总体均值之差两个总体均值之差的检验的检验条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1)H0:1=2 H1:1 2 t(2)H0:1=2 H1:1 2(3)H0:1=2 H1:1 2 t0t00两个正两个正态总体态总体未知,未知,但相等但相等两个总体均值之差两个总体均值之差的检验的检验条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1)H0:1=2 H1:1 2(2)H0:1=2 H1:1 2(3)H0:1=2 H1:1 2 0z00两个非两个非正态体正态体n130 n230已知或已知或未知未知zz总体成数的检验总体成数的检验条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1)H0:P=P0 H1:PP0z(2)H0:P=P0 H1:PP0(3)H0:P=P0 H1:PP0z0z00np5nq5两个总体成数之差两个总体成数之差的检验的检验条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1)H0:P1=P2 H1:P1 P2 z(2)H0:P1 P2 H1:P1 P2(3)H0:P1 P2 H1:P1 P2z0z00n1p15n1q15n2p25n2q25一个总体方差的检一个总体方差的检验验条件条件检验条件量检验条件量拒绝域拒绝域H0、H1总体服总体服从正态从正态分布分布两个总体方差之比两个总体方差之比的检验的检验条件条件检验条件量检验条件量拒绝域拒绝域H0、H1总体服总体服从正态从正态分布分布FFF 方差分析方差分析一、问题的提出一、问题的提出同一原材同一原材料加工产料加工产品质量品质量产地产地各组产品各组产品的质量是的质量是否有显著否有显著差异?差异?随机随机 原原则则一个班级一个班级 的学生,的学生,某门课程某门课程的成绩的成绩 地域地域 分组分组各组学生的各组学生的成绩是否有显成绩是否有显著差异?著差异?差异差异随机误差随机误差系统误差系统误差随机随机 原原则则加以比加以比较较若存在显著性差异,则说明该因素的影响是显著的若存在显著性差异,则说明该因素的影响是显著的二、假定条件二、假定条件各组水平都服从正态分布,均值和方差未知,但各组水平都服从正态分布,均值和方差未知,但方差相同方差相同(i=1,2,3,k)三、单因素方差分三、单因素方差分析析H0:各水平的均值相等:各水平的均值相等 H1:各水平均值不全相等各水平均值不全相等总离差平方和总离差平方和=组间离差平方和组间离差平方和+组内离差平方和组内离差平方和 离差平方和:离差平方和:SST=SSB +SSE自由度:自由度:n-1=k-1 +n-k方差:方差:MST=MSB +MSE检验量检验量=系统误差系统误差/随机误差随机误差即:即:F=MSB/MSE检验规则检验规则因为:因为:F=3.15 (0.05)所以接受原假设,认为不同的家庭背景对学员成绩没所以接受原假设,认为不同的家庭背景对学员成绩没有显著影响。有显著影响。四、不考虑交互作用的两因素方差分析四、不考虑交互作用的两因素方差分析H0(A):因素因素A的的k个水平的均值相等个水平的均值相等 H1:不全相等不全相等总离差平方和总离差平方和=组间离差平方和组间离差平方和 +组内离差平方组内离差平方和和 离差平方和:离差平方和:SST=SS(A)+SS(B)+SSE自由度:自由度:kh-1=k-1 +h-1 +(k-1)(h-1)方差:方差:MST=MS(A)+MS(B)+MSE检验量检验量=系统误差系统误差/随机误差随机误差即:即:F(A)=MS(A)/MSE F(B)=MS(B)/MSE H0(B):因素因素B的的h个水平的均值相等个水平的均值相等 H1:不全相等不全相等检验规则检验规则 因为:因为:F(A)=0.3935.14 F(B)=0.028 (0.05)P(B)(0.99)(0.05)所以接受原假设,认为不同的机器设备和不同的工艺所以接受原假设,认为不同的机器设备和不同的工艺方法对生产量都没有显著影响。方法对生产量都没有显著影响。五、考虑交互作用的两因素方差分析五、考虑交互作用的两因素方差分析H0(A):因素因素A的的k个水平的均值相等个水平的均值相等 H1:不全相等不全相等总离差平方和总离差平方和=组间离差平方和组间离差平方和 +组内离差平方组内离差平方和和离差平方和离差平方和:SST=SS(A)+SS(B)+SS(AB)+SSE自由度:自由度:khm-1=k-1 +h-1+(k-1)(h-1)+kh(m-1)方差:方差:MST=MS(A)+MS(B)+MS(AB)+MSE检验量检验量=系统误差系统误差/随机误差随机误差即:即:F(A)=MS(A)/MSE F(B)=MS(B)/MSE F(AB)=MS(AB)/MSEH0(B):因素因素B的的h个水平的均值相等个水平的均值相等 H1:不全相等不全相等H0(AB):AB之间不存在交互影响的作用之间不存在交互影响的作用 H1:有交互影响有交互影响 检验规则检验规则例:例:
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!