概率论与数理统计置信区间.ppt

上传人:max****ui 文档编号:8589224 上传时间:2020-03-30 格式:PPT 页数:26 大小:1.07MB
返回 下载 相关 举报
概率论与数理统计置信区间.ppt_第1页
第1页 / 共26页
概率论与数理统计置信区间.ppt_第2页
第2页 / 共26页
概率论与数理统计置信区间.ppt_第3页
第3页 / 共26页
点击查看更多>>
资源描述
解 1 样本的似然函数为 当00 X1 X2 Xn是取自总体X的一组样本 求 的极大似然估计量与矩估计量 其中 0为未知参数 例设总体X的密度为 故有对数似然函数 对 求导并令其为0可得似然方程 0 解得极大似然估计量 令 2 解得矩估计量 而区间估计正好弥补了点估计的这个缺陷 无偏性有效性一致性 估计量的期望值等于未知参数的真值 为了使估计的结论更可信 需要引入区间估计 评选标准 方差更小的无偏估计量 样本k阶原点矩是总体k阶原点矩的无偏估计量 样本方差S2是总体方差 2的无偏估计量 无偏估计量的函数未必是无偏估计量 在 的所有线性无偏估计量中 样本均值X是最有效的 参数的点估计是用样本算得的一个值去估计未知参数 使用起来把握不大 点估计值仅仅是未知参数的一个近似值 它没有反映出这个近似值的误差范围 若我们根据一个实际样本得到鱼数N的极大似然估计为1000条 一个可以想到的估计办法是 若我们能给出一个区间 并告诉人们该区间包含未知参数N的可靠度 也称置信系数 但实际上 N的真值可能大于1000条 也可能小于1000条 7 3单个正态总体均值与方差的置信区间 也就是说 给出一个区间 使我们能以一定的可靠度相信区间包含参数 湖中鱼数的真值 这里所说的 可靠程度 是用概率来度量的 称为置信概率 置信度或置信水平 习惯上把置信水平记作1 这里 是一个很小的正数 譬如 在估计湖中鱼数的问题中 根据置信水平1 可以找到一个正数 例如 通常可取置信水平 0 95或0 9等等 根据一个实际样本 由给定的置信水平1 我们求出一个的区间 使 置信水平的大小是根据实际需要选定的 如何寻找这种区间 使得 我们选取未知参数的某个估计量 只要知道 的概率分布就可以确定 下面我们就来正式给出置信区间的定义 并通过例子说明求置信区间的方法 由不等式 可以解出 这个不等式就是我们所求的置信区间 代入样本值所得的普通区间称为置信区间的实现 1 为两个统计量 由样本完全确定的已知函数 X1 X2 Xn是取自总体X的样本 对给定值0 1 满足 定义4设 是总体X的待估参数 分别称为置信下限和置信上限 一 置信区间的概念 则称随机区间 为 的置信水平为1 的双侧置信区间 若统计量 和 置信度置信概率 2 是随机区间 并非一个实现以1 的概率覆盖了 要求置信区间的长度尽可能短 估计的可靠度 即P 1 要尽可能大 可靠度与精度是一对矛盾 一般是在保证可靠度的条件下尽可能提高精度 估计的精度 即要求区间置信的长度尽可能短 或能体现该要求的其它准则 要求 以很大的可能被包含在置信区间内 要求估计尽量可靠 置信水平的概率意义 置信水平为0 95是指100组样本值所得置信区间的实现中 约有95个能覆盖 而不是一个实现以0 95的概率覆盖了 估计要尽量可靠 估计的精度要尽可能的高 只要知道 的概率分布就可以确定 如何根据实际样本 由给定的置信水平1 求出一个区间 使 根据置信水平1 可以找到一个正数 二 置信区间的求法 一 单个正态总体 1 均值 1 已知方差 2 1 均值 1 2 1 已知方差 12 22 二 两个正态总体 2 方差 2 2 未知方差 2 使得 我们选取未知参数的某个估计量 由不等式 可以解出 这个不等式就是我们所求的置信区间 分布的分位数 1 已知均值 2 未知均值 2 未知方差 12 22 2 方差 12 22 1 已知均值 1 2 2 未知均值 1 2 但相等 对于给定的置信水平 根据估计量U的分布 确定一个区间 使得U取值于该区间的概率为置信水平 X S2分别是其样本均值和样本方差 X N 2 n 求参数 2的置信水平为1 的置信区间 设X1 Xn是总体X N 2 的样本 确定未知参数的估计量及其函数的分布 是 的无偏估计量 由分布求分位数 即得置信区间 一 单个正态总体置信区间的求法 1 已知方差 2时 故可用X作为EX的一个估计量 N 0 1 对给定的置信度1 按标准正态分布的双侧 分位数的定义 查正态分布表可得u 2 由u 2确定置信区间 有了分布就可求出U取值于任意区间的概率 简记为 由抽样分布定理知 1 均值 的置信区间 是求什么参数的置信区间 置信水平1 是多少 1 寻找未知参数 的一个良好的点估计量 X1 X2 Xn 确定待估参数估计量函数U 的分布 求置信区间首先要明确问题 2 对于给定的置信水平1 由概率 就是 的100 1 的置信区间 一般步骤如下 3 由分位数 U x 确定置信区间 查表求出分布的分位数x 总体分布的形式是否已知 是怎样的类型 至关重要 某乡农民在联产承包责任制前人均纯收入X 单位 元 求 的置信水平为0 95的置信区间 推行联产承包责任制后 在该乡抽得n 16的样本 且X N 252 解由于 0 05 查正态分布表得 例1 得x 325元 假设 2 252没有变化 即得置信区间 312 75 337 25 同一置信水平下的置信区间不唯一 如在上例中取 0 01 0 04 由正态分布上侧分位数定义知 查表知 u0 025 1 96 当然区间长度越短的估计 精度就越高 其长度也不相等 区间长度为24 25 长度为25 5 谁是精度最高的 由于标准正态分布密度函数的图形是单峰且对称的 在保持面积不变的条件下 以对称区间的长度为最短 但的长度是最短的 l与n 的关系 可知 置信区间的长度l为 由置信区间公式 l随着 的减小而增大 20若给定 l随着n的增大而减小 同一置信水平下的置信区间不唯一 其长度也不相等 故我们总取它作为置信水平为1 的置信区间 若给定n 且由于l与成反比 减小的速度并不快 例如 n由100增至400时 l才能减小一半 则u 2越大 l就越大 这时 就越小 10 u 2 就越大 一般地 在概率密度为单峰且对称的情形下 a b对应的置信区间的长度为最短 例2 某厂生产的零件长度X服从N 0 04 现从该厂生产的零件中随机抽取6个 长度测量值如下 单位 毫米 14 6 15 l 14 9 14 8 15 2 15 1 求 的置信系数为0 95的区间估计 解 n 6 0 05 z 2 z0 025 1 96 2 0 22 所求置信区间为 故不能采用已知方差的均值估计方法 由于与 有关 但其解决的思路一致 由于S2是 2的无偏估计量 查t分布表确定上侧 2分位数 令 T 2 未知方差 用分布的分位数求 的置信区间 故可用S替代 的估计量 S t n 1 即为 的置信度为1 的区间估计 2时 由抽样分布定理知 实用价值更大 t 2 n 1 测定总体服从正态分布 求总体均值 的置信水平为0 95的置信区间 解由于 2 0 025 查t分布表得 例3为确定某种溶液中甲醛浓度 且其4个独立测量值的平均值x 8 34 样本标准差s 0 03 即得置信区间 自由度n 1 3 t0 025 3 182 将x 8 34 代入得 2 未知时 所以 2的置信水平为1 的区间估计为 因为 2的无偏估计为S2 2 方差 2的 置信区间的求法 由抽样分布定理知 2 由确定 2分布的上侧 2分位数 找一个含 与S 但不含 且分布已知的统计量 为了计算简单 在概率密度不对称的情形下 如 2分布 F分布 习惯上仍取对称的分位点来计算未知参数的置信区间 并不是最短的置信区间 2 2 测定总体服从正态分布 求总体均值 的置信水平为0 95的置信区间 解由于 2 0 025 查 2分布表得 例4为确定某种溶液中甲醛浓度 且其4个独立测量值的平均值x 8 34 样本标准差s 0 03 故 2的置信区间为 自由度n 1 3 得 将s2 0 0009代入 求总体方差 2和标准差 的置信水平为0 95的置信区间 故 的置信区间为 在实际应用中 经常会遇到两个正态总体的区间估计问题 于是 评价新技术的效果问题 就归结为研究两个正态总体均值之差 1 2的问题 例如 考察一项新技术对提高产品的某项质量指标的作用 将实施新技术前的产品质量指标看成正态总体N 1 12 实施新技术后产品质量指标看成正态总体N 2 22 设X1 Xm分别是总体X N 1 12 的样本 Y1 Yn分别是总体Y N 2 22 的样本 X Y分别是总体X和Y的样本均值 求参数 1 2和 12 22的置信水平为1 的置信区间 由于X Y分别是 1 2的无偏估计量 即得置信区间 二 两个正态总体 1 已知方差 12 22时 故可用X Y作为 1 2的一个估计量 N 0 1 对给定的置信度1 查正态分布表可得u 2 由抽样分布定理知 1 均值 1 2的置信区间 SX2 SY2分别是总体X和Y的样本方差 置信区间的求法 设X1 Xm分别是总体X N 1 12 的样本 Y1 Yn分别是总体Y N 2 22 的样本 X Y分别是总体X和Y的样本均值 求参数 1 2和 12 22的置信水平为1 的置信区间 即得置信区间 二 两个正态总体置信区间的求法 2 未知方差 12 22 但 12 22 2时 仍用X Y作为 1 2的一个估计量 t n m 2 对给定的置信度1 查t分布表可得 由抽样分布定理知 1 均值差 1 2的置信区间 SX2 SY2分别是总体X和Y的样本方差 t 2 n m 2 例5 某公司利用两条自动化流水线灌装矿泉水 设这两条流水线所装矿泉水的体积 单位 毫升 X N 1 2 和Y N 2 2 现从生产线上分别抽取X1 X2 X12和Y1 Y2 Y17 样本均值与样本方差分别为 求 1 2的置信系数为0 95的区间估计 解 m 12 n 17 0 05 且 查t分布表 得tm n 2 2 t27 0 025 2 05 因此 置信度为1 的置信区间 例6 比较棉花品种的优劣 假设用甲 乙两种棉花纺出的棉纱强度分别为X N 1 2 182 和Y N 2 1 762 试验者从这两种棉纱中分别抽取样本X1 X2 X200和Y1 Y2 Y100 样本均值分别为 求 1 2的置信系数为0 95的区间估计 解 1 2 18 2 1 76 m 200 n 100 0 05 1 2的置信系数为1 的置信区间为 设同上 求参数 12 22的置信水平为1 的置信区间 即得 12 22的置信区间 二 两个正态总体置信区间的求法 2 未知 1 2时 F m 1 n 1 对给定的置信度1 查F分布表可得上侧分位数 由抽样分布定理知 2 方差比 12 22的置信区间 F 2 m 1 n 1 F1 2 m 1 n 1 求两总体方差比 12 22的置信水平为0 90的置信区间 称重后所的样本方差分别为sx2 0 0125 sy2 0 01 假定所装番茄酱的重量X与Y分别服从正态分布N 1 12 和N 2 22 解由于 2 0 05 查F分布表得 例7某厂用两条流水线生产番茄酱小包装 现从两条流水线上各随机抽取样本容量分别为m 6 n 7的样本 将条件代入得 12 22的置信区间为 0 2847 6 1875 自由度m 1 5 n 1 6 主要根据抽样分布Th 二 两个总体 由 的概率分布和置信水平1 确定其相应的分位数x 2 小结 正态总体置信区间的求法 一 单个总体 均值 已知方差 2 均值差 1 2 已知方差 12 22 方差 2 未知方差 2 解得所求的置信区间 根据未知参数的无偏估计量 确定其某个估计量 由不等式 已知均值 未知均值 未知方差 12 22 方差比 12 22 已知均值 1 2 未知均值 1 2 但相等 X1 Xn是取自X的样本 则称随机区间 为 的置信水平为1 的单侧置信区间 但有些实际问题 人们关心的只是参数在一个方向的界限 这时 可将置信上限取为 而只着眼于置信下限 上述置信区间中置信限都是双侧的 例如对于设备 元件的使用寿命来说 平均寿命过长没什么问题 过短就有问题了 三 单侧置信区间 定义 满足 这样求得的置信区间叫单侧置信区间 对给定值0 1 满足 设 是总体X的待估参数 称 为单侧置信下限 则称随机区间 为 的置信水平为1 的单侧置信区间 称 为单侧置信上限 若统计量 若统计量 求单侧置信区间的思路完全同于双侧的情形 记录其磨坏时所行驶路程 单位 公里 问该种轮胎平均行驶路程至少是多少 0 05 解由于 2未知 查t分布表可得满足条件的上侧分位数 例8从一批汽车轮胎中随机地取16只作磨损试验 算得样本均值x 41116 即得置信度为0 95的单侧置信下限 t0 05 15 1 7531 将x 41116 s 6346代入得 设此样本来自正态总体N 2 均未知 t n 1 由抽样分布定理知随机变量 样本标准差s 6346 38334 故该种轮胎平均行驶路程不少于38334公里 其置信概率为0 95
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!