平均数抽样分布(正式.ppt

上传人:w****2 文档编号:6205890 上传时间:2020-02-19 格式:PPT 页数:36 大小:863KB
返回 下载 相关 举报
平均数抽样分布(正式.ppt_第1页
第1页 / 共36页
平均数抽样分布(正式.ppt_第2页
第2页 / 共36页
平均数抽样分布(正式.ppt_第3页
第3页 / 共36页
点击查看更多>>
资源描述
第二章概率与理论分布 第三节平均数抽样分布 研究总体与从中抽取的样本之间的关系是统计学的中心内容 对这种关系的研究可从两方面着手 1 抽样分布 从总体到样本 这就是研究抽样分布 samplingdistribution 的问题 统计量的概率分布称为抽样分布 2 统计推断 从样本到总体 这就是统计推断 statisticalinference 问题 统计推断是以总体分布和样本抽样分布的理论关系为基础的 为了能正确地利用样本去推断总体 并能正确地理解统计推断的结论 须对样本的抽样分布有所了解 我们知道 由总体中随机地抽取若干个体组成样本 即使每次抽取的样本含量相等 其统计量 如 S 也将随样本的不同而有所不同 因而样本统计量也是随机变量 也有其概率分布 我们把统计量的概率分布称为抽样分布 由总体随机抽样 randomsampling 的方法可分为有复置抽样和不复置抽样两种 复置抽样 指每次抽出一个个体后 这个个体应返回原总体 不复置抽样 指每次抽出的个体不返回原总体 对于无限总体 返回与否都可保证各个体被抽到的机会相等 对于有限总体 就应该采取复置抽样 否则各个体被抽到的机会就不相等 一 抽样的目的go二 样本平均数及其分布go三 样本平均数差数及其分布go四 t分布go 导言 一 抽样的目的运用样本推断总体试验测定所得样本数据 试验目的获得总体信息因此要研究 样本与总体关系 如何通过对样本数据的分析获得总体信息 总体 从总体抽取样本 从样本推断总体 导言 总体 从总体抽取样本 从样本推断总体 二 样本平均数及其分布 许多Si形成样本标准差抽样分布 许多形成样本平均数抽样分布 由样本平均数构成的总体称为样本平均数的抽样总体 和一个标准差Si 每一个样本有一个样本平均数 样本平均数抽样分布 二 样本平均数及其分布 抽样分布总体与原总体有什么关系 与 与 抽样分布总体与原总体关系如下 1 样本平均数分布的平均数等于原总体平2 样本平均数分布的标准差等于原总体标即 标准误 准差 除以 均数 即 标准误标准误 平均数抽样总体的标准差 的大小反映样本平均数的抽样误差的大小 即精确性的高低 标准误大 说明各样本平均数间差异程度大 样本平均数的精确性低 反之 小 说明各样本平均数间的差异程度小 样本平均数的精确性高 的大小与原总体的标准差 成正比 与样本含量n的平方根成反比 从某特定总体抽样 因为 是一常数 所以只有增大样本含量才能降低样本平均数的抽样误差 注意 样本标准差与样本标准误是既有联系又有区别的两个统计量 二者的区别在于 样本标准差S是反映样本中各观测值x1 x2 xn 变异程度大小的一个指标 它的大小说明了对该样本代表性的强弱 样本标准误是样本平均数 的标准差 它是抽样误差的估计值 其大小说明了样本间变异程度的大小及精确性的高低 对于大样本资料 常将样本标准差S与样本平均数配合使用 记为 S 用以说明所考察性状或指标的优良性与稳定性 对于小样本资料 常将样本标准误与样本平均数配合使用 记为 用以表示所考察性状或指标的优良性与抽样误差的大小 3 若原分布为正态分布 平均数分布亦为正态分布 若原分布是非正态分布 当n增大时 平均数分布亦趋向正态分布 所以n 30时 可以认为新分布符合正态分布 例3 4 某品种葡萄总体 果穗长 30cm 10 8cm 随机抽50个果穗 所得样本平均数与 相差不超过3cm的概率是多少 解 已知U 查附表3得P y U 0 28 以及y U 0 28 0 78P U 0 28 y U 0 28 1 0 78 0 22 22 以上做法对不对不对 分析 已知 求 3cm的概率 求样本平均数的信息 算U值须用 上面的解答错用 正确做法 从样本均数分布规律入手 样本均数分布解 U 查附表3得P y U 1 96 以及y U 1 96 0 05P U 1 96 y U 1 96 1 0 05 0 95 若题目改为某葡萄品种总体 果穗长 30cm 10 8cm 若从其中抽取50个穗 问50穗中 长度与 相差不超过3cm的果穗共有多少穗 解 U P 0 22 22 50 0 22 11 穂 例3 5某枇杷单果重 30g 9 6g 今从中抽取50个分析 已知总体分布 30 9 6 问解 的概率是多少 的概率P 样本中 果 其平均单果重 查附表3得两尾概率0 46 那么单尾概率 0 46 2 0 23 所以平均单果重小于等于29g的概率为0 23 若将是题目改成 某枇杷品种平均单果重 30g 9 6g 问单果重小于29g的概率是多少 解 U P 29 X 30 0 0398 P X 29 0 5 0 0398 0 4602 查附表3得两尾概率0 92 那么单尾概率 0 92 2 0 46 所以单果重小于等于29g的概率为0 46 例 在江苏沛县调查336个平方米小地老虎虫危害情况的结果 4 37头 2 63 试问样本容量n 30时 由于随机抽样得到样本平均数等于或小于4 37的概率为多少 查附表2 u 0 75 0 2266 即概率为22 66 属于一尾概率 因所得概率较大 说明差数 0 36是随机误差 从而证明这样本平均数4 37是有代表性的 相对精确度估计为 附 变异系数CV 用处 1 比较不同性质 不同单位 平均数相差很远的资料之间的变异情况 2 在空白试验中作为测定土壤差异的指标 解释空白试验 3 在田间试验设计中 作为确定试验小区面积和重复次数的依据 平均数有没有变异系数 反映样本平均数的离散 变异 情况 每一个都代表总体平均数 可是它们之间存在差异 为什么因为存在抽样误差 有 之间有差异 是 的无偏估计 是一个样本的平均数 所以也是抽样误差的反映 即精确度 因而 又称为精确度 越大 精确度越低 越小 精确度越高 是 之间差异是抽样误差的反映 之间差异的估量值 三 样本平均数差数的分布 总体1 1 总体2 2 三 样本平均数差数的分布 差数总体概率分布规律1 差数总体平均数即差数总体的平均数等于原来两个总体平均数之差 2 差数总体标准差 3 如果原来两个总体作正态分布 则样本平均数差数如原两个总体非正态分布 或分布未知 1 当n1 n2均大于30 样本平均数差数2 当n1 n2中有一小于或等于30时 样本平均数差数 总体遵从正态分布 总体遵从正态分布 即 总体遵从t分布 附 不同情况下的变形形式当平均数来自同一个总体 有 1 2 且n1 n2 n时 则当平均数来自不同总体 但是n1 n2 n时 当平均数来自同一个总体 有 1 2 但n1 n2时则 则 平均数抽样分布平均数总体平均数平均数总体标准差平均数总体遵从什么分布平均数差数的分布差数总体平均数差数总体标准差差数总体遵从什么分布 五 二项总体的抽样分布 一 二项总体的分布参数为了说明二项 0 1 总体的抽样分布特征 以总体内包含5个个体为例 每一个体 y 0 y 1 若总体的变量为 0 1 0 1 1 则总体平均数和方差为 0 1 0 1 1 5 3 5 0 6 2 0 0 6 2 1 0 6 2 0 0 6 2 1 0 6 2 1 0 6 2 5 0 24 二项总体的平均数 p 方差为 2 p 1 P pq 标准差为 0 49 二 样本平均数 成数 的抽样分布从二项总体进行抽样得到样本 样本平均数 成数 的分布为二项式分布 平均数 方差 标准误 三 样本总和数 次数 的抽样分布从二项总体进行抽样得到样本 样本总和数 次数 的分布为二项式分布 平均数 方差 标准误 例 棉田盲椿象为害棉株分为受害株和未受害株 假定调查2000株作为一个总体 受害株为704株 此二项总体中受害率p 35 2 0 4776 现从这一总体抽样 以株为单位 用简单随机抽样方法 调查200株棉株 获得74株受害 那么 观察受害率 试问样本平均数与总体真值的差数的概率为多少 p 0 352 差数 0 370 0 352 0 018 样本平均数的标准差为 0 034 由于样本容量大于30 样本平均数的分布可以看作正态分布 故可以计算正态离差u查出概率 查附表3 当u 0 53 概率值为0 59 两尾概率为0 59 故样本的受害率为37 有代表性 第七节t分布 五 t分布由样本平均数抽样分布的性质知道 若y N 2 则 N 2 n 将随机变量标准化得 则u N 0 1 当总体标准差 未知时 以样本标准差S代替 所得到的统计量记为t 在计算时 由于采用S来代替 使得t变量不再服从标准正态分布 而是服从t分布 t distribution 它的概率分布密度函数如下 4 26 式中 t的取值范围是 df n 1为自由度 t分布的平均数和标准差为 t 0 df 1 df 2 4 27 t分布密度曲线如图4 13所示 其特点是 图4 13不同自由度的t分布密度曲线 1 t分布受自由度的制约 每一个自由度都有一条t分布密度曲线 2 t分布密度曲线以纵轴为对称轴 左右对称 且在t 0时 分布密度函数取得最大值 3 与标准正态分布曲线相比 t分布曲线顶部略低 两尾部稍高而平 df越小这种趋势越明显 df越大 t分布越趋近于标准正态分布 当n 30时 t分布与标准正态分布的区别很小 n 100时 t分布基本与标准正态分布相同 n 时 t分布与标准正态分布完全一致 t分布的概率分布函数为 4 28 因而t在区间 t1 取值的概率 右尾概率为1 Ft df 由于t分布左右对称 t在区间 t1 取值的概率也为1 Ft df 于是t分布曲线下由 到 t1和由t1到 两个相等的概率之和 两尾概率为2 1 Ft df 对于不同自由度下t分布的两尾概率及其对应的临界t值已编制成附表4 即t分布表 例如 当df 15时 查附表4得两尾概率等于0 05的临界t值为 2 131 其意义是 P t 2 131 P 2 131 t 0 025 P t 2 131 2 131 t 0 05 由附表4可知 当df一定时 概率P越大 临界t值越小 概率P越小 临界t值越大 当概率P一定时 随着df的增加 临界t值在减小 当df 时 临界t值与标准正态分布的临界u值相等 Theend
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!