总体与样本-概率论与数理统计(李长青版).ppt

上传人:za****8 文档编号:16589906 上传时间:2020-10-16 格式:PPT 页数:22 大小:2.31MB
返回 下载 相关 举报
总体与样本-概率论与数理统计(李长青版).ppt_第1页
第1页 / 共22页
总体与样本-概率论与数理统计(李长青版).ppt_第2页
第2页 / 共22页
总体与样本-概率论与数理统计(李长青版).ppt_第3页
第3页 / 共22页
点击查看更多>>
资源描述
第一节 总体与样本、经验分布函数 一、数理统计的基本概念 一个统计问题总有它明确的研究对象 . 1.总体 研究对象的全体称为 总体 (母体 ), 总体中每个成员称为 个体 . 研究某批灯泡的质量 总体 考察国产轿车的质量 总体 然而在统计研究中,人们关心总体仅仅是关心 其每个个体的一项 (或几项 )数量指标和该数量指标 在总体中的分布情况 . 这时,每个个体具有的数量 指标的全体就是总体 . 该批灯泡寿命的 灯泡的寿命 国产轿车每公里 的耗油量 所有国产轿车每公里耗 油量的全体就是总体 全体就是总体 考察某大学一年级 学生的年龄 某大学一年级全体 学生的年龄构成问 题的总体 总体可以用一个随机变量来表示 设该大学一年级学生 的年龄分布如下表 年龄 18 19 20 21 22 比例 0.5 0.3 0.1 0.07 0.03 若从该大学一年级学生中任 意抽查一个学生的年龄,所 得结果为一随机变量,记作 X. X的概率分布是: 03.007.01.03.05.0 2221201918 可见, X的概率分布 也就是说, 总体可以用一个随机变量及其分布 来描述 . 反映了总体中各个值的分 布情况 . 很自然地,我们 就用随机变量 X来表示所 考察的总体 . 为推断总体分布及各种特征,按一定规则从总体 2. 样本 从国产轿车中抽 5辆 进行耗油量试验 样本容量为 5 中抽取若干个体进行观察试验,以获得有关总体的信 息 , 这一抽取过程称为 “抽样” , 所抽取的部分个体称 为 样本 . 样本中所包含的个体数目称为样本容量 . 但是 , 一旦取定一组样本 , 得到的是 n个具体的数 样本是随机变量 . 抽到哪 5辆是随机的 容量为 n 的样本可以看作 n 维随机变量 ,记作 12( , , , ) .nX X X (x1 , x2 , , xn),称为 样本的一次观察值 ,简称 样本值 . 由于抽样的目的是为了对总体进行统计推断,为 了使抽取的样本能很好地反映总体的信息,必须考虑 抽样方法 . 最常用的一种抽样方法叫作“ 简单随机抽样 ”, 它要求抽取的样本满足下面两点 : 1. 代表性 : X1,X2, Xn中每一个与所考察的总体有 相同的分布 . 2. 独立性 : X1,X2, Xn是相互独立的随机变量 . 由简单随机抽样得到的样本称为 简单随机样本 , 它可以用与总体独立同分布的 n个相互独立的随机变 量 X1,X2, Xn表示 . 若总体的分布函数为 F(x),则其简单随机样本的 联合分布函数为 若总体的分布密度函数为 f (x) , 则样本的联合密度函 数为 12 1 ( , , , ) ( ) . n ni i f x x x f x )()()(),( 2121 nn xFxFxFxxxF ,2,1 ipxXP ii 则 X1, X2, , Xn的联合分布律为 1212 1 , , , nj n i i n i i j P X x X x X x p 若 X的分布律为 简单随机样本是应用中最常见的情形,今后,当 说 1 , 2 , ( 1 , 2 , , )ji j n 到“ X1, X2 , Xn 是取自某总体的样本”时,若不特别 说明,就指简单随机样本 . 例 1 设总体 X B(1, p), X1, X2, , Xn为取自总体 X的样本,求样本 X1, X2, , Xn的联合分布(称为 样本分布) . 1,0)1( 1 xppxXP xx 解 所以样本 X1, X2, , Xn的联合分布律为 1 1 2 2, , , nnP X x X x X x 111 1 ( 1 ) ( 1 ) , nn ii i i i i n x n x xx i p p p p 0 , 1 1 , 2 , ,ix i n X的分布律为 若总体 X 服从正态分布 , 则称总体 X为正态总体 . 设 12( , , , )nX X X 是容量为 n 的简单随机样本 , 则其联合 概率密度函数为 2 12 1 11( , , , ) e x p 22 n i n i xf x x x 22 1 11 e x p 22 n n i i x 二、简单数据处理 通过观察或试验得到的样本值, 一般是杂乱无章的, 需要进行整理才能从总体上呈现其统计规律性 , 据统计表 和 频率直方图 是两种常用的整理方法 . 分组数 1. 分组数据统计表 若样本值较多时 ,可将其分成若干组 ,分组的组数 应与样本容量相适应 . 分组太少 ,则难以反映出分布的 特征 ,分组太多 , 则由于样本取值的随机性而使分布显 得杂乱 . 因此 ,分组时 ,确定分组数 (或组距 )应以突出 分 布的特征并冲淡样本的随机波动性为原则 . 区间所含的样本值个数称为该区间的 组频数 .组频 数与总的样本容量之比称为 组频率 . 2. 频率直方图: 频率直方图能直观地表示出组频 率数的分布 . 其步骤如下: (1) 设 nxxx , 21 是样本 n 个观察值 . 的 nxxx , 21 中 求出 )1(x 和最 的最小者 ;)(nx大者 将区间 , ba 等分成 m个小区间 m 使 nm/(一般取 (2) a(略小于 )1(x ) 和 b(略大于 )(nx ), 选取常数 并 在 10/1 左右, 且小区间不包含右端点 ): );,1(), mim abtttt ii (3) 组频率 ,ii fnn 及 );,2,1(, nitfh ii ,in求组频数 (4) 在 , ttt ii 上以 ih 为高, 其面积恰为 ,if 所有小矩形合在一起就构成了频率 所有小矩形合在一起就构成了频率 直方图 . 典型的频率直方图如下图所示 . t t f i O a bttt ii 3. 经验分布函数 一组观察值,将其从小到大排列成 ( 1 ) ( 2 ) ( ) .nx x x 设 12, , , nX X X 是一个随机样本, 12, , , nx x x 为其 ( 1 ) ( ) ( ) ( 1 ) () 0 , ; ( ) , ; 1 , . n k k n xx k F x x x x n xx 定义 称 Fn(x) 为样本分布函数或经验分布函数 . 格里汶科定理: 对于任一实数 x , 当 n 时, ()nFx 以概率 1一致收敛于分布函数 ( ),Fx 即 l i m s u p ( ) ( ) 0 1 .nn x P F x F x 关于经验分布函数的一个定理 例 2 设一个样本由六个 7, 八个 8, 九个 9和十个 10组 成 . 求样本容量 n 样本均值 x, 样本方差 s2 及经验分布 函数 ()nFx. 解 样本容量为 6 7 8 9 1 0 4 0n 40 1 1 6 6 7 7 8 8 9 9 1 0 1 0 8 . 2 5 4 0 4 0iixx 2240 22 1 1 (6 8 . 2 5 ) 6 ( 1 0 8 . 2 5 ) 1 0( ) 1 . 9 8 7 2 3 9 3 9iis x x 经验分布函数为 0 , 6 , 6 40 , 6 7, 13 40 , 7 8 , () 21 40 , 8 9 , 30 40 , 9 10 , 1 , 10 . n x x x Fx x x x
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!