概率论第6章样本及抽样分布课件

上传人:无*** 文档编号:241509153 上传时间:2024-06-30 格式:PPT 页数:90 大小:3.56MB
返回 下载 相关 举报
概率论第6章样本及抽样分布课件_第1页
第1页 / 共90页
概率论第6章样本及抽样分布课件_第2页
第2页 / 共90页
概率论第6章样本及抽样分布课件_第3页
第3页 / 共90页
点击查看更多>>
资源描述
概率论与数理分析第六章 样本及抽样分布1 随机样本随机样本2 直线图和箱线图直线图和箱线图3 抽样分布抽样分布引言 随机变量及其所伴随的概率分布全面描述了随机现象的统计性规律。概率论的许多问题中,随机变量的概率分布通常是已知的,或者假设是已知的,而一切计算与推理都是在这已知是基础上得出来的。但实际中,情况往往并非如此,一个随机现象所服从的分布可能是完全不知道的,或者知道其分布概型,但是其中的某些参数是未知的。1 随机样本随机样本例如:某公路上行驶车辆的速度服从什么分布是未知的;电视机的使用寿命服从什么分布是未知的;产品是否合格服从两点分布,但参数合格率p是未知的;数理统计的任务则是以概率论为基础,根据试验所得到的数据,对研究对象的客观统计规律性做出合理的推断。1 随机样本随机样本一、总体与个体1.总体试验的全部可能的观察值称为总体.2.个体总体中的每个可能观察值称为个体.例1 在研究2 000名学生的年龄时,这些学生的年龄的全体就构成一个总体,每个学生的年龄就是个体.1 随机样本随机样本3.容量总体中所包含的个体的个数称为总体的容量.4.有限总体和无限总体容量为有限的称为有限总体.容量为无限的称为无限总体.产的灯泡寿命.某工厂10月份生产的灯泡寿命所组成的总 个体的总数就是10月份生产的灯泡数,个有限总体;例2体中,这是而该工厂生产的所有灯泡寿命所组成的总体是一个无限总体,它包括以往生产和今后生1 随机样本随机样本所形成的总体中共含2 000个例3在考察某大学一年级男生的身高这一试试验中,若一年级男生共2 000人,每个男生的身高是一个可能观察值,可能观察值,是一个有限总体.总体也是有限总体.例4 考察某一湖泊中某种鱼的含汞量,所得1 随机样本随机样本我们可以认为有些有限总体,它的容量很大,它是一个无限总体.例5考察全国正在使用的某种型号灯泡的寿可以认为是无限总体.命所形成的总体,由于可能观察值的个数很多,就1 随机样本随机样本因此在理论上可以把总体与概率分布等同起来.我们关心的是总体中的个体的某项指标(如人的身高、灯泡的寿命,汽车的耗油量).由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性.从而可以把这种数量指标看作一个随机变量X ,因此随机变量X的分布就是该数量指标在总体中的分布.总体就可以用一个随机变量及其分布来描述.1 随机样本随机样本5.总体分布 例如:研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数F(x)表示.某批灯泡的寿命总体 寿命 X 可用一概率(指数)分布来刻划鉴于此,常用随机变量的记号或用其分布函数表示总体.如说总体X或总体F(x).1 随机样本随机样本 类似地,在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重,我们用X 和Y 分别表示身高和体重,那么此总体就可用二维随机变量(X,Y)或其联合分布函数 F(x,y)来表示.统计中,总体这个概念的要旨是:总体就是一个随机变量总体就是一个随机变量(向量向量)或一个或一个概率分布概率分布.1 随机样本随机样本X 的分布函数和数字特征就称为总体的分布函数和数字特征.今后将不区分总体与相应的随机变量.参数为p的(0-1)分布:例如,我们检验自生产线出来的零件是次品还是正品,以0表示产品是正品,以1表示产品为次品.的随机变量.设出现次品的频率为 p(常数),那么总体是由一些“0”和一些“1”所组成,这一总体对应于一个具有1 随机样本随机样本根据获得的数据来对总体分布得出在数理统计中,人们都是通过从总体中抽取一部分个体,被抽出的部分个体叫做总体的一个样本.判断的.所谓从总体抽取一个个体,就是对总体X 进行一次观察并记录其结果.1 随机样本随机样本二、随机样本的定义二、随机样本的定义1.样本的定义1 随机样本随机样本2.简单随机抽样的定义获得简单随机样本的抽样方法称为简单随机抽样.1 随机样本随机样本解解例例71 随机样本随机样本解解例例81 随机样本随机样本1 随机样本随机样本三、小结三、小结个体总体有限总体无限总体基本概念:统称为总体X.说明2随机样本一个总体对应一个随机变量X,说明1我们将不区分总体和相应的随机变量,在实际中遇到的总体往往是有限总体,它个数很大时,在理论上可认为它是一个无限总体.对应一个离散型随机变量;当总体中包含的个体的1 随机样本随机样本男子的男子的头颅的最大的最大宽度度(mm),),141 148 132138 154 142150 146 155 158 150 140 147 148 144150 149 145149 158 143 141 144 144 126 140 144142 141 140145 135 147 146 141 136 140 146 142137 148 154137 139 143 140 131 143 141 149 148135 148 152143 144 141 143 147 146 150 132 142142 143 153149 146 149 138 142 149 142 137 134144 146 147140 142 140 137 152 145一、直方图例例1 1 下面下面给出了出了84个伊特拉斯坎个伊特拉斯坎(Etruscan)人人数据的数据的“频率直方率直方图”.现在来画在来画这些些2 直方图和箱线图直方图和箱线图步步骤:1.找出最小找出最小值126,最大最大值158,现取区取区间124.5,159.5;2.将区将区间124.5,159.5等分等分为7个小区个小区间,3.小区小区间的端点称的端点称为组限限,数出落在每个小区数出落在每个小区2 直方图和箱线图直方图和箱线图列表如下:列表如下:组 限限频 数数频 率率累累计频率率124.5129.510.01190.0119129.5134.540.04760.0595134.5139.5100.11910.1786139.5144.5330.39290.5715144.5149.5240.28570.8572149.5154.590.10710.9524154.5159.530.03571.0000这样的的图形叫形叫频率直方率直方图.2 直方图和箱线图直方图和箱线图2 直方图和箱线图直方图和箱线图频率直方率直方图二、箱线图二、箱线图定义定义 2 直方图和箱线图直方图和箱线图综上,上,2 直方图和箱线图直方图和箱线图2 直方图和箱线图直方图和箱线图例例2 2 设有一有一组容量容量为18的的样本如下(已本如下(已经排排过序)序)122 126 133 140 145 145 149 150 157解解162 166 175 177 177 183 188 199 2122 直方图和箱线图直方图和箱线图2 直方图和箱线图直方图和箱线图数据集的箱数据集的箱线图是由箱子和直是由箱子和直线组成的成的图形,形,它是基于以下五个数的它是基于以下五个数的图形概括:形概括:2 直方图和箱线图直方图和箱线图在同一水平在同一水平高度自箱子右高度自箱子右侧引一条水平引一条水平线直至最大直至最大值.2 直方图和箱线图直方图和箱线图以下是以下是8个病人的血个病人的血压(收(收缩压,mmHg)数)数解解故故例例3 3试作出箱作出箱线图.据(已据(已经过排序排序),),102 110 117 118 122 123 132 1502 直方图和箱线图直方图和箱线图故故故故作出箱作出箱线图如如图所示所示.2 直方图和箱线图直方图和箱线图例例4 4 量(以升量(以升计.数据数据应经过排序)排序)女子女子组2.7 2.8 2.9 3.1 3.1 3.1 3.2 3.4 3.4男子男子组4.1 4.1 4.3 4.3 4.5 4.6 4.7 4.8 4.8试分分别画出画出这两两组数据的箱数据的箱线图.下面分下面分别给出了出了25个男子和个男子和25个女子的肺活个女子的肺活3.4 3.4 3.4 3.5 3.5 3.5 3.6 3.7 3.73.7 3.8 3.8 4.0 4.1 4.2 4.25.1 5.3 5.3 5.3 5.4 5.4 5.5 5.6 5.7 5.8 5.8 6.0 6.1 6.3 6.7 6.72 直方图和箱线图直方图和箱线图解解女子女子组男子男子组作出箱作出箱线图如(教材如(教材P134)图6-4所示所示.2 直方图和箱线图直方图和箱线图 在数据集中,在数据集中,称称为四分位数四分位数间距距.某一个某一个观察察值不不寻常地大于或常地大于或小于小于该数据集中的其他数据,数据集中的其他数据,称称为疑似异常疑似异常值.疑似异常疑似异常值2 直方图和箱线图直方图和箱线图修正箱线图修正箱线图 自箱子左自箱子左侧引一水平引一水平线段直至数据集中段直至数据集中又自箱子右又自箱子右侧引一引一除去疑似异常除去疑似异常值后的最小后的最小值,水平水平线直至数据集中除去疑似异常直至数据集中除去疑似异常值后的最大后的最大值.2 直方图和箱线图直方图和箱线图例例5 5 下面下面给出了某医院出了某医院21个病人的住院个病人的住院时间(以(以1 2 3 3 4 4 5 6 6 7 7 9 9解解试画出修正箱画出修正箱线图(数据已(数据已经过排序)排序).天天计),),10 12 12 13 15 18 23 552 直方图和箱线图直方图和箱线图故故55 是疑似异常是疑似异常值,且且仅此一个疑此一个疑疑似异常疑似异常值.作出修正箱作出修正箱线图如(教材如(教材P135)图6-5所示所示.2 直方图和箱线图直方图和箱线图1.频率直方率直方图作作图步步骤(1)找出最小找出最小值和和最大最大值值,(2)将将选定区定区间分分为k个小区个小区间;三、小结三、小结 2 直方图和箱线图直方图和箱线图高度自箱子右高度自箱子右侧引一条水平引一条水平线直至最大直至最大值.2.箱箱线图作作图步步骤2 直方图和箱线图直方图和箱线图一、基本概念1.统计量的定义3 抽样分布抽样分布是是不是实例13 抽样分布抽样分布2.几个常用统计量的定义(1)样本平均值(2)样本方差其观察值3 抽样分布抽样分布其观察值(3)样本标准差其观察值3 抽样分布抽样分布(4)样本k 阶(原点)矩其观察值(5)样本k 阶中心矩其观察值3 抽样分布抽样分布证明再根据第五章辛钦定理知由以上定义得下述结论:3 抽样分布抽样分布由第五章关于依概率收敛的序列的性质知由第五章关于依概率收敛的序列的性质知 以上结论是下一章所要介绍的矩估计法的理论根据.3 抽样分布抽样分布3.经验分布函数经验分布函数的做法如下:3 抽样分布抽样分布实例3 抽样分布抽样分布实例3 抽样分布抽样分布一般地,3 抽样分布抽样分布格里汶科定理格里汶科定理3 抽样分布抽样分布二、常见分布统计量的分布称为抽样分布.自由度是指上式右端包含的独立变量的个数.3 抽样分布抽样分布证明3 抽样分布抽样分布3 抽样分布抽样分布性质1(此性质可以推广到多个随机变量的情形.)3 抽样分布抽样分布性质2证明3 抽样分布抽样分布3 抽样分布抽样分布根据正态分布的对称性知例13 抽样分布抽样分布附表5只详列到n=40为止.例23 抽样分布抽样分布例如利用上面公式,而查详表可得费舍尔费舍尔(R.A.Fisher)证明证明:3 抽样分布抽样分布例3解根据正态分布的性质,3 抽样分布抽样分布3 抽样分布抽样分布3 抽样分布抽样分布t 分布又称学生氏(Student)分布.2.3 抽样分布抽样分布形.当n充分大时,其图形类似于标准正态变量概率密度的图3 抽样分布抽样分布由分布的对称性知3 抽样分布抽样分布例43 抽样分布抽样分布3.3 抽样分布抽样分布3 抽样分布抽样分布根据定义可知,3 抽样分布抽样分布例53 抽样分布抽样分布证明3 抽样分布抽样分布3 抽样分布抽样分布4.正态总体的样本均值与样本方差的分布定理一3 抽样分布抽样分布定理二3 抽样分布抽样分布证明由 t 分布的定义知定理三且两者独立,3 抽样分布抽样分布定理四3 抽样分布抽样分布3 抽样分布抽样分布证明(1)由定理二3 抽样分布抽样分布(2)3 抽样分布抽样分布3 抽样分布抽样分布解例63 抽样分布抽样分布查标准正态分布表知3 抽样分布抽样分布解例73 抽样分布抽样分布3 抽样分布抽样分布3 抽样分布抽样分布三、小结两个最重要的统计量:样本均值样本方差三个来自正态分布的抽样分布:3 抽样分布抽样分布
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!