用样本的频率估计总体分布

上传人:wan****21 文档编号:245283505 上传时间:2024-10-08 格式:PPT 页数:35 大小:760KB
返回 下载 相关 举报
用样本的频率估计总体分布_第1页
第1页 / 共35页
用样本的频率估计总体分布_第2页
第2页 / 共35页
用样本的频率估计总体分布_第3页
第3页 / 共35页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,复习回顾,类别,共同点,各自特点,相互联系,适用范围,简单随机,抽样,系统,抽样,分层抽样,三种抽样方式比较,1.不放回抽样,2.抽样过程中,每个个体被抽取的机会均等,从总体中逐个抽取,将总体均分为几部分,按简单随机抽样抽取第一个样本,然后按相同的间隔抽取其他样本,将总体分成几层,分层进行抽取,抽取第一个样本时采用简单随机抽样,各层抽样时,采用简单随机抽样或系统抽样,总体中的个体数较少,总体中的个体数较多,(间隔相同的时间或距离),总体由差异明显的几部分组成,1某单位有老年人28人,中年人54人,青年人81人为了调查他们的身体状况,需从他们中抽取一个容量为36的样本,最适合抽取样本的方法是(),A简单随机抽样,B系统抽样,C分层抽样,D先从老年人中剔除一人,然后分层抽样,D,课堂练习,2.从2004名学生中选取50名组成参加观团,若,采用下面的方法选取:先用简单随机抽样从,2004人中剔除4人,剩下的2000人再按系统抽,样的方法进行,则每人入选的机会(),A.不全相等 B.均不相等,C.都相等 D.无法确定,C,3.某校高一年级有x个学生,高二年级有y个学,生,高三年级有z个学生,采用分层抽样抽取一,个容量为45人的样本,高一年级抽取20人,高,二年级抽取10人,高三年级共有学生300人,则,此学校共有_人.,900,如何从样本数据中提取基本信息来,估计总体的情况呢?,2.2 用样本估计总体,一、用样本的频率分布估计总体的分布,二、用样本的数字特征估计总体的特征,平均数、中位数、众数、,极差、方差、标准差,频率分布表、频率分布直方图、,频率折线图、茎叶图,1、求极差(即一组数据中最大值与最小值的差),知道这组数据的变动范围4.3-0.2=4.1,2、决定组距与组数(将数据分组),3、将数据分组(8.2取整,分为9组),画频率分布直方图的步骤,4、列出,频率分布表。,5、画出,频率分布直方图,.,组距,:,指每个小组的两个端点的距离,组数,:,将数据分组,当数据在100个以内时,,按数据多少常分5-12组。,分组,频数,频率,频率/组距,0,0.5),0.5,1),1,1.5),1.5,2),2,2.5),2.5,3),3,3.5),3.5,4),4,4.5,4,8,15,22,25,14,6,4,2,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,频率分布表,0.08,0.16,0.30,0.44,0.50,0.28,0.12,0.08,0.04,频率分布直方图如下,:,月均用水量/t,频率,组距,0.10,0.20,0.30,0.40,0.50,0.5,1,1.5,2,2.5,3,3.5,4,4.5,小长方形的面积=?,频率分布直方图如下,:,月均用水量/t,频率,组距,0.10,0.20,0.30,0.40,0.50,0.5,1,1.5,2,2.5,3,3.5,4,4.5,小长方形的面积总和=?,频率分布直方图如下,:,月均用水量/t,频率,组距,0.10,0.20,0.30,0.40,0.50,0.5,1,1.5,2,2.5,3,3.5,4,4.5,月均用水量最多的在那个区间?,P174 例4,跟踪练习4,注意,(2)纵坐标为:,频率分布直方图如下,:,月均用水量/t,频率,组距,0.10,0.20,0.30,0.40,0.50,0.5,1,1.5,2,2.5,3,3.5,4,4.5,连接频率分布直方图中各小长方形上端的中点,得到,频率分布折线图,利用样本频分布对总体分布进行相应估计,(,3)当样本容量无限增大,组距无限缩小,那么频率折线图就会无限接近于一条光滑曲线,总体密度曲线,。,(2)样本容量越大,这种估计越精确。,(,1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?,总体密度曲线,频率,组距,月均用水量/t,a,b,(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。,用样本分布直方图去估计相应的总体分布时,一般样本容量越大,,频率分布直方图,就会无限接近,总体密度曲线,,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。,总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.,总体密度曲线,茎叶图,某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:,甲运动员得分:,13,51,23,8,26,38,16,33,14,28,39,乙运动员得分:,49,24,12,31,50,31,44,36,15,37,25,茎叶图,甲,乙,0,1,2,3,4,5,2 5,5 4,1 6 1 6 7 9,4 9,0,8,4 6 3,6 8,3 8 9,1,几种表示频率分布的方法的优点与不足,1.,频率分布表,在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便。,2.,频率分布直方图,能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式。但是从直方图本身得不出原始的数据内容。,3.,频率分布折线图,的优点是它反映了数据的变化,趋势。如果样本容量不断增大,分组的组距不断,缩小,那么折线图就趋向于总体分布的密度曲线。,4.用,茎叶图,刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况。但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了。,用样本的数字特征估计总体的数字特征,众数、中位数、平均数,1.三数的概念,众数,:_,在一组数据中,出现次数最多的数据。,中位数,:_,_,_.,平均数,:_,_.,将一组数据按从大小依次排列,处,在最中间位置的一个数据(或两个数,据的平均数)。,一组数据的总和除以数据的个数,所得的值.,例如:5、5、5、6、6、6、6、7、7、7这一,组数据,它的众数为_;中位数为_;,平均数为_.,6,6,6,也可以说平均数为各个不同数字乘以,相应频率的和。,标准差的概念:,标准差是样本数据到平均数的一种,平,均距离,,一般用s表示。,计算标准差的公式:,【对标准差的理解】,(1)标准差是用来描述样本数据的离散程,度的,它反映了各个样本数据聚集于样本平,均数周围的程度。标准差越小,表明各个样,本数据在样本平均数的周围越集中;反之,,标准差越大,表明各个样本数据在样本平均,数的两边越分散。,(2)在实际应用中,标准差常被理解为,稳定性。,(3)标准差的取值范围是什么?标准差为,0的样本数据有什么特点?,答:标准差是非负的。标准差为0意味着所有的样本数据都相等的特性,且与样本平均,数也相等。,标准差的平方s,2,方差,例2(08山东)从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为(),分数,5,4,3,2,1,人数,20,10,30,30,10,例3某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30min抽取一包产品,称其重量,分别记录抽查数据如下:,甲:102,101,99,98,103,98,99;,乙:110,115,90,85,75,115,110.,(1)这种抽样方法是哪一种?,(2)将这两组数据用茎叶图表示;,(3)将两组数据比较,说明哪个车间产品较稳定,在频率分布直方图中如何求,众数,?,月均用水量/t,频率,组距,0.10,0.20,0.30,0.40,0.50,0.5,1,1.5,2,2.5,3,3.5,4,4.5,众数:频率分布直方图中,最高,小长方形底边中点的,横坐标,.,左图中,众数为_.,2.25,在频率分布直方图中如何求,中位数,?,月均用水量/t,频率,组距,0.10,0.20,0.30,0.40,0.50,0.5,1,1.5,2,2.5,3,3.5,4,4.5,中位数,:在频率分布直方图中,把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标。,在频率分布直方图中如何求,平均数,?,月均用水量/t,频率,组距,0.10,0.20,0.30,0.40,0.50,0.5,1,1.5,2,2.5,3,3.5,4,4.5,平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!