用样本的频率分布估计总体分布课件

上传人:2127513****773577... 文档编号:240905525 上传时间:2024-05-16 格式:PPT 页数:34 大小:1.58MB
返回 下载 相关 举报
用样本的频率分布估计总体分布课件_第1页
第1页 / 共34页
用样本的频率分布估计总体分布课件_第2页
第2页 / 共34页
用样本的频率分布估计总体分布课件_第3页
第3页 / 共34页
点击查看更多>>
资源描述
总体分布的估计总体分布的估计总体分布的估计统计的基本思想方法:用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本从总体中抽取一个样本,根据根据样本的情况去估计总体的相应情况样本的情况去估计总体的相应情况.统计的核心问题:如何根据样本的情况对总体的情况作出一种推断.这里包括两类问题:一类是如何从总体中抽取样本?另一类是如何根据对样本的整理、计算、另一类是如何根据对样本的整理、计算、分析分析,对总体的情况作出推断对总体的情况作出推断.统计的基本思想方法:用样本估计总体,即通常不直问题某班40名同学在一次测验中的成绩如下:73 69 77 66 84 78 48 78 73 85 98 81 52 96 73 65 85 79 100 63 88 57 99 71 79 83 67 78 75 74 71 89 76 74 50 62 92 87 77 64现在我想弄清这些同学的成绩分布情况,该怎么办?各分点比所给数据多取一位小数的原因是:为了使数据不落在分点上,从而明确它们究竟属于哪一组。分数段人数与全班人数的比40.550.520.0550.560.520.0560.570.570.17570.580.5160.4080.590.580.2090.5100.550.125分数段人数与全班人数的比40.550.5250.560.5260.570.5770.580.51680.590.5890.5100.55分数段人数与全班人数的比40.550.550.560.560.570.570.580.580.590.590.5100.5分数段人数与全班人数的比学生分数分布表(频率分布表)学生分数分布统计图(频率分布直方图)问题某班40名同学在一次测验中的成绩如下:各分点比所给数据多用样本的频率分布估计总体分布课件用样本估计总体用样本估计总体用样本估计总体用样本估计总体(两种):两种):一种是:用样本的频率分布估计总体的一种是:用样本的频率分布估计总体的分布。分布。另一种是:用样本的数字特征(平均数另一种是:用样本的数字特征(平均数标准差等)估计总体的数字特征。标准差等)估计总体的数字特征。用样本估计总体用样本估计总体(两种):用样本的频率分布估计总体分布用样本的频率分布估计总体分布一一 频率分布图和频率分布直方图频率分布图和频率分布直方图二二频率分布折线图和总体密度曲线频率分布折线图和总体密度曲线三 茎叶图(茎叶图(stem-and-leaf display)用样本的频率分布估计总体分布探究探究:我国是世界上严重缺水的我国是世界上严重缺水的 国家之一,城市国家之一,城市缺水问题较为突出。某市政府为了节约用缺水问题较为突出。某市政府为了节约用水,计划在水,计划在 本市试行居民生活用水定额管本市试行居民生活用水定额管理,即确定一个居民月用水量标准理,即确定一个居民月用水量标准a,用水用水量不超过量不超过a的按平价收费,超过的按平价收费,超过 a的按议价的按议价收费。如果希望大部分居民的收费。如果希望大部分居民的 日常生活不日常生活不受影响,那么标准受影响,那么标准a定为多少比较合理?你定为多少比较合理?你认为,为了较为合理地确定出这个标准,认为,为了较为合理地确定出这个标准,需要做什么工作?需要做什么工作?探究:根据这些数据根据这些数据你能得出用水你能得出用水量其他信息吗量其他信息吗?用样本的频率分布估计总体分布课件表表21 100位居民的月均用水量位居民的月均用水量 (单位(单位:t )3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2表21 100位居民的月均用水量 (单位:t 表表22 100位居民月均用水量的位居民月均用水量的 频率分布表频率分布表 分组分组 频数累计频数累计 频数频数 频率频率 0,0.5)4 0.04 0.5,1)8 0.08 1,1.5)15 0.15 1.5,2)22 0.22 2,2.5)25 0.25 2.5,3)14 0.14 3,3.5)6 0.06 3.5,4)4 0.04 4,4.5)2 0.02 合计合计 100 1.00 表22 100位居民月均用水量的 频率分布表00.511.522.53 3.5 4 4.50.500.400.300.200.10频率频率/组距组距月均用水量月均用水量/t注:小长方形的面积组距注:小长方形的面积组距频率频率/组距频率组距频率 各长方形的面积总和等于各长方形的面积总和等于1。00.511.522.533.544.50.500.400.1、求极差、求极差(即一组数据中最大值与最小值的差即一组数据中最大值与最小值的差)知道这组数据的变动范围知道这组数据的变动范围4.3-0.2=4.12、决定组距与组数(将数据分组)、决定组距与组数(将数据分组)3、将数据分组将数据分组(8.2取整取整,分为分为9组组)画频率分布直方图的步骤画频率分布直方图的步骤4、列出、列出频率分布表频率分布表.(学生填写频率学生填写频率/组距一栏组距一栏)5、画出、画出频率分布直方图频率分布直方图。组距组距:指每个小组的两个端点的距离,组距指每个小组的两个端点的距离,组距组数组数:将数据分组,当数据在将数据分组,当数据在100个以内时,个以内时,按数据多少常分按数据多少常分5-12组。组。1、求极差(即一组数据中最大值与最小值的差)2、决定组距与组例例.从规定尺寸为从规定尺寸为25.40mm25.40mm的一堆产品中任取的一堆产品中任取 100100件,测得尺寸如下:件,测得尺寸如下:25.39 25.36 25.34 25.42 25.45 25.38 25.39 25.42 25.4725.35 25.41 25.43 25.44 25.48 25.45 25.43 25.46 25.4025.51 25.45 25.40 25.39 25.41 25.36 25.38 25.31 25.56 25.43 25.40 25.38 25.37 25.44 25.33 25.46 25.40 25.4925.34 25.42 25.50 25.37 25.35 25.32 25.45 25.40 25.2725.43 25.54 25.39 25.45 25.43 25.40 25.43 25.44 25.41 25.53 25.37 25.38 25.24 25.44 25.40 25.36 25.42 25.39 25.46 25.38 25.35 25.31 25.34 25.40 25.36 25.41 25.3225.38 25.42 25.40 25.33 25.37 25.41 25.49 25.35 25.47 25.34 25.30 25.39 25.46 25.29 25.40 25.37 25.33 25.40 25.35 25.41 25.37 25.37 25.47 25.39 25.42 25.47 25.38 25.39样本的频率分布表示形式有:样本的频率分布表示形式有:频率分布表频率分布表和和频率分布直方图频率分布直方图例.从规定尺寸为25.40mm的一堆产品中任取 100件,测一一、计算最大值与最小值的差(也称极差),计算最大值与最小值的差(也称极差),从而知道这组数据的变动范围。从而知道这组数据的变动范围。二、决定组距与组数(将数据分组)二、决定组距与组数(将数据分组)组距:组距:指每个小组的两个端点的距离,指每个小组的两个端点的距离,组距组距=极差极差/组数组数列出频率分布表、画频率分布直方图的方法列出频率分布表、画频率分布直方图的方法极差为:极差为:25.56 25.24=0.32三三.决定分点决定分点 可以令分点比数据多可以令分点比数据多1 1位小数,并且把第位小数,并且把第1 1小组的小组的起点稍微减少一点起点稍微减少一点组数:组数:将数据分组,当数据在将数据分组,当数据在100100个以内时,个以内时,按数据多少分成按数据多少分成5 51212组组 一、计算最大值与最小值的差(也称极差),从而知道这组数据的变 分分 组组个数累计个数累计频频 数数 频频 率率累计频率累计频率25.235,25.265)一一10.010.0125.265,25.295)T20.020.0325.295,25.325)正正50.050.0825.325,25.355)正正正正 T120.120.2025.355,25.385)正正正下正正正下180.180.3825.385,25.415)正正正正正正正正正正250.250.6725.415,25.445)正正正一正正正一160.160.7925.445,25.475)正正下正正下130.130.9225.475,25.505)TT40.040.9625.505,25.535)T20.020.9825.535,25.565)T20.021.00 合计合计1001.00四四.列出频率分布表列出频率分布表 分 组个数累计频 数 频 频率频率/组距组距产品尺寸产品尺寸(mm)五五.画频率分布直方图画频率分布直方图注意:直方图的纵轴表注意:直方图的纵轴表示频率与组距的比值,示频率与组距的比值,8.3频率/组距产品尺寸(mm)五.画频率分布直方图注意:直方图的频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5小长方形的面小长方形的面积积=?频率分布直方图如下:月均用水量/t频率0.100.200.3频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5小长方形的面小长方形的面积总和积总和=?频率分布直方图如下:月均用水量/t频率0.100.200.3频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5月均用水量最月均用水量最多的在那个区多的在那个区间间?频率分布直方图如下:月均用水量/t频率0.100.200.3频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5请大家阅读第请大家阅读第68页页,直方图有直方图有那些优点和缺那些优点和缺点点?频率分布直方图如下:月均用水量/t频率0.100.200.3练练 习习1.有一个容量为有一个容量为50的样本数据的分组的频数如下:的样本数据的分组的频数如下:12.5,15.5)315.5,18.5)818.5,21.5)921.5,24.5)1124.5,27.5)1027.5,30.5)530.5,33.5)4(1)列出样本的频率分布表列出样本的频率分布表;(2)画出频率分布直方图画出频率分布直方图;(3)根据频率分布直方图估计根据频率分布直方图估计,数据落在数据落在15.5,24.5)的)的百分比是多少百分比是多少?练 习1.有一个容量为50的样本数据的分组的频数如下:12某校对初二年级60名15岁女学生的身高做了测量,结果如下(单位:cm):142 154 159 175 159 156 149 162 166158 159 156 166 160 164 155 157 146147 161 158 158 153 158 154 158 163154 153 153 162 162 151 154 165 164152 151 146 151 158 160 165 158 163163 162 161 154 165 162 162 159 157159 149 164 149 159 153列出频率分布表,绘出频率分布直方图。例题某校对初二年级60名15岁女学生的身高做例题已知一组数据如下:2521 23 25 27 29 25 28 30 292624 25 27 26 22 24 25 26 28填写下面的频率分布表,绘出频率分布直方图。组别频数累计频数频率20.522.522.524.524.526.526.528.528.530.5 合计练习一已知一组数据如下:组别频数累计频数频率20.522.522红星养猪场400头猪的质量频率分布直方图如图,其中数据不在分点上。按图回答:1)质量在 组里的猪最多,有 头。2)质量在60.5kg以上的猪有 头。3)这400头猪的总质量约 kg,平均质量约是 kg。4000.4=1604000.4=16055.555.560.560.5400(0.2+0.08+0.02)=120400(0.2+0.08+0.02)=120组组平均值每组头数每组总质量45.550.54840192050.555.55380424055.560.558160928060.565.56380504065.570.56832217670.575.5738584总质量23240232402324023240400=58.123240400=58.1练习二红星养猪场400头猪的质量频率分布直方图如图,其中数据不在分想一想想一想频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5连接频率分布直方图中连接频率分布直方图中各小长方形上端的中点各小长方形上端的中点,得到得到频率分布折线图频率分布折线图频率分布直方图如下:月均用水量/t频率0.100.200.30.511.522.53 3.5 44.50.20频率频率/组距组距0月均用水量月均用水量/t0.500.400.300.10图图2.22 100位居民的月均用水量的频率分位居民的月均用水量的频率分布折线图布折线图0.511.522.533.544.50.20频率/组距0月利利用用样样本本频频率率分分布布对对总总体体分分布布进进行行相相应应估估计计(3)当样本容量无限增大,组距无限缩小,)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑那么频率分布直方图就会无限接近于一条光滑曲线曲线总体密度曲线总体密度曲线。(2)样本容量越大,这种估计越精确。)样本容量越大,这种估计越精确。(1)上上例例的的样样本本容容量量为为100,如如果果增增至至1000,其其频频率率分分布布直直方方图图的的情情况况会会有有什什么么变变化化?假假如如增增至至10000呢?呢?利用样本频率分布对总体分布进行相应估计(3)当样本容量无限增月均用水量月均用水量/t频率频率组距组距0ab总体密度曲线能够很好的反映总体在各个范围总体密度曲线能够很好的反映总体在各个范围内的百分比,能构提供更准确的信息。尽管有些内的百分比,能构提供更准确的信息。尽管有些总体密度曲线是客观存在的,但是很难象函数图总体密度曲线是客观存在的,但是很难象函数图象那样准确的地画出来。象那样准确的地画出来。?思考一下图中阴影部分的面积表示什么?思考一下图中阴影部分的面积表示什么?月均用水量/t频率0ab总体密度曲线能够很好的反映总体在各 用用样样本本分分布布直直方方图图去去估估计计相相应应的的总总体体分分布布时时,一一般般样样本本容容量量越越大大,频频率率分分布布直直方方图图就就会会无无限限接接近近总总体体密密度度曲曲线线,就就越越精精确确地地反反映映了了总总体体的的分分布布规规律律,即即越越精精确确地地反反映映了了总总体体在在各各个个范范围围内内取取值值百分比。百分比。总总体体密密度度曲曲线线反反映映了了总总体体在在各各个个范范围围内内取取值值的的百百分分比比,精精确确地地反反映映了了总总体体的的分分布布规规律律。是是研研究究总总体分布的工具体分布的工具.总体密度曲线总体密度曲线 用样本分布直方图去估计相应的总体分布时,一般样茎叶图茎叶图某赛季甲、乙两名篮球运动员每场比赛得分的原某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:始记录如下:(1)甲运动员得分:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(1)乙运动员得分乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39茎叶图某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:茎叶图茎叶图甲甲乙乙0123452 55 41 6 1 6 7 94 9 084 6 336 83 8 9 1注:中间的数字表示得分的十注:中间的数字表示得分的十位数字。位数字。旁边的数字分别表示两旁边的数字分别表示两个人得分的个位数个人得分的个位数茎叶图甲乙08注:中间的数字表示得分的十位数字。小结小结 图形图形 优点优点 缺点缺点频率分布频率分布 1)易表示大量数据)易表示大量数据 丢失一些丢失一些直方图直方图 2)直观地表明分布地)直观地表明分布地 情况情况 信息信息 1)无信息损失)无信息损失 只能处理样本只能处理样本 茎页图茎页图 2)随时记录方便记录和表示)随时记录方便记录和表示 容量较小数据容量较小数据 再见!
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!