用样本的数字特估计总体的数字特征课件

上传人:1ta3****9ta1 文档编号:252307792 上传时间:2024-11-14 格式:PPT 页数:33 大小:512.47KB
返回 下载 相关 举报
用样本的数字特估计总体的数字特征课件_第1页
第1页 / 共33页
用样本的数字特估计总体的数字特征课件_第2页
第2页 / 共33页
用样本的数字特估计总体的数字特征课件_第3页
第3页 / 共33页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,(2),(2),1,1、求极差(即一组数据中最大值与最小值的差),知道这组数据的变动范围4.3-0.2=4.1,2、决定组距与组数(将数据分组),3、将数据分组(8.2取整,分为9组),画频率分布直方图的步骤,4、列出,频率分布表.(填写频率/组距一栏),5、画出,频率分布直方图,。,组距,:,指每个小组的两个端点的距离,组距,组数,:,将数据分组,当数据在100个以内时,,按数据多少常分5-12组。,1、求极差(即一组数据中最大值与最小值的差)2、决定组距与组,2,频率分布直方图如下,:,月均用水量/t,频率,组距,0.10,0.20,0.30,0.40,0.50,0.5,1,1.5,2,2.5,3,3.5,4,4.5,小长方形的面积=该组频率,频率分布直方图如下:月均用水量/t频率0.100.200.3,3,频率分布直方图如下,:,月均用水量/t,频率,组距,0.10,0.20,0.30,0.40,0.50,0.5,1,1.5,2,2.5,3,3.5,4,4.5,连接频率分布直方图中各小长方形上端的中点,得到,频率分布折线图,频率分布直方图如下:月均用水量/t频率0.100.200.3,4,利用样本频分布对总体分布进行相应估计,(3)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,总体密度曲线,。,(2)样本容量越大,这种估计越精确。,(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?,利用样本频分布对总体分布进行相应估计(3)当样本容量无限增大,5,总体密度曲线,频率,组距,月均用水量/t,a,b,(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。,总体密度曲线频率月均用水量/tab (图中阴影部分,6,用样本分布直方图去估计相应的总体分布时,一般样本容量越大,,频率分布直方图,就会无限接近,总体密度曲线,,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。,总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.,总体密度曲线,用样本分布直方图去估计相应的总体分布时,一般样,7,茎叶图,某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:,(1),甲运动员得分:,13,51,23,8,26,38,16,33,14,28,39,(2),乙运动员得分,:49,24,12,31,50,31,44,36,15,37,25,36,39,茎叶图某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:,8,茎叶图,甲,乙,0,1,2,3,4,5,2 5,5 4,1 6 1 6 7 9,4 9,0,8,4 6 3,6 8,3 8 9,1,茎叶图甲乙08,9,茎叶图,甲,乙,0,1,2,3,4,5,5 2,5 4,9 7 6 6 1 1,9 4,0,8,3 4 6,6 8,3 8 9,1,茎叶图甲乙08,10,例2:在同等条件下,对30辆同一型号的汽车进行耗油1升所走路程的试验,得到如下数据(单位:km):,14.1 12.3 13.7 14.0 12.8 12.9 13.1,13.6 14.4 13.8 12.6 13.8 12.6 13.2,13.3 14.2 13.9 12.7 13.0 13.2 13.5,13.6 13.4 13.6 12.1 12.5 13.1 13.5 13.2 13.4,以前两位数为茎画出上面数据的茎叶图(只有单侧有数据),并找出中位数.,例2:在同等条件下,对30辆同一型号的汽车进行耗油1升所走路,11,解:茎叶图如下,12.1 3 5 6 6 7 8 9,13.0 1 1 2 2 2 3 4 4 5 5 6 6,6 7 8 8 9,14.0 1 2 4,中位数为13.35,解:茎叶图如下,12,2.2.2用样本的数字特征,估计,总体的数字特征,2.2.2用样本的数字特征估计总体的数字特征,13,众数、中位数、平均数的概念,众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.,一、复习,众数、中位数、平均数的概念 众数、中位数、平均数,14,一、众数、中位数、平均数的概念,中位数,:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,众数,:在一组数据中,出现次数最多的数据叫做这组数据的众数,平均数,:一组数据的算术平均数,即,x=,一、众数、中位数、平均数的概念 中位数:将一组数据,15,二、,练习,:在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:,成绩(单位:米),150,160,165,170,175,180,185,190,人数,2,3,2,3,4,1,1,1,分别求这些运动员成绩的众数,中位数与平均数,二、练习:在一次中学生田径运动会上,参加男子,16,解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75,上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;,这组数据的平均数是,答:17名运动员成绩的众数、中位数、平均数依次是1.75(米)、1.70(米)、1.69(米).,解:在17个数据中,1.75出现了4次,出现的次数最多,即,17,二、新课,二、新课,18,二、众数、中位数、平均数与频率分 布直方图的关系,1、,众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。,例如,在上一节调查的100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t.如图所示:,二、众数、中位数、平均数与频率分 布直方图的关系,19,频率,组距,0.1,0.2,0.3,0.4,0.5,O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t),频率0.10.20.30.40.5O 0.5,20,2、,在样本中,有50的个体小于或等于中位数,也有50的个体大于或等于中位数,,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。下图中虚线代表居民月均用水量的中位数的估计值,此数据值为2.02t.,2、在样本中,有50的个体小于或等于中位数,也有5,21,频率,组距,0.1,0.2,0.3,0.4,0.5,O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t),频率0.10.20.30.40.5O 0.5,22,说明:,2.02这个中位数的估计值,与样本的中位数值2.0不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原始的数据内容,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致.,说明:,23,3、,平均数是频率分布直方图的“重心”.,是直方图的平衡点,.n 个样本数据的平均数由公式:,X=,给出.下图显示了居民月均用水量的平均数:x=2.02,3、平均数是频率分布直方图的“重心”.X=给出.下图,24,频率,组距,0.1,0.2,0.3,0.4,0.5,O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t),频率0.10.20.30.40.5O 0.5,25,三、三种数字特征的优缺点,1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征.如上例中众数是2.25t,它告诉我们,月均用水量为2.25t的居民数比月均用水量为其它数值的居民数多,但它并没有告诉我们多多少.,三、三种数字特征的优缺点 1、众数体现了样本数据的,26,2、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量为10t,那么它所占频率为0.01,几乎不影响中位数,但显然这一极端值是不能忽视的。,2、中位数是样本数据所占频率的等分线,它不受少数几个极端值,27,3、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因如此,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。,3、由于平均数与每一个样本的数据有关,所以任何一个样本数据的,28,四、众数、中位数、平均数的简单应用,例1:某工厂人员及工资构成如下:,人员,经理,管理人员,高级技工,工人,学徒,合计,周工资,2200,250,220,200,100,人数,1,6,5,10,1,23,合计,2200,1500,1100,2000,100,6900,(1)指出这个问题中周工资的众数、中位数、平均数。,(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?,四、众数、中位数、平均数的简单应用例1:某工厂人员及工资构成,29,分析,:众数为200,中位数为220,平均数为300。,因平均数为300,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。,分析:众数为200,中位数为220,平均数为300。,30,想一想:,平均数受极端值影响较大,结合实际情况,想一想,能用什么办法解决这个问题呢?,去掉一个最大值,去掉一个最小值,想一想:去掉一个最大值,去掉一个最小值,31,四、阅读课本73页的思考,举例分析对极端值不敏感的利与弊。,四、阅读课本73页的思考,举例分析对极端值不敏感的利与弊。,32,五、练习,应该采用平均数来表示每一个国家项目的平均金额,因为它能反映所有项目的信息。但平均数会受到极端数据2200万元的影响,所以大多数项目投资金额都和平均数相差比较大。,五、练习 应该采用平均数来表示每一个国家项目的,33,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!