资源描述
第三节用样本估计总体第三节用样本估计总体1作频率分布直方图的步骤作频率分布直方图的步骤(1)求极差求极差(即一组数据中即一组数据中_与与_的差的差)(2)决定决定_与组数与组数(3)将数据分组将数据分组(4)列频率分布表列频率分布表(5)画频率画频率_最大值最大值最小值最小值组距组距分布直方图分布直方图2频率分布折线图和总体密度曲线频率分布折线图和总体密度曲线(1)频率分布折线图:连结频率分布直方图中各小长方形上端频率分布折线图:连结频率分布直方图中各小长方形上端的的_,就得到频率分布折线图,就得到频率分布折线图(2)总体密度曲线:随着总体密度曲线:随着_的增加,作图时所的增加,作图时所分的组数增加,分的组数增加,_减小,相应的频率折线图会越减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线曲线中点中点样本容量样本容量组距组距3茎叶图茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数的一列数,叶是从茎的旁边生长出来的数4标准差和方差标准差和方差(1)标准差是样本数据到平均数的一种标准差是样本数据到平均数的一种_平均距离平均距离1在一组数据中,众数,中位数,平均数多指什么?在一组数据中,众数,中位数,平均数多指什么?2如何利用频率分布直方图估计样本的中位数、平均数、众数?如何利用频率分布直方图估计样本的中位数、平均数、众数?【提示【提示】(1)中位数:在频率分布直方图中,中位数左边和中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值右边的直方图的面积应该相等,由此可以估计中位数的值(2)平均数:平均数的估计值等于频率分布直方图中每个小矩平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和形的面积乘以小矩形底边中点的横坐标之和(3)众数:在频率分布直方图中,众数是最高的矩形的中点的众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标横坐标 【答案【答案】A【答案【答案】B3(2011江苏高考江苏高考)某老师从星期一到星期五收到的信件数分别某老师从星期一到星期五收到的信件数分别为为10,6,8,5,6,则该组数据的方差,则该组数据的方差s2_.【答案【答案】3.24(2012汕尾调研汕尾调研)在如图在如图932所示的茎叶图中,甲、乙两所示的茎叶图中,甲、乙两组数据的中位数分别是组数据的中位数分别是_,_.【解析【解析】甲组数据为:甲组数据为:28,31,39,42,45,55,57,58,66,中位数为,中位数为45.乙组数据为:乙组数据为:29,34,35,42,46,48,53,55,67,中位数为,中位数为46.【答案【答案】4546 某市某市2012年年4月月1日日4月月30日对空气污染指数的监测数据日对空气污染指数的监测数据如下如下(主要污染物为可吸入颗粒物主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表;完成频率分布表;(2)作出频率分布直方图;作出频率分布直方图;频率分布直方图的绘制及应用频率分布直方图的绘制及应用 (3)根据国家标准,污染指数在根据国家标准,污染指数在050之间时,空气质量为优;之间时,空气质量为优;在在51100之间时,为良;在之间时,为良;在101150之间时,为轻微污染;之间时,为轻微污染;在在151200之间时,为轻度污染之间时,为轻度污染请你依据所给数据和上述标准,对该市的空气质量给出一个简请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价短评价【思路点拨【思路点拨】决定组距和组数,将数据分组,列出频率分布决定组距和组数,将数据分组,列出频率分布表作出频率分布直方图,根据分布表或直方图分析空气质量的表作出频率分布直方图,根据分布表或直方图分析空气质量的优、良、轻微污染的频率,对空气质量做出评价优、良、轻微污染的频率,对空气质量做出评价【尝试解答【尝试解答】(1)频率分布表:频率分布表:(2)频率分布直方图:频率分布直方图: (2011浙江高考浙江高考)某中学为了解学生数学课程的学习情况,在某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取名学生中随机抽取200名,并统计这名,并统计这200名学生的某次数学名学生的某次数学考试成绩,得到了样本的频率分布直方图考试成绩,得到了样本的频率分布直方图(如图如图933)根根据频率分布直方图推测,这据频率分布直方图推测,这3 000名学生在该次数学考试中成名学生在该次数学考试中成绩小于绩小于60分的学生数是分的学生数是_【解析【解析】由样本频率分布直方图知,数学考试中成绩小于由样本频率分布直方图知,数学考试中成绩小于60分的频率为分的频率为(0.0020.0060.012)100.2,估计总体中成绩小于估计总体中成绩小于60分的概率约为分的概率约为0.2,故所求成绩小于故所求成绩小于60分的学生数约为分的学生数约为3 0000.2600人人【答案【答案】600 某班甲、乙两学生的高考备考成绩如下:某班甲、乙两学生的高考备考成绩如下:甲:甲:512 554 528 549 536 556 534 541 522 538乙:乙:515 558 521 543 532 559 536 548 527 531(1)用茎叶图表示两学生的成绩;用茎叶图表示两学生的成绩;(2)分别求两学生成绩的中位数和平均分分别求两学生成绩的中位数和平均分【思路点拨【思路点拨】解答本题可以百位,十位数字为茎,个位数字解答本题可以百位,十位数字为茎,个位数字为叶作茎叶图,再利用茎叶图求中位数及平均分为叶作茎叶图,再利用茎叶图求中位数及平均分茎叶图的绘制及应用茎叶图的绘制及应用 【尝试解答【尝试解答】(1)两学生成绩的茎叶图如图所示:两学生成绩的茎叶图如图所示:(2)将甲、乙两学生的成绩从小到大排列为:将甲、乙两学生的成绩从小到大排列为:甲:甲:512 522 528 534 536 538 541 549 554 556乙:乙:515 521 527 531 532 536 543 548 558 5591作样本的茎叶图时先要根据数据特点确定茎、叶,再作样本的茎叶图时先要根据数据特点确定茎、叶,再作茎叶图作茎叶图2作样本的茎叶图一般对称作图,数据排列由内向外,作样本的茎叶图一般对称作图,数据排列由内向外,从小到大排列,便于数据的处理从小到大排列,便于数据的处理3当样本数据较少时,用茎叶图表示数据的效果较好,当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,这对数据的记它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都非常方便录和表示都非常方便 (2011北京高考北京高考)以下茎叶图以下茎叶图934记录了甲、乙两组各四名记录了甲、乙两组各四名同学的植树棵数,乙组记录中有一个数据模糊,无法确认,在同学的植树棵数,乙组记录中有一个数据模糊,无法确认,在图中以图中以X表示表示(1)如果如果X8,求乙组同学植树棵数的平均数和方差;,求乙组同学植树棵数的平均数和方差;(2)如果如果X9,分别从甲、乙两组中随机选取一名同学,求这,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵数为两名同学的植树总棵数为19的概率的概率(2011辽宁高考辽宁高考)某农场计划种植某种新作物,为此对这种某农场计划种植某种新作物,为此对这种作物的两个品种作物的两个品种(分别称为品种甲和品种乙分别称为品种甲和品种乙)进行田间试验选取进行田间试验选取两大块地,每大块地分成两大块地,每大块地分成n小块地,在总共小块地,在总共2n小块地中,随机选小块地中,随机选n小块地种植品种甲,另外小块地种植品种甲,另外n小块地种植品种乙小块地种植品种乙(1)假设假设n2,求第一大块地都种植品种甲的概率;,求第一大块地都种植品种甲的概率;(2)试验时每大块地分成试验时每大块地分成8小块,即小块,即n8,试验结束后得到品种甲,试验结束后得到品种甲和品种乙在各小块地上的每公顷产量和品种乙在各小块地上的每公顷产量(单位:单位:kg/hm2)如下表:如下表:从样本的数字特征估计总体的数字特征从样本的数字特征估计总体的数字特征 品种甲品种甲403397390404388400412406品种乙品种乙419403412418408423400413分别求品种甲和品种乙的每公顷产量的样本平均数和样本方差;分别求品种甲和品种乙的每公顷产量的样本平均数和样本方差;根据试验结果,你认为应该种植哪一品种?根据试验结果,你认为应该种植哪一品种?【思路点拨【思路点拨】(1)当当n2时,列举出时,列举出4小块地的所有种植情况,小块地的所有种植情况,求第一大块地都种植甲的概率;求第一大块地都种植甲的概率;(2)利用公式求出品种甲和乙的平均数和方差,分析平均数和利用公式求出品种甲和乙的平均数和方差,分析平均数和方差的大小关系,作出评价和选择方差的大小关系,作出评价和选择1平均数和方差都是重要的数字特征,是对总体一种简平均数和方差都是重要的数字特征,是对总体一种简明的阐述,一般可以通过比较甲、乙两组样本数据的平均数和明的阐述,一般可以通过比较甲、乙两组样本数据的平均数和方差的差异,对甲、乙两品种可以做出评价或选择方差的差异,对甲、乙两品种可以做出评价或选择2样本平均数反映了数据的中心,是平均水平,而样本样本平均数反映了数据的中心,是平均水平,而样本方差和标准差反映的是数据的稳定程度,进行均值与方差的计方差和标准差反映的是数据的稳定程度,进行均值与方差的计算,关键是正确运用公式算,关键是正确运用公式为备战世界杯预选赛,我国男足甲、乙两名运动为备战世界杯预选赛,我国男足甲、乙两名运动员参加了某项体能训练,近期的五次测试成绩得分情况如图员参加了某项体能训练,近期的五次测试成绩得分情况如图935.(1)分别求出两人得分的平均数与方差;分别求出两人得分的平均数与方差;(2)根据图和根据图和(1)中算得的结果,对两人的训练成绩作出评价中算得的结果,对两人的训练成绩作出评价从近两年高考看,用样本估计总体能较好地考查数学应从近两年高考看,用样本估计总体能较好地考查数学应用意识,是高考的热点之一,主要考查频率分布直方图、茎叶用意识,是高考的热点之一,主要考查频率分布直方图、茎叶图、用样本的数字特征估计总体数字特征,并出现统计与概率图、用样本的数字特征估计总体数字特征,并出现统计与概率相结合的命题趋向,应引起足够重视相结合的命题趋向,应引起足够重视规范解答之十九用样本估计总体的实际应用规范解答之十九用样本估计总体的实际应用 (12分分)(2011湖南高考湖南高考)某河流上的一座水力发电站,每某河流上的一座水力发电站,每年六月份的发电量年六月份的发电量Y(单位:万千瓦时单位:万千瓦时)与该河上游在六月份的与该河上游在六月份的降雨量降雨量X(单位:毫米单位:毫米)有关据统计,当有关据统计,当X70时,时,Y460;X每 增 加每 增 加 1 0 , Y 增 加增 加 5 . 已 知 近已 知 近 2 0 年年 X 的 值 为 :的 值 为 :140,110,160,70,200,160,140,160,220,200,110,160,160,200,140,110,160,220,140,160.(1)完成如下的频率分布表:完成如下的频率分布表:近近20年六月份降雨量频率分布表年六月份降雨量频率分布表(2)假定今年六月份的降雨量与近假定今年六月份的降雨量与近20年六月份降雨量的分布规年六月份降雨量的分布规律相同,并将频率视为概率,求今年六月份该水力发电站的发律相同,并将频率视为概率,求今年六月份该水力发电站的发电量低于电量低于490(万千瓦时万千瓦时)或超过或超过530(万千瓦时万千瓦时)的概率的概率【规范解答【规范解答】(1)在所给数据中,降雨量为在所给数据中,降雨量为110毫米的有毫米的有3个,个,为为160毫米的有毫米的有7个,为个,为200毫米的有毫米的有3个故近个故近20年六月份降雨年六月份降雨量频率分布表为量频率分布表为 .4分分【解题程序【解题程序】第一步:处理数据,完成频率分布表第一步:处理数据,完成频率分布表第二步:建立降雨量第二步:建立降雨量X与发电量与发电量Y的函数模型的函数模型第三步:求出第三步:求出Y490或或Y530的概率的概率易错提示:易错提示:(1)不能准确表示变量不能准确表示变量X与变量与变量Y的关系的关系(2)把求把求“Y490或或Y530”的概率转化为变量的概率转化为变量“X的范围的范围”时出错或不会转化时出错或不会转化防范措施:防范措施:(1)准确理解题意,根据题意准确表示准确理解题意,根据题意准确表示X与与Y的的关系关系(2)抓住解决问题的关键,求解第抓住解决问题的关键,求解第(2)问的关键是把问的关键是把“Y的的范围范围”转化为转化为“X的范围的范围”,要充分利用,要充分利用X与与Y的关系的关系1(2012宁波模拟宁波模拟)从某小学随机抽取从某小学随机抽取100名同学,将他们的身名同学,将他们的身高高(单位:厘米单位:厘米)数据绘制成频率分布直方图数据绘制成频率分布直方图(如图如图936)由由图中数据可知图中数据可知a_,若要从身高在,若要从身高在120,130),130,140),140,150三组内的学生中,用分层抽样的方法选取三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在人参加一项活动,则从身高在140,150内的学生中选取的人内的学生中选取的人数应为数应为_【答案【答案】0.03032(2011课标全国卷课标全国卷)某种产品的质量以其质量指标值衡量,质某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于量指标值越大表明质量越好,且质量指标值大于或等于102的的产品为优质品现用两种新配方产品为优质品现用两种新配方(分别称为分别称为A配方和配方和B配方配方)做试做试验,各生产了验,各生产了100件这种产品,并测量了每件产品的质量指标件这种产品,并测量了每件产品的质量指标值,得到下面试验结果:值,得到下面试验结果:A配方的频数分布表配方的频数分布表指标值指标值分组分组90,94)94,98)98,102)102,106)106,110)频数频数82042228B配方的频数分布表配方的频数分布表指标值指标值分组分组90,94)94,98)98,102)102,106) 106,110)频数频数412423210
展开阅读全文