新版人教A版理科高考数学一轮细讲精练【第九篇】统计与统计案例

上传人:痛*** 文档编号:64484114 上传时间:2022-03-21 格式:DOC 页数:56 大小:2.41MB
返回 下载 相关 举报
新版人教A版理科高考数学一轮细讲精练【第九篇】统计与统计案例_第1页
第1页 / 共56页
新版人教A版理科高考数学一轮细讲精练【第九篇】统计与统计案例_第2页
第2页 / 共56页
新版人教A版理科高考数学一轮细讲精练【第九篇】统计与统计案例_第3页
第3页 / 共56页
点击查看更多>>
资源描述
1 1第九篇统计与统计案例A第1讲随机抽样最新考纲1理解随机抽样的必要性和重要性2会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.知 识 梳 理1简单随机抽样(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样(2)最常用的简单随机抽样的方法:抽签法和随机数法2系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本(1)编号:先将总体的N个个体编号;(2)分段:确定分段间隔k,对编号进行分段,当(n是样本容量)是整数时,取k;(3)确定首个个体:在第1段用简单随机抽样确定第一个个体编号l(lk);(4)获取样本:按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(lk),再加k得到第3个个体编号(l2k),依次进行下去,直到获取整个样本3分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样辨 析 感 悟1对简单随机抽样的认识(1)(教材思考问题改编)在简单随机抽样中,某一个个体被抽到的可能性与第几次抽取有关,第一次抽到的可能性最大()(2)从100件玩具中随机拿出一件,放回后再拿出一件,连续拿5次,是简单随机抽样()2对系统抽样的理解(3)系统抽样适用于元素个数较多且分布均衡的总体()(4)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平()3对分层抽样的理解(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关()(6)(20xx郑州模拟改编)某校即将召开学生代表大会,现从高一、高二、高三共抽取60名代表,则可用分层抽样方法抽取()(7)(20xx湖南卷改编)某学校有男、女学生各500名为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是分层抽样()感悟提升两点提醒一是简单随机抽样(抽签法和随机数法)都是从总体中逐个地进行抽取,都是不放回抽样,如(2)二是三种抽样方法在抽样过程中每个个体被抽到的可能性都相等,如(1)、(4)、(5).考点一简单随机抽样【例1】 下列抽取样本的方式是否属于简单随机抽样?(1)从无限多个个体中抽取100个个体作为样本(2)盒子里共有80个零件,从中选出5个零件进行质量检验在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里(3)从20件玩具中一次性抽取3件进行质量检验(4)某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛解(1)不是简单随机抽样由于被抽取的样本总体的个体数是无限的,而不是有限的(2)不是简单随机抽样由于它是放回抽样(3)不是简单随机抽样因为这是“一次性”抽取,而不是“逐个”抽取(4)不是简单随机抽样因为指定个子最高的5名同学是56名中特指的,不存在随机性,不是等可能抽样规律方法 (1)简单随机抽样需满足;抽取的个体数有限;逐个抽取;是不放回抽取;是等可能抽取(2)简单随机抽样常有抽签法(适用总体中个体数较少的情况)、随机数表法(适用于个体数较多的情况)【训练1】 下列抽样试验中,适合用抽签法的有()A从某厂生产的5 000件产品中抽取600件进行质量检验B从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验C从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验D从某厂生产的5 000件产品中抽取10件进行质量检验答案B考点二系统抽样【例2】 采用系统抽样方法从960人中抽取32人做问卷调查为此将他们随机编号为1,2,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间1,450的人做问卷A,编号落入区间451,750的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为()A7 B9 C10 D15解析从960人中用系统抽样方法抽取32人,则每30人抽取一人,因为第一组抽到的号码为9,则第二组抽到的号码为39,第n组抽到的号码为an930(n1)30n21,由45130n21750,得n,所以n16,17,25,共有2516110人,选C.答案C规律方法 (1)系统抽样适用的条件是总体容量较大,样本容量也较大(2)使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体,从而确定分段间隔(3)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定【训练2】 (1)从编号为150的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A5,10,15,20,25 B3,13,23,33,43C1,2,3,4,5 D2,4,6,16,32(2)(20xx临沂模拟)某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号、29号、42号同学在样本中,那么样本中还有一个同学的学号是()A10 B11 C12 D16解析(1)间隔距离为10,故可能编号是3,13,23,33,43.(2)因为29号、42号的号码差为13,所以31316,即另外一个同学的学号是16.答案(1)B(2)D考点三分层抽样【例3】 (20xx兰州模拟)某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人)篮球组书画组乐器组高一4530a高二151020学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样的方法,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为_解析因为,所以解得a30.答案30规律方法 进行分层抽样的相关计算时,常利用以下关系式巧解:(1);(2)总体中某两层的个体数之比样本中这两层抽取的个体数之比【训练3】 (1)(20xx江苏卷)某学校高一、高二、高三年级的学生人数之比为334,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取_名学生(2)某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为_解析(1)高二年级学生人数占总数的.样本容量为50,则高二年级抽取:5015(名)学生(2)由题意知,青年职工人数中年职工人数老年职工人数350250150753.由样本中青年职工为7人得样本容量为15.答案(1)15(2)15 1三种抽样方法的联系三种抽样方法的共同点都是等概率抽样,即抽样过程中每个个体被抽到的概率相等,体现了这三种抽样方法的客观性和公平性若样本容量为n,总体的个体数为N,则用这三种方法抽样时,每个个体被抽到的概率都是.2各种抽样方法的特点(1)简单随机抽样的特点:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小;用简单随机抽样法抽取的个体带有随机性,个体间无固定间距(2)系统抽样的特点:适用于元素个数很多且均衡的总体;各个个体被抽到的机会均等;总体分组后,在起始部分抽样时,采用简单随机抽样(3)分层抽样的特点:适用于总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样创新突破8抽样方法与概率的交汇问题【典例】 (20xx天津卷)某地区有小学21所,中学14所,大学7所,现采用分层抽样的方法从这些学校中抽取6所学校对学生进行视力调查(1)求应从小学、中学、大学中分别抽取的学校数目;(2)若从抽取的6所学校中随机抽取2所学校做进一步数据分析,列出所有可能的抽取结果;求抽取的2所学校均为小学的概率突破1:确定分层抽样中的每层所占的比例突破2:用列举法列出所有可能抽取的结果突破3:利用古典概型的计算公式计算解(1)由分层抽样的定义知,从小学中抽取的学校数目为63;从中学中抽取的学校数目为62;从大学中抽取的学校数目为61.则从小学、中学、大学分别抽取的学校数目为3,2,1.(2)在抽取到的6所学校中,3所小学分别记为A1,A2,A3,2所中学分别记为A4,A5,大学记为A6,则抽取2所学校的所有可能结果为(A1,A2),(A1,A3),(A1,A4),(A1,A5),(A1,A6),(A2,A3),(A2,A4),(A2,A5),(A2,A6),(A3,A4),(A3,A5),(A3,A6),(A4,A5),(A4,A6),(A5,A6),共15种从6所学校中抽取的2所学校均为小学(记为事件B)的所有可能结果为(A1,A2),(A1,A3),(A2,A3),共3种所以P(B).反思感悟 分层抽样与概率结合的题目多与实际问题紧密联系,计算量和阅读量都比较大,且一般会有图表,求解时容易造成失误,平时需注意多训练此类型的题目【自主体验】(20xx潮州模拟)某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表:学历35岁以下3550岁50岁以上本科803020研究生x20y(1)用分层抽样的方法在3550岁年龄段的专业技术人员中抽取一个容量为5的样本,将该样本看成一个总体,从中任取2人,求至少有1人学历为研究生的概率;(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人,其中35岁以下48人,50岁以上10人,再从这N个人中随机抽取出1人,此人的年龄为50岁以上的概率为,求x,y的值解(1)用分层抽样的方法在3550岁中抽取一个容量为5的样本,设抽取学历为本科的人数为m,解得m3.抽取的样本中有研究生2人,本科生3人,分别记作S1,S2;B1,B2,B3.从中任取2人的所有等可能基本事件共有10个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2),(B1,B2),(B1,B3),(B2,B3),其中至少有1人的学历为研究生的基本事件有7个:(S1,B1),(S1,B2),(S1,B3),(S2,B1)(S2,B2),(S2,B3),(S1,S2)从中任取2人,至少有1人学历为研究生的概率为.(2)由题意,得,解得N78.3550岁中被抽取的人数为78481020,解得x40,y5.即x,y的值分别为40,5.基础巩固题组(建议用时:40分钟)一、选择题1某中学进行了该学年度期末统一考试,该校为了了解高一年级1 000名学生的考试成绩,从中随机抽取了100名学生的成绩单,就这个问题来说,下面说法正确的是()A1 000名学生是总体B每个学生是个体C1 000名学生的成绩是一个个体D样本的容量是100解析1 000名学生的成绩是总体,其容量是1 000,100名学生的成绩组成样本,其容量是100.答案D2(20xx新课标全国卷)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大在下面的抽样方法中,最合理的抽样方法是()A简单随机抽样 B按性别分层抽样C按学段分层抽样 D系统抽样解析因为男女生视力情况差异不大,而学段的视力情况有较大差异,所以应按学段分层抽样,故选C.答案C3(20xx东北三校联考)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为357,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n()A54 B90 C45 D126解析依题意有n18,由此解得n90,即样本容量为90.答案B4(20xx江西卷)总体由编号为01,02,19,20的20个个体组成利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为().7816657208026314070243699728019832049234493582003623486969387481A08 B07 C02 D01解析由题意知前5个个体的编号为08,02,14,07,01.答案D5(20xx石家庄模拟)某学校高三年级一班共有60名学生,现采用系统抽样的方法从中抽取6名学生做“早餐与健康”的调查,为此将学生编号为1,2,60.选取的这6名学生的编号可能是()A1,2,3,4,5,6 B6,16,26,36,46,56C1,2,4,8,16,32 D3,9,13,27,36,54解析系统抽样是等间隔抽样答案B二、填空题6(20xx成都模拟)某课题组进行城市空气质量调查,按地域把24个城市分成甲、乙、丙三组,对应城市数分别为4,12,8.若用分层抽样抽取6个城市,则甲组中应抽取的城市数为_解析甲组中应抽取的城市数为41.答案17某校高级职称教师26人,中级职称教师104人,其他教师若干人为了了解该校教师的工资收入情况,按分层抽样从该校的所有教师中抽取56人进行调查,已知从其他教师中共抽取了16人,则该校共有教师_人解析设其他教师为x人,则,解得x52,x26104182(人)答案1828(20xx青岛模拟)某班级有50名学生,现要采取系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号150号,并分组,第一组15号,第二组610号,第十组4650号,若在第三组中抽得号码为12的学生,则在第八组中抽得号码为_的学生解析因为12522,即第三组抽出的是第二个同学,所以每一组都相应抽出第二个同学,所以第8组中抽出的号码为57237号答案37三、解答题9某初级中学共有学生2 000名,各年级男、女生人数如下表:初一年级初二年级初三年级女生373xy男生377370z已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19.(1)求x的值;(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名?解(1)0.19.x380.(2)初三年级人数为yz2 000(373377380370)500,现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取的人数为:50012名10某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施抽取解用分层抽样方法抽取具体实施抽取如下:(1)2010015,2,14,4,从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人(2)因副处级以上干部与工人的人数较少,他们分别按110编号与120编号,然后采用抽签法分别抽取2人和4人;对一般干部70人采用00,01,02,69编号,然后用随机数表法抽取14人(3)将2人,4人,14人的编号汇合在一起就取得了容量为20的样本能力提升题组(建议用时:25分钟)一、选择题1某工厂在12月份共生产了3 600双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为a,b,c,且a,b,c构成等差数列,则第二车间生产的产品数为()A800 B1 000 C1 200 D1 500解析因为a,b,c成等差数列,所以2bac,即第二车间抽取的产品数占抽样产品总数的三分之一,根据分层抽样的性质可知,第二车间生产的产品数占总数的三分之一,即为1 200双皮靴答案C2将参加夏令营的600名学生编号为:001,002,600,采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第营区,从301到495在第营区,从496到600在第营区,三个营区被抽中的人数依次为()A26,16,8 B25,17,8C25,16,9 D24,17,9解析由题意知间隔为12,故抽到的号码为12k3(k0,1,49),列出不等式可解得:第营区抽25人,第营区抽17人,第营区抽8人答案B二、填空题3.200名职工年龄分布如图所示,从中随机抽40名职工作样本,采用系统抽样方法,按1200编号为40组,分别为15,610,196200,第5组抽取号码为22,第8组抽取号码为_若采用分层抽样,40岁以下年龄段应抽取_人解析将1200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为223537;由已知条件200名职工中40岁以下的职工人数为20050%100,设在40岁以下年龄段中抽取x人,则,解得x20.答案3720三、解答题4某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:文艺节目新闻节目总计20至40岁401858大于40岁152742总计5545100(1)用分层抽样方法在收看新闻节目的观众中随机抽取5名,大于40岁的观众应该抽取几名?(2)在上述抽取的5名观众中任取2名,求恰有1名观众的年龄为20至40岁的概率解(1)应抽取大于40岁的观众人数为553(名)(2)用分层抽样方法抽取的5名观众中,20至40岁有2名(记为Y1,Y2),大于40岁有3名(记为A1,A2,A3).5名观众中任取2名,共有10种不同取法:Y1Y2,Y1A1,Y1A2,Y1A3,Y2A1,Y2A2,Y2A3,A1A2,A1A3,A2A3.设A表示随机事件“5名观众中任取2名,恰有1名观众年龄为20至40岁”,则A中的基本事件有6种:Y1A1,Y1A2,Y1A3,Y2A1,Y2A2,Y2A3,故所求概率为P(A).第2讲用样本估计总体最新考纲1了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,体会他们各自的特点2理解样本数据标准差的意义和作用,会计算数据标准差3能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释4会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解样本估计总体的思想5会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.知 识 梳 理 知 识 梳 理1频率分布直方图(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征(2)在频率分布直方图中,纵轴表示,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线,它能够更加精细的反映出总体在各个范围内取值的百分比(4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便2用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数众数:在一组数据中,出现次数最多的数据叫做这组数据的众数中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数平均数:样本数据的算术平均数,即(x1x2xn)在频率分布直方图中,中位数左边和右边的直方图的面积相等(2)样本方差、标准差标准差s .其中xn是样本数据的第n项,n是样本容量,是平均数标准差是反映总体波动大小的特征数,样本方差是标准差的平方通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差辨 析 感 悟1对频率分布直方图的认识(1)在频率分布直方图中,小矩形的高表示频率()(2)频率分布直方图中各个长方形的面积之和为1.()2对样本数字特征的认识(3)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势()(4)一组数据的方差越大,说明这组数据的波动越大()(5)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次()(6)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数()(7)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的()(8)如图是某电视台综艺节目举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为85,1.6.()(9)(20xx广州调研改编)10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,19,17,16,14,12,则这一天10名工人生产的零件的中位数是15.()感悟提升1作频率分布直方图的步骤(1)求极差;(2)确定组距和组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图2两个防范一是在频率分布直方图中,小矩形的高表示频率/组距,而不是频率,如(1);二是利用频率分布直方图求众数、中位数和平均数时,应注意三点:最高的小长方形底边中点的横坐标即是众数;中位数左边和右边的小长方形的面积和是相等的;平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.考点一频率分布直方图的应用【例1】 某中学高一女生共有450人,为了了解高一女生的身高情况,随机抽取部分高一女生测量身高,所得数据整理后列出频率分布表如下:组别频数频率145.5149.580.16149.5153.560.12153.5157.5140.28157.5161.5100.20161.5165.580.16165.5169.5mn合计MN(1)求出表中字母m,n,M,N所对应的数值;(2)在给出的直角坐标系中画出频率分布直方图;(3)估计该校高一女生身高在149.5165.5 cm范围内有多少人?审题路线由频率分布表可以计算出m,n,M,N的值作频率分布直方图利用频率分布直方图求值解(1)由题意M50,落在区间165.5169.5内数据频数m50(8614108)4,频率为n0.08,总频率N1.00.(2)频率分布直方图如下图:(3)该所学校高一女生身高在149.5165.5 cm之间的比例为0.120.280.200.160.76,则该校高一女生在此范围内的人数为4500.76342(人)规律方法 解决频率分布直方图的问题,关键在于找出图中数据之间的联系这些数据中,比较明显的有组距、,间接的有频率、小长方形的面积,合理使用这些数据,再结合两个等量关系:小长方形面积组距频率,小长方形面积之和等于1,即频率之和等于1,就可以解决直方图的有关问题【训练1】 (20xx辽宁卷)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:20,40),40,60),60,80),80,100人若低于60分的人数是15人,则该班的学生人数是()A45 B50 C55 D60解析第一、第二小组的频率分别是0.1,0.2,所以低于60分的频率是0.3,设班级人数为m,则0.3,m50.答案B考点二茎叶图的应用【例2】 为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:061.22.71.52.81.82.22.33.23.5252.61.22.71.52.93.03.12.32.4服用B药的20位患者日平均增加的睡眠时间:321.71.90.80.92.41.22.61.31.4160.51.80.62.11.12.51.22.70.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成右面茎叶图,从茎叶图看,哪种药的疗效更好?解(1)设A药观测数据的平均数为A,B药观测数据的平均数为B,则A(0.61.22.71.52.81.82.22.33.23.52.52.61.22.71.52.93.03.12.32.4)2.3.B(3.21.71.90.80.92.41.22.61.31.41.60.51.80.62.11.12.51.22.70.5)1.6.则AB,因此A药的疗效更好(2)由观测结果绘制如下茎叶图:从茎叶图可以看出,A药疗效的试验结果有的叶集中在茎2,3上;B药疗效的试验结果有的叶集中在茎0,1上由上述可看出A药的疗效更好规律方法 茎叶图的绘制需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置的数据【训练2】 (20xx重庆卷)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)甲组乙组909x215y87424已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()A2,5 B5,5 C5,8 D8,8解析由茎叶图及已知得x5,又乙组数据的平均数为16.8,即16.8,解得y8.答案C考点三样本的数字特征【例3】 甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价解(1)由图象可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分. 甲13,乙13,s(1013)2(1313)2(1213)2(1413)2(1613)24,s(1313)2(1413)2(1213)2(1213)2(1413)20.8.(2)由ss可知乙的成绩较稳定从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高规律方法 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小【训练3】 将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:则7个剩余分数的方差为()A. B. C36 D.解析由题意知91,解得x4.所以s2(8791)2(9491)2(9091)2(9191)2(9091)2(9491)2(9191)2(16910190).答案B 1茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作2众数、中位数、平均数的异同(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量(2)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动,而中位数和众数都不具备此性质(3)众数体现各数据出现的频率,当一组数据中有若干数据多次出现时,众数往往更能反映问题(4)中位数仅与数据的排列位置有关,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势 易错辨析8统计图表识图不准致误【典例】 从某校高三年级随机抽取一个班,对该班50名学生的高校招生体检表中的视力情况进行统计,其频率分布直方图如图所示:若某高校A专业对视力的要求在0.9以上,则该班学生中能报A专业的人数为_解析该班学生视力在0.9以上的频率为(1.000.750.25)0.20.4,故能报A专业的人数为0.45020.答案20易错警示解题中易出现审题不仔细,又对所给图形没有真正理解清楚,将矩形的高误认为频率或者对“0.9以上”的含义理解有误防范措施 求解频率分布直方图中的数据问题,最容易出现的问题就是把纵轴误以为是频率导致错误在频率分布直方图中,纵轴表示,我们用各个小矩形的面积表示该段数据的频率,所以各组数据的频率等于小矩形的高对应的数据与小矩形的宽(样本数据的组距)的乘积【自主体验】(20xx福建卷)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:40,50),50,60),60,70),70,80),80,90),90,100加以统计,得到如图所示的频率分布直方图已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A588 B480 C450 D120解析从频率分布直方图可以看出:分数大于或等于60分的频率为(0.0300.0250.0150.010)100.8,故频数为6000.8480.答案B基础巩固题组(建议用时:40分钟)一、选择题1(20xx山东卷)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据则A,B两样本的下列数字特征对应相同的是()A众数 B平均数 C中位数 D标准差解析对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变答案D2在样本频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形面积和的,且样本容量为160,则中间一组的频数为()A32 B0.2 C40 D0.25解析由频率分布直方图的性质,可设中间一组的频率为x,则x4x1,x0.2,故中间一组的频数为1600.232,选A.答案A3(20xx潮州二模)有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲78795491074乙9578768677则下列判断正确的是()A甲射击的平均成绩比乙好B乙射击的平均成绩比甲好C甲比乙的射击成绩稳定D乙比甲的射击成绩稳定解析甲、乙的平均成绩分别为甲7,乙7,故排除A,B项;甲、乙的成绩的方差分别为s(77)2(87)2(77)2(97)2(57)2(47)2(97)2(107)2(77)2(47)24,s(97)2(57)2(77)2(87)2(77)2(67)2(87)2(67)2(77)2(77)21.2,则ss,所以乙比甲的射击成绩稳定,故选D.答案D4.(20xx临沂一模)某中学高三从甲、乙两个班中各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图,其中甲班学生成绩的众数是85,乙班学生成绩的中位数是83,则xy的值为()A7 B8 C9 D10解析由茎叶图可知,甲班学生成绩的众数是85,所以x5.乙班学生成绩的中位数是83,所以y3,所以xy538.答案B5甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A甲的成绩的平均数小于乙的成绩的平均数B甲的成绩的中位数等于乙的成绩的中位数C甲的成绩的方差小于乙的成绩的方差D甲的成绩的极差小于乙的成绩的极差解析由条形统计图知:甲射靶5次的成绩分别为:4,5,6,7,8;乙射靶5次的成绩分别为:5,5,5,6,9;所以甲6;乙6.所以甲乙故A不正确甲的成绩的中位数为6,乙的成绩的中位数为5,故B不正确s(46)2(56)2(66)2(76)2(86)2102,s(56)2(56)2(56)2(66)2(96)212,因为2,所以ss.故C正确甲的成绩的极差为:844,乙的成绩的极差为:954,故D不正确故选C.答案C二、填空题6在如图所示的茎叶图中,甲、乙两组数据的中位数分别是_,_.解析根据茎叶图所给数据,易知两组数据的中位数分别为45,46.答案45467(20xx湖北卷)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示(1)直方图中x的值为 _;(2)在这些用户中,用电量落在区间100,250内的户数为_解析(1)根据频率和为1,得(0.002 40.003 60.006 0x0.002 40.001 2)501,解得x0.004 4.(2)(0.003 60.004 40.006 0)5010070.答案0.004 4708某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|xy|的值为_解析由题意可得:xy20,(x10)2(y10)28,设x10t,y10t,|xy|2|t|4.答案4三、解答题9某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:(1)求分数在50,60的频率及全班人数;(2)求分数在80,90之间的频数,并计算频率分布直方图中80,90间的矩形的高解(1)分数在50,60的频率为0.008100.08.由茎叶图知,分数在50,60之间的频数为2,所以全班人数为25.(2)分数在80,90之间的频数为25271024,频率分布直方图中80,90间的矩形的高为100.016.10(20xx大连模拟)从某校高三年级800名男生中随机抽取50名学生测量其身高,据测量,被测学生的身高全部在155 cm到195 cm之间将测量结果按如下方式分成8组:第一组155,160),第二组160,165),第八组190,195,下图是按上述分组得到的频率分布直方图的一部分已知第一组与第八组的人数相同,第七组与第六组的人数差恰好为第八组与第七组的人数差求下列频率分布表中所标字母的值,并补充完成频率分布直方图频率分布表:分组频数频率频率/组距180,185)xyz185,190)mnp解由频率分布直方图可知前五组的频率和是(0.0080.0160.040.040.06)50.82,第八组的频率是0.00850.04,所以第六、七组的频率和是10.820.040.14,所以第八组的人数为500.042,第六、七组的总人数为500.147.由已知得xm7,mx2m,解得x4,m3,所以y0.08,n0.06,z0.016,p0.012.补充完成频率分布直方图如图所示能力提升题组(建议用时:25分钟)一、选择题1(20xx长春调研)如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在30,35),35,40)、40,45的上网人数呈现递减的等差数列分布,则年龄在35,40)的网民出现的频率为()A0.04 B0.06 C0.2 D0.3解析由频率分布直方图可知,年龄在20,25)的频率为0.0150.05,25,30)的频率为0.0750.35,又年龄在30,35),35,40),40,45的频率成等差数列分布,所以年龄在35,40)的网民出现的频率为0.2.答案C2(20xx陕西卷)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示)设甲乙两组数据的平均数分别为甲,乙,中位数分别为m甲,m乙,则()A.甲m乙 B.甲乙,m甲乙,m甲m乙 D.甲乙,m甲m乙解析甲(41433030382225271010141818568),乙(42434831323434382022232327101218).甲乙又m甲20,m乙29,m甲m乙答案B二、填空题3(20xx西安一检)由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为_解析不妨设x1x2x3x4,由中位数及平均数均为2,得x1x4x2x34,故这四个数只可能为1,1,3,3或1,2,2,3或2,2,2,2,由标准差为1可得这四个数只能为1,1,3,3.答案1,1,3,3三、解答题4(20xx西安模拟)某校从参加高三模拟考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六组90,100),100,110),140,150后得到如下部分频率分布直方图观察图形的信息,回答下列问题:(1)求分数在120,130)内的频率;(2)若在同一组数据中,将该组区间的中点值(如:组区间100,110)的中点值为105.)作为这组数据的平均分,据此,估计本次考试的平均分;(3)用分层抽样的方法在分数段为110,130)的学生中抽取一个容量为6的样本,将该样本看成一个总体,从中任取2人,求至多有1人在分数段120,130)内的概率解(1)分数在120,130)内的频率为1(0.10.150.150.250.05)10.70.3.(2)估计平均分为950.11050.151150.151250.31350.251450.05121.(3)由题意,110,120)分数段的人数为600.159(人)120,130)分数段的人数为600.318(人)用分层抽样的方法在分数段为110,130)的学生中抽取一个容量为6的样本,需在110,120)分数段内抽取2人,并分别记为m,n;在120,130)分数段内抽取4人,并分别记为a,b,c,d;设“从样本中任取2人,至多有1人在分数段120,130)内”为事件A,则基本事件共有(m,n),(m,a),(m,d),(n,a),(n,d),(a,b),(c,d)共15种则事件A包含的基本事件有(m,n),(m,a),(m,b),(m,c),(m,d),(n,a),(n,b),(n,c),(n,d)共9种P(A).第3讲变量间的相关关系、统计案例最新考纲1会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系2了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程3了解独立性检验(只要求22列联表)的基本思想、方法及其简单应用4了解回归分析的基本思想、方法及其简单应用.知 识 梳 理1两个变量的线性相关(1)正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关(2)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线2回归方程(1)最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法(2)回归方程方程x是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的回归方程,其中,是待定参数3回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn)中(,)称为样本点的中心(3)相关系数当r0时,表明两个变量正相关;当r0时,表明两个变量负相关r的绝对值越接近于1,表明两个变量的线性相关性越强r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系通常|r|大于0.75时,认为两个变量有很强的线性相关性4独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量(2)列联表:列出两个分类变量的频数表,称为列联表假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为:y1y2总计x1ababx2cdcd总计acbdabcd构造一个随机变量K2,其中nabcd为样本容量(3)独立性检验利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验辨 析 感 悟1对变量间的相关关系的认识(1)(20xx武汉调研改编)A项:正方体的棱长与体积是相关关系()B项:日照时间与水稻的亩产量是相关关系()(2)(教材思考问题改编)相关关系与函数关系都是一种确定性的关系,也是一种因果关系()(3)利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系去表示()2对回归直线方程的理解(4)通过回归方程x可以估计和观测变量的取值和变化趋势()(5)任何一组数据都对应着一个回归
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 成人自考


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!