资源描述
2019年高考数学二轮复习 统计与统计案例1(xx四川高考)在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析在这个问题中,5 000名居民的阅读时间的全体是()A总体B个体C样本的容量D从总体中抽取的一个样本【解析】5 000名居民的阅读时间的全体为总体,故选A.【答案】A2(xx重庆高考)某中学有高中生3 500人,初中生1 500人为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A100 B150 C200 D250【解析】样本抽取比例为,该校总人数为1 5003 5005 000,则,故n100,选A.【答案】A3(xx湖北高考)根据如下样本数据x345678y4.02.50.50.52.03.0得到的回归方程为bxa,则()Aa0,b0 Ba0,b0Ca0 Da0,b0【解析】回归直线方程过中心点(5.5,1.5),即1.55.5ba,由题意,两个变量负相关,b0,故选B.【答案】B4(xx广东高考)某车间20名工人年龄数据如下表:年龄(岁)工人数(人)191283293305314323401合计20(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差【解】(1)由题可知,这20名工人年龄的众数是30,极差是401921.(2)这20名工人年龄的茎叶图如图所示:(3)这20名工人年龄的平均数为(1932832953043133240)30,这20名工人年龄的方差为s2 (xi)212.6.从近三年高考来看,该部分高考命题的热点考向为:1随机抽样随机抽样问题与实际生活紧密相连,是高考考查的热点之一主要考查系统抽样中号码的确定和分层抽样中各层人数的确定多以选择题和填空题的形式呈现,属容易题2用样本估计总体该考向重点考查样本特征数的计算,样本频率分布直方图和茎叶图等知识特别是茎叶图是新课标中的新增内容,与实际生活联系密切,可方便处理数据,是高考中新的热点多以选择题、填空题的形式考查,有时也出现在解答题中,属容易题3线性回归分析线性回归分析是新增内容,在现实生活中有着广泛的应用,应引起重视多以选择题、填空题的形式考查,有时也出现在解答题中,属中、低档题目4独立性检验独立性检验也是新增内容,在现实生活中有着广泛的应用,近几年许多省的高考题涉及本考向,应引起关注既可以以选择题、填空题的形式考查,也可以以解答题的形式呈现,属中、低档题目.【例1】(1)(xx天津高考)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查已知该校一年级、二年级、三年级、四年级的本科生人数之比为4556,则应从一年级本科生中抽取_名学生(2)(xx广东高考)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本 ,则分段的间隔为()A50B40C25D20【解析】(1)由题意知应抽取人数为30060.(2)由25,可得分段的间隔为25.故选C.【答案】(1)60(2)C【规律方法】解答与抽样方法有关的问题时应注意:(1)要深刻理解各种抽样方法的特点和实施步骤(2)熟练掌握系统抽样中被抽个体号码的确定方法(3)熟练掌握分层抽样中各层人数的计算方法注意:抽样方法常和概率、频率分布直方图等知识结合在一起考查创新预测1(1)(xx湖南高考)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件、80件、60件为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n()A9 B10 C12 D13(2)(xx江西高考)总体由编号为01,02,19,20的20个个体组成利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08 B07C02 D01【解析】(1)根据分层抽样的特点,用比例法求解依题意得,故n13.(2)由随机数表法的随机抽样的过程可知选出的5个个体是08,02,14,07,01,所以第5个个体的编号是01.【答案】(1)D(2)D【例2】(xx北京高考)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:组号分组频数10,2)622,4)834,6)1746,8)2258,10)25610,12)12712,14)6814,16)2916,18)2合计100(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论)【解】(1)根据频数分布表,100名学生中课外阅读时间不少于12小时的学生共有62210名,所以样本中的学生课外阅读时间少于12小时的频率是10.9.从该校随机选取一名学生,估计其课外阅读时间少于12小时的概率为0.9.(2)课外阅读时间落在组4,6)的有17人,频率为0.17,所以a0.085.课外阅读时间落在组8,10)的有25人,频率为0.25,所以b0.125.(3)样本中的100名学生课外阅读时间的平均数在第4组【规律方法】1.用样本估计总体时应注意的问题:(1)理解在抽样具有代表性的前提下,可以用样本的频率分布估计总体的频率分布,用样本的特征数估计总体的特征数,这是统计的基本思想(2)反映样本数据分布的主要方式,一个是频率分布表,一个是频率分布直方图要学会根据频率分布直方图估计总体的概率分布以及总体的特征数,特别是均值、众数和中位数2样本数字特征及茎叶图:(1)要掌握好样本均值和方差的实际意义,并在具体的应用问题中会根据所计算出的样本数据的均值和方差对实际问题作出解释(2)茎叶图是表示样本数据分布的一种方法,其特点是保留了所有的原始数据,这是茎叶图的优势创新预测2(1)(xx福建高考)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:40,50),50,60),60,70),70,80),80,90),90,100加以统计,得到如图所示的频率分布直方图已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A588 B480 C450 D120(2)(xx山东高考)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:87794010x91则7个剩余分数的方差为()A. B. C36 D.【解析】(1)先求出频率,再求样本容量不少于60分的学生的频率为(0.0300.0250.0150.010)100.8,该模块测试成绩不少于60分的学生人数应为6000.8480.故选B.(2)利用平均数为91,求出x的值,利用方差的定义,计算方差根据茎叶图,去掉1个最低分87,1个最高分99,则8794909190(90x)9191,x4.s2(8791)2(9491)2(9091)2(9191)2(9091)2(9491)2(9191)2.【答案】(1)B(2)B【例3】(xx全国新课标高考)某地区xx年至xx年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份xxxxxxxx2011xxxx年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析xx年至xx年该地区农村居民家庭人均纯收入的变化情况,并预测该地区xx年农村居民家庭人均纯收入附:回归直线的斜率和截距的最小二乘估计公式分别为:,.【解】(1)由所给数据计算得(1234567)4,(2.93.33.64.44.85.25.9)4.3(ti)2941014928,(ti)(yi)(3)(1.4)(2)(1)(1)(0.7)00.110.520.931.614,0.5,4.30.542.3,所求回归方程为0.5t2.3.(2)由(1)知,0.50,故xx至xx年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元将xx年的年份代号t9代入()中的回归方程,得0.592.36.8,故预测该地区xx年农村居民家庭人均纯收入为6.8千元【规律方法】进行线性回归分析时应注意的问题(1)正确理解计算b,a的公式和准确的计算,是求回归直线方程的关键(2)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值(3)在散点图中,若所有点大部分都集中在斜向上(自左向右看)的直线的附近,则为正相关;若大部分都集中在斜向下(自左向右看)的直线的附近,则为负相关创新预测3(xx重庆高考)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i80,i20,iyi184,720.(1)求家庭的月储蓄y对月收入x的线性回归方程ybxa;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄附:线性回归方程ybxa中,b,ab,其中,为样本平均值线性回归方程也可写为x.【解】(1)由题意知n10,i8,i2,又lxxn2720108280,lxyiyin 184108224,由此得b0.3,ab20.380.4,故所求线性回归方程为y0.3x0.4.(2)由于变量y的值随x值的增加而增加(b0.30),故x与y之间是正相关(3)将x7代入回归方程可以预测该家庭的月储蓄为y0.370.41.7(千元)【例4】(xx辽宁高考)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品合计南方学生602080北方学生101020合计7030100(1)根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”;(2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率附:2,P(2k)0.1000.0500.010k2.7063.8416.635【解】(1)将22列联表中的数据代入公式计算,得24.762.由于4.7623.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”(2)从5名数学系学生中任取3人的一切可能结果所组成的基本事件空间(a1,a2,b1),(a1,a2,b2),(a1,a2,b3),(a1,b1,b2),(a1,b2,b3),(a1,b1,b3),(a2,b1,b2),(a2,b2,b3),(a2,b1,b3),(b1,b2,b3)其中ai表示喜欢甜品的学生,i1,2.bj表示不喜欢甜品的学生,j1,2,3.由10个基本事件组成,且这些基本事件的出现是等可能的用A表示“3人中至多有1人喜欢甜品”这一事件,则A(a1,b1,b2),(a1,b2,b3),(a1,b1,b3),(a2,b1,b2),(a2,b2,b3),(a2,b1,b3),(b1,b2,b3)事件A是由7个基本事件组成,因而P(A).【规律方法】1.独立性检验的关键是准确计算K2(2),而计算k2(2)时,要正确绘制22列联表2两个变量的独立性检验,在统计学中有着广泛的应用,学习时一定要结合实际问题,从现实中寻找例子,增强学习数学的动力创新预测4(xx安徽高考)某高校共有学生15 000人,其中男生10 500人,女生4 500人为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时)(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:0,2,(2,4,(4,6,(6,8,(8,10,(10,12估计该校学生每周平均体育运动时间超过4小时的概率;(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”附:K2P(K2k0)0.100.050.0100.005k02.7063.8416.6357.879【解】(1)30090,所以应收集90位女生的样本数据(2)由题中频率分布直方图得12(0.1000.025)0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.(3)由(2)知,300位学生中有3000.75225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时又因为样本数据中有210份是关于男生的,90份是关于女生的所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表男生女生总计每周平均体育运动时间不超过4小时453075每周平均体育运动时间超过4小时16560225总计21090300结合列联表可算得K24.7623.841.所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”总结提升失分盲点(1)混淆简单随机抽样、系统抽样、分层抽样的区别,不能正确地选择抽样方法(2)不能正确地从频率分布直方图中提取相关的信息,混淆了频数与频率的差异答题指导(1)看到抽样问题,想到三种抽样的定义以及适用范围和三者的区别(2)看到频率分布直方图,想到频数与频率的区别以及计算方法方法规律(1)分层抽样:抽样原则:分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取nn(i1,2,k)个个体:分层原则:层内样本的差异要小,两层之间的样本差异要大,且互不重叠(2)利用统计量K2进行独立性检验的步骤:根据数据列出22列联表根据公式计算K2的观测值k.比较观测值k与临界值表中相应的检验水平,作出统计判断通过数据分析事物蕴含的规律1数据的作用是为了说明实际问题中存在的问题,通过对数据的处理(如计算样本数据的均值、方差、极差、中位数、众数等),看出实际问题中蕴含的某种规律,根据规律的利弊确定未来的发展方向,这是数据处理的一个主要方面2在统计中通过对抽取的样本数据进行处理,根据样本估计总体的思想,可以对总体作出估计,从而对总体作出评价,给出令人信服的结论,这就是用数据说话【典例】(xx全国新课标高考)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价【解】(1)由题中所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由题中所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为0.1,0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由题中所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由题中茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大(注:考生利用其他统计量进行分析,结论合理的同样给分)【规律感悟】样本数据的均值体现了一种整体的态势,样本数据的方差则说明了整体态势的稳定性,整体态势(均值)及其稳定性(方差)是样本数据的两个重要特征数.
展开阅读全文