资源描述
2019-2020年高考数学 专题49 统计与统计案例黄金解题模板【高考地位】统计与统计案例是高考的热点,高考对该内容的考查主要体现了以下两个特点:一是覆盖面广,几乎所有的统计考点都有所涉及,说明统计的任何环节都不能遗漏;二是考查力度加大. 在高考各种题型均有出现如选择题、填空题和解答题,其试题难度属中档题.【方法点评】类型一 变量间的相互关系使用情景:变量间的相互关系解题模板:第一步 根据题意画出散点图并判断两变量之间是正相关还是负相关;第二步 计算样本中心点并代入公式进行计算;第三步 得出变量间的相互关系线性回归方程.例1. 一次考试中,五名学生的数学、物理成绩如下表所示:学生A1A2A3A4A5数学(x分)8991939597物理(y分)8789899293(1)请在所给的直角坐标系中画出它们的散点图;(2)并求这些数据的线性回归方程bxa附:线性回归方程中, 其中,为样本平均值,线性回归方程也可写为 【答案】(1)详见解析(2) 075x20.25. 考点:回归方程与散点图;点评:(1)把所给的五组数据作为五个点的坐标描到直角坐标系中,得到散点图;(2)根据所给的数据先做出数据的平均数,即样本中心点,根据最小二乘法做出线性回归方程的系数,写出线性回归方程【变式演练1】年年岁史诗大剧芈月传风靡大江南北,影响力不亚于以前的甄嬛传,某记者调查了大量芈月传的观众,发现年龄段与爱看的比例存在较好的线性相关关系,年龄在 的爱看比例分别为,现用这个年龄段的中间值代表年龄段,如代表代表,根据前四个数据求得关于爱看比例的线性回归方程为,由此可推测的值为( )A. B. C. D. 【答案】B 【解析】由题意可知:前四个数据的,代入线性回归方程,得,当时,代入线性回归方程,故选B.点睛:本题主要考查了线性回归方程及相关问题,属于中档题,线性回归直线方程按最小二乘法计算时,必过这组数据的中心点,所以求回归直线方程中参数时,只需代入中心点即可,线性回归方程的用途是用来预测估算的,因此预测时只需代入相应的,即可得到预估值. 【变式演练2】某车间加工零件的数量与加工时间的统计数据如表:零件数(个)182022加工时间(分钟)273033现已求得上表数据的回归方程中的值为,则据此回归模型可以预测,加工个零件所需要的加工时间约为( )A分钟 B分钟 C分钟 D分钟【答案】C考点:回归直线方程.【变式演练3【xx山西省实验中学模拟】某电子产品的成本价格由两部分组成,一是固定成本,二是可变成本,为确定该产品的成本.进行5次试验,收集到的数据如表: 由最小二乘法得到回归方程,则_【答案】68【解析】,所以,得。【变式演练4】【xx湖南长沙长郡中学模拟】已知具有相关关系的两个变量之间的几组数据如下表所示: (1)请根据上表数据在网格纸中绘制散点图; (2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程,并估计当时, 的值;(3)将表格中的数据看作五个点的坐标,从这五个点中随机抽取2个点,求这两个点都在直线的右下方的概率.(参考公式: , ) 类型二 统计案例使用情景:统计检验解题模板:第一步 根据题意画出列联表;第二步 运用公式(其中n=a+b+c+d)进行计算;第三步 根据已知表格判断两变量间的相互关联性;第四步 得出结论.例2为了了解某校学生喜欢吃辣是否与性别有关,随机对此校100人进行调查,得到如下的列表:已知在全部100人中随机抽取1人抽到喜欢吃辣的学生的概率为喜欢吃辣不喜欢吃辣合计男生10女生20合计100(1)请将上面的列表补充完整;(2)是否有99.9%以上的把握认为喜欢吃辣与性别有关?说明理由:下面的临界值表供参考:0.100.050.0250.0100.0050.0012.7063.8415.0246.6357.87910.828(参考公式:,其中)【答案】(1)列表见解析(2)有%以上的把握认为喜欢吃辣与性别有关,理由见解析.列表补充如下 :喜欢吃辣不喜欢吃辣合计男生401050女生203050合计6040100(2)有99.9%以上的把握认为喜欢吃辣与性别有关考点:独立性检验. 【变式演练5】郑州一中研究性学习小组对本校高三学生视力情况进行调查,在高三的全体1000名学生中随机抽取了100名学生的体检表,并得到如图1的频率分布直方图(1)若直方图中后四组的频数成等差数列,计算高三的全体学视力在5.0以下的人数,并估计这100名学生视力的中位数(精确到0.1);(2)学习小组成员发现,学习成绩突出的学生,近视的比较多,为了研究学生的视力与学习成绩是否有关系,对高三全体学生成绩名次在前50名和后50名的学生进行了调查,得到如表1中数据,根据表1及表2中的数据,能否在犯错的概率不超过0.05的前提下认为视力与学习成绩有关系? 年级名次是否近视前50名后50名近视4234不近视816附表2:0.150.100.050.0250.0100.0050.0012.0722.0763.8415.0246.6357.87910.828(参考公式:,其中)【答案】(1),;(2)不能在犯错的概率不超过的前提下认为视力与学习成绩有关系. 考点:1、频率分布直方图;2、独立性检验.【变式演练6】某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时)(1)应收集多少位女生的样本数据?(2)根据这300样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:估计该校学生每周平均体育运动时间超过4小时的概率; (3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别的列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”0.100.050.0100.0052.7063.8416.6357.879附:【答案】(1);(2);(3)有%的把握认为“该校学生的每周平均体育运动时间与性别有关”.(3)由(2)知,位学生有(位)的每周平均体育运动时间超过小时,人的每周平均体育运动时间不超过小时,又因为样本数据中有份是关于男生的,份是关于女生的,所以每周平均体育运动时间与性别列联表如下:男生女生总计每周平均体育运动时间不超过小时每周平均体育运动时间超过小时总计结合列联表可算得,所以有的把握认为“该校学生的每周平均体育运动时间与性别有关”考点:1、频率分布直方图;2、独立性检验. 【变式演练7】“开门大吉”是某电视台推出的游戏节目选手面对18号8扇大门,依次按响门上的门铃,门铃会播放一段音乐(将一首经典流行歌曲以单音色旋律的方式演绎),选手需正确回答出这首歌的名字,方可获得该扇门对应的家庭梦想基金在一次场外调查中,发现参赛选手多数分为两个年龄段:2030;3040(单位:岁),其猜对歌曲名称与否的人数如图所示 (1)写出22列联表;判断是否有90%的把握认为猜对歌曲名称是否与年龄有关;说明你的理由;(下面的临界值表供参考)010005001000052706384166357879 (2)现计划在这次场外调查中按年龄段用分层抽样的方法选取6名选手,并抽取3名幸运选手,求3名幸运选手中至少有一人在2030岁之间的概率(参考公式:其中)【答案】(1)列联表详见解析,有90%把握认为有关(2) 考点:独立性检验古典概型的概率计算【高考再现】1. 【xx山东,理5】为了研究某班学生的脚长(单位:厘米)和身高(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出与之间有线性相关关系,设其回归直线方程为已知,该班某学生的脚长为24,据此估计其身高为(A) (B) (C) (D)【答案】C【解析】试题分析:由已知 ,选C.【考点】线性相关与线性回归方程的求法与应用【名师点睛】(1)判断两个变量是否线性相关及相关程度通常有两种方法:(1)利用散点图直观判断;(2)将相关数据代入相关系数公式求出,然后根据的大小进行判断求线性回归方程时在严格按照公式求解时,一定要注意计算的准确性2.【xx课标II,理18】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg)某频率分布直方图如下:(1) 设两种养殖方法的箱产量相互独立,记A表示事件:“旧养殖法的箱产量低于50kg, 新养殖法的箱产量不低于50kg”,估计A的概率;(2) 填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关: 箱产量50kg箱产量50kg旧养殖法新养殖法 (3) 根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01) 附: 【答案】(1);(2) 有的把握认为箱产量与养殖方法有关;(3)。(2)根据箱产量的频率分布直方图得列联表箱产量箱产量旧养殖法6238新养殖法3466由于,故有的把握认为箱产量与养殖方法有关。(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于的直方图面积为,箱产量低于的直方图面积为,故新养殖法箱产量的中位数的估计值为。【考点】 独立事件概率公式;独立性检验原理;频率分布直方图估计中位数。【名师点睛】利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测。独立性检验就是考察两个分类变量是否有关系,并能较为准确地给出这种判断的可信度,随机变量的观测值值越大,说明“两个变量有关系”的可能性越大。利用频率分布直方图求众数、中位数和平均数时,应注意三点:最高的小长方形底边中点的横坐标即是众数;中位数左边和右边的小长方形的面积和是相等的;平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和。3.xx高考新课标文数下图是我国xx年至xx年生活垃圾无害化处理量(单位:亿吨)的折线图 (I)由折线图看出,可用线性回归模型拟合与的关系,请用相关系数加以说明;(II)建立关于的回归方程(系数精确到0.01),预测xx年我国生活垃圾无害化处理量附注:参考数据:,2.646.参考公式:相关系数 回归方程 中斜率和截距的最小二乘估计公式分别为:【答案】()理由见解析;()1.82亿吨【解析】 考点:线性相关与线性回归方程的求法与应用【方法点拨】(1)判断两个变量是否线性相关及相关程度通常有两种方法:(1)利用散点图直观判断;(2)将相关数据代入相关系数公式求出,然后根据的大小进行判断求线性回归方程时在严格按照公式求解时,一定要注意计算的准确性4【xx高考福建,理4】为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入(万元)8.28.610.011.311.9支出(万元)6.27.58.08.59.8根据上表可得回归直线方程 ,其中 ,据此估计,该社区一户收入为15万元家庭年支出为( )A11.4万元 B11.8万元 C12.0万元 D12.2万元【答案】B【考点定位】线性回归方程【名师点睛】本题考查线性回归方程,要正确利用平均数公式计算和理解线性回归方程的意义,属于基础题,要注意计算的准确性5.【xx高考新课标2,理3】根据下面给出的xx年至xx年我国二氧化硫排放量(单位:万吨)柱形图。以下结论不正确的是( )A逐年比较,xx年减少二氧化硫排放量的效果最显著Bxx年我国治理二氧化硫排放显现Cxx年以来我国二氧化硫年排放量呈减少趋势Dxx年以来我国二氧化硫年排放量与年份正相关【答案】D【考点定位】正、负相关【名师点睛】本题以实际背景考查回归分析中的正、负相关,利用增长趋势或下降趋势理解正负相关的概念是解题关键,属于基础题6.【xx高考湖南,理7】在如图所示的正方形中随机投掷10000个点,则落入阴影部分(曲线C为正态分布N(0,1)的密度曲线)的点的个数的估计值为( )A.2386 B.2718 C.3413 D.4772附:若,则, 【答案】C. 【考点定位】1.正态分布;2.几何概型.【名师点睛】本题主要考查正态分布与几何概型等知识点,属于容易题,结合参考材料中给出的数据,结合正态分布曲线的对称性,再利用几何概型即可求解,在复习过程中,亦应关注正态分布等相对冷门的知识点的基本概念. 7.【xx高考新课标1,理19】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费和年销售量(=1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值. 46.656.36.8289.81.61469108.8表中 , =()根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)()根据()的判断结果及表中数据,建立y关于x的回归方程;()已知这种产品的年利率z与x、y的关系为z=0.2y-x.根据()的结果回答下列问题:()年宣传费x=49时,年销售量及年利润的预报值是多少?()年宣传费x为何值时,年利率的预报值最大?附:对于一组数据,,,其回归线的斜率和截距的最小二乘估计分别为:,【答案】()适合作为年销售关于年宣传费用的回归方程类型;()()46.24()根据()的结果知,年利润z的预报值,当=,即时,取得最大值.故宣传费用为46.24千元时,年利润的预报值最大.12分【考点定位】非线性拟合;线性回归方程求法;利用回归方程进行预报预测;应用意识【名师点睛】本题考查了非线性拟合及非线性回归方程的求解与应用,是源于课本的试题类型,解答非线性拟合问题,先作出散点图,再根据散点图选择合适的函数类型,设出回归方程,利用换元法将非线性回归方程化为线性回归方程,求出样本数据换元后的值,然后根据线性回归方程的计算方法计算变换后的线性回归方程系数,即可求出非线性回归方程,再利用回归方程进行预报预测,注意计算要细心,避免计算错误. 8.【xx高考重庆,文17】随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份xxxxxxxxxx时间代号12345储蓄存款(千亿元)567810 ()求y关于t的回归方程()用所求回归方程预测该地区xx年()的人民币储蓄存款.附:回归方程中【答案】(),()千亿元. 【考点定位】线性回归方程.【名师点睛】本题考查线性回归直线方程的求法及应用,采用列表方式分别求出,的值然后代入给出的公式中进行求解.本题属于基础题,特别注意运算的准确性. 【反馈练习】1. 【xx黑龙江大庆四校联考】已知的取值如下表所示:若与线性相关,且,则 ( ) A. 2.2 B. 2.9 C. 2.8 D. 2.6【答案】D【解析】由表格得线性回归直线过样本中点点,故答案选2观察下列散点图,其中两个变量的相关关系判断正确的是( ) A为正相关,为负相关,为不相关 B为负相关,为不相关,为正相关C为负相关,为正相关,为不相关 D为正相关,为不相关,为负相关【答案】D考点:两个变量的线性相关.3某商场为了了解毛衣的月销售量(件)与月平均气温()之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:月平均气温171382月销售量(件)24334055由表中数据算出线性回归方程中的,气象部门预测下个月的平均气温为,据此估计该商场下个月毛衣销售量约为( )A58件 B40件 C38件 D46件【答案】D【解析】试题分析:由表格得为:,因为在回归方程上且,解得,当时,故选D.考点:1、线性回归方程的性质;2、回归方程的应用.4【xx湖南衡阳市第八中模拟】某省的一个气象站观测点在连续4天里记录的指数与当天的空气水平可见度(单位: )的情况如表1:7000.53.56.59.5 该省某市xx年9月指数频数分布如表2:频数361263 (1)设,根据表1的数据,求出关于的线性回归方程;(2)小李在该市开了一家洗车店,经统计,洗车店平均每天的收入与指数有相关关系,如表3:日均收入(元) 根据表3估计小李的洗车店9月份平均每天的收入(附参考公式: ,其中, )【解析】(1), , , 5【xx福建三校联考】某学校为倡导全体学生为特困学生捐款,举行“一元钱,一片心,诚信用水”活动,学生在购水处每领取一瓶矿泉水,便自觉向捐款箱中至少投入一元钱。现统计了连续5天的售出和收益情况,如下表:售出水量x(单位:箱)76656收益y(单位:元)165142148125150 () 若x与y成线性相关,则某天售出8箱水时,预计收益为多少元?() 期中考试以后,学校决定将诚信用水的收益,以奖学金的形式奖励给品学兼优的特困生,规定:特困生考入年级前200名,获一等奖学金500元;考入年级201500 名,获二等奖学金300元;考入年级501名以后的特困生将不获得奖学金。甲、乙两名学生获一等奖学金的概率均为,获二等奖学金的概率均为,不获得奖学金的概率均为.在学生甲获得奖学金条件下,求他获得一等奖学金的概率;已知甲、乙两名学生获得哪个等第的奖学金是相互独立的,求甲、乙两名学生所获得奖学金总金额X 的分布列及数学期望。附: , 。 X的取值可能为0,300,500,600,800,1000, , , 即 的分布列为: (元)6【xx河南豫南豫北联考】某老师对全班名学生学习积极性和参加社团活动情况进行调查,统计数据如下所示:参加社团活动不参加社团活动合计学习积极性高学习积极性一般合计 (1)请把表格数据补充完整;(2)若从不参加社团活动的人按照分层抽样的方法选取人,再从所选出的人中随机选取两人作为代表发言,求至少有一个学习积极性高的概率;(3)运用独立性检验的思想方法分析:请你判断是否有的把握认为学生的学习积极性与参与社团活动由关系?附: 试题解析:(1)参加社团活动不参加社团活动合计学习积极性高学习积极性一般合计 7【xx湖南五校联考】某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:日期雅创教育网1月10日2月10日3月10日4月10日5月10日6月10日昼夜温差x(C)1011131286就诊人数y(个)222529261612 该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.()求选取的2组数据恰好是相邻两个月的概率;()若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y关于x的线性回归方程;()若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想? (参考公式: )参考数据:1092, 498【解析】()设抽到相邻两个月的数据为事件A.因为从6组数据中选取2组数据共有15种情况,每种情况都是等可能出现的,其中,抽到相邻两个月的数据的情况有5种 ,所以 ()由数据求得 由公式求得 8. 【xx四川成都第七中模拟】“微信运动”已成为当下热门的运动方式,小王的微信朋友圈内也有大量好友参与了“微信运动”,他随机选取了其中的40人(男、女各20人),记录了他们某一天的走路步数,并将数据整理如下:步数性别0-xxxx-50005001-80008001-1000010000男12368女021062 0.100.050.0250.0102.7063.8415.0246.635 附: (1)已知某人一天的走路步数超过8000步被系统评定为“积极型”,否则为“懈怠型”,根据题意完成下面的列联表,并据此判断能否有95%以上的把握认为“评定类型”与“性别”有关?积极型懈怠型总计男女总计(2)若小王以这40位好友该日走路步数的频率分布来估计其所有微信好友每日走路步数的概率分布,现从小王的所有微信好友中任选2人,其中每日走路不超过5000步的有人,超过10000步的有人,设,求的分布列及数学期望.即的分布列为012 可得期望9. 【xx黑龙江齐齐哈尔一次模拟】2016年6月22 日,“国际教育信息化大会”在山东青岛开幕.为了解哪些人更关注“国际教育信息化大会”,某机构随机抽取了年龄在15-75岁之间的100人进行调查,经统计“青少年”与“中老年”的人数之比为9: 11.(1)根据已知条件完成下面的列联表,并判断能否有的把握认为“中老年”比“青少年”更加关注“国际教育信息化大会”; (2)现从抽取的青少年中采用分层抽样的办法选取9人进行问卷调查.在这9人中再选取3人进行面对面询问,记选取的3人中关注“国际教育信息化大会”的人数为,求的分布列及数学期望.附:参考公式,其中.临界值表: 10【南宁市xx届高三毕业班摸底联考】某省高考改革实施方案指出:该省高考考生总成绩将由语文、数学、外语3门统一高考成绩和学生自主选择的学业水平等级性考试科目共同构成,该省教育厅为了解正在读高中的学生家长对高考改革方案所持的赞成态度,随机从中抽取了100名城乡家长作为样本进行调查,调查结果显示样本中有25人持不赞成意见,如图是根据样本的调查结果绘制的等高条形图.(1)根据已知条件与等高条形图完成下面的列联表,并判断我们能否有95%的把握认为“赞成高考改革方案与城乡户口有关”? 注:,其中. (2)用样本的频率估计概率,若随机在全省不赞成高考改革的家长中抽取3个,记这3个家长中是城镇户口的人数为,试求的分布列及数学期望. 【解析】(1)完成列联表,如下: 代入公式,得观测值: .我们没有95%的把握认为“赞成高考改革方案与城乡户口有关”. 11 【xx陕西省西安中学模拟】近年空气质量逐步雾霾天气现象增多,大气污染危害加重,大气污染可引起心悸,呼吸困难等心肺疾病,为了解某市心肺疾病是否与性别有关,在某医院随机的对入院50人进行了问卷调查得到了如下的列联表:患心肺疾病不患心肺疾病合计男5女10合计50 已知在全部50人中随机抽取1人,抽到患心肺疾病的人的概率为.(1)请将上面的列联表补充完整,并判断是否有99.5%的把握认为患心肺疾病与性别有关?说明你的理由;(2)已知在患心肺疾病的10位女性中,有3位又患胃病,现在从患心肺疾病的10位女性中,选出3名进行其他方面的排查,记选出患胃病的女性人数为,求的分布列、数学期望及方差,下面的临界值表供参考:0.150.100.050.0250.0100.0050.0012.0722.7063.8415.0246.6357.87910.828 (参考公式,其中.)所以的分布列如下:
展开阅读全文