高考数学大二轮专题复习冲刺方案文数经典版文档:第二编 专题六 第1讲 统计、统计案例 Word版含解析

上传人:痛*** 文档编号:80888344 上传时间:2022-04-26 格式:DOC 页数:26 大小:1,014KB
返回 下载 相关 举报
高考数学大二轮专题复习冲刺方案文数经典版文档:第二编 专题六 第1讲 统计、统计案例 Word版含解析_第1页
第1页 / 共26页
高考数学大二轮专题复习冲刺方案文数经典版文档:第二编 专题六 第1讲 统计、统计案例 Word版含解析_第2页
第2页 / 共26页
高考数学大二轮专题复习冲刺方案文数经典版文档:第二编 专题六 第1讲 统计、统计案例 Word版含解析_第3页
第3页 / 共26页
点击查看更多>>
资源描述
专题六 概率与统计第1讲统计、统计案例考情研析1.以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等2.概率与统计的交汇问题是高考的热点,以解答题形式出现,难度中等.核心知识回顾1.三种抽样方法的特点简单随机抽样:操作简便、适当,总体个数较少分层抽样:按比例抽样系统抽样:等距抽样2必记公式数据x1,x2,x3,xn的数字特征公式(1)平均数:.(2)方差:s2(x1)2(x2)2(xn)2(3)标准差:s .3重要性质及结论(1)频率分布直方图的三个结论小长方形的面积组距频率;各小长方形的面积之和等于1;小长方形的高,所有小长方形高的和为.(2)回归直线方程:一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn)其回归方程x ,其过样本点中心(,).(3)独立性检验K2(其中nabcd为样本容量)热点考向探究考向1 抽样方法例1(1)从编号为001,002,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应该为()A480 B481 C482 D483答案C解析样本中编号最小的两个编号分别为007,032,样本数据组距为32725,则样本容量为20,则对应的号码数x725(n1),当n20时,x取得最大值,此时x72519482.故选C(2)(2019广州普通高中高三综合测试)某公司生产A,B,C三种不同型号的轿车,产量之比依次为234,为检验该公司的产品质量,用分层抽样的方法抽取一个容量为n的样本,若样本中A种型号的轿车比B种型号的轿车少8辆,则n()A96 B72 C48 D36答案B解析由题意,得nn8,n72.选B 系统抽样与分层抽样的求解方法(1)系统抽样的最基本特征是“等距性”,每组内所抽取的号码需要依据第一组抽取的号码和组距唯一确定每组抽取样本的号码依次构成一个以第一组抽取的号码m为首项,组距d为公差的等差数列an,第k组抽取样本的号码akm(k1)d.(2)分层抽样的关键是根据样本特征的差异进行分层,实质是等比例抽样,求解此类问题需先求出抽样比样本容量与总体容量的比,则各层所抽取的样本容量等于该层个体总数与抽样比的乘积在每层抽样时,应采用简单随机抽样或系统抽样进行 1(2019云南省第二次高三统一检测)某中学高一年级有学生1200人,高二年级有学生900人,高三年级有学生1500人,现按年级为标准,用分层抽样的方法从这三个年级学生中抽取一个容量为720的样本进行某项研究,则应从高三年级学生中抽取学生()A200人 B300人 C320人 D350人答案B解析由分层抽样可得高三抽取的学生人数为720300.故选B2采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入1,450的人做问卷A,编号落入451,750的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为_答案10解析由题意得系统抽样的抽样间隔为30,又因为第一组内抽取的号码为9,则由451930k750(kN*),得14k24,所以做问卷B的人数为10.考向2 用样本估计总体例2(1)甲、乙两名学生在5次数学考试中的成绩统计如茎叶图所示,若甲,乙分别表示甲、乙两人的平均成绩,则下列结论正确的是()A甲乙,乙比甲稳定 B甲乙,甲比乙稳定C甲乙,乙比甲稳定 D甲乙因为s(12)2(4)222529254,s(5)2(5)2(4)24210236.4,所以ss,故乙比甲稳定故选A(2)(2019皖南八校高三第三次联考)从某地区年龄在2555岁的人员中,随机抽出100人,了解他们对今年两会的热点问题的看法,绘制出频率分布直方图如图所示,则下列说法正确的是()A抽出的100人中,年龄在4045岁的人数大约为20B抽出的100人中,年龄在3545岁的人数大约为30C抽出的100人中,年龄在4050岁的人数大约为40D抽出的100人中,年龄在3550岁的人数大约为50答案A解析根据频率分布直方图的性质得(0.010.050.06a0.020.02)51,解得a0.04,所以抽出的100人中,年龄在4045岁的人数大约为0.04510020,所以A正确;年龄在3545岁的人数大约为(0.060.04)510050,所以B不正确;年龄在4050岁的人数大约为(0.040.02)510030,所以C不正确;年龄在3550岁的人数大约为(0.060.040.02)510060,所以D不正确故选A (1)频率分布直方图中每个小矩形的面积为对应的频率,不要混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错(2)由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表题时,就要充分使用这个图表提供的数据进行相关的计算或者是对某些问题作出判断 1(2019福建省高三模拟)为比较甲、乙两名高二学生的数学素养,对课程标准中规定的数学六大素养进行指标测验(指标值满分为5分,分值高者为优),根据测验情况绘制了如图所示的六大素养指标雷达图,则下面叙述正确的是()A乙的数据分析素养优于甲B乙的数学建模素养优于数学抽象素养C甲的六大素养整体水平优于乙D甲的六大素养中数据分析最差答案C解析根据雷达图得到如下数据所示由数据可知选C2(2019江西省吉安一中、九江一中、新余一中等八所重点中学高三4月联考)某地区某村的前三年的经济收入分别为100,200,300万元,其统计数据的中位数为x,平均数为y;经过今年政府新农村建设后,该村经济收入在上年基础上翻番,则在这4年里收入的统计数据中,下列说法正确的是()A中位数为x,平均数为1.5yB中位数为1.25x,平均数为yC中位数为1.25x,平均数为1.5yD中位数为1.5x,平均数为2y答案C解析依题意,前三年中位数x200,平均数y200,第四年收入为600万元,故中位数为2501.25x,平均数为3001.5y.故选C考向3 回归分析与独立性检验角度1回归分析在实际中的应用例3(2019沧州市普通高等学校招生全国统一模拟考试)近年来,随着互联网技术的快速发展,共享经济覆盖的范围迅速扩张,继共享单车、共享汽车之后,共享房屋以“民宿”“农家乐”等形式开始在很多平台上线某创业者计划在某景区附近租赁一套农房发展成特色“农家乐”,为了确定未来发展方向,此创业者对该景区附近六家“农家乐”跟踪调查了100天得到的统计数据如下表,x为收费标准(单位:元/日),t为入住天数(单位:天),以频率作为各自的“入住率”,收费标准x与“入住率”y的散点图如图x50100150200300400t906545302020(1)令zln x,由散点图判断x与z哪个更合适于此模型(给出判断即可,不必说明理由)?并根据你的判断结果求回归方程(结果保留一位小数);(2)若一年按365天计算,试估计收费标准为多少时,年销售额L最大?(年销售额L365入住率收费标准x)参考数据:, ,200,0.45,x325000,5.1,yizi12.7,z158.1,e5148.4.解(1)由散点图可知z更适合于此模型其中0.5, 3,所求的回归方程为0.5ln x3.(2)L365(0.5ln x3)xxln x1095x.L ln x3653,令L0ln x5xe5148.4.若一年按365天计算,当收费标准约为148.4元/日时,年销售额L最大,最大值约为27083元 在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值 (2019太原市高三模拟)近年来随着互联网的高速发展,旧货交易市场也得以快速发展某网络旧货交易平台对2018年某种机械设备的线上交易进行了统计,得到如图所示的频率分布直方图和散点图现把直方图中各组的频率视为概率,用x(单位:年)表示该设备的使用时间,y(单位:万元)表示其相应的平均交易价格(1)已知2018年在此网络旧货交易平台成交的该种机械设备为100台,现从这100台设备中,按分层抽样抽取使用时间x(12,20的4台设备,再从这4台设备中随机抽取2台,求这2台设备的使用时间都在(12,16的概率;(2)由散点图分析后,可用yebxa作为此网络旧货交易平台上该种机械设备的平均交易价格y关于其使用时间x的回归方程iyiizi5.58.71.9301.479.75385表中zln y,i.根据上述相关数据,求y关于x的回归方程;根据上述回归方程,求当使用时间x15时,该种机械设备的平均交易价格的预报值(精确到0.01)附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线vu的斜率和截距的最小二乘估计分别为, .参考数据:e0.551.733,e0.950.3867,e1.850.1572.解(1)由图1中频率分布直方图可知,从2018年成交的该种机械设备中使用时间x(12,16的台数为10040.0312,使用时间x(16,20的台数为10040.014,按分层抽样所抽取4台中,使用时间x(12,16的设备有3台,分别记为A,B,C;使用时间x(16,20的设备有1台,记为d,从这4台设备中随机抽取2台的结果为(A,B),(A,C),(A,d),(B,C),(B,d),(C,d),共有6种等可能出现的结果,其中这2台设备的使用时间x都在(12,16的结果为(A,B),(A,C),(B,C),共有3种,所求事件的概率为.(2)由题意得zln yln ebxabxa,0.3, 1.90.35.53.55,z关于x的线性回归方程为z0.3x3.55,y关于x的回归方程为ye0.3x3.55.由知,当使用时间x15时,ye0.3153.550.39,故该种机械设备的平均交易价格的预报值为0.39万元角度2独立性检验在实际中的应用例4(2019贵州遵义航天高级中学七模)某中学为了解中学生的课外阅读时间,决定在该中学的1200名男生和800名女生中按分层抽样的方法抽取20名学生,对他们的课外阅读时间进行问卷调查现在按课外阅读时间的情况将学生分成三类:A类(不参加课外阅读),B类(参加课外阅读,但平均每周参加课外阅读的时间不超过3小时),C类(参加课外阅读,且平均每周参加课外阅读的时间超过3小时)调查结果如下表:A类B类C类男生x53女生y33(1)求出表中x,y的值;(2)根据表中的统计数据,完成下面的列联表,并判断是否有90%的把握认为“参加课外阅读与否与性别有关”男生女生总计不参加课外阅读参加课外阅读总计附:K2,nabcd.P(K2k0)0.100.050.01k02.7063.8416.635解(1)设抽取的20人中,男、女生人数分别为n1,n2,则所以x12534,y8332.(2)列联表如下:男生女生总计不参加课外阅读426参加课外阅读8614总计12820K20.15910.828.有99.9%的把握认为闯红灯与年龄有关(2)未进行处罚前,行人闯红灯的概率为0.4,进行处罚10元后,行人闯红灯的概率为0.2,降低了0.2.(3)根据调查数据显示,行人闯红灯与年龄有明显关系,可以针对30岁以上人群开展“道路安全”宣传教育;由于处罚可以明显降低行人闯红灯的概率,可以进行适当处罚来降低行人闯红灯的概率真题押题真题模拟1(2019益阳市高三模拟)如图所示的三个统计图分别是随机抽查甲、乙、丙三地的若干个家庭教育年投入(万元),记A表示众数,B表示中位数,C表示平均数,则根据图表提供的信息,下面的结论正确的是()AA甲A乙A丙,B甲B乙B丙BB丙B甲B乙,C甲C乙C丙CA丙A甲A乙,C丙C甲C乙DA丙A甲A乙,B丙B甲B乙答案C解析由甲地的条形图可知,家庭教育年投入的中位数为10,众数为10,平均数为10.32;由乙地的折线图可知,家庭教育年投入的中位数为10,众数为10,平均数为9.7;由丙地的扇形图可知,家庭教育年投入的中位数为12,众数为12,平均数为12.4.结合选项可知C正确故选C2(2019全国卷)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A中位数 B平均数C方差 D极差答案A解析中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响故选A3(2019郴州市高三第三次质量检测)新闻出版业不断推进供给侧结构性改革,深入推动优化升级和融合发展,持续提高优质出版产品供给,实现了行业的良性发展下面是2012年至2016年我国新闻出版业和数字出版业营收增长情况:给出下列四个结论:2012年至2016年我国新闻出版业和数字出版业营收均逐年增加2016年我国数字出版业营收超过2012年我国数字出版业营收的2倍2016年我国新闻出版业营收超过2012年我国新闻出版业营收的1.5倍2016年我国数字出版业营收占新闻出版业营收的比例未超过三分之一其中所有正确结论的编号为()A B C D答案C解析根据图示数据可知正确;对于:1935.52387123595.8,不正确;对于:23595.878655720.9,正确故选C4(2019江苏高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是_答案解析这组数据的平均数为8,故方差为s2(68)2(78)2(88)2(88)2(98)2(108)2.5(2019全国卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液每只小鼠给服的溶液体积相同、摩尔浓度相同经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表)解(1)由已知得0.70a0.200.15,故a0.35.b10.050.150.700.10.(2)甲离子残留百分比的平均值的估计值为20.1530.2040.3050.2060.1070.054.05,乙离子残留百分比的平均值的估计值为30.0540.1050.1560.3570.2080.156.00.6(2019湖北武汉高三第二次质量检测)光伏发电是利用太阳能电池及相关设备将太阳光能直接转化为电能近几年在国内出台的光伏发电补贴政策的引导下,某地光伏发电装机量急剧上涨,如下表:某位同学分别用两种模型:bx2a,dxc进行拟合,得到相应的回归方程并进行残差分析,残差图如下(注:残差等于yii):经过计算得(xi)(yi)72.8,(xi)242,(ti)(yi)686.8,(ti)23570,其中tix,i.(1)根据残差图,比较模型,的拟合效果,应该选择哪个模型?并简要说明理由;(2)根据(1)的判断结果及表中数据建立y关于x的回归方程,并预测该地区2020年新增光伏装机量是多少?(在计算回归系数时精确到0.01)附:回归直线的斜率和截距的最小二乘估计公式分别为, .解(1)选择模型.理由如下:根据残差图可以看出,模型的估计值和真实值比较相近,模型的残差值相对较大一些,所以模型的拟合效果相对较好(2)由(1)可知,y关于x的回归方程为x2,令tx2,则t.由所给数据可得i(1491625364964)25.5.i(0.40.81.63.15.17.19.712.2)5,0.19, 50.1925.50.16,所以y关于x的回归方程为0.19x20.16,预测该地区2020年新增光伏装机量为0.191020.1619.16(兆瓦)金版押题7某市环保部门对该市市民进行了一次垃圾分类知识的网络问卷调查,每位市民仅有一次参加机会,通过随机抽样,得到参与问卷调查的100人的得分(满分:100分)数据,统计结果如表所示组别40,50)50,60)60,70)70,80)80,90)90,100男235151812女051010713(1)若规定问卷得分不低于70分的市民称为“环保关注者”,请完成下列22列联表,并判断能否在犯错误的概率不超过0.05的前提下,认为是否为“环保关注者”与性别有关?非“环保关注者”是“环保关注者”合计男女合计(2)若问卷得分不低于80分的人称为“环保达人”现在从本次调查的“环保达人”中利用分层抽样的方法随机抽取5名市民参与环保知识问答,再从这5名市民中抽取2人参与座谈会,求抽取的2名市民中,既有男“环保达人”又有女“环保达人”的概率附表及公式:K2,nabcd.P(K2k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828解(1)由图中表格可得22列联表如下,非“环保关注者”是“环保关注者”合计男104555女153045合计2575100将22列联表中的数据代入公式计算得K2的观测值k3.03s,所以参加比赛的最佳人选为乙三、解答题9(2019青岛市高三一模)某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取100件产品作为样本称出它们的质量(单位:毫克),质量值落在(175,225的产品为合格品,否则为不合格品如表是甲流水线样本频数分布表,如图是乙流水线样本的频率分布直方图产品质量/毫克频数(165,1753(175,1859(185,19519(195,20535(205,21522(215,2257(225,2355(1)由以上统计数据完成下面22列联表,能否在犯错误的概率不超过0.15的前提下认为“产品的包装合格与否与两条自动包装流水线的选择有关”?甲流水线乙流水线总计合格品不合格品总计附表:P(K2k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828(2)按照以往经验,在每小时次品数超过180件时,产品的次品率会大幅度增加,为检测公司的生产能力,同时尽可能控制不合格品总量,公司工程师抽取几组一小时生产的产品数据进行次品情况检查分析,在x(单位:百件)件产品中,得到次品数量y(单位:件)的情况汇总如下表所示:x(百件)0.523.545y(件)214243540根据公司规定,在一小时内不允许次品数超过180件,请通过计算分析,按照公司的现有生产技术设备情况,判断可否安排一小时生产2000件的任务? 解(1)由乙流水线样本的频率分布直方图可知,合格品的个数为100(10.04)96,所以,22列联表是:甲流水线乙流水线总计合格品9296188不合格品8412总计100100200所以K21.4182.072.所以,在犯错误的概率不超过0.15的前提下,不能认为“产品的包装合格与否与两条自动包装流水线的选择有关”(2)由已知可得,3;23;xiyi0.522143.524435540453;x0.52223.52425257.5.由回归直线的系数公式,8.64. 238.6432.92.所以x8.64x2.92.当x20(百件)时,y8.64202.92169.88180,符合有关要求所以按照公司的现有生产技术设备情况,可以安排一小时生产2000件的任务10(2019聊城市高三一模)某小学为了了解四年级学生的家庭作业用时情况,从本校四年级随机抽取了一批学生进行调查,并绘制了学生作业用时的频率分布直方图,如图所示(1)估算这批学生的作业平均用时情况;(2)作业用时不能完全反映学生学业负担情况,这与学生自身的学习习惯有很大关系,如果用时四十分钟之内评价为优异,一个小时以上为一般,其他评价为良好现从优异和良好的学生里面用分层抽样的方法抽取300人,其中女生有90人(优异20人)请完成列联表,并根据列联表分析能否在犯错误的概率不超过0.05的前提下认为学习习惯与性别有关系?男生女生合计良好优异合计附:K2,其中nabcd.P(K2k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828解(1)10(350.01450.02550.03650.025750.01850.005)57.所以批学生作业用时的平均数为57.(2)优异学生数与良好学生数之比为0.01(0.020.03)15,按照分层抽样得300人中优异50人,良好250人;女生90人,男生210人;女生优异20,良好70人,男生优异30人,良好180人,列联表如下:男生女生合计良好18070250优异302050合计21090300K22.8573.841,故不能在犯错误的概率不超过0.05的前提下认为学习习惯与性别有关系11(2019云南省第二次高三统一检测)在某市创建全国文明城市的过程中,创文专家组对该市的中小学进行了抽检,其中抽检的一个环节是对学校的教师和学生分别进行问卷测评下表是被抽检到的五所学校A,B,C,D,E的教师和学生的测评成绩(单位:分):学校ABCDE教师测评成绩x9092939496学生测评成绩y8789899293 (1)建立y关于x的回归方程x;(2)现从A,B,C,D,E这五所学校中随机选两所派代表参加座谈,求A,B两所学校至少有一所被选到的概率P.附:, .解(1)依据题意计算得93,90, (xi)2(3)2(1)202123220, (xi)(yi)(3)(3)(1)(1)0(1)123321, 9093.所求回归方程为x.(2)从A,B,C,D,E这5所学校中随机选2所,具体情况为(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),(C,D),(C,E),(D,E),共有10种A,B两所学校至少有一所被选到的为(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),共有7种它们都是等可能发生的,所以A,B两所学校至少有一所被选到的概率P.
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 成人自考


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!