2019届高考数学二轮复习 第二篇 专题通关攻略 专题5 统计与概率 专题能力提升练十三 2.5.1 统计、统计案例.doc

上传人:tian****1990 文档编号:6342861 上传时间:2020-02-23 格式:DOC 页数:21 大小:1.73MB
返回 下载 相关 举报
2019届高考数学二轮复习 第二篇 专题通关攻略 专题5 统计与概率 专题能力提升练十三 2.5.1 统计、统计案例.doc_第1页
第1页 / 共21页
2019届高考数学二轮复习 第二篇 专题通关攻略 专题5 统计与概率 专题能力提升练十三 2.5.1 统计、统计案例.doc_第2页
第2页 / 共21页
2019届高考数学二轮复习 第二篇 专题通关攻略 专题5 统计与概率 专题能力提升练十三 2.5.1 统计、统计案例.doc_第3页
第3页 / 共21页
点击查看更多>>
资源描述
专题能力提升练 十三 统计、统计案例(45分钟80分)一、选择题(每小题5分,共30分)1.(2018资阳二模)为考察A,B两种药物预防某疾病的效果,进行动物试验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是()A.药物B的预防效果优于药物A的预防效果B.药物A的预防效果优于药物B的预防效果C.药物A,B对该疾病均有显著的预防效果D.药物A,B对该疾病均没有预防效果【解析】选B.由等高条形图可知,服用药物A患病与未患病的比例数差异更加明显,所以药物A的预防效果优于药物B的预防效果.2.一个频数分布表(样本容量为30)不小心被损坏了一部分,若样本中数据在20,60)内的频率为0.8,则样本中在40,60)内的数据个数为()A.15B.16C.17D.19【解析】选A.因为样本中数据在20,60)上的频率为0.8,由图知,样本中数据在20,40)上的频率为4+5=9,所以样本中数据在20,40)上的频率为930=0.3.所以样本在40,50),50,60)内的数据的频率和为0.8-0.3=0.5,所以样本在40,50),50,60)内的数据的个数和为300.5=15.3.下表是我国某城市在2017年1月份至10月份各月最低温与最高温()的数据一览表.月份12345678910最高温59911172427303121最低温-12-31-271719232510已知该城市的各月最低温与最高温具有相关关系,根据该一览表,则下列结论错误的是()A.最低温与最高温为正相关B.每月最高温与最低温的平均值在前8个月逐月增加C.月温差(最高温减最低温)的最大值出现在1月D.1月至4月的月温差(最高温减最低温)相对于7月至10月,波动性更大【解析】选B.A项,由表格前两行(最高温、最低温)可知最低温大致随最高温增大而增大,故A项正确,不符合题意.B项,由表格可知,3月最高温与最低温的平均值为5 ,4月最高温与最低温的平均值为4.5 s22,1月至4月的波动性更大,故D项正确,不符合题意.4.在某校连续5次考试中,统计甲、乙两名同学的数学成绩得到如图所示的茎叶图.已知甲同学5次成绩的平均数为81,乙同学5次成绩的中位数为73,则x+y的值为()A.3B.4C.5D.6【解析】选A.因为81=77+72+86+80+x+905所以x=0,因为乙同学5次成绩的中位数为73,所以y=3,所以x+y=3.【加固训练】 在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间139,151上的运动员人数是()A.3B.4C.5D.6【解析】选B.由题意知,将135号分成7组,每组5名运动员,成绩落在区间139,151的运动员共有4组,故由系统抽样法知,共抽取4名.5.(2018泸州三模)某中学兴趣小组为调查该校学生对学校食堂的某种食品喜爱与否是否与性别有关,随机询问了100名性别不同的学生,得到如下的22列联表:男生女生总计喜爱 3020 50不喜爱 20 30 50总计 50 50 100附K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d). P(K2k0) 0.15 0.10 0.05 0.025 0.010 k0 2.072 2.706 3.841 5.024 6.635根据以上数据,该数学兴趣小组在犯错误的概率不超过多少的前提下认为“喜爱该食品与性别有关”?()A.0.01B.0.025C.0.05D.0.15【解析】选C.k=100(3030-2020)250505050=43.841,所以该数学兴趣小组在犯错误的概率不超过0.05的前提下认为“喜爱该食品与性别有关”.6.我国古代数学名著九章算术中有如下问题“今有北乡八千七百五十八,西乡七千二百三十六,南乡算八千三百五十六,凡三乡,发役三百七十八人,欲以算数多少出之,何各几何?”意思是:北乡有8 758人,西乡有7 236人,南乡有8 356人,现要按人数多少从三乡共征集378人,问从各乡征集多少人?在上述问题中,需从西乡征集的人数是()A.102B.112C.130D.136【解析】选B.北乡有8 758人,西乡有7 236人,南乡有8 356人,现要按人数多少从三乡共征集378人,需从西乡征集的人数是3787 2368 758+7 236+8 356112.二、填空题(每小题5分,共10分)7.某学校为了调查学生在学科教辅书方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出的钱数在 30,40)的同学比支出的钱数在 10,20)的同学多26人,则n的值为_.【解析】样本数据落在30,40)上的频率为0.03810=0.38,落在10,20)上的频率为0.01210=0.12,因为支出在30,40)元的同学比支出在10,20)元的同学多26人,所以0.38n-0.12n=26,解得n=100.答案:100【加固训练】(2018绵阳二模)交通部门利用测速仪测得成绵高速公路绵阳段2018年元旦期间某时段车速的数据(单位:km/h),从中随机抽取2 000个样本,作出如图所示的频率分布直方图,则绵阳段车速的中位数的估计值为_.(精确到个位)【解析】根据中位数的定义与频率分布直方图可得,在这2 000个样本中,因为(0.010+0.030)10=0.4,(0.010+0.030+0.035)10=0.750.5,所以中位数在90100之间,具体为90+0.100.03592.857,精确到个位为93.由样本估计整体,可得绵阳段车速的中位数的估计值为93.答案:938.已知由样本数据点集合(xi,yi)|i=1,2,n求得的回归直线方程为=1.5x+0.5,且x=3.现发现两个数据点(1.1,2.1)和(4.9,7.9)误差较大,去除后重新求得的回归直线l的斜率为1.2,那么,当x=2时,y的估计值为_.【解题导引】解答本题的主要依据是回归直线必过样本点的中心,关键是分析出去除这两个数据点后,样本点的中心不变.【解析】将x=3代入=1.5x+0.5得y=5.所以样本点的中心为(3,5),由数据点(1.1,2.1)和(4.9,7.9)知:1.1+4.92=3,2.1+7.92=5,故去除这两个数据点后,样本点的中心不变.设新的回归直线方程为=1.2x+b,将样本点的中心的坐标代入得:b=1.4,所以,当x=2时,y的估计值为3.8.答案:3.8三、解答题(共40分)9.(12分)(2018山东省实验中学模拟)某省电视台为了解该省卫视一档成语类节目的收视情况,抽查东西两部各5个城市,得到观看该节目的人数(单位:千人)如下茎叶图所示,其中一个数字被污损.(1)求东部各城市观看该节目观众平均人数超过西部各城市观看该节目观众平均人数的概率.(2)节目的播出极大地激发了观众对成语知识的学习与积累的热情.现从观看节目的观众中随机统计了4位观众的周均学习成语知识的时间y(单位:小时)与年龄x(单位:岁),并制作了对照表(如下表所示):年龄x20304050周均学习成语知识时间y2.5344.5由表中数据分析,x,y呈线性相关关系,试求线性回归方程=x+,并预测年龄为60岁观众周均学习成语知识的时间.参考数据:线性回归方程中,的最小二乘估计分别是=i=1nxiyi-nx yi=1nxi2-n(x)2,=y-x.【解析】(1)设被污损的数字为a,则a有10种情况.令88+89+90+91+9283+83+87+90+a+99,则a1”的概率.附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),P(K2k0)0.100.050.0250.010k02.7063.8415.0246.635【解析】(1)在样本数据中,男性好友B类别设为x人,则由题意可知1+x+3+3x+4x=20,可知x=2,故B类别有2人,D类别有6人,E类别有8人,走路步数在5 00110 000步的包括C,D两类别共计9人;女性好友走路步数在5 00110 000步共有16人.用样本数据估计所有微信好友每日走路步数的概率分布,则:6009+1640=375人.(2)根据题意选取的40个样本数据的22列联表为:卫健型进步型总计男14620女81220总计221840得到k=40(1412-68)2202022183.6361”包含“x=3,y=1”,“x=3,y=0”,“x=2,y=0”,“x=0,y=2”.P(x=3,y=1)=C73C103C21C31C52=42240,P(x=3,y=0)=C73C103C32C52=21240.P(x=2,y=0)=C72C31C103C32C52=63400,P(x=0,y=2)=C33C103C22C52=11 200,故P(|x-y|1)=42240+21240+63400+11 200=101240.【加固训练】1.近代统计学的发展起源于二十世纪初,它是在概率论的基础上发展起来的,统计性质的工作可以追溯到远古的“结绳记事”和二十四史中大量的关于人口、钱粮、水文、天文、地震等资料的记录.近几年,雾霾来袭,对某市该年11月份的天气情况进行统计,结果如下:表一日期123456789101112131415天气晴霾霾阴霾霾阴霾霾霾阴晴霾霾霾日期161718192021222324252627282930天气霾霾霾阴晴霾霾晴霾晴霾霾霾晴霾由于此种情况某市政府为减少雾霾于次年采取了全年限行的政策.下表是一个调査机构对比以上两年11月份(该年不限行30天、次年限行30天共60天)的调查结果:表二不限行限行总计没有雾霾a有雾霾b总计303060(1)请由表一数据求a,b,并求在该年11月份任取一天,估计该市是晴天的概率.(2)请用统计学原理计算若在犯错误的概率不超过0.1的前提下不能认为雾霾与限行有关系,则限行时有多少天没有雾霾?(由于不能使用计算器,所以表中数据使用时四舍五入取整数)P(K2k)0.1000.0500.0100.001k2.7063.8416.63510.828K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).【解析】(1)根据题意知,a=10,b=30-10=20,在该年11月份任取一天,估计该市是晴天的概率为P=630=15.(2)设限行时x天没有雾霾,则有雾霾为(30-x)天,由题意得,k=6010(30-x)-20x23030(10+x)(50-x)3,化简为21x2-440x+1 5000,x0,30,且xN*,即(7x-30)(3x-50)0,解得307x503,所以5x16,且xN*,所以在犯错误的概率不超过0.1的前提下不能认为雾霾与限行有关系,则限行时有516天没有雾霾天气.2.(2018珠海模拟)某兴趣小组进行“野岛生存”实践活动,他们设置了200个取水敞口箱.其中100个采用A种取水法,100个采用B种取水法.如图甲为A种方法一个夜晚操作一次100个水箱积取淡水量频率分布直方图,图乙为B种方法一个夜晚操作一次100个水箱积取淡水量频率分布直方图.(1)设两种取水方法互不影响,设M表示事件“A法取水箱水量不低于1.0 kg,B法取水箱水量不低于1.1 kg”,以样本估计总体,以频率分布直方图中的频率为概率,估计M的概率.(2)填写下面22列联表,并判断是否在犯错误的概率不超过0.01的前提下认为箱积水量与取水方法有关.箱积水量1.1 kg箱积水量1.1 kg箱数总计A法B法箱数总计附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).P(K2k0)0.0500.0100.001k03.8416.63510.828【解析】(1)设“A法取水箱水量不低于1.0 kg”为事件E,“B法取水箱水量不低于1.1 kg”为事件F,则P(E)=(2+1+0.3)0.1=0.33,P(F)=(5+3+0.2+0.1)0.1=0.83,P(M)=P(EF)=P(E)P(F)=0.330.83=0.2739,故M发生的概率为0.2739.(2)填写22列联表如下:箱积水量6.635,因此,在犯错误的概率不超过0.01的前提下认为箱积水量与取水方法有关.11.(16分)(2018成都二模)随着移动互联网的快速发展,基于互联网的共享单车应运而生,某市场研究人员为了了解共享单车运营公司M的经营状况,对该公司最近六个月内的市场占有率进行了统计,并绘制了相应的折线图:(1)由折线图可以看出,可用线性回归模型拟合月度市场占有率y与月份代码x之间的关系,求y关于x的线性回归方程,并预测M公司2017年4月的市场占有率.(2)为进一步扩大市场,公司拟再采购一批单车,现有采购成本分别为1 000元/辆和1 200元/辆的A,B两款车型可供选择,按规定每辆单车最多使用4年,但由于多种原因(如骑行频率等)会导致单车使用寿命各不相同.考虑到公司运营的经济效益,该公司决定先对这两款车型的单车各100辆进行科学模拟测试,得到两款单车使用寿命的频数表如下:寿命车型1年2年3年4年总计A20353510100B10304020100经测算,平均每辆单车每年可以带来收入500元.不考虑除采购成本之外的其他成本,假设每辆单车的使用寿命都是整数年,且以频率作为每辆单车使用寿命的概率.如果你是M公司的负责人,以每辆单车产生利润的期望值为决策依据,你会选择采购哪款车型?参考公式:回归直线方程为=x+,其中=i=1n(xi-x)(yi-y)i=1n(xi-x)2,=y-x.【解析】(1)由题意,x=3.5,y=16,i=16(xi-x)(yi-y)=35,i=16(xi-x)2=17.5.=3517.5=2,=y-x=16-23.5=9,所以=2x+9,x=7时,=27+9=23,即预测M公司2017年4月份(即x=7时)的市场占有率为23%.(2)由频率估计概率,每辆A款单车可使用1年,2年,3年,4年的概率分别为0.2,0.35,0.35,0.1,所以每辆A款车的利润数学期望为(500-1 000)0.2+(1 000-1 000)0.35+(1 500-1 000)0.35+(2 000-1 000)0.1=175元,每辆B款单车可使用1年,2年,3年,4年的概率分别为0.1,0.3,0.4,0.2,所以每辆B款车的利润数学期望为(500-1 200)0.1+(1 000-1 200)0.3+(1 500-1 200)0.4+(2 000-1 200)0.2=150元.所以采购A款车型.(建议用时:50分钟)1.一组数据共有7个数,记得其中有10,2,5,2,4,2,还有一个数没记清,但知道这组数的平均数、中位数、众数依次成等差数列,这个数的所有可能值的和为()A.9B.3C.17D.-11【解析】选A.设这个数为x,则平均数为25+x7,众数为2,若x2,则中位数为2,此时x=-11;若2x0,若该运动员在这5场比赛中得分的中位数为12,则得分的平均数不可能为()A.685B.695C.715D.14【解题导引】根据中位数为12,得出a12,计算平均数得出结论.【解析】选C.若中位数为12,则a12,所以平均分为12+a+8+15+23514=705,由选项知平均数不可能为715.2.某同学用收集到的6组数据对(xi,yi)(i=1,2,3,4,5,6)制作成如图所示的散点图(点旁的数据为该点坐标),并由最小二乘法计算得到回归直线l的方程为=x+,相关系数为r.现给出以下3个结论:r0;直线l恰好过点D;1;其中正确结论是()A.B.C.D.【解析】选A.由图可知这些点分布在一条斜率大于零的直线附近,所以为正相关,即相关系数r0;因为x=0+1+2+3+5+76=3,y=1.5+2+2.3+3+5+4.26=3,所以回归直线l的方程必过点(x,y)=(3,3),即直线l恰好过点D.因为直线l斜率接近于AD斜率,而kAD=3-1.53=121,所以错误,综上,正确结论是.3.下列说法中正确的是()A.若分类变量X和Y的随机变量K2的观测值k越大,则“X与Y相关”的可信程度越小B.对于自变量x和因变量y,当x取值一定时,y的取值具有一定的随机性,x,y间的这种非确定关系叫做函数关系C.相关系数r2越接近1,表明两个随机变量线性相关性越弱D.若分类变量X与Y的随机变量K2的观测值k越小,则两个分类变量有关系的把握性越小【解析】选D.对于选项A,若分类变量X和Y的随机变量K2的观测值k越大,则“X与Y相关”的可信程度越大,所以A错误;对于选项B,对于自变量x和因变量y,当x取值一定时,y的取值具有一定的随机性,x,y间的这种非确定关系叫做相关关系,所以B错误;对于选项C,相关系数r2越接近1,表明两个随机变量线性相关性越强,所以C错误;对于选项D,若分类变量X与Y的随机变量K2的观测值k越小,则两个分类变量有关系的把握性越小,所以D正确.4.某工厂有120名工人,其年龄都在2060岁之间,各年龄段人数按20,30),30,40),40,50),50,60分成四组,其频率分布直方图如图所示.工厂为了开发新产品,引进了新的生产设备.现采用分层抽样法从全厂工人中抽取一个容量为20的样本参加新设备培训,培训结束后进行结业考试.已知各年龄段培训结业考试成绩优秀的人数如表所示:年龄分组培训成绩优秀人数20,30)530,40)640,50)250,601若随机从年龄段20,30)和40,50)的参加培训工人中各抽取1人,则这两人培训结业考试成绩恰有一人优秀的概率为_.【解析】由频率分布直方图可知,年龄段20,30),30,40),40,50),50,60的人数的频率分别为0.3,0.35,0.2,0.15,所以年龄段20,30),30,40),40,50),50,60应抽取人数分别为6,7,4,3,若随机从年龄段20,30)和40,50)的参加培训工人中各抽取1人,则这两人培训结业考试成绩恰有一人优秀的概率为P=52+1264=12.答案:125.“共享单车”的出现,为我们提供了一种新型的交通方式.某机构为了调查人们对此种交通方式的满意度,从交通拥堵不严重的A城市和交通拥堵严重的B城市分别随机调查了20个用户,得到了一个用户满意度评分的样本,并绘制出茎叶图如图:(1)根据茎叶图,比较两城市满意度评分的平均值的大小及方差的大小(不要求计算出具体值,给出结论即可).(2)若得分不低于80分,则认为该用户对此种交通方式“认可”,否则认为该用户对此种交通方式“不认可”,请根据此样本完成此22列联表,并据此样本分析是否在犯错误的概率不超过0.05的前提下认为城市拥堵与认可共享单车有关.AB总计认可不认可总计(3)若从此样本中的A城市和B城市各抽取1人,则在此2人中恰有一人认可的条件下,此人来自B城市的概率是多少?附:参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).【解析】(1)A城市评分的平均值小于B城市评分的平均值;A城市评分的方差大于B城市评分的方差.(2)22列联表认可不认可总计A城市51520B城市101020总计152540根据列联表中的数据,得到k=40(510-1015)220201525=83P2,所以G1421次老乘客较多.(2)根据题意,填写列联表如下;老乘客新乘客总计50岁以上10253550岁以下303565总计4060100计算k=100(1035-2530)2356540602.932.706,所以在犯错误的概率不超过0.1的前提下认为年龄与乘车次数有关.6.(2018衡水一模)一只药用昆虫的产卵数y与一定范围内的温度x有关,现收集了该种药用昆虫的6组观测数据如下表:温度x/212324272932产卵数y/个61120275777经计算得:x=16i=16xi=26,y=16i=16yi=33,i=16(xi-x)(yi-y)=557,i=16(xi-x)2=84,i=16(yi-y)2=3 930,线性回归模型的残差平方和i=16(yi-i)2=236.64,e8.06053 167,其中xi,yi分别为观测数据中的温差和产卵数,i=1,2,3,4,5,6.(1)若用线性回归模型,求y关于x的回归方程=x+(精确到0.1).(2)若用非线性回归模型求得y关于x回归方程为=0.06e0.2303x,且相关指数R2=0.9522.(i)试与(1)中的回归模型相比,用R2说明哪种模型的拟合效果更好.(ii)用拟合效果好的模型预测温度为35 时该种药用昆虫的产卵数(结果取整数).附:一组数据(x1,y1),(x2,y2),(xn,yn),其回归直线=x+的斜率和截距的最小二乘估计为=i=1n(xi-x)(yi-y)i=1n(xi-x)2,=y-x;相关指数R2=1-.【解析】(1)由题意得,=i=1n(xi-x)(yi-y)i=1n(xi-x)2=557846.6,所以=33-6.626=-138.6,所以y关于x的线性回归方程为=6.6x-138.6.(2)()由所给数据求得的线性回归方程为=6.6x-138.6,相关指数为R2=1-=1-236.643 9301-0.0602=0.9398.因为0.93980.9522,所以回归方程=0.06e0.2303x比线性回归方程=6.6x-138.6拟合效果更好.()由()得当温度x=35 时,=0.06e0.230 335=0.06e8.0605.又因为e8.06053 167,所以0.063 167190(个).即当温度x=35 时,该种药用昆虫的产卵数估计为190个.
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 高中资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!