资源描述
2019-2020年高考数学二轮复习 专题7 概率与统计 第2讲 统计与统计案例 文 抽样方法1.(xx新课标全国卷)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是(C)(A)简单随机抽样(B)按性别分层抽样(C)按学段分层抽样(D)系统抽样解析:由于三个学段学生的视力情况差异较大,故需按学段分层抽样.故选C.2.(xx青岛模拟)高三(3)班共有学生56人,座号分别为1,2,3,56,现根据座号,用系统抽样的方法,抽取一个容量为4的样本.已知3号、17号、45号同学在样本中,那么样本中还有一个同学的座号是(B)(A)30(B)31(C)32(D)33解析:k=14,则样本中4名同学的座号依次构成以4为首项,14为公差的等差数列,故样本中还有一个同学的座号是31.3.某校对高三年级1600名男女学生的视力状况进行调查,现用分层抽样的方法抽取一个容量是200的样本,已知样本中女生比男生少10人,则该校高三年级的女生人数是.解析:抽样比为2001600=18,样本中女生人数为=95,所以该校高三年级的女生人数为958=760.答案:7604.假设要考查某公司生产的500克袋装牛奶的三聚氰胺是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,799进行编号,如果从随机数表第7行第8列的数开始向右读,则得到第4个样本个体的编号是.(下面摘取了随机数表第7行至第9行)844217533157245506887704744767217633502583921206766301637859169556671998105071751286735807443952387933211234297864560782524207443815510013429966027954解析:找到第7行第8列的数开始向右读,第一个符合条件的数是331,第二个数是572,第三个数是455,第四个数是068.答案:068样本估计总体5.某校100名学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是50,60),60,70),70,80),80,90),90,100,则图中a的值为(B)(A)0.006 (B)0.005(C)0.0045(D)0.0025解析:由题意知,a=0.005.6.如图是xx年某大学自主招生面试环节中,七位评委为某考生打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和众数依次为(A)(A)85,84(B)84,85(C)86,84(D)84,86解析:由图可知,去掉一个最高分和一个最低分后,所剩数据为84,84,84,86,87.所以平均数为=85,众数为84.7.(xx江苏卷)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为.解析:由已知得,所求平均数为=6.答案:6回归方程及其应用8.某产品的广告费用x与销售额y的统计数据如表:根据如表可得回归方程=x+中的=10.6,据此模型预报广告费用为10万元时销售额为(D)广告费用x(万元)4235销售额y(万元)49263958(A)112.1万元(B)113.1万元(C)113.9万元(D)111.9万元解析:因为=3.5,=43,将(3.5,43)代入=10.6x+中得=5.9,=10.6x+5.9,当x=10时,=111.9.9.(xx新课标全国卷)某地区xx年至xx年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份xxxxxxxxxxxxxx年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析xx年至xx年该地区农村居民家庭人均纯收入的变化情况,并预测该地区xx年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘法估计公式分别为=,=-解:(1)由所给数据计算得=(1+2+3+4+5+6+7)=4,=(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,(ti-)2=9+4+1+0+1+4+9=28,(ti-)(yi-)=(-3)(-1.4)+(-2)(-1)+(-1)(-0.7)+00.1+10.5+20.9+31.6=14,=0.5,=-=4.3-0.54=2.3,所求回归方程为=0.5t+2.3.(2)由(1)知,=0.50.故xx年至xx年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将xx年的年份代号t=9代入(1)中的回归方程,得=0.59+2.3=6.8,故预测该地区xx年农村居民家庭人均纯收入为6.8千元. 一、选择题1.(xx四川卷)在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间的全体是(A)(A)总体(B)个体(C)样本的容量(D)从总体中抽取的一个样本解析:5000名居民的阅读时间的全体是总体,每名居民的阅读时间是个体,200名居民的阅读时间是样本,故选A.2.(xx陕西卷)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为(C)(A)93(B)123(C)137(D)167解析:因为该校女教师的人数为11070%+150(1-60%)=77+60=137,所以选C.3.某公司在甲、乙、丙、丁四个地区分别有150,120,180,150个销售点.公司为了调查产品销售情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为;在丙地区有20个大型销售点,要从中抽取7个调查其销售收入和售后服务等情况,记这项调查为,则完成,这两项调查宜采用的抽样方法依次是(B)(A)分层抽样法,系统抽样法(B)分层抽样法,简单随机抽样法(C)系统抽样法,分层抽样法(D)简单随机抽样法,分层抽样法解析:甲、乙、丙、丁四个地区会存在差异,采用分层抽样法较好.抽取的样本个数较少,采用简单随机抽样法.4.xx年春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到列联表:做不到“光盘”能做到“光盘”男4510女3015则下面的正确结论是(A)(A)有90%以上的把握认为“该市居民能否做到光盘与性别有关”(B)在犯错误的概率不超过1%的前提下,认为“该市居民能否做到光盘与性别无关”(C)在犯错误的概率不超过1%的前提下,认为“该市居民能否做到光盘与性别有关”(D)有90%以上的把握认为“该市居民能否做到光盘与性别无关”解析:由22列联表得到a=45,b=10,c=30,d=15,则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100,计算得K2的观测值k=3.030.因为2.7063.030,s1s2(B),s1s2(C)s2(D),s10,b0(B)a0,b0(C)a0(D)a0,b0解析:由表中数据画出散点图,如图,由散点图可知b0,选B.8.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则(C)(A)甲的成绩的平均数小于乙的成绩的平均数(B)甲的成绩的中位数等于乙的成绩的中位数(C)甲的成绩的方差小于乙的成绩的方差(D)甲的成绩的极差小于乙的成绩的极差解析:甲的平均数是=6,中位数是6,极差是4,方差是=2;乙的平均数是=6,中位数是5,极差是4,方差是=,故选C.9.某学校从高二甲、乙两个班中各选6名同学参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图,其中甲班学生成绩的众数是85,乙班学生成绩的平均分为81,则x+y的值为(D)(A)6(B)7(C)8(D)9解析:由众数的定义知x=5,由乙班的平均分为81得=81,解得y=4,故x+y=9.10.某教研机构随机抽取某校20个班级,调查各班关注汉字听写大赛的学生人数,根据所得数据的茎叶图,以组距为5将数据分组成0,5),5,10),10,15),15,20),20,25),25,30),30,35),35,40时,所作的频率分布直方图如图所示,则原始茎叶图可能是(A)解析:由频率分布直方图可知:0,5)的频数为200.015=1个,5,10)的频数为200.015=1个,10,15)的频数为200.045=4个,15,20)的频数为200.025=2个,20,25)的频数为200.045=4个,25,30)的频数为200.035=3个,30,35)的频数为200.035=3个,35,40的频数为200.025=2个,则对应的茎叶图可能为A,故选A.11.(xx河南模拟)在检验某产品直径尺寸的过程中,将某尺寸分成若干组,a,b)是其中的一组,抽查出的个体数在该组上的频率为m,该组在频率分布直方图上的高为h,则|a-b|等于(A)(A)(B)(C)mh(D)与h,m无关解析:根据频率分布直方图的概念可知|a-b|h=m,由此可知|a-b|=.12.(xx福建卷)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万元家庭的年支出为(B)(A)11.4万元(B)11.8万元(C)12.0万元(D)12.2万元解析:由统计数据表可得=10.0,=8.0,则=8.0-0.7610.0=0.4,所以回归直线方程为=0.76x+0.4,当x=15时,=0.7615+0.4=11.8,故估计年收入为15万元家庭的年支出为11.8万元.故选B.二、填空题13.某学校共有师生3200人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是.解析:设该学校的教师人数为x,由分层抽样的特点知=,所以x=200.答案:20014.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的22列联表:喜爱打篮球不喜爱打篮球总计男生20525女生101525总计302050则在犯错误的概率不超过的前提下认为喜爱打篮球与性别有关(请用百分数表示).P(K2k0)0.100.050.0250.0100.0050.001k02.7063.8415.0246.6357.87910.828解析:由公式K2=可计算K2的观测值k=8.3337.879.因此在犯错误的概率不超过0.5%的前提下认为喜爱打篮球与性别有关.答案:0.5%15.(xx大同三模)为了解某校教师使用多媒体进行教学的情况,现采用简单随机抽样的方法,从该校200名授课教师中抽取20名教师,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如图所示.据此可估计该校200名教师中,上学期使用多媒体进行教学次数在15,25)内的人数约为.解析:由茎叶图可得在15,25)内的人数分布的频率为=,于是可估计该校200名教师中,上学期使用多媒体进行教学次数在15,25)内的人数约为200=60.答案:6016.(xx湖南卷)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间139,151上的运动员人数是.解析:由系统抽样方法知,应把35人分成7组,每组5人,每组按规则抽取1人,因为成绩在区间139,151上的共有4组,故成绩在区间139,151上的运动员人数是4.答案:4 统计、统计案例与概率的综合问题训练提示:(1)统计与古典概型的综合问题;(2)回归分析与概率的综合问题;(3)独立性检验与古典概型的综合问题.1.(xx锦州质检)如图所示的茎叶图记录了甲、乙两组各四名同学的投篮命中次数,乙组记录中有一个数据模糊,无法确认,在图中以x表示.(1)如果乙组同学投篮命中次数的平均数为,求x及乙组同学投篮命中次数的方差;(2)在(1)的条件下,分别从甲、乙两组投篮命中次数低于10次的同学中,各随机选取一名,求这两名同学的投篮命中次数之和为17的概率.解:(1)依题意得=,解得x=8,方差s2=2(8-)2+(9-)2+(10-)2=.(2)记甲组投篮命中次数低于10次的同学为A1,A2,他们的命中次数分别为9,7.乙组投篮命中次数低于10次的同学为B1,B2,B3,他们的命中次数分别为8,8,9.依题意,不同的选取方法有(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3)共6种.设“这两名同学的投篮命中次数之和为17”为事件C,则C中恰含有(A1,B1),(A1,B2)共2种,所以P(C)=.2.(xx遵义市高三联考)从某学校的1600名男生中随机抽取50名测量身高,被测学生身高全部介于155 cm和195 cm之间,将测量结果按如下方式分成八组:第一组155,160),第二组160,165),第八组190,195,如图是按上述分组方法得到的频率分布直方图的一部分,第六组的人数为4人.(1)求第七组的频率;(2)估计该校1600名男生中身高在180 cm以上(含180 cm)的人数;(3)若从身高属于第六组和第八组的所有男生中随机抽取两名男生,设他们的身高分别为x,y,记事件E=(x,y)|x-y|5,求事件E的概率.解:(1)第六组的频率为=0.08.所以第七组的频率为1-0.08-5(0.0082+0.016+0.042+0.06)=0.06;(2)由直方图得后三组频率为0.06+0.08+0.0085=0.18,所以估计该校1600名男生中身高在180 cm以上(含180 cm)的人数为0.181600=288人.(3)第六组180,185)的人数为4人,设为a,b,c,d,第八组190,195的人数为2人,设为A,B,则有ab,ac,ad,bc,bd,cd,aA,bA,cA,dA,aB,bB,cB,dB,AB,共15种情况.因事件E=(x,y)|x-y|5发生当且仅当随机抽取的两名男生在同一组,所以事件E包含的基本事件为ab,ac,ad,bc,bd,cd,AB共7种情况,故P(E)=.3.(xx黑龙江高三模拟)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:日期1月10日2月10日3月10日4月10日5月10日6月10日昼夜温差x()1011131286就诊人数y(个)222529261612该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y关于x的线性回归方程=x+;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问(2)中所得线性回归方程是否理想?解:(1)设抽到相邻两个月的数据为事件A,因为从6组数据中选取2组数据共有15种情况,每种情况都是等可能出现的,其中,抽到相邻两个月的数据的情况有5种,所以P(A)=.(2)由数据求得=11,=24,由公式求得=,再由=-=-,所以y关于x的线性回归方程为=x-.(3)当x=10时,=,-222;同样,当x=6时,=, -123.841.所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.
展开阅读全文