资源描述
第15讲概率与统计考情分析统计的主要内容包括随机抽样、用样本估计总体、变量的相关关系;概率部分以考查古典(几何)概型、互斥事件、对立事件等为主,主要以选择或填空的方式呈现,多为低、中档题目热点题型分析热点1抽样方法与用样本估计总体1.抽样方法2样本的数字特征(1)众数:在样本数据中,出现次数最多的那个数据;(2)中位数:样本数据中,将数据按大小排列,位于最中间的一个或两个数据的平均数,是样本数据的“中心点”;(3)平均数:样本数据的算术平均数,即(x1x2xn),是样本数据的平均水平;(4)方差与标准差:是样本数据到平均数的一种平均距离,表示样本数据的离散程度,标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小方差:s2(x1)2(x2)2(xn)2;标准差:s.3直方图的两个结论(1)小长方形的面积组距频率;(2)各小长方形的面积之和等于1.4直方图与众数、中位数和平均数的关系(1)众数:是直方图中最高矩形的底边中点横坐标;(2)中位数:是直方图中平分所有矩形面积和,且垂直于横轴的直线与横轴交点的横坐标;(3)平均数:是每个小矩形的面积乘以小矩形底边中点的横坐标之和1(2019东三省三校一模)如图是某居民小区年龄在20岁到45岁的居民上网情况的频率分布直方图,现已知年龄在30,35),35,40),40,45的上网人数呈现递减的等差数列,且年龄在30,35)的频率为0.3,则由此频率分布直方图估计该小区在20岁到45岁的居民上网年龄的()A平均数为32.5 B众数为32.25C中位数为 D在40,45的频率为0.15答案C解析由题意可知20,25),25,30),30,35)的频率分别为0.05,0.35,0.3.设35,40),40,45的频率分别为a,b.因为已知年龄在30,35),35,40),40,45的上网人数呈现递减的等差数列,所以他们的频率也成递减的等差数列,则有ab0.3且2ab0.3,解得a0.2,b0.1,故选项D不正确;居民上网年龄的平均数为22.50.0527.50.3532.50.337.50.242.50.132.25,所以A不正确;根据众数和直方图的关系,可得上网年龄的众数为27.5,故B不正确;由前面计算可知中位数在30,35)组中,设中位数为x,则,解得x,故选C2一个总体中的100个个体的号码分别为0,1,2,99,并依次将其分为10个小组,组号为0,1,2,9.要用系统抽样方法抽取一个容量为10的样本,规定如果在第0组随机抽取的号码为m,那么依次错位地得到后面各组的号码,即第k组(k1,2,9)中抽取的号码个位数字为mk或mk10(如果mk10),当m5时,第8组抽取的号码为_答案83解析因为m5,k8,则mk13,则第8组中抽取号码的个位数字为mk103,所以第8组抽取的号码为83.3(2019江苏高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是_答案解析这组数据的平均数为8,故方差为s2(68)2(78)2(88)2(88)2(98)2(108)2.1对于以统计图为载体的概率与统计问题,认真观察图表,从中提取有用信息和数据是解题关键特别是利用频率直方图解题时,常把直方图的高误认为是频率而导致错误因此,应注意每个小矩形的面积为频率,所有面积和为1.对于第1题这类,利用直方图考查众数、中位数和平均数的问题,关键在于相应的计算公式是否掌握,特别是中位数问题,找准中位数所在的区间是解题关键;2对于抽样方法的问题,要明确总体的基本特征符合哪种抽样特点对于系统抽样通常是等距抽样,但也有例外情况,如第2题给出的规则即为每组号码错后一位,如果还按照等距原则计算,就会出现错解85.因此解决系统抽样的问题时,要认真审题,分析题目给出的抽取规则,按照规则进行抽样;3对于样本的数字特征的一系列问题(如第3题),解题关键在于计算公式的准确使用和计算准确,应掌握简便运算的方法,减小计算量,提高准确率热点2统计案例1线性回归方程方程x称为线性回归方程,利用最小二乘法估计公式斜率和截距分别为, ,其中(,)是样本点的中心,且回归直线恒过该点2相关系数r,当r0时,表明变量x与y正相关,r3.841时,则有95%的把握说两个事件有关;当K26.635时,则有99%的把握说两个事件有关1(2019衡水中学调研)已知变量x,y之间的线性回归方程为0.7x10.3,且变量x,y之间的一组相关数据如下表所示,则下列说法错误的是()x681012y6m32A变量x,y之间呈负相关关系B可以预测,当x20时,3.7Cm4D该回归直线必过点(9,4)答案C解析由题意得,由0.73.841,所以有95%的把握认为选修文科与性别有关1线性回归分析是对有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义;同时,根据回归方程预测仅是一个预测值,而不是真实发生的值2独立检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表在分析问题时一定要注意不可对某个问题下确定性结论,否则就可能对统计计算的结果做出错误的解释热点3古典概型、几何概型1古典概型P(A).2几何概型P(A).1(2019全国卷)两位男同学和两位女同学随机排成一列,则两位女同学相邻的概率是()A B C D答案D解析设两位男同学分别为A,B,两位女同学分别为a,b,则用“树形图”表示四位同学排成一列所有可能的结果如图所示由图知,共有24种等可能的结果,其中两位女同学相邻的结果(画“”的情况)共有12种,故所求概率为.故选D2(2019西安调研)若函数f(x)在区间0,e上随机取一个实数x,则f(x)的值不小于常数e的概率是()A B1 C D答案B解析当0x1时,恒有f(x)ex1的概率为()A B C D答案B解析由sinxcosx1,得sin,因为x0,所以sinxcosx1的解集为,由几何概型可知所求概率P,故选B52021年某省新高考将实行“312”模式,即语文、数学、外语必选,物理、历史二选一,政治、地理、化学、生物四选二,共有12种选课模式某同学已选了物理,记事件A:“他选择政治和地理”,事件B:“他选择化学和地理”,则事件A与事件B()A是互斥事件,不是对立事件B是对立事件,不是互斥事件C既是互斥事件,也是对立事件D既不是互斥事件也不是对立事件答案A解析事件A与事件B不能同时发生,是互斥事件,该同学还可以有其他选择,例如他还可以选择化学和政治,所以事件A与事件B不是对立事件故选A6如图所示的茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,则甲的平均成绩超过乙的平均成绩的概率是()A B C D答案C解析设被污损的数字为x,则甲(8889909192)90,乙(8383879990x),若甲乙,则x8.若甲乙,则x可以为0,1,2,3,4,5,6,7,故P.7(2019兰州实战考试)采用系统抽样的方法从1000人中抽取50人做问卷调查,将他们随机编号1,2,1000.适当分组后在第一组采用简单随机抽样的方法抽到的号码为8.若抽到的50人中,编号落入区间1,400的人做问卷A,编号落入区间401,750的人做问卷B,其余的人做问卷C,则抽到的人中做问卷C的人数为()A12 B13 C14 D15答案A解析根据系统抽样的特点可知,所有做问卷调查的人的编号构成首项为8,公差d20的等差数列an,所以an820(n1)20n12,令75120n121000,解得n,又nN*,所以39n50,则做问卷C的共有12人,故选A8(2019兰州一模)已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:x24568y304050m70根据表中提供的全部数据,用最小二乘法得出y与x的线性回归方程为6.5x17.5,则表中m的值为()A45 B50 C55 D60答案D解析由回归直线恒过(,),可得5,38,即386.5517.5,解得m60,故选D9法国学者贝特朗发现,在研究事件A“在半径为1的圆内随机地取一条弦,其长度超过圆内接等边三角形的边长”的概念的过程中,基于对“随机地取一条弦”的含义的不同理解,事件A的概率P(A)存在不同的答案,该问题被称为“贝特朗悖论”现给出一种解释:若固定弦的一个端点,另一个端点在圆周上随机选取,则P(A)()A B C D答案B解析设固定弦的一个端点为A,则另一个端点在圆周上且在BC劣弧上随机选取,即可满足题意,则P(A),故选B10(2017全国卷)从分别写有1,2,3,4,5的5张卡片中随机抽取1张,放回后再随机抽取1张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为()A B C D答案D解析从5张卡片中随机抽取1张,放回后再随机抽取1张的情况如图:基本事件总数为25,第一张卡片上的数大于第二张卡片上的数的事件数为10,所以所求概率P.故选D11已知正三棱锥SABC的底面边长为4,高为3,在正三棱锥内任取一点P,使得VPABCVSABC的概率是()A B C D答案A解析由题意知,当点P在三棱锥的中截面ABC以下时,满足VPABCVSABC,又V锥SABCV锥SABCV锥SABC事件“VPABC的概率是_答案解析由题意得e ,即b2a.同时抛掷两颗骰子,得到的点数a,b满足b2a的情况有:当a1时,b3,4,5,6,共4种情况;当a2时,b5,6,共2种情况,所以满足题意的情况共有6种,又同时掷两颗骰子有36种情况,所求概率为.13从2,3,4,5,8,9这6个数中一次取出两个数分别作为对数的底数和真数,则得到的对数是整数的概率为_答案解析设取得的第一个数为对数的底数,第二个数为对数的真数,则从2,3,4,5,8,9这六个数中一次取出两个数的基本事件有(2,3),(2,4),(2,5),(2,8),(2,9),(3,4),(3,5),(3,8),(3,9),(4,5),(4,8),(4,9),(5,8),(5,9),(8,9),共15个,其中得到的对数是整数的有(2,4),(2,8),(3,9),共3个,故所求事件概率为.14按文献记载,百家姓成文于北宋初年,表1记录了百家姓开头的24大姓氏表1赵钱孙李周吴郑王冯陈褚卫蒋沈韩杨朱秦尤许何吕施张表2记录了2018年中国人口最多的前10大姓氏表21李2王3张4刘5陈6杨7赵8黄9周10吴从百家姓开头的24大姓氏中随机选取1个姓氏,则这个姓氏是2018年中国人口最多的前10大姓氏的概率为_答案解析2018年中国人口最多的前10大姓氏也是百家姓的前24大姓氏的是赵、李、周、吴、王、陈、杨、张,共8个,故所求概率为.15在平面区域内随机取一点(a,b),则函数f(x)ax24bx1在区间1,)上是增函数的概率为_答案解析不等式组表示的平面区域为如图所示的AOB的内部及边界AB(不包括边界OA,OB),则SAOB448.函数f(x)ax24bx1在区间1,)上是增函数,则应满足a0,且x1,即满足可得对应的平面区域如图中阴影部分(包括边界OC,BC,不包括边界OB),由解得a,b,即点C坐标为,所以SCOB4.根据几何概型的概率计算公式,可知所求的概率为.- 14 -
展开阅读全文