资源描述
2019-2020年高考数学专题复习 第39讲 变量间的相关关系、统计案例练习 新人教A版考情展望1.考查独立性检验的基本思想,两个临界值的理解及应用.2.考查回归分样的基本思想及回归直线方程的计算应用.3.多以选择题、填空题形式进行考查一、两个变量的线性相关1在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关2在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关3如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线二、回归方程1最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫最小二乘法2回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),(xn,yn)其回归方程为x,则其中(,)称为样本点的中心三、残差分析1残差:对于样本点(x1,y1),(x2,y2),(xn,yn),它们的随机误差为eiyibxia,i1,2,n,其估计值为iyiiyixi,i1,2,n.i称为相应于点(xi,yi)的残差2残差平方和为 (yii)2.3相关指数:R21.四、独立性检验1利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验2列联表:列出的两个分类变量的频数表,称为列联表假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为22列联表y1y2总计x1ababx2cdcd总计acbdabcd构造一个随机变量K2,其中nabcd为样本容量1某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是()A.10x200B.10x200C.10x200 D.10x200【解析】由题意回归方程斜率应为负,故排除B,D,又销售量应为正值,故C不正确,故选A.【答案】A2下面是22列联表:y1y2合计x1a2173x2222547合计b46120则表中a,b的值分别为()A94,72 B52,50C52,74 D74,52【解析】a2173,a52.又a22b,b74.【答案】C3调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:0.254x0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_万元【解析】由题意知0.254(x1)0.321(0.254x0.321)0.254.【答案】0.2544在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算K2的观测值k27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是_的(填有关或无关)【解析】k27.636.635,有99%的把握认为“打鼾与患心脏病有关”【答案】有关5(xx湖北高考)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:y与x负相关且2.347x6.423;y与x负相关且3.476x5.648;y与x正相关且5.437x8.493;y与x正相关且4.326x4.578.其中一定不正确的结论的序号是()A BC D【解析】由正负相关性的定义知一定不正确【答案】D6(xx福建高考)已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归直线方程为x.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为ybxa,则以下结论正确的是()A.b,a B.b,aC.a D.b,a【解析】由(1,0),(2,2)求b,a.b2,a0212.求,时,iyi04312152458,3.5,14916253691,3.5,a.【答案】C考向一 169相关关系的判断(1)下列结论:函数关系是一种确定性关系;相关关系是一种非确定性关系;回归分析是对具有函数关系的两个变量进行统计分析的一种方法;回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法其中正确的是_(2)下列关系属于线性负相关的是()A父母的身高与子女身高的关系B球的体积与半径之间的关系C汽车的重量与汽车每消耗1 L汽油所行驶的平均路程D一个家庭的收入与支出【思路点拨】(1)根据相关关系及回归分析的定义判断;(2)先判断两个变量之间关系是否为相关关系,再判断是否为负相关【尝试解答】(1)由函数yf(x)的定义可知当x确定时,y也唯一确定了,所以函数关系是一种确定性关系,所以正确相关关系的两个变量x,y存在一定的联系,但无法确定具体的关系,所以相关关系是一种非确定性关系,所以正确回归分析是对具有相关关系的两个变量进行统计分析的一种方法,不是对具有函数关系的变量进行分析,所以错误与对比,同时根据回归分析的定义可知正确,所以正确的是.(2)父母身高与子女身高的关系是一个正相关,球的体积与半径之间的关系是函数关系,一个家庭的收入与支出是一个正相关关系,即A、D中的两个变量属于线性正相关,B中两个变量是函数关系【答案】(1)(2)C规律方法11.相关关系的判断方法:一是利用散点图直观判断,二是利用相关系数作出判断.2.对于由散点图作出相关性判断时,若散点图呈带状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线型也是有相关性.3.在散点图中,若点散布在从左下角到右上角的区域,称为正相关;若散布在从左上角到右下角的区域称为负相关.对点训练对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图931(1);对变量u,v有观测数据(ui,vi)(i1,2,10),得散点图931(2)由这两个散点图可以判断()图(1)图(2)图931A变量x与y正相关,u与v正相关B变量x与y正相关,u与v负相关C变量x与y负相关,u与v正相关D变量x与y负相关,u与v负相关【解析】由散点图可知x与y负相关,u与v正相关【答案】C考向二 170线性回归分析(xx重庆高考)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i80,i20,iyi184,720.(1)求家庭的月储蓄y对月收入x的线性回归方程ybxa;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄附:线性回归方程ybxa中,b,ab,其中,为样本平均值,线性回归方程也可写为x.【思路点拨】(1)根据已知数据求回归系数,再求出线性回归方程(2)根据回归方程判断(3)利用回归方程进行预测分析【尝试解答】(1)由题意知n10,i8,i2,又lxxn2720108280,lxyiyin184108224,由此得b0.3,ab20.380.4.故所求线性回归方程为y0.3x0.4.(2)由于变量y的值随x值的增加而增加(b0.30),故x与y之间是正相关(3)将x7代入回归方程可以预测该家庭的月储蓄为y0.370.41.7(千元)规律方法21.正确运用计算、的公式和准确的计算,是求线性回归方程的关键.2.在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.对点训练为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:时间x12345命中率y0.40.50.60.60.4(1)试求小李这5天的平均投篮命中率;(2)请你用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率【解】(1)由图表知,5天的平均投篮命中率0.5,(2)(12345)3,0.01,0.50.0130.47,故回归直线方程为0.470.01x将x6代入,得0.53,6号打6小时篮球的投篮命中率约为0.53.考向三 171独立性检验某中学对“学生性别和是否喜欢看NBA比赛”作了一次调查,其中男生人数是女生人数的2倍,男生喜欢看NBA的人数占男生人数的,女生喜欢看NBA的人数占女生人数的.(1)若被调查的男生人数为n,根据题意建立一个22列联表;(2)若有95%的把握认为是否喜欢看NBA和性别有关,求男生至少有多少人?附:K2P(K2k)0.1000.0500.0250.0100.001k2.7063.8415.0246.63510.828【思路点拨】(1)根据题意列出22列联表;(2)计算K2的观测值,解不等式即可【尝试解答】(1)由已知,得喜欢NBA不喜欢NBA总计男生n女生总计n(2)K2n.若有95%的把握认为是否喜欢看NBA和性别有关则K23.841,即n3.841,n10.24.,为整数,n最小值为12,即男生至少12人规律方法31.独立性检验的关键是准确的计算K2,在计算时,要充分利用22列联表.2.独立性检验的步骤:,(1)根据样本数据制成22列联表.,(2)根据公式K2计算K2的观测值k.(3)比较k与临界值的大小关系作统计推断.对点训练某班主任对班级22名学生进行了作业量多少的调查,数据如下表:在喜欢玩电脑游戏的12人中,有10人认为作业多,2人认为作业不多;在不喜欢玩电脑游戏的10人中,有3人认为作业多,7人认为作业不多(1)根据以上数据建立一个22列联表;(2)试问喜欢电脑游戏与认为作业多少是否有关系?(可能用到的公式:K2.(可能用到数据:P(K26.635)0.01,P(K23.841)0.05)【解】(1)根据题中所给数据,得到如下列联表:认为作业多认为作业不多总计喜欢玩电脑游戏10212不喜欢玩电脑游戏3710总计13922(2)K26.418,而3.8416.4186.635有95%的把握认为喜欢玩电脑游戏与认为作业多少有关规范解答之二十概率与统计的综合应用问题求解第一步:理清题意,理解问题中的条件和结论尤其是直方图中给定的信息,找关键量;第二步:由直方图确定所需的数据,列出22列联表;第三步:利用独立性检验的步骤进行判断;第四步:确定基本事件总数及所求事件所含基本事件的个数;第五步:利用概率公式求事件的概率1个示范例1个规范练(12分)电视传媒公司为了解某地区电视观众对某个类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名,下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图932:图932将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性(1)根据已知条件完成下面的22列联表,并据此资料判断是否有95%的把握认为“体育迷”与性别有关?非体育迷体育迷合计男女合计(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率附:K2P(K2k)0.050.01k3.8416.635【规范解答】(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而完成22列联表如下:非体育迷体育迷合计男301545女451055合计75251003分将22列联表中的数据代入公式计算,得K23.030.因为3.0303.841,所以我们没有95%的把握认为“体育迷”与性别有关.6分(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的基本事件为(a1,a2),(a1,a3),(a2,a3),(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2),其中ai表示男性,i1,2,3,bj表示女性,j1,2.9分由10个基本事件组成,而且这些基本事件的出现是等可能的用A表示“任选2人中,至少有1人是女性”这事件,则A(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2),11分事件A由7个基本事件组成,因而P(A).12分【名师寄语】1.忽视直方图纵轴表示为导致每组人数计算失误.2.K2的计算不准确、导致结果判断出错.3.由5人中任取2人列举出所有可能结果时重复或遗漏某一情况导致失误.中国共产党第十八届中央委员会第三次会议于2013年11月9日至12日在北京召开,为了搞好对外宣传工作,会务组选聘了16名男记者和14名女记者担任对外翻译工作,调查发现,男、女记者中分别有10人和6人会俄语(1)根据以上数据完成以下22列联表:会俄语不会俄语总计男女总计30并回答能否在犯错的概率不超过0.10的前提下认为性别与会俄语有关?参考公式:K2,其中nabcd.参考数据:P(K2k0)0.400.250.100.010k00.7081.3232.7066.635(2)会俄语的6名女记者中有4人曾在俄罗斯工作过,若从会俄语的6名女记者中随机抽取2人做同声翻译,则抽出的2人都在俄罗斯工作过的概率是多少?【解】(1)如表:会俄语不会俄语总计男10616女6814总计161430假设是否会俄语与性别无关由已知数据可求得K21.157 52.706.所以在犯错的概率不超过0.10的前提下不能判断会俄语与性别有关(2)会俄语的6名女记者,分别设为A,B,C,D,E,F,其中A,B,C,D曾在俄罗斯工作过则从这6人中任取2人有AB,AC,AD,AE,AF,BC,BD,BE,BF,CD,CE,CF,DE,DF,EF共15种,其中2人都在俄罗斯工作过的是AB,AC,AD,BC,BD,CD共6种,所以抽出的女记者中,2人都在俄罗斯工作过的概率是P.
展开阅读全文