资源描述
第第3课时变量的相关性、统课时变量的相关性、统计案例计案例第十章统计、统计案例第十章统计、统计案例教材回扣教材回扣 夯实双基夯实双基基础梳理基础梳理1.变量间的相关关系变量间的相关关系(1)变量与变量之间的关系常见的有两变量与变量之间的关系常见的有两类:一类是类:一类是_的函数关系的函数关系;另一另一类是变量间确实存在关系类是变量间确实存在关系,但又不具但又不具备函数关系所要求的备函数关系所要求的_,它们的它们的关系是带有随机性的关系是带有随机性的.确定性确定性确定性确定性(2)如果一个变量的值由小变大时如果一个变量的值由小变大时,另一另一个变量的值个变量的值_,这种相关称为这种相关称为正相关正相关,如果一个变量的值由小变大时如果一个变量的值由小变大时,另一个变量的值另一个变量的值_,这种相关这种相关称为负相关称为负相关.由小变大由小变大由大变小由大变小思考探究思考探究相关关系与函数关系有什么异同点相关关系与函数关系有什么异同点?提示:提示:相同点:两者均是指两个变量的相同点:两者均是指两个变量的关系关系.不同点:不同点:函数关系是一种确定的关函数关系是一种确定的关系系,相关关系是一种非确定的关系相关关系是一种非确定的关系.函函数关系是一种因果关系数关系是一种因果关系,而相关关系不而相关关系不一定是因果关系一定是因果关系,也可能是伴随关系也可能是伴随关系.2.回归直线方程与回归分析回归直线方程与回归分析 (1)直线方程直线方程yabx 叫做叫做 y 对对 x 的的_,b 叫做叫做_.要要确确定回归直线方程定回归直线方程,只需确定只需确定 a 与回归系数与回归系数 b. 回归直线方程回归直线方程回归系数回归系数(2)用最小二乘法求回归直线方程中的用最小二乘法求回归直线方程中的 a,b有下面的公式:有下面的公式: bi1nxiyin x yi1nx2in x 2,a_.其其中中a,b的上方加的上方加“”,表示是由观察值按最小表示是由观察值按最小二乘法求得的二乘法求得的_,b也叫回归系数也叫回归系数. 估计值估计值i1nxiyin x y i1nx2in x 2 i1ny2in y 2 . (4)样本相关系数样本相关系数 r 具有以下性质:具有以下性质: |r|_1,并且并且 |r|越接近越接近 1,线性线性相关程度相关程度_;|r|越越接近接近 0,线性相关程度线性相关程度_. 越强越强越弱越弱3.独立性检验独立性检验(1)假设有两个分类变量假设有两个分类变量X和和Y,它们的值它们的值域分别为域分别为x1,x2和和y1,y2,其样本频数列其样本频数列联表联表(称为称为22列联表列联表)为:为:y1y2合计合计x1n11n12n1x2n21n22n2合计合计n1n2n2_(其中其中nn11n21n12n22为样本容量为样本容量)(2)两个临界值:两个临界值:3.841与与6.635.对于事件对于事件A与与B,当当_时时,有有95%的把握说事件的把握说事件A与与B有关有关;当当26.635时时,有有99%的把握说事件的把握说事件A与与B有关有关;当当_时时,认为事件认为事件A与与B是无关是无关的的.23.84123.841课前热身课前热身1.下列关系中下列关系中,是相关关系的为是相关关系的为()学生的学习态度与学习成绩之间的学生的学习态度与学习成绩之间的关系关系;教师的执教水平与学生的学习成绩教师的执教水平与学生的学习成绩之间的关系之间的关系;学生的身高与学生的学习成绩之间的学生的身高与学生的学习成绩之间的关系关系;家庭的经济条件与学生的学习成绩之家庭的经济条件与学生的学习成绩之间的关系间的关系.A.B.C. D.答案:答案:A2.有关线性回归的说法有关线性回归的说法,不正确的是不正确的是()A.具有相关关系的两个变量是非确定关具有相关关系的两个变量是非确定关系系B.散点图能直观地反映数据的相关程度散点图能直观地反映数据的相关程度C.回归直线最能代表线性相关的两个变回归直线最能代表线性相关的两个变量之间的关系量之间的关系D.散点图中的点越集中散点图中的点越集中,两个变量的相两个变量的相关性越强关性越强答案:答案:D3.(2012辽阳质检辽阳质检)对于事件对于事件A和事件和事件B,通过计算得到通过计算得到2的观测值的观测值24.514,下下列说法正确的是列说法正确的是()A.有有99%的把握说事件的把握说事件A和事件和事件B有关有关B.有有95%的把握说事件的把握说事件A和事件和事件B有关有关C.有有99%的把握说事件的把握说事件A和事件和事件B无关无关D.有有95%的把握说事件的把握说事件A和事件和事件B无关无关答案:答案:B4.据两个变量据两个变量x,y之间的观测数据画成之间的观测数据画成散点图如图散点图如图,这两个变量是否具有线性这两个变量是否具有线性相关关系相关关系_(填填“是是”或或“否否”).答案:否答案:否解析:由题意知解析:由题意知0.254(x1)0.321(0.254x0.321)0.254.答案:答案:0.254考点探究考点探究 讲练互动讲练互动考点考点1判断两个变量的相关关系判断两个变量的相关关系(1)判断两变量之间有无相关关系判断两变量之间有无相关关系,一种一种常用的简便可行的方法是绘散点图常用的简便可行的方法是绘散点图.散散点图是由数据点分布构成的点图是由数据点分布构成的,是分析研是分析研究两个变量相关关系的重要手段究两个变量相关关系的重要手段,从散点图中从散点图中,如果发现点的分布从整体如果发现点的分布从整体上看大致在一条直线附近上看大致在一条直线附近,那么这两个那么这两个变量是线性相关的变量是线性相关的.(2)用回归直线进行拟合两个变量的关用回归直线进行拟合两个变量的关系系. 5个学生的数学和物理成绩如下个学生的数学和物理成绩如下表:表:画出散点图画出散点图,判断它们是否有相关关系判断它们是否有相关关系.例例1学生学生学科学科ABCDE数学数学80 75 70 65 60物理物理70 66 68 64 62【解解】以以x轴表示数学成绩轴表示数学成绩,y轴表示轴表示物理成绩物理成绩,可得到相应的散点图如图所可得到相应的散点图如图所示:示:由散点图可知由散点图可知,两者之间具有相关关系两者之间具有相关关系,且为线性相关且为线性相关.【规律小结规律小结】判断两变量是否有相关判断两变量是否有相关关系很容易将相关关系与函数关系混淆关系很容易将相关关系与函数关系混淆.相关关系是一种非确定性关系相关关系是一种非确定性关系,即是非即是非随机变量与随机变量之间的关系随机变量与随机变量之间的关系,而函而函数关系是一种因果关系数关系是一种因果关系,如例如例1中以数学中以数学成绩为成绩为x轴轴,以物理成绩为以物理成绩为y轴轴,建系描点建系描点后后,可知两者并不是函数关系可知两者并不是函数关系,而是相关而是相关关系关系,并且是线性相关关系并且是线性相关关系. 下表提供了某厂节能降耗技术改下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量造后生产甲产品过程中记录的产量x(吨吨)与相应的生产能耗与相应的生产能耗y(吨标准煤吨标准煤)的几组的几组对照数据对照数据.例例2x3456y2.5344.5【解解】(1)由题设所给数据由题设所给数据,可得散点可得散点图如图所示:图如图所示:互动探究互动探究1.在本例条件下在本例条件下,若该厂技改前若该厂技改前100吨甲吨甲产品的生产能耗为产品的生产能耗为90吨标准煤吨标准煤.试根据试根据(2)求出的线性回归方程求出的线性回归方程,预测生产预测生产100吨甲产品的生产能耗比技改前降低多少吨甲产品的生产能耗比技改前降低多少吨标准煤吨标准煤?解:由解:由(2)的回归方程及技改前生产的回归方程及技改前生产100吨甲产品的生产能耗吨甲产品的生产能耗,得降低的生产能得降低的生产能耗为耗为90(0.71000.35)19.65(吨吨标准煤标准煤). 某班主任对全班某班主任对全班50名学生学习名学生学习积极性和对待班级工作的态度进行了调积极性和对待班级工作的态度进行了调查查,统计数据如下表所示:统计数据如下表所示:积极参加积极参加班级工作班级工作不太主动参不太主动参加班级工作加班级工作合计合计学习积极学习积极性高性高18725学习积极学习积极性一般性一般61925合计合计242650试运用独立性检验的思想方法分析:学试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度生的学习积极性与对待班级工作的态度是否有关系是否有关系?说明理由说明理由.【思路分析思路分析】根据公式根据公式2计算后与临计算后与临界值比较界值比较.互动探究互动探究2.在本例条件下在本例条件下,如果随机抽查这个班如果随机抽查这个班的一名学生的一名学生,那么抽到积极参加班级工那么抽到积极参加班级工作的学生的概率是多少作的学生的概率是多少?抽到不太主动抽到不太主动参加班级工作且学习积极性一般的学生参加班级工作且学习积极性一般的学生的概率是多少的概率是多少?方法技巧方法技巧1.求回归方程求回归方程,关键在于正确求出系数关键在于正确求出系数a,b,由于由于a,b的计算量大的计算量大,计算时应仔细计算时应仔细谨慎谨慎,分层进行分层进行,避免因计算而产生错避免因计算而产生错误误.(注意回归直线方程中一次项系数为注意回归直线方程中一次项系数为b,常数项为常数项为a,这与一次函数的习惯表示这与一次函数的习惯表示不同不同)2.回归分析是处理变量相关关系的一种回归分析是处理变量相关关系的一种数学方法数学方法.主要解决:主要解决:(1)确定特定量之确定特定量之间是否有相关关系间是否有相关关系,如果有就找出它们如果有就找出它们之间贴近的数学表达式之间贴近的数学表达式;(2)根据一组观根据一组观察值察值,预测变量的取值及判断变量取值预测变量的取值及判断变量取值的变化趋势的变化趋势;(3)求出回归直线方程求出回归直线方程.3.独立性检验是一种假设检验独立性检验是一种假设检验,在对总体在对总体的估计中的估计中,通过抽取样本通过抽取样本,构造合适的随构造合适的随机变量机变量,对假设的正确性进行判断对假设的正确性进行判断.失误防范失误防范1.回归分析是对具有相关关系的两个回归分析是对具有相关关系的两个变量进行统计分析的方法变量进行统计分析的方法,只有在散点只有在散点图大致呈线性时图大致呈线性时,求出的回归直线方程求出的回归直线方程才有实际意义才有实际意义,否则否则,求出的回归直线方求出的回归直线方程毫无意义程毫无意义.2.根据回归方程进行预报根据回归方程进行预报,仅是一个预报仅是一个预报值值,而不是真实发生的值而不是真实发生的值.3.r的大小只说明是否相关并不能说明的大小只说明是否相关并不能说明拟合效果的好坏拟合效果的好坏,2才是判断拟合效果才是判断拟合效果好坏的依据好坏的依据.4.独立性检验的随机变量独立性检验的随机变量22.706是是判断是否有关系的临界值判断是否有关系的临界值,22.076应应判断为没有充分证据显示判断为没有充分证据显示X与与Y有关系有关系,而不能作为小于而不能作为小于90%的量化值来判断的量化值来判断.考向瞭望考向瞭望 把脉高考把脉高考命题预测命题预测从近几年的高考试题来看从近几年的高考试题来看,高考对此部高考对此部分内容考查有加强趋势分内容考查有加强趋势,主要是以考查主要是以考查独立性检验、回归分析为主独立性检验、回归分析为主,并借助解决一些简单的实际问题来考查并借助解决一些简单的实际问题来考查一些基本的统计思想一些基本的统计思想,在高考中多为选在高考中多为选择、填空题择、填空题,也有解答题出现也有解答题出现.预测预测2013年高考年高考,散点图与相关关系仍散点图与相关关系仍是考查的重点是考查的重点,同时应注意线性回归方同时应注意线性回归方程、独立性检验在实际生活中的应用程、独立性检验在实际生活中的应用.规范解答规范解答 (本题满分本题满分12分分)(2010高考课高考课标全国卷标全国卷)为调查某地区老年人是否需为调查某地区老年人是否需要志愿者提供帮助要志愿者提供帮助,用简单随机抽样方用简单随机抽样方法从该地区调查了法从该地区调查了500位老年人位老年人,结果结果如下:如下:例例性别性别 是否需是否需要志愿者要志愿者男男女女需要需要4030不需要不需要160270(1)估计该地区老年人中估计该地区老年人中,需要志愿者提需要志愿者提供帮助的老年人的比例供帮助的老年人的比例;(2)能否有能否有99%的把握认为该地区的老的把握认为该地区的老年人是否需要志愿者提供帮助与性别有年人是否需要志愿者提供帮助与性别有关关?(3)根据根据(2)的结论的结论,能否提出更好的调查能否提出更好的调查方法来估计该地区的老年人中方法来估计该地区的老年人中,需要志需要志愿者提供帮助的老年人的比例愿者提供帮助的老年人的比例?说明理说明理由由.附:附:P(2k) 0.050 0.010 0.001k3.841 6.63510.828(3)由由(2)的结论知的结论知,该地区老年人是否需该地区老年人是否需要帮助与性别有关要帮助与性别有关,并且从样本数据能并且从样本数据能看出该地区男性老年人与女性老年人中看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异需要帮助的比例有明显差异,因此在调因此在调查时查时,先确定该地区老年人中男、女的先确定该地区老年人中男、女的比例比例,再把老年人分成男、女两层并采再把老年人分成男、女两层并采用分层抽样方法用分层抽样方法,比采用简单随机抽样比采用简单随机抽样方法更好方法更好.12分分【名师点评名师点评】本题考查了独立性检本题考查了独立性检验验,考生在求解时有一定难度考生在求解时有一定难度;导致考生导致考生在该题得分较低在该题得分较低,错误原因为:一是错误原因为:一是a、b、c、d所表示数字对应错所表示数字对应错,二是第二是第(3)问中分析不到位问中分析不到位,有个别考生有乱说现有个别考生有乱说现象象.
展开阅读全文