资源描述
,第十章,10.3,相关性、最小二乘估计与统计案例,考纲要求,#,知识梳理,双击自测,核心考点,10.3,相关性、,最小二乘估计,与,统计案例,-,2,-,考纲要求,:1,.,会做两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系,.,2,.,了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程,(,线性回归方程系数公式不要求记忆,),.,3,.,了解回归分析的思想、方法及其简单应用,.,4,.,了解独立性检验的思想、方法及其初步应用,.,-,3,-,1,.,相关关系,:,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫作相关关系,.,与函数关系不同,相关关系是一种,非确定性关系,.,2,.,散点图,:,表示具有相关关系的两个变量的一组数据的图形叫作散点图,它可直观地判断两变量的关系是否可以用线性关系表示,.,若这些散点分布在从左下角到右上角的区域,则称两个变量,正相关,;,若这些散点分布在从左上角到右下角的区域,则称两个变量,负相关,.,3,.,回归分析,:,对具有相关关系的两个变量进行统计分析的方法叫作回归分析,.,在线性回归模型,y=bx+a+e,中,因变量,y,的值由自变量,x,和随机误差,e,共同确定,即自变量,x,只能解释部分,y,的变化,在统计中,我们把自变量,x,称为,解释变量,因变量,y,称为,预报变量,.,-,4,-,-,5,-,5,.,相关系数,:,它主要用于相关量的显著性检验,以衡量它们之间的线性相关程度,.,当,r,0,时表示两个变量正相关,当,r,10,.,828,在犯错误的概率不超过,0,.,001,的前提下认为打鼾与患心脏病有关,.,答案,解析,关闭,有关,-,14,-,2,3,4,1,5,自测点评,1,.,散点图上的点大致分布在某条直线附近,整体上呈线性分布时,两个变量相关关系越强,.,2,.,2,越,大,“,X,与,Y,有关联,”,的把握程度越大,.,3,.,注意回归分析时对应的结果均是估计值,不要误认为是真实值,;,对于独立性检验的结论需要在概率意义下来理解,避免在现实生活中错误应用,.,4,.,要理解回归直线方程中的参数是用最小二乘法得出的,目的是使距离的平方和最小,不是看具体某一个距离的大小,这样使用求平方和也避免了讨论绝对值和正负问题,.,-,15,-,考点,1,考点,2,考点,3,知识方法,易错易混,考点,1,相关关系的判断,例,1,(1),对变量,x,y,有观测数据,(,x,i,y,i,)(,i=,1,2,10),得散点图,;,对变量,u,v,有观测数据,(,u,i,v,i,)(,i=,1,2,10),得散点图,由这两个散点图可以判断,(,),A.,变量,x,与,y,正相关,u,与,v,正相关,B.,变量,x,与,y,正相关,u,与,v,负相关,C.,变量,x,与,y,负相关,u,与,v,正相关,D.,变量,x,与,y,负相关,u,与,v,负相关,答案,解析,解析,关闭,题图,的散点分布在斜率小于,0,的直线附近,y,随,x,的增大而减小,故变量,x,与,y,负相关,;,题图,的散点分布在斜率大于,0,的直线附近,u,随,v,的增大而增大,故变量,u,与,v,正相关,故选,C,.,答案,解析,关闭,C,-,16,-,考点,1,考点,2,考点,3,知识方法,易错易混,(2),甲、乙、丙、丁四位同学各自对,A,B,两变量的线性相关性做试验,并用回归分析方法分别求得相关系数,r,与残差平方和,m,如下表,:,则,哪位同学的试验结果体现,A,B,两变量有更强的线性相关性,(,),A,.,甲,B,.,乙,C,.,丙,D,.,丁,答案,解析,解析,关闭,在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近,1,相关性越强,在四个选项中只有丁的相关系数最大,;,残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了,A,B,两变量有更强的线性相关性,故选,D,.,答案,解析,关闭,D,-,17,-,考点,1,考点,2,考点,3,知识方法,易错易混,思考,:,如何判断两个变量有无相关关系,?,解题心得,:,判断两个变量有无相关关系有两个方法,:,一是根据散点图,具有很强的直观性,直接得出两个变量是正相关或负相关,;,二是计算相关系数法,这种方法能比较准确地反映相关程度,相关系数的绝对值越接近,1,相关性就越强,相关系数就是描述相关性强弱的,.,-,18,-,考点,1,考点,2,考点,3,知识方法,易错易混,对点训练,1,(1),对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是,(,),A,.r,2,r,4,0,r,3,r,1,B,.r,4,r,2,0,r,1,r,3,C,.r,4,r,2,0,r,3,r,1,D,.r,2,r,4,0,r,1,r,3,答案,解析,解析,关闭,易知题中图,(1),与图,(3),是正相关,图,(2),与图,(4),是负相关,且图,(1),与图,(2),中的样本点集中分布在一条直线附近,则,r,2,r,4,0,r,3,6,.,635,所以在犯错误的概率不超过,0,.,01,的前提下认为该地区的老年人是否需要帮助与性别有关,.,(3),由,(2),的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好,.,-,30,-,考点,1,考点,2,考点,3,知识方法,易错易混,思考,:,独立性检验得出的结论是什么,?,它对我们日常生活有什么帮助,?,解题心得,:,独立性检验就是考察两个分类变量是否有关系,利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测,并能较为准确地给出这种判断的可信度,;,具体做法是根据公式,计算,2,2,值越大,说明,“,两个变量有关系,”,的可能性越大,.,-,31,-,考点,1,考点,2,考点,3,知识方法,易错易混,对点训练,3,某中学对,“,学生性别和是否喜欢看,NBA,比赛,”,作了一次调查,其中男生人数是女生人数的,2,倍,男生喜欢看,NBA,的人数占男生人数,的,女生喜欢看,NBA,的人数占女生人数,的,(1),若被调查的男生人数为,n,根据题意建立一个,2,2,列联表,;,(2),若在犯错误的概率不超过,0,.,05,的前提下认为是否喜欢看,NBA,和性别有关,求男生至少有多少人,?,-,32,-,考点,1,考点,2,考点,3,知识方法,易错易混,解,:,(1),由已知得,:,-,33,-,考点,1,考点,2,考点,3,知识方法,易错易混,-,34,-,考点,1,考点,2,考点,3,知识方法,易错易混,1,.,求回归方程,关键在于正确求出系数,a,b,由于,a,b,的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误,.,(,注意线性回归方程中一次项系数为,b,常数项为,a,这与一次函数的习惯表示不同,.,),2,.,回归分析是处理变量相关关系的一种数学方法,.,主要解决,:(1),确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式,;(2),根据一组观察值,预测变量的取值及判断变量取值的变化趋势,;(3),求出线性回归方程,.,3,.,根据,2,的值可以判断两个分类变量有关的可信程度,并用来指导科研和生活实际,.,-,35,-,考点,1,考点,2,考点,3,知识方法,易错易混,1,.,相关关系与函数关系的区别,相关关系与函数关系不同,函数关系中的两个变量间是一种确定性关系,.,例如正方形面积,S,与边长,x,之间的关系,S=x,2,就是函数关系,.,相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系,.,例如商品的销售额与广告费是相关关系,.,两个变量具有相关关系是回归分析的前提,.,2,.,回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性分布时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义,.,根据回归方程进行预报,仅是一个预报值,而不是真实发生的值,.,
展开阅读全文