资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,2.3变量间的相关关系,对于两个变量,如果一个变量取值一定时,另一个变量的取值被唯一确定,则这两个变量时函数关系。函数关系是一种确定性的关系,例如匀速直线运动中时间与路程的关系是完全确定的,一个t对应一个s。,我们今天要学习一个新的关系:,相关关系,1,思考?有人说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题。”我们把数学成绩和物理成绩看成是两个变量,那么这两个变量时函数关系吗?,不是,学生的物理成绩与数学成绩之间存在一种相关关系。,2,物理成绩与数学成绩确定是相关的,但两者之间不是确定的函数关系,两者之间的对应不严格,有一定的随机性,它们是相关关系。当然水涨船高,属,正相关关系,。,物理成绩与数学成绩有一定关系,但还和是否喜欢物理,和学生在物理学习上所用的时间等都有关系。,3,我们还可以举出现实生活中存在许多相关关系的问题,1.商品销售收入与,广告支出经费,之间的关系。商品销售收入与广告支出经费由密切的联系,但商品销售收入还与,商品质量,、,居民收入,等因素有关。,2.粮食产量与,施肥量,之间的关系。在一定范围内,施肥量越大,粮食产量就越高。但是粮食产量还要受到,土壤质量,、,降雨量,、,田间管理水平,等因素的影响。,3.人体内的脂肪含量与,年龄,之间的关系。在一定年龄段内,随年龄的增长,人体内的脂肪含量会增加,但人体内的脂肪含量还与,饮食习惯,、,体育锻炼,等有关,可能 还与,个人 的先天体质,有关。,4,例1.下面变量间的关系属于相关关系的是(,),A.圆的周长和它的半径之间的关系,B.价格不变的条件下,商品销售额与销售量之间的关系,C.家庭收入与消费支出之间的关系,D.正方形的面积和它的边长之间的关系,C,5,练习1.下列两个变量之间不具有相关关系的是(),A.小麦的产量与施肥量,B.球的体积与表面积,C.蛋鸭产蛋个数与饲养天数,D.甘蔗的含糖量与生长期的日照天数,B,练习2.下列两个变量中具有相关关系的是(C),A.正方形的体积与棱长,B.匀速行驶的车辆的行驶距离与时间,C.人的身高和体重,D.人的身高与视力,函数关系,函数关系,相关关系,无相关关系,6,85页练习,1.,有关法律规定,香烟盒上必须印上“吸烟有害健康”的警示语,吸烟是否一定会引起健康问题?你认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?,吸烟只是影响健康的一个因素,对健康的影响还有其他一些因素,两者之间非函数关系即非因果关系,但两者是相关关系,而且属负相关,吸烟影响健康是事实,故应禁烟。,2.某地区的环境条件适合天鹅栖息繁衍,有人统计发现,村庄附近栖息的天鹅多,这个村庄的婴儿出生率也高,天鹅少的地方婴儿的出生率低。于是,他认为天鹅能够带来孩子。你认为这样得到的结论可靠吗?如何证明这个结论的可靠性?,不可靠,从 表面看,似有因果关系,但函数关系式一种因果关系,而相关关系部一定是因果关系,也可能是伴随关系,是环境条件改善的两种伴随关系。,7,2、两个变量的线性相关,(1)回归分析,对具有相关关系的两个变量进行统计分析的方法叫回归分析。通俗地讲,回归分析是寻找相关关系中非确定关系的某种确定性。,(2)散点图,A、定义;B、正相关、负相关。,3、回归直线方程,注,:,如果关于两个变量统计数据的散点图呈现发散状,则这两个变量之间不具有相关关系.,8,探究,:,.,年龄,脂肪,23,9.5,27,17.8,39,21.2,41,25.9,45,49,27.5,26.3,50,28.2,53,29.6,54,30.2,56,31.4,57,30.8,年龄,脂肪,58,33.5,60,35.2,61,34.6,如上的一组数据,你能分析人体的脂肪含量与年龄,之间有怎样的关系吗?,9,从上表发现,对某个人不一定有此规律,但对很多个体放在一起,就体现出“人体脂肪随年龄增长而增加”这一规律.而表中各年龄对应的脂肪数是这个年龄 人群的样本平均数.我们也可以对它们作统计图、表,对这两个变量有一个直观上的印象和判断.,下面我们以年龄为横轴,,脂肪含量为纵轴建立直,角坐标系,作出各个点,,称该图为,散点图,。,如图:,O,20,25,30,35,40,45,50,55,60,65,年龄,脂肪含量,5,10,15,20,25,30,35,40,10,从刚才的散点图发现:年龄越大,体内脂肪含量越高,点的位置散布在从左下角到右上角的区域。称它们成,正相关,。,但有的两个变量的相关,如下图所示:,如高原含氧量与海拔高度,的相关关系,海平面以上,,海拔高度越高,含氧量越,少。,作出散点图发现,它们散,布在从左上角到右下角的区,域内。又如汽车的载重和汽,车每消耗1升汽油所行使的,平均路程,称它们成,负相关.,注:课本P86的思考.,O,11,思考,(1)两个变量成负相关关系时,散点图有什么特点?,负相关的两个变量的散点图中点分布的区域为左上角到右下角。,(2)你能列举出一些生活中的变量成正相关或成负相关的例子吗?,正相关:学习时间与成绩,负相关:日月用眼和视力,12,我们再观察它的图像发现这些点大致分布在一条直线附 近,像这样,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相 关关系,这条直线叫做,回归直线,,该直线叫,回归方程,。,那么,我们该怎样来求出这个回归方程?,请同学们展开讨论,能得出哪些具体的方案?,20,25,30,35,40,45,50,55,60,65,年龄,脂肪含量,0,5,10,15,20,25,30,35,40,13,.,.方案1、先画出一条直线,测量出各点与它的距离,再移动直线,到达一个使距离的,和最小时,测出它的斜率和截距,得回归,方程。,20,25,30,35,40,45,50,55,60,65,年龄,脂肪含量,0,5,10,15,20,25,30,35,40,如图:,14,.,方案2、在图中选两点作直线,使直线两侧,的点的个数基本相同。,20,25,30,35,40,45,50,55,60,65,年龄,脂肪含量,0,5,10,15,20,25,30,35,40,15,方案3、如果多取几对点,确定多条直线,再求出 这些直线的斜率和截距的平均值作为回归 直线的斜率和截距。而得回归方程。如图,我们还可以找到,更多的方法,但,这些方法都可行,吗?科学吗?,准确吗?怎样的,方法是最好的?,20,25,30,35,40,45,50,55,60,65,年龄,脂肪含量,0,5,10,15,20,25,30,35,40,我们把由一个变量的变化,去推测另一个变量的方法,称为,回归方法。,16,回归直线,实际上,求回归直线的关键是如何用数学的方法来刻画“从整体上看,各点到此直线的距离最小”.,17,这样的方法叫做最小二乘法.,18,人们经过实践与研究,已经找到了计算回归方程的斜率与截距的一般公式:,以上公式的推导较复杂,故不作推导,但它的原理较为简单:即各点到该直线的距离的平方和最小,这一方法叫,最小二乘法,。(参看如书P80),19,思考:把表2-3中的年龄作为x代入回归方程,看看得出的数值与真实数值之间的关系,从中体会什么?,把年龄x代入回归直线方程,可以看到估计值y与数据Y的值是由差距的,这说明1.体内脂肪含量与年龄是相关关系,而非函数关系;2.回归直线能较好地逼近两变量的关系,直线在整体上的接近程度最好,但因相关关系的非确定性,有些点的差距还是较大的。,20,例3、,有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的饮料杯数与当天气温的对比表:,摄氏温度(),-5,0,4,7,12,热饮杯数,156,150,132,128,130,15,19,23,27,31,36,116,104,89,93,76,54,(1)画出散点图;,(2)从散点图中发现气温与热饮杯数之间关系的一般规律;,(3)求回归方程;,(4)如果某天的气温是2,预测这天卖出的热饮杯数.,21,当x=2时,y=143.063.,22,(2)各点散步从左上角到右下角的区域里,因此,气温与热饮销售杯数之间成负相关,即气温越高,卖出去的热饮杯数越少。,思考:气温为2摄氏度时,小卖部一定能够卖出143杯左右热饮吗?为什么?,不一定,因为回归方程整体上的接近程度最好,但只能是较好的逼近,相关变量有随机性。,23,一、相关关系的判断,例1:5个学生的数学和物理成绩如下表:,A,B,C,D,E,数学,80,75,70,65,60,物理,70,66,68,64,62,画出散点图,并判断它们是否有相关关系。,解:,数学成绩,由散点图可见,两者之间具有正相关关系。,24,二、求线性回归方程,例2:观察两相关变量得如下表:,x,-1,-2,-3,-4,-5,5,3,4,2,1,y,-9,-7,-5,-3,-1,1,5,3,7,9,求两变量间的回归方程,解1:,列表:,i,1,2,3,4,5,6,7,8,9,10,-1,-2,-3,-4,-5,5,3,4,2,1,-9,-7,-5,-3,-1,1,5,3,7,9,9,14,15,12,5,5,15,12,14,9,计算得:,25,所求回归直线方程为 y=x,小结:求线性回归直线方程的步骤:,第一步:列表 ;,第二步:计算 ;,第三步:代入公式计算b,a的值;,第四步:写出直线方程。,26,总结,基础知识框图表解,变量间关系,函数关系,相关关系,散点图,线形回归,线形回归方程,27,
展开阅读全文