资源描述
相关性及最小二乘法估计,正方形的面积y与正方形的边长x之间的关系y = x2,1、函数是研究两个变量之间的依存关系的一种数量形式.对于两个变量,如果当一个变量的取值一定时,另一个变量的取值被唯一确定,则这两个变量之间的关系就是一个函数关系.,是确定性关系,2、在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你学习物理就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间的关系是函数关系吗?,3、我们不能通过一个人的数学成绩是多少就准确地断定其物理成绩能达到多少,学习兴趣、学习时间、教学水平等,也是影响物理成绩的一些因素,但这两个变量是有一定关系的,它们之间是一种不确定性的关系.类似于这样的两个变量之间的关系,有必要从理论上作些探讨,如果能通过数学成绩对物理成绩进行合理估计,将有着非常重要的现实意义.,探究1:变量之间的相关关系,思考1:考查下列问题中两个变量之间的关系: (1)商品销售收入与广告支出经费; (2)粮食产量与施肥量; (3)人体内的脂肪含量与年龄. 这些问题中两个变量之间的关系是函数关系吗?,思考3:上述两个变量之间的关系是一种非确定性关系,称之为相关关系,那么相关关系的含义如何?,自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫作相关关系.,例如,由人的身高并不能确定体重,但一般说来“身高者,体也重”,我们说身高与体重这两个变量具有相关关系.,常见的变量与变量之间的关系有两类:,一类是确定性的函数关系,像正方形的边长a和面积S的关系;,另一类是相关关系,但不具备函数关系所要求的确定性,它们的关系是带有随机性的.,三、相关性,1、在散点图中,点有一个集中的大致趋势 2、在散点图中,所有的点都在一条直线附近 波动线性相关。,x,x,x,y,y,y,O,O,O,探究2:散点图,【问题】在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:,其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数.,思考:为了确定年龄和人体脂肪含量之间的更明确的关系,我们需要对数据进行分析,通过作图可以对两个变量之间的关系有一个直观的印象.以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?,思考:观察散点图的大致趋势,人的年龄与人体脂肪含量具有什么相关关系?,人的年龄与人体脂肪含量的散点图,从整体上看,它们是线性相关的.,在上面的散点图中,这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.,思考:一般地,如果两个变量成正相关,那么从整体上看,这两个变量的变化趋势如何?,一个变量随另一个变量的变大而变小,散点图中的点散布在从左上角到右下角的区域.这就像函数中的增函数和减函数.即一个变量从小到大,另一个变量也从小到大,或从大到小.,思考:如果两个变量成负相关,从整体上看这两个变量的变化趋势如何?其散点图有什么特点?,思考:你能列举一些生活中的变量成正相关或负相关的实例吗?,探究:相关关系与函数关系的异同点:,(1)相同点:两者均是指两个变量的关系;,(2)不同点:函数关系是一种确定的关系,如匀速直线运动中时间t与路程s的关系.,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.,相关关系是一种非确定的关系,如一块农田的水稻产量与施肥量之间的关系,事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.,如何进行定量分析呢?由于变量间的相关关系是一种随机关系,因此,我们只能借助统计这一工具来解决问题,也就是通过收集大量数据,在对数据进行统计分析的基础上,发现其中的规律,并对它们之间的关系作出推断.,例: 5个学生的数学和物理成绩如下表:,画出散点图,并判断它们是否有相关关系.,具有相关关系.,1、某农场经过观测得到水稻产量和施化肥量的统计数据如下:,画出散点图 ,判断它们是否有相关关系,并考虑水稻的产量会不会随化肥使用量的增加而一直增加.,散点图如下:具有相关关系.,水稻的产量不会随化肥使用量的增加而一直增加.,1对于两个变量之间的关系,有函数关系和相关关系两种,其中函数关系是一种确定性关系,相关关系是一种非确定性关系.,2散点图能直观地反映两个相关变量之间的大致变化趋势,利用计算机作散点图是简单可行的办法.,3.一般情况下两个变量之间的相关关系成正相关或负相关,类似于函数的单调性.,22,一个好的线性关系要保证这条直线与所有点都近。最小二乘法就是基于这种想法,23,24,这条直线叫做回归直线。,y=a+bx,25,解:(1)从散点图可看出,表中的两个变量是线性相关的。,26,27,28,步骤,求线性回归方程的步骤: 1.列表、计算 2.代入公式求a,b。 3.写出直线方程。,29,利用试验数据进行拟合时,所用数据越多,拟合效果越好。即使选取相同的样本数,得到的直线方程也可能是不相同的,这是由样本的随机性造成的样本量越大,所估计的直线方程越能更好地反映变量之间的关系。,注意,30,31,从题目中可看出提供的数据满足 ,图像应为曲线方程,而用最小二乘法进行估计时得出是线性方程。,32,概括,
展开阅读全文