资源描述
第 10 讲回归分析与独立性检验1会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系2了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程3了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题(1)了解独立性检验(只要求22列联表)的基本思想、方法及其简单应用(2)了解假设检验的基本思想、方法及其简单应用(3)了解回归的基本思想、方法及其简单应用1变量间的关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系(2)将样本中 n 个数据点(xi,yi)(i1,2,n)描在平面直角坐标系中,表示两个变量关系的一组数据的图形叫做散点图(3)正相关、负相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系称为正相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关2回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法(2)线性相关关系:观察散点图的特征,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线(3)回归直线的求法:当 rk0)的k0 作为拒绝域的临界值表 1不及格及格总计男61420女102232总计163652【互动探究】2(2014 年江西)某人研究中学生的性别与成绩、视力、智商、阅读量这 4 个变量之间的关系,随机抽查 52 名中学生,得到统计数据如表 1 至表 4,这与性别有关联的可能性最大的变量是()A成绩表 3不及格及格总计男81220女82432总计163652表 2不及格及格总计男41620女122032总计163652B视力C智商表 4不及格及格总计男14620女23032总计163652D阅读量答案: D日期1 月10 日2 月10 日3 月10 日4 月10 日5 月10 日6 月10 日昼夜温差 x/1011131286就诊人数 y/人222529261612考点 3 回归分析的综合运用例 3:某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了 1 至 6 月份每月 10 日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:该兴趣小组确定的研究方案是:先从这六组数据中选取 2组,用剩下的 4 组数据求线性回归方程,再用被选取的 2 组数据进行检验(1)求选取的 2 组数据恰好是相邻两个月的概率;(2)若选取的是 1 月与 6 月的两组数据,请根据 2 至 5 月份的数据,求出 y 关于 x 的线性回归方程ybxa;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过 2 人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?(2)回归分析是处理变量相关关系的一种数学方法主要解决:确定特定量之间是否有相关关系,如果有,就找出它们之间的数学表达式;根据一组观察值,预测变量的取值及判断变量取值的变化趋势;求出回归直线方程【互动探究】3(2014年新课标)某地区2007年至2013年农村居民家庭人均收入y(单位:千元)的数据如下表:(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均收入年份200720082009 201020112012 2013年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9日期1 月 11 日 1 月 12 日 1 月 13 日 1 月 14 日 1 月 15 日平均气温/91012118销量/杯2325302621易错、易混、易漏 对回归分析的理解例题:(2015 年广东广州调研)某位同学进行寒假社会实践活动,为了对白天平均气温与某奶茶店的某种饮料销量之间的关系进行分析研究,他分别记录了 1 月 11 日至 1 月 15 日的白天平均气温(单位:)与该奶茶店的这种饮料销量(单位:杯),所得数据如下表:(1)若从这 5 组数据中随机抽出 2 组,求抽出的 2 组数据恰好是相邻 2 天数据的概率;解:(1)设“选取的 2 组数据恰好是相邻 2 天数据”为事件 A.所有基本事件(m,n)(其中m,n 为1 月份的日期数)有(11,12),(11,13),(11,14),(11,15),(12,13),(12,14),(12,15),(13,14),(13,15),(14,15),共 10 种事件 A 包括的基本事件有(11,12),(12,13),(13,14),(14,15),共 4 种
展开阅读全文