资源描述
第一章,统计案例,1,知识网络 整体构建,2,要点归纳 主干梳理,3,题型探究 重点突破,章末复习提升,两个基本思想 1.回归分析的基本思想 回归分析包括线性回归分析和非线性回归分析两种,而非线性回归分析往往可以通过变量代换转化为线性回归分析,因此,回归分析的思想主要是指线性回归分析的思想. 注意理解以下几点:,(1)确定线性相关关系 线性相关关系有两层含义:一是具有相关关系,如广告费用与销售量的关系等在一定条件下具有相关关系,而气球的体积与半径的关系是函数关系,而不是相关关系;二是具有线性相关关系. 判断是否线性相关的依据是观察样本点的散点图或计算相关系数.,(2)回归方程的预报精度 简单来说,线性回归分析就是通过建立回归直线方程对变量进行预报,用回归方程预报时,需对函数值明确理解,它表示当x取值时,真实值在函数值附近或平均值在函数值附近,不能认为就是真实值.,2.独立性检验的基本思想 独立性检验的基本思想类似于反证法.要确认两个分类变量有关系的可信程度,先假设两个分类变量没有关系,再计算统计量2的值,最后由2的值很大在一定程度上说明两个分类变量有关系. 进行独立性检验要注意理解以下三个问题: (1)独立性检验适用于两个分类变量.,(2)两个分类变量是否有关系的直观判断: 根据22列联表计算|adbc|,值越大关系越强; (3)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握确认两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.,题型一回归分析思想的应用,回归分析是对抽取的样本进行分析,确定两个变量的相关关系,并用一个变量的变化去推测另一个变量的变化.如果两个变量非线性相关,我们可以通过对变量进行变换,转化为线性相关问题.,例1某餐饮部为研究气温对热饮销售的影响,经过数据统计,得到热饮杯数与当天气温的对照表:,(1)画出散点图; 解以x轴表示温度,以y轴表示热饮杯数,作散点图.,(2)从散点图中可看出气温与热饮杯数之间关系的一般规律是什么? 解从图中可看出,各散点分布在左上角到右下角的区域里,气温越高,卖出去的热饮杯数越少.,(3)求线性回归方程; 解从散点图可看出,这些点大致分布在一条直线附近,两变量呈现近似的线性关系,因此利用计算器求得下列表中数据.,所以线性回归方程是y2.347x147.69.,(4)如果某天的气温为3 ,预测这天卖出的热饮杯数. 解当x3时,y2.3473147.69140.65,因此,某天的气温为3 时,这天大约可以卖出140杯热饮.,跟踪训练1在一段时间内,某种商品的价格x元和需求量y件之间的一组数据为,且知x与y具有线性相关关系,求出y对x的线性回归方程.,a7.41.151828.1, 线性回归方程为y1.15x28.1.,题型二独立性检验思想的应用,独立性检验的基本思想是统计中的假设检验思想,类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即假设“两个分类变量没有关系”成立,在该假设下我们构造的统计量2应该很小,如果由观测数据计算得到的2的值很大,则在一定程度上说明假设不合理.,例2为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2) 表1:注射药物A后皮肤疱疹面积的频数分布表,表2:注射药物B后皮肤疱疹面积的频数分布表,完成下面22列联表,能否在犯错误概率不超过0.001的前提下,认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.p(210.828)0.001,表3:,解列出22列联表,由于210.828,所以在犯错误概率不超过0.001的前提下,认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.,跟踪训练2某电视台联合相关报社对“男女同龄退休”这一公众关注的问题进行了民意调查,数据如下表所示:,根据表中数据,能否在犯错误的概率不超过0.001的前提下认为对这一问题的看法与性别有关系?P(210.828)0.001,解假设“对这一问题的看法与性别无关”,由列联表中的数据,可以得到:,又P(210.828)0.001, 故在犯错误的概率不超过0.001的前提下认为对“男女同龄退休”这一问题的看法与性别有关.,课堂小结,1.建立回归模型的基本步骤:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出散点图,观察它们之间的关系.(3)由经验确定回归方程的类型.(4)按照一定的规则估计回归方程中的参数. 2.独立性检验是对两个分类变量间是否存在相关关系的一种案例分析方法.利用假设的思想方法,计算出统计量2的值来判断更精确些.,
展开阅读全文