数学:第一章《统计案例》教案(新人教A版选修1-2)

上传人:青山 文档编号:1385777 上传时间:2019-10-18 格式:DOC 页数:7 大小:626KB
返回 下载 相关 举报
数学:第一章《统计案例》教案(新人教A版选修1-2)_第1页
第1页 / 共7页
数学:第一章《统计案例》教案(新人教A版选修1-2)_第2页
第2页 / 共7页
数学:第一章《统计案例》教案(新人教A版选修1-2)_第3页
第3页 / 共7页
点击查看更多>>
资源描述
第一章 统计案例复习教案一、本章知识脉络:统计案例回归分析样本点的中心随机误差残差分析建立回归模型的基本步骤回归分析列联表K2判断结论成立可能性的步骤二、本章要点追踪:1.样本点的中心(,)其中xi, yi.2.线性回归模型的完美表达式 3.类比样本方差估计总体方差的思想,可以用iQ(,)(n2)作为2的估计量其中4.我们可以用相关指数R2来刻画回归的效果,其计算公式是:R21 R2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好.5.建立回归模型的基本步骤:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程ybxx);(4)按一定规则估计回归方程中的参数(如最小二乘法);(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性等等),若存在异常,则检查数据是否有误,或模型是否合适等。6.作K2来确定结论“X与 Y有关系”的可信程度.三、几个典型例题:例1某地区10名健康儿童头发和全血中的硒含量(1000ppm)如下,血硒74668869917366965873发硒13101311169714510(1)画出散点图;(2)求回归方程;(3)如果某名健康儿童的血硒含量为94(1000ppm)预测他的发硒含量.解(1)散点图如下图所示:(2)利用计算器或计算机,求得回归方程:0.2358x6.9803(3)当x94时,15.2因此,当儿童的血硒含量为94(1000ppm)时,该儿童的发硒含量约为15.2(1000ppm).例2 某地大气中氰化物测定结果如下:污染源距离50100150200250300400500氰化物浓度0.6870.3980.2000.1210.090.050.020.01(1)试建立氰化物浓度与距离之间的回归方程.(2)求相关指数.(3)作出残差图,并求残差平方和解析(1)选取污染源距离为变量x,氰化物浓度为自因变量y作散点图. 从表中所给的数据可以看出,氰化物浓度与距离有负的相关关系,用非线性回归方程来拟合,建立y关于x的指数回归方程.0.9293e0.0094x(2)相关指数K210.9915 (3)编号12345678污染源距离50100150200250300400500氰化物浓度0.6870.398 0.20.1210.090.050.020.01残差0.10618570.0350.0270.021 0.00140.0050.0020.0015残差平方和(yi)20.0118例3某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机制取了189名员工进行调查,所得数据如下表所示:积极支持企业改革不太造成企业改革合计工作积极544094工作一般326395合计86103189对于人力资源部的研究项目,根据上述数据能得出什么结论?解:根据列联表中的数据,得到K210.76.因为10.766.635,所以有99%的把握说:员工“工作积极”与“积极支持企业改革”是有关的,可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的.例4 有人统计了同一个省的6个城市某一年的人均国内生产总值(即人均GDP)和这一年各城市患白血病的儿童数量,如下表:人均GDP(万元)1086431患白血病的儿童数351312207175132180(1)画出散点图;(2)求对的回归直线方程;(3)如果这个省的某一城市同时期年人均GDP为12万元,估计这个城市一年患白血病的儿童数目;分析:利用公式分别求出的值,即可确定回归直线方程,然后再进行预测.16题图解:(1)作与对应的散点图,如右图所示;(2)计算得, ,对的回归直线方程是;(3)将代入得,估计这个城市一年患白血病的儿童数目约为381.评注:本题涉及的是一个和我们生活息息相关,也是一个愈来愈严峻的问题环保问题.本题告诉了我们一个沉痛的事实:现如今,一个城市愈发达,这个城市患白血病的儿童愈多.原因在于,城市的经济发展大都以牺牲环境为代价的,经济发展造成了大面积的环境污染,空气、水源中含有的大量的有害物质是导致白血病患者增多的罪魁祸首,所以,我们一定要增强自我保护意识和环境保护意识. 例5 寒假中,某同学为组织一次爱心捐款,于2008年2月1日在网上给网友发了张帖子,并号召网友转发,下表是发帖后一段时间的收到帖子的人数统计:天数 1234567人数 711212466115325(1)作出散点图,并猜测与之间的关系;(2)建立与的关系,预报回归模型并计算残差;(3)如果此人打算在2008年2月12日(即帖子传播时间共10天)进行募捐活动,根据上述回归模型,估计可去多少人. 分析:先通过散点图,看二者是否具有线性相关关系,若不具有,可通过相关函数变换,转化为线性相关关系.解:(1)散点图略.从散点图可以看出与不具有线性相关关系,同时可发现样本点分布在某一个指数函数曲线的周围,其中是参数;(2)对两边取对数,把指数关系变成线性关系.令,则变换后的样本点分布在直线的周围,这样就可以利用线性回归模型来建立与之间的非线性回归方程了,数据可以转化为:天数 1234567人数 1.9462.3983.0453.1784.1904.7455.784求得回归直线方程为,.(3)截止到2008年2月12日,此时(人).估计可去1530人. 评注:现如今是网络时代,很多同学都会通过互联网发帖子,所以此类问题为同学们司空见惯.但如何预测发帖后的效果,这却是个新课题,通过本题你是否已明确.例6 有人发现了一个有趣的现象,中国人的邮箱名称里含有数字的比较多,而外国人邮箱名称里含有数字的比较少.为了研究国籍和邮箱名称里是否含有数字的关系,他收集了124个邮箱名称,其中中国人的70个,外国人的54个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.(1)根据以上数据建立一个22的列联表;(2)他发现在这组数据中,外国人邮箱名称里含数字的也不少,他不能断定国籍和邮箱名称里含有数字是否有关,你能帮他判断一下吗? 分析:按题中数据建列联表,然后根据列联表数据求出值,即可判定.解:(1)22的列联表 中国人外国人总计有数字432770无数字213354总计6460124(2)假设“国籍和邮箱名称里是否含有数字无关”.由表中数据得, 因为,所以有理由认为假设“国籍和邮箱名称里是否含有数字无关”是不合理的,即有的把握认为“国籍和邮箱名称里是否含有数字有关”.评注:独立性检验类似于反证法,其一般步骤为:第一步:首先假设两个分类变量几乎没有关系(几乎独立);第二步:求随机变量的值;第三步.判断两个分类变量有关的把握(即概率)有多大.例7 针对时下的“韩剧热”,某校团委对“学生性别和是否喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的,男生喜欢韩剧的人数占男生人数的,女生喜欢韩剧人数占女生人数的. (1)若有的把握认为是否喜欢韩剧和性别有关,则男生至少有多少人;(2)若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有多少人.分析:有的把握认为回答结果对错和性别有关,说明,没有充分的证据显示回答结果对错和性别有关,说明.设出男生人数,并用它分别表示各类别人数,代入的计算公式,建立不等式求解即可.解:设男生人数为,依题意可得列联表如下:喜欢韩剧不喜欢韩剧总计男生女生总计(1)若有的把握认为回答结果的对错和性别有关,则,由,解得,为整数,若有的把握认为回答结果的对错和性别有关,则男生至少有12人;(2)没有充分的证据显示回答结果的对错和性别有关,则,由,解得,为整数,若没有充分的证据显示回答结果的对错和性别有关,则男生至多有6人.评注:这是一个独立性检验的创新问题,解答时要注意理解“至少”、“至多”的含义.通过上面几例,大家是否已体会到了回归分析和独立性检验思想方法的应用的广泛性和重要性.其实,这两种思想方法并不神秘,你身边有很多问题可信手拈来,用它们处理,这一点还请同学们多思考、勤尝试. - 7 -
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 中学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!