资源描述
1.掌握简单的随机抽样. 2.了解分层抽样和系统抽样. 3.会画频率分布直方图,会计算数据标准差,并会用样 本的频率分布估计总体的频率分布,用样本的数字特 征估计总体的数字特征. 4.能根据给出的线性回归方程系数公式建立回归方程. 5.了解回归分析的基本思想、方法及简单应用,了解 独立性检验(只要求22列联表)的基本思想、方法 及简单应用.,学案22 统计、统计案例,1.一个容量为100的样本,其数据的分组与各组的频数 如下: 则样本容量数据落在(10,40上的频率为 ( ) A.0.13 B.0.39 C.0.52 D.0.64 解析 (10,40包含(10,20,(20,30,(30,40三部 分,共13+24+15=52(个)样本数据,故数据落在(10, 40上的频率为,C,2.(2009山东)某工厂对一批产 品进行了抽样检测,右图是根据 抽样检测后的产品净重(单位: 克)数据绘制的频率分布直方图, 其中产品净重的范围是96,106,样本数据分组为 96,98),98,100),100,102),102,104),104, 106.已知样本中产品净重小于100克的个数是36,则 样本中净重大于或等于98克并且小于104克的产品的 个数是 ( ) A.90 B.75 C.60 D.45,解析 产品净重小于100克的频率为(0.050+0.100) 2=0.300,已知样本中产品净重小于100克的个数是36, 设样本容量为n,则 所以n=120,净重大于或 等于98克并且小于104克的产品的频率为(0.100+ 0.150+0.125)2=0.75,所以样本中净重大于或等于 98克并且小于104克的产品的个数是1200.75=90. 答案 A,3.(2009湖南)一个总体分为A,B两层,用分层抽样方 法从总体中抽取一个容量为10的样本,已知B层中每 个个体被抽到的概率都为 则总体中的个体数为 _. 解析 由分层抽样定义知,任何个体被抽到的概率都 是一样的,设总体中个体数为x,则 x=120.,120,题型一 抽样方法 【例1】某校共有学生2 000名,各年级男、女生人数 如下表.已知在全校学生中随机抽取1名,抽到二年级 女生的概率是0.19.现用分层抽样的方法在全校抽取 64名学生,则应在三年级抽取的学生人数为 ( ) A.24 B.48 C.16 D.12,解析 依题意知二年级的女生有380名,那么三年级学 生的人数应该是2 000-373-377-380-370=500,即总体 中各个年级的人数比例为3:3:2,故在分层抽样中应在 三年级抽取的学生人数为 答案 C 【探究拓展】分层抽样适用于数目较多且各部分之间 具有明显差异的总体,无论采用哪一种抽样方法,在 整个抽样过程中每个个体被抽到的概率都是相等的, 等于样本容量与总体容量的比值.,变式训练1 某学校共有教师490人,其中不到40岁的 有350人,40岁及以上的有140人.为了了解普通话在 该学校的推广普及情况,用分层抽样的方法从全体教 师中抽取一个容量为70人的样本进行普通话水平测 试,其中不到40岁的教师应抽取的人数为 ( ) A.30 B.40 C.50 D.60 解析 因抽取的比例为 故在不到40岁的教师 中抽取的人数为,C,题型二 用样本的数字特征估计总体的数字特征 【例2】(2009四川)设矩形的长为a,宽为b,其比满 足b:a= 这种矩形给人以美感,称为黄金 矩形,黄金矩形常应用于工艺品设计中,下面是某工 艺品厂随机抽取两个批次的初加工矩形宽度与长度 的比值样本: 甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620,根据上述两个样本来估计两个批次的总体平均数,与 标准值0.618比较,正确结论是 ( ) A.甲批次的总体平均数与标准值更接近 B.乙批次的总体平均数与标准值更接近 C.两个批次总体平均数与标准值接近程度相同 D.两个批次总体平均数与标准值接近程度不能确定 解析 (0.598-0.618)+(0.625-0.618)+(0.628- 0.618)+(0.595-0.618)+(0.639-0.618)=-0.001, (0.618-0.618)+(0.613-0.618)+(0.592-0.618)+ (0.622-0.618)+(0.620-0.618)=-0.005,| -0.618| -0.618|. 甲批次的总体平均数更接近标准值. 答案 A,变式训练2 甲、乙、丙三名射箭运动员在某次测试 中各射箭20次,三人的测试成绩如下表,s1,s2,s3分别表示甲、乙、丙三名运动员这次测试成绩 的标准差,则有 ( ) A.s3s1s2B.s2s1s3 C.s1s2s3D.s2s3s1 解析,由 得s2s1s3. 答案 B,题型三 回归分析 【例3】为了对2009年某市中考成绩进行分析,所有成 绩均按百分制进行折算,在60分以上的全体同学中随 机抽取8位,他们的数学分数从小到大排是60,65,70, 75,80,85,90,95,物理分数从小到大排是72,77,80, 84,88,90,93,95.若规定85分(包括85分)以上为优 秀, (1)求这8位同学中恰有3位同学的数学和物理成绩均 为优秀的概率; (2)若这8位同学的数学、物理、化学分数对应如表:,用变量y与x,z与x的相关系数说明物理与数学,化学 与数学的相关程度; 求y与x,z与x的线性回归方程(系数精确到0.01),并 用相关指数比较所求回归模型的效果. 参考数据:,解 (1)这8位同学中恰有3位同学的数学和物理成绩 均为优秀,则需要先从物理的4个优秀分数中选出3个 与数学优秀分数对应,种数是 然后将剩 下的5个数学分数与物理分数任意对应,种数是 根 据乘法原理,满足条件的种数是 这8位同学的 物理分数和数学分数分别对应的种数共有 种. 故所求的概率P=,(2)变量y与x,z与x的相关系数分别是 可以看出,物理与数学,化学与数学的成绩都是高度正 相关. 设y与x,z与x的线性回归方程分别是 根据所给的数据, 可以计算出 a=85-0.6677.5=33.85, a=81-0.7277.5=25.20. 所以y与x,z与x的线性回归方程分别是,又y与x,z与x的相关系数是 故回归模型 比回归模型 25.20的拟合效果好. 【探究拓展】一般地,在尚未确定两个变量之间是否 具有线性相关关系的情况下,应先进行相关性检验, 在确定具有相关关系后,再求回归直线方程.如果利 用散点图观察两个变量是否具有相关性不太明显时, 可以通过计算样本统计量相关系数进行判断.对 于多个回归模型回归直线方程可通过计算其相 关指数来比较它们拟合效果的强弱,相关指数越大拟 合效果越好.,变式训练3 下表提供了某厂节能降耗技术改造后生 产甲产品过程中记录的产量x(吨)与相应的生产能耗 y(吨标准煤)的几组对照数据: (1)请根据上表提供的数据,用最小二乘法求出y关于 x的线性回归方程 (2)已知该厂技改前100吨甲产品的生产能耗为90吨 标准煤.试根据(1)求出的线性回归方程,预测生产 100吨甲产品的生产能耗比技改前降低多少吨标准 煤?(参考数值:32.5+43+54+64.5=66.5).,解 (1) =32.5+43+54+64.5=66.5. =32+42+52+62=86, 故线性回归方程为 (2)根据回归方程的预测,现生产100吨甲产品消耗的 标准煤的数量为0.7100+0.35=70.35(吨),故耗能减 少了90-70.35=19.65吨标准煤.,题型四 独立性检验 【例4】为了判断高中三年级学生选修文科是否与性 别有关,现随机抽取50名学生,得到如下22列联表: 已知P(K23.841)0.05,P(K25.024)0.025. 则认为选修文科与性别有关系出错的可能性有多大? 解 根据表中数据, 得到 由于3.8414.8445.024,故有95%的把握认为选修文科与性别有关系, 所以认为选修文科与性别有关系出错的可能性为5%. 【探究拓展】独立性检验关键是准确计算出K2,在计 算时充分利用22列联表,在进行相关和无关的判断 时,一定要结合实际问题,从实践中寻找相关事例,切 忌盲从.,变式训练4 防疫站为考察某种药物预防疾病的效果, 进行动物实验,服用该药的动物共有55只,其中有10 只患病,没有服用该药的动物中患病的有20只,不患 病的有30只. (1)列出药物效果实验的列联表; (2)根据下表,利用独立性检验估计有多大把握认为 药物有效.,解 (1)药物效果实验的列联表如下图: (2)根据列联表中的数据,得到 K2=6.1095.024, 有97.5%的把握认为药物对预防疾病有效果.,【考题再现】 (2009山东)汽车厂生产A,B,C三类轿车,每类轿车 均有舒适型和标准型两种型号,某月的产量如下表 (单位:辆): 按类用分层抽样的方法在这个月生产的轿车中抽取 50辆,其中有A类轿车10辆.,(1)求z的值; (2)用分层抽样的方法在C类轿车中抽取一个容量为5 的样本,将该样本看成一个总体,从中任取2辆,求至少 有1辆舒适型轿车的概率; (3)用随机抽样的方法从B类舒适型轿车中抽取8辆, 经检测它们的得分如下:9.4,8.6,9.2,9.6,8.7,9.3, 9.0,8.2.把这8辆车的得分看成一个总体,从中任取一 个数,求该数与样本平均数之差的绝对值不超过0.5的 概率. 【解题示范】 解 (1)设该厂这个月共生产轿车n辆, 由题意得 所以n=2 000.,则z=2 000-(100+300)-(150+450)-600=400. 4分 (2)设所抽样本中有a辆舒适型轿车, 由题意 得a=2. 因此抽取的容量为5的样本中,有2辆舒适型轿车,3辆 标准型轿车. 用A1,A2表示2辆舒适型轿车,用B1,B2,B3表示3辆标准 型轿车.用E表示事件“在该样本中任取2辆,其中至少 有1辆舒适型轿车”, 则基本事件空间包含的基本事件有: (A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2) (A2,B3),(B1,B2),(B1,B3),(B2,B3)共10个,事件E包含,的基本事件有:(A1,A2),(A1,B1),(A1,B2),(A1,B3), (A2,B1),(A2,B2),(A2,B3)共7个. 7分 故P(E)= 即所求概率为 8分 (3)样本平均数 = (9.4+8.6+9.2+9.6+8.7+9.3+ 9.0+8.2)=9. 10分 设D表示事件“从样本中任取一数,该数与样本平均数 之差的绝对值不超过0.5”,则基本事件空间中有8个 基本事件,事件D包括的基本事件有:9.4,8.6,9.2, 8.7,9.3,9.0,共6个,所以P(D)= 即所求概率 为 12分,1.抽样方法主要有简单随机抽样、系统抽样、分层抽 样三种,这三种抽样方法各自适用不同特点的总体, 它们之间既有区别又有联系,但不论是哪种抽样方 法,在整个抽样过程中,每一个个体被抽到的概率是 相等的,都等于样本容量和总体容量的比值.此外还 要注意分层抽样中有关数值的计算. 2.频率分布直方图中每一个小矩形的面积等于数据落 在相应区间上的频率,所有小矩形的面积之和等于1. 3.正态分布也是日常生活中一种常见的分布,要了解 正态曲线的特征,会进行非标准正态分布和标准正态 分布之间的转化,能够进行有关的数值计算.,一、选择题 1.(2009福建)已知某运动员每次投篮命中的概率低 于40%.现采用随机模拟的方法估计该运动员三次投 篮恰有两次命中的概率:先由计算器产生0到9之间取 整数值的随机数,指定1,2,3,4表示命中,5,6,7,8,9, 0表示不命中;再以每三个随机数为一组,代表三次投 篮的结果.经随机模拟产生了如下20组随机数: 907 966 191 925 271 932 812 458 569 683 431 257 393 027 556 488 730 113 537 989,据此估计,该运动员三次投篮恰有两次命中的概率为 ( ) A.0.35 B.0.25 C.0.20 D.0.15 解析 由题意知在20组随机数中表示三次投篮恰有两 次命中的有:191、271、932、812、393,共5组随机 数,故所求概率为 2.某公司甲、乙、丙、丁四个地区分别有150个、120 个、180个、150个销售点.公司为了调查产品销售的 情况,需从这600个销售点中抽取一个容量为100的样 本,记这项调查为;在丙地区中有20个特大型销售,B,点,要从中抽取7个调查其收入和售后服务等情况,记 这项调查为.则完成、这两项调查宜采用的抽 样方法依次是 ( ) A.分层抽样法,系统抽样法 B.分层抽样法,简单随机抽样法 C.系统抽样法,分层抽样法 D.简单随机抽样法,分层抽样法 解析 因为抽取的销售点与地区有关,因此采用分 层抽样法,从20个特大型销售点中抽取7个调查,总 体和样本容量都比较少,适合采用简单随机抽样法.,B,3.下表是x与y之间的一组数据,则y关于x的线性回归方 程 必过 ( ) A.点(2,2) B.点(1.5,2) C.点(1,2) D.点(1.5,4) 解析 回归直线方程必过样本中心点(x,y),经计算 得(1.5,4).,D,4.选择薪水高的职业是人之常情,假如张伟和李强两 人大学毕业有甲、乙两人公司可供选择,现从甲、乙 两个公司分别随机抽取50名员工的月工资的资料,统 计如下:根据以上的统计信息,若张伟想找一份工资 比较稳定的工作,而李强想找一份有挑战性的工作, 则他俩分别选择的公司是 ( ),A.甲、乙 B.乙、甲 C.都选择甲 D.都选择乙 解析 由表中的信息可知,甲公司的工资标准差远小 于乙公司的工资标准差,这表示甲公司的工资比较稳 定,张伟想找一份工资比较稳定的工作,会选择甲公 司;而乙公司的工资最大值和极差远大于甲公司的工 资最大值和极差,李强想找一份有挑战性的工作,会选 择乙公司. 答案 A,二、填空题 5.某班级共有学生52人,现将学生随机编号,用系统抽 样法,抽取一个容量为4的样本,已知6号,32号,45号 同学在样本中,那么样本中还有一个同学的编号是 _号. 解析 间距为 又在第一组中抽取的是6,所以 应该依次抽取:6+13=19,6+213=32,6+313=45,故 还有一个编号为19.,19,6.从一堆苹果中任取20个,并得到它们的质量(单位: 克)数据分布表如下: 则这堆苹果中,质量小于120克的苹果数约占苹果总 数的_%. 解析 根据条件可得110,120)内的频数为20-1-2-3 -10-1=3,则样本中质量小于120克的苹果个数为1+2+ 3=6,其频率为 即约占苹果总数的30%.,30,7.(2009湖北)样本容量为200的频率分布直方图如 图所示.根据样本的频率分布直方图估计,样本数据 落在6,10)内的频数为_.数据落在2,10)内的概 率约为_. 解析 由于组距为4,因此在6,10)之间的频率为 0.084=0.32,其频数为0.32200=64. 落在2,10)之间的概率约为(0.02+0.08)4=0.4.,0.4,64,三、解答题 8.根据空气质量指数API(为整数)的不同,可将空气质 量分级如下表: 对某城市一年(365天)的空气质量进行监测,获得的 API数据按照区间0,50,(50,100,(100,150, (150,200,(200,250,(250,300进行分组,得到频 率分布直方图如图.,(1)求直方图中x的值; (2)计算一年中空气质量分别为良和轻微污染的天数; (3)求该城市某一周至少有2天的空气质量为良或轻微 污染的概率. (结果用分数表示.已知57=78 125,27=128, 365=735),解,(3)记良为A,轻微污染为B,返回,
展开阅读全文