资源描述
2019-2020年高中数学第2章统计2.3总体特征数的估计名师导航学案苏教版必修3三点剖析 在初中我们知道,总体平均数(又称为总体期望值)描述了一个总体的平均水平,由于对很多总体来说,它的平均数不易求得,常用容易求得的样本平均数:对它进行估计,而且常用两个样本平均数的大小去近似地比较相应的两个总体平均数的大小. 一、平均数 1平均数定义 若给定一组数据x1,x2,xn,则称 (i=1,2,3,n)为这组数据x1,x2,xn的平均数(或均值).通常用样本平均数来估计总体平均数.当所给数据中没有重复数据时,我们一般用此公式来求这组数据的平均数.这里(x1+x2+xn).平均数反映了一组数据的集中趋势,我们常用一组数据的平均数来衡量这组数据的水平. 当一组数据中的重复数据过多时,若用上面公式求这组数据的平均数,其过程就会显得比较复杂和冗长,为了简化计算过程,我们引入下面这种计算平均数的方法: 一般地,若取值为x1,x2,xn的频率分别为p1,p2,pn,则其平均数为x1p1+x2p2+xnpn.这一公式实质上就是公式的一个变形,它主要用于含有重复数据的数据组求平均数. 除此之外,当所给数据在某一常数a的上下波动时,我们也可利用公式:,其中 (x1+x2+xn),x1=x1-a,x2=x2-a,x3=x3-a,xn=xn-a;常数a通常取接近于这组数据的平均数较“整”的数. 例如:求数据70,71,72,73的平均数时,我们可以先求出0,1,2,3的平均数,然后将此平均数加上70即得该组数据的平均数. 2平均数的性质 (1)若给定一组数据x1,x2,xn的平均数为,则ax1,ax2,axn的平均数为a; (2)若给定一组数据x1,x2,xn的平均数为,则ax1+b,ax2+b,axn+b的平均数为a+b; 二、极差、方差与标准差 在初中我们知道,极差、方差和标准差是描述一个样本和总体的波动大小的特征数. 1极差的定义 一组数据的最大值和最小值的差叫极差.极差也可以对两组数据的集中程度进行对比,且比较简单.但两组数据的集中程度差异不大时,利用它就不易得出结论了.而且它只利用了数据中的最大值和最小值,对极值过于敏感.但由于只涉及到了两个数据,便于得到.所以极差在实际中也经常用到. 例如:数据:25,41,37,22,14,19,39,21,42,40中的最大值为42,最小值为14,它的极差为42-14=28 2方差的定义 在一组数据x1,x2,xn中,各数据与它们的平均数的差的平方的平均数,叫做这组数据的方差,记作s2,即若给定一组数据x1,x2,xn,则s2=. 为了更好地比较两组数据的集中程度,我们可以利用这两组数据的方差对两组数据进行比较.方差较大的数据波动较大;方差较小的数据波动较小.当所给的数据有单位时,所求得的平均数与原数据的单位相同,不要漏写单位.方差的单位为所给数据单位的平方. 3方差的性质 (1)若给定一组数据x1,x2,xn,方差为s2,则ax1,ax2,axn的方差为a2s2; (2)若给定一组数据x1,x2,xn,方差为s2,则ax1+b,ax2+b,axn+b的方差为a2s2,特别地,当a=1时,则有x1+b,x2+b,xn+b的方差为s2,这说明将一组数据的每一个数据都减去相同的一个常数,其方差是不变的,即不影响这组数据的波动性; (3)方差刻画了数据相对于均值的平均偏离程度.对于不同的数据集,当离散程度越大时,方差越大; (4)方差的单位是原始测量数据单位的平方,对数据中的极值较为敏感. 4标准差 刻画数据离散程度的度量,其理想形式应满足以下三条原则: (1)应充分利用所得到的数据,以便提供更确切的信息; (2)仅用一个数值来刻画数据的离散程度; (3)对于不同的数据,当离散程度大时,该数值也大. 我们上面提到的极差显然不满足第一条原则,因为它只利用了数据中最大和最小的两个值.方差虽然满足上面的三条原则,然而它有局限性:方差的单位是原始数据单位的平方,而刻画离散程度的一种理想度量应与原始观测数据具有相同的单位.解决这一局限性的方法就是取方差的算术平方根.方差的算术平方根称作标准差,记作s,即标准差的单位与原始测量数据单位相同,可以减弱极值的影响.问题探究问题1:甲、乙两台机床同时生产直径为40的零件.为了检验产品的质量,从两台机床生产的产品中各抽取10件进行了测量,结果如下:甲/mm40.039840.140.239940.040.239840.2398乙/mm40.040.039940.039940.140.140.140.0399 能用几种方法比较这两台机床的性能? 探究:经简单计算可以得出:甲、乙两台机床生产的这10件产品的直径的平均数都为40mm.所以,不能从平均数这一角度来比较这两台机床的性能,即不能从数据的平均水平上来比较,只能从数据的离散程度上进行比较.要从数据的离散程度上进行比较,常见的方法有以下几种: 方法一:利用初中所学的折线统计图.由折线统计图我们可以直观地表示出这两组数据的离散程度,甲机床生产的产品波动幅度比乙大.所以,乙机床的性能好于甲. 方法二:利用这两组数据的极差进行比较.甲:40.2-398=0.04;乙:40.1-399=0.02显然,乙组数据的极差小于甲组数据的极差.所以,乙机床的性能好于甲. 方法三:利用这两组数据的方差或标准差进行比较.由方差和标准差的计算公式不难得出甲的方差为s甲2=0.026(mm2),标准差为s甲=0.161(mm);乙的方差为s乙2=0.006(mm2),标准差为s乙=0.077(mm).由上可知:不论是方差还是标准差甲的均比乙的大,这就说明乙机床生产的产品要更标准些.所以,乙机床的性能好于甲. 问题2:某校拟派一名跳高运动员参加一项校际比赛,对甲、乙两名跳高运动员进行了8次选拔比赛,他们的成绩(单位:m)如下: 甲:1.70,1.65,1.68,1.69,1.72,1.73,1.68,1.67; 乙:1.60,1.73,1.72,1.61,1.62,1.71,1.70,1.75 经预测,跳高1.65m就很可能获得冠军.该校为了获取冠军,可能选哪位选手参赛?若预测跳高1.70 m方可获得冠军呢? 探究:参加比赛的选手的成绩得突出,且成绩稳定,这就需要比较这两名选手的平均成绩和成绩的方差. 甲的平均成绩和方差如下: (1.70+1.65+1.68+1.69+1.72+1.73+1.68+1.67)=1.69, s甲2=(1.70-1.69)2+(1.65-1.69)2+(1.67-1.69)2=0.000 6 乙的平均成绩和方差如下: (1.60+1.73+1.72+1.61+1.62+1.71+1.70+1.75)=1.68, s乙2=(1.60-1.68)2+(1.73-1.68)2+(1.75-1.68)2=0.003 15 显然,甲的平均成绩好于乙的平均成绩,而且甲的方差小于乙的方差,说明甲的成绩比乙稳定.由于甲的平均成绩高于乙,且成绩稳定,所以若跳高1.65m就很可能获得冠军,应派甲参赛.在这8次选拔赛中乙有5次成绩在1.70 m以上,虽然乙的平均成绩不如甲,成绩的稳定性也不如甲,若跳高1.70m方可获得冠军时,应派乙参加比赛.精题精讲例1在去年的足球甲A联赛上,一队每场比赛平均失球数是1.5,全年比赛失球个数的标准差为1.1;二队每场比赛平均失球数为2.1,全年比赛失球个数的标准差为0.4你认为下列说法中哪一种是正确的? (1)平均说来一队比二队技术好; (2)二队比一队技术水平更稳定; (3)一队有时表现很差,有时表现又非常好; (4)二队很少不失球.思路解析本题主要考查对平均数和标准差的概念的理解.平均数反映了一组数据的平均水平,而方差则反映了一组数据的波动性的大小.一队每场比赛平均失球数比二队每场比赛平均失球数少,说明一队的技术比二队的技术好;一队全年比赛失球个数的标准差较大,说明一队的表现时好时坏,起伏较大;二队的平均失球数多,全年比赛失球个数的标准差很小,说明二队的表现较稳定,经常失球. 答案:(1)(2)(3)(4)都正确.例2下面是某一个工厂所有工作人员在某个月的工资,总经理6 000元,技术工人甲900元,技术工作人员乙800元,杂工640元,服务员甲700元,服务员乙640元,会计820元. (1)计算所有工作人员的平均工资. (2)去掉总经理后,再计算平均工资. (3)在(1)和(2)中两种平均工资哪一种能代表一般工人的收入水平,为什么?思路解析计算平均工资是用工资总数除以领工资的人数即可. 答案:(1)所有工作人员平均工资为(6 000+900+800+640+700+640+820)=1 500(元). (2)去掉总经理后平均工资为(900+800+640+700+640+820)=750(元). (3)能代表一般工人的收入水平的是去掉总经理后的平均工资750元.因为除去总经理之外,工作人员的工资均在900元以下,因此不能以1 500元来代表职工的平均工资水平.绿色通道 一般地,在一组数据中,平均数、众数、中位数能够反映该组数据的集中趋势和平均水平,但有时需要去掉极端值(极大值或极小值),这样计算平均数则更能反映平均水平,这就是有些比赛活动中往往会去掉一个最大值和一个最小值再去计算平均成绩的原因.例3甲、乙两工人同时加工一种圆柱零件,在他们所加工的零件中各抽取10个进行直径检测,测得数据如下(单位:mm): 甲:19.9,19.7,19.8,20.0,19.9,20.2,20.1,20.3,20.2,20.1; 乙:20.0,20.2,19.8,19.9,19.7,20.2,20.1,19.7,20.2,20.4 (1)分别计算上面两个样本的平均数和方差; (2)若零件规定直径为20.00.5(mm),根据两个样本的平均数和方差,说明谁加工的零件的质量较稳定.思路解析利用平均数和方差的计算公式进行计算,再比较谁的零件的质量较稳定.由于方差能说明一组数据波动性的大小,则可通过比较这两个样本的方差的大小来比较两人加工零件的稳定性. 答案:(1)甲=20.02,乙=20.02, 利用s2,可得s甲2=0.033 6,s乙2=0.041 6 s甲2s乙2, 甲工人加工零件的质量比较稳定.绿色通道 比较两人加工零件的质量的稳定性,这里通过平均数比较不出来,需要使用方差来比较,方差越大说明波动性较大,质量越不稳定.一般地,方差和标准差通常用来反映一组数据的波动大小.在统计中,样本的方差和标准差通常用来估计总体数据的波动大小.例4从2001年2月21日0时起,中国电信执行新的电话收费标准,其中本地网营业区内通话费是:前3min为0.2元(不足3min的按3min计算),以后每分钟加收0.1元(不足1min的按1min计算).某星期天,一位学生调查了A、B、C、D、E五位同学某天打本地网营业区内电话的通话时间情况,原始数据如表1表1ABCDE第一次通话时间3min3min 45s3min 55s3min 20s6min第二次通话时间04min3min 40s4min 40s0第三次通话时间005min2min0表2时间段频数累计频数0t33t44t55t6 (1)问D同学这天的通话费是多少? (2)设通话时间为t min,试根据表1填写频数(落在某一时间段上的通话次数)分布表(表2). (3)调整前执行的原电话收费标准是:每3 min为0.2元(不足3 min的按3 min计算).问:这五位同学这天的实际平均通话费与用原电话收费标准算出的平均通话费相比,是增多了,还是减少了?若增多,多多少?若减少,少多少?思路解析在解答此题时,要认真分析题中所给的条件,分清不同的时间段的话费情况,再进一步结合所学的数学知识,这样就不难求出结果. 答案:(1)0.2+0.1+0.2+20.1+0.2=0.9(元), D同学这天通话费是0.9元. (2)表2时间段频数累计频数0t323t454t525t61 (3)设这五位同学这天的实际平均通话费为元, 按原电话收费标准算出的平均通话费为元, 则= (20.2+50.3+20.4+0.5)=0.64, = (20.2+80.4)=0.72, =0.720.64=0.08(元). 这五位同学这天的实际平均通话费比按原电话标准算出的平均通话费减少了0.08元.绿色通道 统计的学习重在应用,要学会从实际生活之中抽取数据,处理数据,解决实际问题.本题中对于收费方式的正确理解是解决问题的关键.
展开阅读全文