资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,11/7/2009,#,高中新课标总复习(第,1,轮),理科数学,湖南,人教版,*,立足教育 开创未来,随机抽样、正态分布,1,第一页,共40页。,随机抽样、正态分布,第二页,共40页。,1.数据的基本数字特征,(1)平均数:一组数据的平均数,记为.设有n个数据x1,x2,xn,则平均数为,=.,(2)中位数:一组数据按照从小到大或从大到小的顺序进行排列时,处于中间位置的数.当这组数据的个数为奇数(j sh)时,中位数为中间一个数;当这组数据的个数为偶数时,中位数为中间的两个数的平均数.,第三页,共40页。,()当x0,所以(suy),(x(-,+),因此,乙发挥比较稳定,总体情况比甲好.,(2)用样本的数字特征验证他们谁发挥得更好.,(1)从茎叶图的特征来说明他们谁发挥得更稳定;,超过130分以上的人数(rn sh)为500.,(3)将各个数据的叶按大小次序写在其茎右(左)侧;,第(3)问先计算出中点的概率,然后根据期望的定义求解.,(3)众数:一组数据中出现次数(csh)最多的数.,(4)极差:一组数据中最大数与最小数的差.,(5)方差:一组数据中所有数与平均数的差的平方和的平均数,记为s2,,即s2=.,(6)标准差:方差的算术平方根,记作s.,2.主要统计图表,(1)基本统计图表:象形、条形、折线、扇形统计图.,第四页,共40页。,(2)频率分布直方图的画图步骤:,()求极差;()决定(judng)组距与组数;()将数据分组;()列频率分布表;()画频率分布直方图(以频率组距为纵坐标).,(3)频率分布折线图:连接频率分布直方图中各小长方形上端的中点所得的折线.,(4)总体密度曲线:随着样本容量的增加,作频率分布折线图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,则称这条光滑曲线为总体密度曲线.,第五页,共40页。,(5)茎叶图:中间的数字表示数据的十位数字,旁边(pngbin)的数字分别表示两组数据中各个数据的个位数字.,3.抽样方法,(1)简单随机抽样:从含有N个个体的总体中逐个不放回地抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做 .有两种常用方法:,简单(jindn)随机抽样,第六页,共40页。,():就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中取出一个号签,连续抽取n次,就得到一个容量(rngling)为n的样本.,():利用随机数表、随机数骰子或计算机产生的随机数进行抽样.,(2)系统抽样:按下列步骤进行抽样:,()先将总体的N个个体编号;()确定分段间隔k,对编号进行分段;()在第1段用简单随机抽样确定第一个个体编号l(lk);()按照一定的规则抽取样本.,抽签(chu qin)法,随机数表法,第七页,共40页。,(3)分层抽样:即 .,.,.,4.正态分布,(1)如果随机变量的概率密度为,(x)=.,其中(qzhng)、分别表示总体的平均数与标准差,称服从参数为、的正态分布,记作N(,2),函数图象称为正态密度曲线,简称正态曲线.,在抽样时,将总体(zngt)分成,互不交叉的层,然后(rnhu)按照一定的比例,从各层,独立地抽出一定数量的个体,将各层取出的,个体合在一起作为样本,(,x,(-,+),第八页,共40页。,一般的,如果对于任何(rnh)实数ab,随机变量满足P(ab)=,(x)dx,则称的分布为 .,(2)标准正态分布,在正态分布中,当=,=时,正态总体称为标准正态总体,正态分布N(0,1),称为标准正态分布,记作N(0,1).,(3)正态曲线的性质,()曲线在x轴的上方,与x轴不相交;,()曲线关于直线x=对称;,正态分布,0,1,第九页,共40页。,()曲线在x=时位于最高点;,()当x时,曲线下降,并且当曲线向左、右两边无限延伸时,以x轴为渐近线向它无限靠近;,()当一定时,曲线的形状由确定(qudng),越大,曲线越“矮胖”,表示总体的分布越分散;越小,曲线越“瘦高”,表示总体的分布越集中.,(4)若N(,2),则E=,D=2.,第十页,共40页。,(5)若XN(,2),则P(-X+)=0.6826,P(-2X+2)=0.9544,P(-3X+3)=0.9974.,(6)通常(tngchng)认为服从正态分布N(,2)的随机变量X只取 ,并简称之为3原则.,(,-3,+3,),之间的值,11,第十一页,共40页。,题型一 抽样(chu yn)方法,例,1,在我国东南沿海(ynhi)有60个人均GDP在3万元以上的城市,其中人均GDP在34万元之间的有36个,在45万元之间的有18个,在5万元以上的有6个.国家环保总局欲用分层抽样从中随机抽取部分城市进行环境调查,若抽取的人均GDP在45万元之间的城市个数为3,则抽取的人均GDP在34万元之间的城市个数为.,第十二页,共40页。,根据分层抽样的特征,在各层抽取(chu q)的比例是相同的,故可先依据已知求出这个比例,再求解.,抽取的人均(rn jn)GDP在45万元之间的城市的比例为 ,故抽取的人均(rn jn)GDP在34万元之间的城市的比例也是 ,则抽取的城市个数为36 .,分层抽样在各层抽取样本(yngbn)的比例是相等的,这是解决分层抽样计算问题的主要依据.,第十三页,共40页。,题型二 正态分布,例,2,某批材料(cilio)的强度服从正态分布N(200,182),任取一件这种材料(cilio),强度在164236的概率是多少?,依题意(t y),得=200,=18.,则P(164236)=P(200-218200+218),P(-2+2),=0.9544.,故任取一件材料,其强度在164236的概率是0.9544.,第十四页,共40页。,设在一次数学考试中,某班学生的分数(fnsh)服从N(110,),且已知满分为150分,这个班的学生共50人,求这个班在这次考试中不小于90分的人数和超过130分以上的人数.,第十五页,共40页。,因为N(110,),则=110,=20,P(110-20130)=1/2*(1-0.6826)=0.1587.,P(90)=0.6826+0.1587=0.8413.,故不小于90分的人数(rn sh)为500.841342(人).,超过130分以上的人数(rn sh)为500.15878(人).,求此概率需将问题化为正态随机变量的几种特殊(tsh)值的概率形式,然后利用对称性求解.,第十六页,共40页。,题型三 频率(pnl)分布表与频率(pnl)分布直方图,例,3,在生产过程中,测得纤维产品的纤度(表示纤维粗细的一种量)共有(n yu)100个数据,数据分组如下表,分组,1.30,1.34),1.34,1.38),1.38,1.42),1.42,1.46),1.46,1.50),1.50,1.54),合计,频数,4,25,30,29,10,2,100,第十七页,共40页。,(1)完成频率分布(fnb)表,并在给定的坐标系中画出频率分布(fnb)直方图;,分组,频数,频率,1.30,1.34,),4,1.34,1.38,),25,1.38,1.42,),30,1.42,1.46,),29,1.46,1.50,),10,1.50,1.54),2,合计,100,第十八页,共40页。,第十九页,共40页。,(2)估计纤度落在1.38,1.50)中的概率及纤度小于的概率是多少(dusho)?,(3)统计方法中,同一组数据常用该组区间的中点值(例如区间)的中点值是)作为代表.据此,估计纤度的期望.,第二十页,共40页。,分组,频数,频率,1.30,1.34,),4,0.04,1.34,1.38,),25,0.25,1.38,1.42,),30,0.3,1.42,1.46,),29,0.29,1.46,1.50,),10,0.10,1.50,1.54),2,0.02,合计,100,1.00,(1)频率(pnl)分布表为:,第二十一页,共40页。,第二十二页,共40页。,(2)纤度落在)中的概率(gil)约为,纤度小于的概率(gil)约为0.44.,(3)总体数据的期望约为1.320.04+1.360.25+1.400.30+1.440.29+1.480.10+1.520.02=1.4088.,第二十三页,共40页。,1.解答本题时,第(1)问首先需计算出每组的频率(利用频数100);第(2)问注意(zh y)1.38,1.42)中既有小于,又有大于的,可以认为各一半;第(3)问先计算出中点的概率,然后根据期望的定义求解.,2.本题主要考查频率分布直方图、频率、期望等概念和用样本频率估计整体分布的统计方法,考查运用概率、统计知识解决实际问题的能力.,第二十四页,共40页。,题型三 样本的数字特征估计(gj)总体,例,3,对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(m/s)的数据如下表:,(1)画出茎叶图,由茎叶图你能获得哪些信息?,(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、中位数、标准差,并判断选谁参加比赛(bsi)更合适.,甲,27,38,30,37,35,31,乙,33,29,38,34,28,36,第二十五页,共40页。,(1)画茎叶图,中间数为数据的十位数字:,从这个茎叶图上可以看出,甲、乙的最大速度情况都是分布均匀的,只是乙更好一些;乙的中位数是33.5,甲的中位数是33.因此,乙发挥比较稳定,总体情况比甲好.,(2)=33,=33;s甲=3.96,s乙=3.56;,甲的中位数是33,乙的中位数是33.5.,综合比较,选乙参加比赛(bsi)较为合适.,第二十六页,共40页。,在某篮球比赛中,根据甲和乙两人的得分情况得到(d do)如图所示的茎叶图.,(1)从茎叶图的特征来说明他们谁发挥得更稳定;,(2)用样本的数字特征验证他们谁发挥得更好.,第二十七页,共40页。,茎叶图的直观形状(xngzhun)像横放的频率分布直方图,且保留了所有原始数据的信息,所以从数与形的特征来看,甲和乙的得分都是对称的,叶的分布是“单峰”的,但甲全部的叶都集中在茎2上,而乙只有57的叶集中在茎2上,这说明甲发挥得更稳定.,第二十八页,共40页。,(2)=25,=25,=(20-25)2+(21-25)2+(25-25)2+(26-25)2+(27-25)2+(28-25)2+(28-25)29.14,=(17-25)2+(23-25)2+(24-25)2+(25-25)2+(26-25)2+(29-25)2+(31-25)217.43.,因为(yn wi)=,0),则=(),A.B.,C.D.,A,第三十八页,共40页。,因为(yn wi)E=0,D=1,E=-5,D=4,而E=E(a+b)=aE+b,D=D(a+b)=a2D.,-5a+b=0 a=,4a2=1 b=,所以=+,故选A.,又a0,所以(suy),解得,第三十九页,共40页。,6.已知正态曲线(qxin),(x)=,当=时,曲线(qxin)最高点的纵坐标是标准正态曲线(qxin)最高点的纵坐标的 倍.,当=时,正态曲线最高点的纵坐标为 ,而标准(biozhn)正态曲线最高点的纵坐标为 ,故答案是 .,第四十页,共40页。,
展开阅读全文