资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,必修,3,复习统计,必修3复习统计,统计知识点:,1,、抽样方法。,(,1,)简单随机抽样(,2,)系统抽样(,3,)分层抽样,2,、样本分布估计总体分布,(,1,)频率分布表 (,2,)直方图,(,3,)折线图,(4),散点图(,5,)茎叶图,3,、样本特征数估计总体特征数,(1),平均数()方差,(3),众数,(4),中位数,、线性回归方程。,统计知识点:,总体:,在统计中,所有考察对象的全体。,个体,:,总体中的每一个考察对象。,样本,:,从总体中抽取的一部分个体叫做,这个总体的一个样本。,样本容量,:,样本中个体的数目。,总体、个体、样本、样本容量,总体:在统计中,所有考察对象的全体。总体、个体、样本、样本容,1.,统计的的,基本思想,是:,用样本的某个量去估计总体的某个量,1.统计的的基本思想是:,抽取样本,要求:,总体中每个个体被抽取的机会相等,(,1,)简单随机抽样,(,2,)系统抽样,(,3,)分层抽样,抽取样本要求:总体中每个个体被抽取的机会相等(1)简单随机抽,1,、抽签法步骤,(,1,)先将总体中的所有个体(共有,N,个)编号(号码可从,1,到,N,),(,2,)把号码写在形状、大小相同的号签上,号签可用小球、卡片、纸条等制作,(,3,)将这些号签放在同一个箱子里,进行均匀搅拌,(,4,)抽签时,每次从中抽出一个号签,连续抽取,n,次,(,5,)抽出样本,1、抽签法步骤(1)先将总体中的所有个体(共有N个)编号(号,2,、随机数表法步骤,(,1,)将总体中的个体编号,(,编号时位数要一样,),;,(,2,)选定开始的数字;,(,3,)按照一定的规则读取号码;,(,4,)取出样本,2、随机数表法步骤(1)将总体中的个体编号(编号时位数要一样,系统抽样步骤,:,1.,编号,随机剔除多余个体,重新编号,2.,分段,(,段数等于样本容量,),间隔长度,k=N/n,3.,抽取第一个个体编号为,i,4.,依预定的规则抽取余下的 个体编号为,i+k,i+2k,系统抽样步骤:1.编号,随机剔除多余个体,重新编号,分层抽样步骤:,1.,将总体按一定标准分层,;,2.,计算各层的个体数与总体的个体数的比,;,3.,按比例确定各层应抽取的样本数目,4.,在每一层进行抽样,(,可用简单随机抽样或系统抽样,),分层抽样步骤:1.将总体按一定标准分层;,类别,抽样方式,使用范围,共同点,相互联系,简单随机抽样,从总体中逐个抽取,总体中个体数较少时,抽样过程中每个个体被抽取的可能性相同,系统抽样,分段,按规则抽取,总体中个体数较多时,在第一段中采用简单随机抽样,分层抽样,分层,按各层比例抽取,总体中个体差异明显时,各层中抽样时采用前两种方式,类别抽样方式使用范围共同点相互联系简单随机抽样从总体中逐个抽,分析样本,估计总体,(,1,)分析样本的分布情况,(,2,)分析样本的特征数,分析样本,估计总体(1)分析样本的分布情况(2)分析样本的特,公式,样本数据:,平均数:,标准差:,公式样本数据:平均数:标准差:,1.,(,2014,陕西高考)某公司,10,位员工的月工资(单,位,:,元)为,,其均值和方差分别为,和,s,2,,,若从下月起每位员工的月工资增加,100,元,则这,10,位,员工下月工资的均值和方差分别为(,),A,.,,,s,2,+100,2,B,.,+100,s,2,+100,2,C,.,s,2,D,.,+100,s,2,D,1.(2014陕西高考)某公司10位员工的月工资(单D,2,.,(2013安徽高考)某班级有,50,名学生,其中有,30,名男生和,20,名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为,86,94,88,92,90,,五名女生的成绩分别为,88,93,93,88,93.,下列说法一定正确的是(,),A.,这种抽样方法是一种分层抽样,B.,这种抽样方法是一种系统抽样,C.,这五名男生成绩的方差大于这五名女生成绩的方差,D.,该班级男生成绩的平均数小于该班女生成绩的平均数,C,2.(2013安徽高考)某班级有50名学生,其中有30名男,3.,某同学使用计算器求,30,个数据的平均数时,错将其中一个数据,105,输入为,15,,那么由此求出的平均数与实际平均数的差是,_.,-3,3.某同学使用计算器求30个数据的平均数时,错将其中一个数,4,甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人,的平均成绩和方差如下表所示:,从这四个人中选择一人参加奥运会射击项目比赛,最佳人选是,(,),A,甲,B,乙,C,丙,D,丁,C,4甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人 从这,茎叶图,茎叶图的概念:,当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。(见课本例子),2,茎叶图的特征:,(,1,)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。,()茎叶图只便于表示两位有效数字的数据,而且茎叶图只方,便记录两组的数据,两个以上的数据虽然能够记录,但是没有表,示两个记录那么直观,清晰。,茎叶图茎叶图的概念:当数据是两位有效数字时,用中间的数字,3.,制作茎叶图的方法:将所有两位数的十位数字作为“茎”,个位数字作为叶,茎相同者共用一个茎,茎按从小到大 的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。,注意:相同的得分要重复记录,不能遗漏。,3.制作茎叶图的方法:将所有两位数的十位数字作为“茎”,个,2.,如图所示是甲、乙两名篮球运动员每场比赛得分情况的茎叶图,则甲和乙得分的中位数的和是,_.,【,解析,】,根据茎叶图可知甲、乙两人的中位数分别是,32,和,25,,所以两人得分的中位数之和为,32+25=57.,57,甲,乙,2.如图所示是甲、乙两名篮球运动员每场比赛得分情况的茎叶图,,(,1,)分析样本的分布情况,样本的频率分布表,样本的频率分布直方图,样本的茎叶图,(1)分析样本的分布情况样本的频率分布表样本的频率分布直方图,频率分布:,是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。,频率分布直方图的特征:,(,1,)从频率分布直方图可以清楚的看出数据分布的总体趋势。,(,2,)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。,频率分布:是指一个样本数据在各个小范围内所占比例的大小。一般,样本的频率分布表,(,1,)找全距,(,2,)分组,(,3,)找频数,计算频率,列表,样本的频率分布表(1)找全距,样本的频率分布直方图,作样本频率分布直方图的步骤:,(,1,)求极差;,(,2,)决定组距与组数,;(,组数极差,/,组距,),(,3,)将数据分组;,(,4,)列频率分布表(分组,频数,频率);,(,5,)画频率分布直方图。,样本的频率分布直方图 作样本频率分布直方图的步骤:(1),作频率分布直方图的方法:,把,横轴,分成若干段,每一线段对应一个组的,组距,,然后以此线段为底作一矩形,它的,高,等于该组的,频率,/,组距,,这样得出一系列的矩形,,每个矩形的面积恰好是该组上的频率,,这些矩形就构成了频率分布直方图,。,作频率分布直方图的方法:把横轴分成若干段,每一线段对应一个组,温故知新:,初中统计部分曾学过用什么来反映总体的水平?,用什么来考察稳定程度?它们是怎么定义的?,1,、,众数,:在一组数据中,出现次数最多的数据叫做,这组数据的众数,在初中我们学过用,平均数、众数和中位数,反映总体的水平,用,方差,考察稳定程度。,2,、,中位数,:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,3,、平均数,:,一般地,如果,n,个数 ,那么,,叫做这,n,个数的平均数,众数、中位数、平均数,都是描述一组数据的,集中趋势的特征数,,本节课就学习如何利用频率分布直方图求众数、中位数、平均数?,温故知新:初中统计部分曾学过用什么来反映总体的水平?1、众,频率分布直方图的关系,众数、中位数、平均数与,频率分布直方图的关系众数、中位数、平均数与,我们以前面学过的调查,100,位居民的月均用水量的问题中,,所得到的频率分布直方图为例,来研究样本的众数、中位数、,平均数等数字特征与样本数据的频率分布直方图的关系。,0.5,2.5,2,1.5,4,3.5,3,4.5,频率,组距,1,如图为,100,位居民的月均用水量的样本频率分布直方图:,思考,1,:图中最高的小长方形的含义是什么?由此你是否能得 出众数是几?,图中最高的小长方形的含义是,样本数据落在,2,,,2.5,)的最多,,所以众数一定在,2,,,2.5,)内,因为在,2,,,2.5,),内的数据较多,于是通常,取该区间的两个端点的平均数作为众数,即,众数是,2.25,2.25,重要结论,1,:,众数在样本数据的频率分布直方图中,就是,最高矩形的中点的横坐标,我们以前面学过的调查100位居民的月均用水量的问,我们已经会用频率分布直方图来求样本的众数。那么如何求中位数?,0.5,2.5,2,1.5,4,3.5,3,4.5,频率,组距,1,如图为,100,位居民的月均用水量的样本频率分布直方图:,思考,2,:根据中位数的定义知道:,在样本中,有,50,的个体小于或等于中位数,也有,50,的个体大于或等于中位数,,,由此你是否能求出中位数是几?,中位数左边的,数据个数,与右边的,数据个数,是相等的,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值,我们已经会用频率分布直方图来求样本的众数。那么如何求中位数,0.5,2.5,2,1.5,4,3.5,3,4.5,频率,组距,1,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,前四个小长方形的面积和,=0.49,后四个小矩形的面积和,=0.26,x,=,a,若令所求的中位数为,a,,,则直线,x,=,a,把整个直方图的面积平分为二,于是有,0.49+,(,a,-2,),0.5,=0.5,得,a,=2.02,2.02,重要结论,2,:,中位数在样本数据的频率分布直方图中,就是把频率分布直方图划分左右两个面积相等的分界线与,x,轴交点的横坐标,0.52.521.543.534.5频率10.040.08,思考题,中位数一定在最高的小长方形内取得吗?,最高的小长方形左右两边的小长方形的面积和分别都不会达到,0.5,结论:中位数一定在最高的小长方形内取得,,但是不一定是,该区间的两个端点的平均数,即有可能比平均数大,也可能比平均数小,思,0.5,2.5,2,1.5,4,3.5,3,4.5,频率,组距,1,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,我们已经会用频率分布直方图来求出了样本的众数和中位数,那么最后如何求平均数?,思考,1,:在频率分布直方图中,各个组的平均数如何找?,在频率分布直方图中,各个组的平均数用其区间的中点表示即区间的两个端点之和的一半,0.25,0.75,1.25,1.75,2.25,2.75,3.25,3.75,4.25,思考,2,:各个小组的平均数与所求的样本的平均数有何关系?即各个小组的平均数对所求样
展开阅读全文