资源描述
河北省正定中学2020届高考数学一轮复习 统计学案 理(无答案)一、 基础知识整理统计的基本思想是用样本去估计总体。为使样本能更好的反映总体,抽取样本要具有代表性和公平性。1 抽样方法:(1) 简单的随机抽样:一般地,设一个总体有有限个个体,并记其个数为N,如果通过逐个抽取的方法,从中抽取一个样本,且每次抽取时,各个个体被抽取的概率相等,就称这样的抽样为简单随机抽样。两种常用的方法:抽签法;随机数表法。它适用于总体所含个体数较少的情况。(2) 系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做系统抽样。当均分时,总体个数不能被整除,则可随机的剔除几个个体。(3) 分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更能充分地反映总体情况,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫做层。显然,简单的随机抽样是系统抽样和分层抽样的基础。2 总体分布的估计(1) 总体分布:总体取值的概率分布规律通常称为总体分布。总体分布往往是不易知道的,所以要用样本的频率分布支估计总体分布。一般地,样本容量越大,估计就越精确。(2) 样本频率分布:样本所有数据(或数据组)的频率的分布变化规律,称为样本频率分布。(3) 样本频率分布的表示方法有频率分布表、频率分布条形图、频率分布直方图。要特别注意:频率分布条形图的高度是频率,而频率分布直方图的高度是频率与组距的比,这为后边用面积表示频率或概率提供了方便。(4) 总体密度曲线:设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线总体密度曲线。总体地某一区间内的概率等于总体密度曲线与横轴及过区间两端点且与横轴垂直的两条平行线围成的图形的面积(如图)。总体密度曲线与轴之间的区域的面积为1,它表示总体在区间内的分布的概率为1。3 正态分布:(1) 总体密度曲线是可近似地是函数,(0)图象的分布称为分布(这个总体是有无限容量的抽象总体)。这个函数的图象叫做正态曲线。(2) 正态曲线具有以下性质:工 曲线在轴的上方,与轴不相交; 曲线关于直线对称; 曲线在时,位于最高点; 当时,曲线上升;当时,曲线下降,并且当曲线向左、右两边无限延伸时,以轴为渐近线,向它无限靠近。 当一定时,曲线的形状由确定。越大,曲线越“矮胖”,表示总体的分布越分散;越小,曲线越“瘦高”,表示总体的分布越集中。(3) 标准正态总体:总体密度曲线是函数,(-x+)的图象的总体称为标准正态总体,相应的曲线称为标准正态曲线。标准正态曲线的对称轴是轴。它是,(0)的特例。(4) 标准正态分布下的概率计算: 在标准正态分布表中,表示的是总体取值小于的概率,即。 两个重要公式:; 一般的正态总体都能化为标准正态总体来计算,即一般正态总体取值小于的概率。(5) 小概率事件:正态总体在区间以外的概率只有4.6,在区间外的概率只有0.3,由于这些概率值很小,通常称这些情况发生为小概率事件。4 线性回归(1) 相关关系:当自变量的取值一定时,因变量的取值带有一定的随机性的两个变量之间的关系叫做相关关系。相关关系是一种非确定性关系。(2) 回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析。(3) 线性回归分析: 散点图:表示具有相关关系的两个变量的一组数据的图形,叫做散点图; 回归直线方程:两个具有相关关系的变量的散点图中的点,大致分布在一条直线上,并且由确定的直线方程叫做回归直线方程,相应的直线叫做回归直线,而对上述两个变量所进行的统计分析叫做线性回归分析。(4) 线性相关显著性质检验:对于变量与的一组观测值来说,把叫做变量与之间的样本相关系数(), 当时,与之间不具有线性相关关系,当时,与之间具有线性相关关系。在求回归直线方程时,应先进行线性相关性检验。二、 练习题(一)选择题:1 正态曲线是( )A递增函数;B递减函数;C从左到右先增后减的函数;D从左到右先减后增的函数2 一个容量为20的样本,已知某组的频率为0.25,则该组的频数为( )A2 B5 C15 D803 右图所示是一批产品中抽样得到数据的频率分布直方图,由图 中可看出概率最大时数据所落在的范围是 ( )A(8.1,8.3)B(8.2,8.4)C(8.4,8.5)D(8.5,8.7)4 以表示标准正态总体在区间内取值的概率,若随机变量服从正态分布,则概率等于( )(A)(B)(C)(D)5 在线性回归中,点 是散点图中个点的( )A.内心B.外心C.重心D.垂心6 设随机变量服从标准正态分布,已知,则=( )A0.025B0.050 C0.950 D0.9757 某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;第六组,成绩大于等于18秒且小于等于19秒右图是按上述分组方法得到的频率分布直方图设成绩小于17秒的学生人数占全班总人数的百分比为,成绩大于等于15秒且小于17秒的学生人数为,则从频率分布直方图中可分析出和分别为( )A0.9, 35 B0.9,45C0.1,20 D0.1,40.8 某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测。若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是( )A 4 B 5C 6 D 79 某中学有高级教师28人,中级教师54人,初级教师81人,为了调查他们的身体状况,从他们中抽取容量为36的样本,最适合抽取样本的方法是( )A、简单随机抽样;B、系统抽样;C、分层抽样;D、先从高级教师中随机剔除1人,再用分层抽样10 为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知两个人在试验中发现对变量x的观测数据的平均数都为s,对变量y的观测数据的平均数都为t,那么下列说法正确的是( )Al1与l2有交点(s,t)Bl1与l2相交,但交点不一定是(s,t)Cl1与l2必定平行Dl1与l2必定重合(二)填空题:本大题共4小题,每小题4分,共16分,把答案填在题中横线上.11 一个总体含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为5的样本,则指定的某个个体被抽到的概率为 12 某自动包装机包装的食盐中,随机抽取20袋,测得各袋的质量分别为(单位:g):492496494495498497501502504496497503506508507492496500501499根据频率分布估计总体分布的原理,该自动包装机包装的袋装食盐质量在497.5g501.5g之间的概率约为_13 某校有学生2000人,其中高三学生500人为了解学生的身体素质情况,采用按年级分层抽样的方法,从该校学生中抽取一个200人的样本则样本中高三学生的人数为_14 设随机变量服从正态分布N(0,1),记,给出下列结论:; 其中正确的序号是。15 为了了解高三学生的身体状况。抽取了部分男生的体重,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为123,第2小组的频数为12,则抽取的男生人数是。16 某校共有2500名学生,其中男生1300名,女生1200名,用分层抽样法抽取一个容量为200的样本,则男生应抽取 名.(三)解答题:本大题共6小题,共74分.解答应写出文字说明,证明过程和演算步骤.17 (本小题满分12分)下表给出了某校120名12岁男孩的身高资料(单位:cm)身高122,126126,130130,134134,138138,142142,146146,150150,154154,158人数58102233201165(1)列出样本的频率分布表;(2)绘出频率分布直方图;(3)根据样本的频率分布,估计身高小于134cm的男孩所占的百分比.18 为了解某学校高一男生的身体发育情况,用系统抽样法从中抽取了一个容量为40的样本,用测得的体重数据绘出的频率分布直方图如下图。根据频率分布直方图,估计该校男生体重大于56.5kg的概率是多少?19 在学校举行的数学竞赛中,全体参赛学生的成绩近似服从正态分布N(70,100)。已知成绩在85分以上(含85分)的学生有20名。如果要对成绩排在前15名的学生进行奖励,设奖的分数线怎样确定?20 某种鱼的饲养时间(月数)与个体体重(kg)的统计资料如下表:饲养月数23456个体体重2.23.85.56.57.0(1) 资料中变量与之间有线性相关关系吗(可用散点图确定)?(2) 若资料中的与具有线性相关关系,求对的回归直线方程,并估计饲养7个月时,这种鱼个体的体重。答案:110题:CBCBC CACDA 11、0.0512、0.2513、501415、4816、10417、(1)略;(2)略; (3)约19%.18、0.347519、86.5分20、(1)略;(2)12.4kg
展开阅读全文