2019-2020年高中数学复习课一统计教学案北师大版必修3.doc

上传人:tian****1990 文档编号:2573672 上传时间:2019-11-27 格式:DOC 页数:18 大小:886KB
返回 下载 相关 举报
2019-2020年高中数学复习课一统计教学案北师大版必修3.doc_第1页
第1页 / 共18页
2019-2020年高中数学复习课一统计教学案北师大版必修3.doc_第2页
第2页 / 共18页
2019-2020年高中数学复习课一统计教学案北师大版必修3.doc_第3页
第3页 / 共18页
点击查看更多>>
资源描述
2019-2020年高中数学复习课一统计教学案北师大版必修3抽样方法的选取及应用1三种抽样方法(1)简单随机抽样:是抽样中一个最基本的方法逐一不放回地抽取一次抽取所有样本和抽取样本检查后放回样本都不是简单随机抽样(2)系统抽样:按照简单随机抽样抽取第一个样本,然后按相同的间隔(即抽样距)抽取其他样本(3)分层抽样:将总体分成若干层,在各层中按照所占比例随机抽取一定的样本2三种抽样方法的适用原则(1)看总体是否由差异明显的几个层组成若是,则选用分层抽样;否则,考虑用简单随机抽样或系统抽样(2)看总体容量和样本容量的大小当总体容量较小时,采用抽签法;当总体容量较大、样本容量较小时,采用随机数表法;当总体容量较大、样本容量也较大时,采用系统抽样典例(1)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()类别人数老年教师900中年教师1 800青年教师1 600合计4 300A.90B100C180 D300(2)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间139,151上的运动员人数是()A3 B4C5 D6解析(1)设样本中的老年教师人数为x,则,解得x180,选C.(2)第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在139,151上恰有4组,故有4人,选B.答案(1)C(2)B类题通法(1)分层抽样中容量的计算分层抽样的特点是“按比例抽样”,即.(2)系统抽样中个体编号的确定系统抽样的特点是“等距抽样”,即第一段抽取的是编号为i的个体,则第k段抽取的是第k段中的第i个(3)当总体容量或其中某层中的个体数使得不能恰好按比例或等距抽取时,应该采取简单随机抽样的方法剔除若干个体后再进行1某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是()A抽签法 B系统抽样法C分层抽样法 D随机数法解析:选C根据年级不同产生差异及按人数比例抽取易知应为分层抽样法2有20位同学,编号从1至20,现在从中抽取4人做问卷调查,用系统抽样的方法确定所抽的编号可能为()A3,8,13,18B2,6,10,14C2,4,6,8 D5,8,11,14解析:选A总体个体数是20,样本容量为4,因此分段间隔k5,只有选项A中的数据的分段间隔为5.3某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为_解析:设男生抽取x人,则有,解得x25.答案:254某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按的抽样比用分层抽样的方法抽取样本,则应抽取高一学生数为_解析:若设高三学生数为x,则高一学生数为,高二学生数为300,所以有x3003 500,解得x1 600.故高一学生数为800,因此应抽取高一学生数为8.答案:8用样本的频率分布估计总体分布此类问题多以选择题、填空题的形式考查频率分布直方图、茎叶图等,属中、低档题有时与概率等知识相结合以解答题的形式出现1频率分布直方图2茎叶图典例(1)对一批产品的长度(单位:毫米)进行抽样检测,如图为检测结果的频率分布直方图根据标准, 产品长度在区间20,25)上为一等品,在区间15,20)和25,30)上为二等品,在区间10,15)和30,35上为三等品用频率估计概率,现从该批产品中随机抽取1件,则其为二等品的概率是()A0.09 B0.20C0.25 D0.45(2)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示以组距为5将数据分组成0,5),5,10),30,35),35,40时,所作的频率分布直方图是()(3)某电子商务公司对10 000名网络购物者xx年度的消费情况进行统计,发现消费金额(单位:万元)都在区间0.3,0.9内,其频率分布直方图如图所示直方图中的a_;在这些购物者中,消费金额在区间0.5,0.9内的购物者的人数为_解析(1)由频率分布直方图的性质可知,样本数据在区间25,30)上的频率为15(0.020.040.060.03)0.25,则二等品的频率为0.250.0450.45,故任取1件为二等品的概率为0.45.(2)由茎叶图知,各组频数统计如下表:分组区间0,5)5,10)10,15)15,20)20,25)25,30)30,35)35,40频数统计11424332上表对应的频率分布直方图为A.(3)由0.11.50.12.50.1a0.12.00.10.80.10.21,解得a3.区间0.3,0.5)内的频率为0.11.50.12.50.4,故0.5,0.9内的频率为10.40.6.因此,消费金额在区间0.5,0.9内的购物者的人数为0.610 0006 000.答案(1)D(2)A(3)36 000类题通法(1)茎叶图与频率分布表的关系如下:频率分布表中的分组茎叶图的茎;频率分布表中指定区间组的频率茎上叶的数目(2)频率分布直方图中计算用到的知识:图中小矩形的面积组距频率所有小矩形的面积之和为1.1如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间22,30)内的频率为()A0.2 B0.4C0.5 D0.6解析:选B由茎叶图可知数据落在区间22,30)内的频数为4,所以数据落在区间22,30)内的频率为0.4,故选B.2某地教育部门为了调查学生在数学考试中的有关信息,从上次参加考试的10 000名考生中用分层抽样的方法抽取500人,并根据这500人的数学成绩画出样本的频率分布直方图(如图所示),则这10 000人的数学成绩在140,150(单位:分)段的约是_人解析:设500人的数学成绩在140,150段的人数为x,10 000人的数学成绩在140,150段的人数为n.由样本频率分布直方图知数学成绩在140,150段的频率是相应小矩形的面积,即0.008100.08,x40.又样本的个数占总体个数的,即每组的抽样比为,n800,因此10 000人的数学成绩在140,150段的约是800人答案:800用样本的数字特征估计总体的数字特征此类问题主要以选择题、填空题形式考查平均数、方差等数字特征的计算,有时与其他知识结合出现在解答题中1有关数据的数字特征2众数、中位数、平均数的异同(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量(2)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会相应引起平均数的变动(3)众数考查各数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,众数往往更能反映问题(4)中位数仅与数据的大小排列顺序有关,某些数据的变动可能对中位数没有影响,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势典例(1)重庆市xx年各月的平均气温()数据的茎叶图如图,则这组数据的中位数是()A.19 B20C21.5 D23(2)某工厂36名工人的年龄数据如下表.工人编号年龄工人编号年龄工人编号年龄工人编号年龄140103619272834244113120432939340123821413043441133922373138533144323343242640154524423353745163925373437842173826443549943183627423639用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据计算中样本的均值和方差s2.36名工人中年龄在s与s之间有多少人?所占的百分比是多少(精确到0.01%)?解析(1)由茎叶图可知这组数据由小到大依次为8,9,12,15,18,20,20,23,23,28,31,32,所以中位数为20.答案:B(2)解:36人分成9组,每组4人,其中第一组的工人年龄为44,所以它在组中的编号为2,所以所有样本数据的编号为4n2(n1,2,9),其年龄数据为:44,40,36,43,36,37,44,43,37.由均值公式知:40,由方差公式知:s2(4440)2(4040)2(3740)2.因为s2,s,所以36名工人中年龄在s和s之间的人数等于年龄在区间37,43上的人数,即40,40,41,39,共23人所以36名工人中年龄在s和s之间的人数所占的百分比为100%63.89%.类题通法通常我们用样本的平均数和方差(标准差)来近似代替总体的平均数和方差(标准差),呈现样本数据的集中趋势及波动大小,从而实现对总体的估计(1)一般情况下,需要将平均数和标准差结合,得到更多样本数据的信息,从而对总体作出较好的估计因为平均数容易掩盖一些极端情况,使我们对总体作出片面的判断,而标准差较好地避免了极端情况(2)若两组数据的平均数差别很大,也可以仅比较平均数,估计总体的平均水平,从而作出判断1.为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:)制成如图所示的茎叶图考虑以下结论:甲地该月14时的平均气温低于乙地该月14时的平均气温;甲地该月14时的平均气温高于乙地该月14时的平均气温;甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差其中根据茎叶图能得到的统计结论的编号为()A BC D解析:选B法一:甲29,乙30,甲s乙故可判断结论正确法二:甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论正确,故选B.2若样本数据x1,x2,x10的标准差为8,则数据2x11,2x21,2x101的标准差为()A8 B15C16 D32解析:选C已知样本数据x1,x2,x10的标准差为s8,则s264,数据2x11,2x21,2x101的方差为22s22264,所以其标准差为2816,故选C.3(新课标全国卷)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表图B地区用户满意度评分的频数分布表满意度评分分组50,60)60,70)70,80)80,90)90,100频数2814106(1)在图中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可)图(2)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由解:(1)如图所示通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散(2)A地区用户的满意度等级为不满意的概率大记CA表示事件:“A地区用户的满意度等级为不满意”;CB表示事件:“B地区用户的满意度等级为不满意”由直方图得P(CA)的估计值为(0.010.020.03)100.6,P(CB)的估计值为(0.0050.02)100.25.所以A地区用户的满意度等级为不满意的概率大.变量的相关性此类问题既有选择题、填空题,也有解答题,主要考查线性回归方程的求法及应用1最小二乘法求回归直线使得样本数据的点到回归直线的距离的平方和最小的方法叫作最小二乘法2线性回归方程方程ybxa是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的线性回归方程,其中a,b是待定参数典例(1)(福建高考)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程ybxa,其中b0.76,ab.据此估计,该社区一户年收入为15万元家庭的年支出为()A11.4万元 B11.8万元C12.0万元 D12.2万元(2)(重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份xxxxxxxxxx时间代号t12345储蓄存款y(千亿元)567810求y关于t的回归方程ybta;用所求回归方程预测该地区xx年(t6)的人民币储蓄存款解析(1)由题意知,10,8,a80.76100.4,当x15时,y0.76150.411.8(万元)答案:B(2)解:列表计算如下:itiyittiyi11515226412337921448163255102550153655120这里n5,i3,i7.2.又n25553210,iyin120537.212,从而b1.2,ab7.21.233.6,故所求回归方程为y1.2t3.6.将t6代入回归方程可预测该地区xx年的人民币储蓄存款为y1.263.610.8(千亿元)类题通法线性回归分析就是研究两组变量间线性相关关系的一种方法,通过对统计数据的分析,可以预测可能的结果,这就是线性回归方程的基本应用,因此利用最小二乘法求线性回归方程是关键,必须熟练掌握线性回归方程中两个重要估计量的计算1(新课标全国卷)根据下面给出的xx年至xx年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A逐年比较,xx年减少二氧化硫排放量的效果最显著Bxx年我国治理二氧化硫排放显现成效Cxx年以来我国二氧化硫年排放量呈减少趋势Dxx年以来我国二氧化硫年排放量与年份正相关解析:选D对于A选项,由图知从xx年到xx年二氧化硫排放量下降得最多,故A正确对于B选项,由图知,由xx年到xx年矩形高度明显下降,因此B正确对于C选项,由图知从xx年以后除xx年稍有上升外,其余年份都是逐年下降的,所以C正确由图知xx年以来我国二氧化硫年排放量与年份负相关,故选D.2以下是某地搜集到的新房屋的销售价格y和房屋面积x的数据:房屋面积x(m2)11511080135105销售价格y(万元)24.821.618.429.222(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)根据(2)的结果估计当房屋面积为150 m2时的销售价格解:(1)数据对应的散点图如下图所示:(2)i109,(xi)21 570,i23.2,(xi)(yi)308.设所求回归直线方程为ybxa,则b0.196 2,ab23.21090.1 9621.814 2.故回归直线方程为y0.196 2x1.814 2,回归直线在(1)中的散点图中(3)据(2)知当x150 m2时,销售价格估计为:y0.196 21501.814 231.244 231.2(万元)1某日用品按行业质量标准分成五个等级,等级系数X依次为1,2,3,4,5.现从一批该日用品中随机抽取20件,对其等级系数进行统计分析,得到频率分布表如下:X12345fa0.20.45bc若所抽取的20件日用品,等级系数为4的恰有3件,等级系数为5的恰有2件,则a,b,c的值分别为()A无法确定 B0.2,0.75,0.05C0.1,0.15,0.1 D0.2,0.15,0.1解析:选C由频率分布表得a0.20.45bc1,即abc0.35.因为抽取的20件日用品中,等级系数为4的恰有3件,等级系数为5的恰有2件,所以b0.15,c0.1,从而a0.35bc0.1.所以a0.1,b0.15,c0.1.2已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数相同,则图中的mn()A.3 B5C8 D11解析:选D根据茎叶图,得乙的中位数是33,甲的中位数也是33,即m3;甲的平均数甲(273933)33,乙的平均数是乙(20n323438)33,n8,mn11.故选D.3对于下列表格所示的五个散点,已知求得的线性回归直线方程为y0.8x155.x196197200203204y1367m则实数m的值为()A8 B8.2C8.4 D8.5解析:选A因为回归直线过样本点的中心(,),又 (196197200203204)200,(1367m),所以把(,)代入y0.8x155可得,0.8200155,解得m8.4某中学高中部有300名学生为了研究学生的周平均学习时间,从中抽取了60名学生,先统计了他们某学期的周平均学习时间(单位:小时),再将学生的周平均学习时间分成5组:40,50),50,60),60,70),70,80),80,90,并加以统计,得到如图所示的频率分布直方图则高中部学生的周平均学习时间为(同一组中的数据用该组区间的中点值作代表)()A63.5小时 B62.5小时C63小时 D60小时解析:选A在高中部抽取的60名学生中,周平均学习时间分别落在40,50),50,60),60,70),70,80),80,90的人数依次为6,15,24,12,3.所以高中部学生的周平均学习时间为(645155524651275385)6063.5(小时)故选A.5某学校随机抽查了本校20名同学平均每天在课外从事体育锻炼的时间(单位:分钟),根据所得数据的茎叶图,以5为组距将数据分为8组,分别是0,5),5,10),35,40,作出频率分布直方图如图所示,则原始的茎叶图可能是()解析:选B根据频率分布直方图,样本数据位于区间15,20)内的有200.0252个,位于区间20,25)内的有200.0454个,据此检验只可能是选项B.6气象意义上从春季进入夏季的标志为“连续5天的日平均温度均不低于22 ”现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数)甲地:5个数据的中位数为24,众数为22;乙地:5个数据的中位数为27,总体平均数为24;丙地:5个数据中有一个数据是32,总体平均数为26,总体方差为10.8.则肯定进入夏季的地区有()A0个 B1个C2个 D3个解析:选C甲地肯定进入,因为众数为22,所以22至少出现两次,若有一天低于22 ,则中位数不可能为24;丙地肯定进入,令x为其中某天的日平均温度,则10.85(3226)218(x26)2,若x21,上式显然不成立;乙地不一定进入,如13,23,27,28,29.故选C.7为了解某市甲、乙、丙三所学校高三数学模拟考试成绩,采取分层抽样方法,从甲校的1 260份试卷、乙校的720份试卷、丙校的900份试卷中进行抽样调研若从丙校的900份试卷中抽取了45份试卷,则这次调研共抽查的试卷份数为_解析:抽取比例为,故抽取的试卷份数为(1 260720900)144.答案:1448一组数据中的每一个数据都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是_,_.解析:由题意得原来数据的平均数是801.281.2,方差不变,仍是4.4.答案:81.24.49利用随机数表法对一个容量为500,编号为000,001,002,499的产品进行抽样检验,抽取一个容量为10的样本,选取方法是从随机数表第12行第5列、第6列、第7列数字开始由左到右依次选取三个数字(下面摘取了随机数表中的第11行至第12行),根据下表,读出的第3个数是_18 18 07 92 45 44 17 16 58 09 79 83 86 19 62 06 76 50 03 10 55 23 64 05 0526 62 38 97 75 84 16 07 44 99 83 11 46 32 24 20 14 85 88 45 10 93 72 88 71解析:最先读到的数据的编号是389,向右读下一个数是775,775大于499,故舍去,再下一个数是841,舍去,再下一个数是607,舍去,再下一个数是449,再下一个数是983,舍去,再下一个数是114.故读出的第3个数是114.答案:11410为了了解小学生的体能情况,抽取某校一个年级的部分学生进行一分钟跳绳次数的测试,将数据整理后,画出频率分布直方图(如图所示)已知图中从左到右前三个小组的频率分别为0.1,0.3,0.4,且第一小组的频数为5.(1)求第四小组的频率;(2)求参加这次测试的学生的人数;(3)若一分钟跳绳次数在75次以上(含75次)为达标,试估计该年级学生跳绳测试的达标率解:(1)第四小组的频率为10.10.30.40.2.(2)设参加这次测试的学生有x人,则0.1x5,x50,故参加这次测试的学生有50人(3)由题意,样本的达标率约为0.30.40.20.9,该年级学生跳绳测试的达标率约为90%.11甲、乙两位同学进行投篮比赛,每人玩5局,每局在指定线外投篮,若第一次不进,再投第二次,依此类推,但最多只能投6次当投进时,该局结束,并记下投篮的次数当6次投不进,该局也结束,记为“”第一次投进得6分,第二次投进得5分,第三次投进得4分,依此类推,第6次投不进,得0分两人的投篮情况如下:第1局第2局第3局第4局第5局甲5次4次5次1次乙2次4次2次请通过计算,判断哪位同学投篮的水平高解:依题意,甲、乙的得分情况如下表:第1局第2局第3局第4局第5局甲20326乙05350甲(20326)2.6,s甲1.96,乙(05350)2.6,s乙2.24,因为甲得分的平均数为2.6,乙得分的平均数为2.6,甲得分的标准差约为1.96,乙得分的标准差约为2.24,所以甲得分的平均数与乙得分的平均数相等甲得分的标准差小于乙得分的标准差故甲投篮的水平高12某零售店近5个月的销售额和利润额资料如下表:商店名称ABCDE销售额x/千万元35679利润额y/百万元23345(1)画出散点图,观察散点图,说明两个变量有怎样的相关关系(2)用最小二乘法计算利润额y关于销售额x的回归直线方程(3)当销售额为4千万元时,利用(2)的结论估计该零售店的利润额(百万元)解:(1)散点图如图所示,两个变量有线性相关关系(2)设回归直线方程是ybxa,由题中的数据可知6,3.4.所以b0.5.ab3.40.560.4.所以利润额y关于销售额x的回归直线方程为y0.5x0.4.(3)由(2)知,当x4时,y0.540.42.4,所以当销售额为4千万元时,可以估计该商场的利润额为2.4百万元
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 高中资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!