资源描述
第四节 统计图表、数据的数字特征、用样本估计总体1.1.统计图表的含义统计图表的含义(1 1)频率分布直方图)频率分布直方图频率分布直方图由一些小矩形来表示,每个小矩形的宽度为频率分布直方图由一些小矩形来表示,每个小矩形的宽度为_,高为,高为_,_,小矩形的面积恰为相应的小矩形的面积恰为相应的_,_,图中所有小矩形的面积之和为图中所有小矩形的面积之和为_._.xxi i( (分组的宽度分组的宽度) )iifx频率频率f fi i1 1求极差(即一组数据中求极差(即一组数据中_与与_的差)的差)决定决定_与与_将数据将数据_列列_画画_作频率作频率分布直分布直方图的方图的步骤步骤最大值最大值最小值最小值分组的宽度分组的宽度组数组数分组分组频率分布表频率分布表频率分布直方图频率分布直方图(2 2)频率折线图)频率折线图定义:在频率分布直方图中,按照分组原则,再在定义:在频率分布直方图中,按照分组原则,再在_和和_各加一个区间各加一个区间. .从所加的左边区间的从所加的左边区间的_开始,用线段开始,用线段依次连接各个矩形的依次连接各个矩形的_,直至右边所加区间的,直至右边所加区间的_,就可以得到一条折线,我们称之为频率折线图就可以得到一条折线,我们称之为频率折线图. .作用:可以用它来估计作用:可以用它来估计_情况情况. .左边左边右边右边中点中点顶端中点顶端中点中点中点总体的分布总体的分布(3 3)茎叶图)茎叶图茎叶图表示数据的优点茎叶图表示数据的优点()()茎叶图上茎叶图上_的损失的损失, ,所有的所有的_都可以从这都可以从这个茎叶图中得到个茎叶图中得到. .()()茎叶图可以随时记录茎叶图可以随时记录, ,方便方便_._.茎叶图表示数据的缺点茎叶图表示数据的缺点当数据量很大或有多组数据时,茎叶图就不那么直观清晰了当数据量很大或有多组数据时,茎叶图就不那么直观清晰了. .没有信息没有信息原始数据原始数据表示与比较表示与比较2.2.样本的数字特征样本的数字特征(1 1)众数、中位数、平均数)众数、中位数、平均数数字数字特征特征定义与求法定义与求法优点与缺点优点与缺点众众数数一组数中一组数中_的数据的数据众数通常用于描述变量的值众数通常用于描述变量的值出现次数最多的数出现次数最多的数. .但显然它但显然它对其他数据信息的忽视使得对其他数据信息的忽视使得无法客观地反映总体特征无法客观地反映总体特征出现次数最出现次数最多多数字数字特征特征定义与求法定义与求法优点与缺点优点与缺点中中位位数数一组从小到大(或从大一组从小到大(或从大到小)排列的数,若个到小)排列的数,若个数是奇数,数是奇数,_的数为中位数,若个数的数为中位数,若个数是偶数,中位数为是偶数,中位数为_中位数等分样本数据所占频中位数等分样本数据所占频率,它不受少数几个极端值率,它不受少数几个极端值的影响,这在某些情况下是的影响,这在某些情况下是优点,但它对极端值的不敏优点,但它对极端值的不敏感有时也会成为缺点感有时也会成为缺点位于中间位于中间位位于中间两数的平均数于中间两数的平均数数字数字特征特征定义与求法定义与求法优点与缺点优点与缺点平平均均数数如果有如果有n n个数据个数据x x1 1, ,x x2 2,,x xn n, ,那么这那么这n n个个数的平均数数的平均数平均数和每一个数据都有关,平均数和每一个数据都有关,可以反映样本数据全体的信可以反映样本数据全体的信息,但平均数受数据中的极息,但平均数受数据中的极端值的影响较大,使平均数端值的影响较大,使平均数在估计总体时可靠性降低在估计总体时可靠性降低 x_12n1(xxx )n(2)(2)标准差、方差标准差、方差标准差:表示样本数据到平均数的一种平均距离,一般用标准差:表示样本数据到平均数的一种平均距离,一般用s s表示,表示,s=_.s=_.方差:标准差的平方方差:标准差的平方s s2 2叫作方差叫作方差. .s s2 2=_=_,其中,其中x xn n(nN(nN* *) )是是_,n n是是_, 是是_._.22212n1xxxxxxn() ()() 22212n1xx)xx)xx)n(样本样本数据数据样本容量样本容量x样本平均数样本平均数判断下面结论是否正确(请在括号中打判断下面结论是否正确(请在括号中打“”或或“”). .(1)(1)平均数、众数与中位数从不同的角度描述了一组数据的集平均数、众数与中位数从不同的角度描述了一组数据的集中趋势中趋势.( ).( )(2)(2)一组数据的平均数一定大于这组数据中的每个数据一组数据的平均数一定大于这组数据中的每个数据.( ).( )(3)(3)一组数据的标准差越大一组数据的标准差越大, ,说明这组数据的波动越大说明这组数据的波动越大.( ).( )(4)(4)一组数据的众数可以是一个或几个,那么中位数也具有相一组数据的众数可以是一个或几个,那么中位数也具有相同的结论同的结论.( ).( )(5)(5)从频率分布直方图得不出原始的数据内容,把数据表示成从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了直方图后,原有的具体数据信息就被抹掉了.( ).( )(6)(6)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次小到大的顺序写,相同的数据可以只记一次.( ).( )(7)(7)茎叶图只能表示有两位有效数字的数据茎叶图只能表示有两位有效数字的数据.( ).( )【解析【解析】(1)(1)正确正确. .平均数表示一组数据的平均水平,众数表示平均数表示一组数据的平均水平,众数表示一组数据中出现次数最多的数,中位数等分样本数据所占频率一组数据中出现次数最多的数,中位数等分样本数据所占频率. .(2)(2)错误错误. .平均数一定不大于这组数据中的最大值平均数一定不大于这组数据中的最大值. .(3)(3)正确正确. .由标准差的意义知结论正确由标准差的意义知结论正确. .(4)(4)错误错误. .中位数在一组数据中一定存在且唯一中位数在一组数据中一定存在且唯一. .(5)(5)正确正确. .由频率分布直方图的意义知结论正确由频率分布直方图的意义知结论正确. .(6)(6)错误错误. .茎叶图要求不能丢失数据茎叶图要求不能丢失数据. . (7)(7)错误错误. .茎叶图也能够记录有三个或三个以上的有效数字的数茎叶图也能够记录有三个或三个以上的有效数字的数据,只不过此时茎叶的选择要灵活据,只不过此时茎叶的选择要灵活. .答案:答案:(1 1) (2 2) (3 3) (4 4)(5) (6)(5) (6) (7) (7)1.1.一个容量为一个容量为3232的样本,已知某组样本的频率为的样本,已知某组样本的频率为0.3750.375,则该,则该组样本的频数为组样本的频数为( )( )(A A)4 4 (B B)8 8 (C C)12 12 (D D)1616【解析【解析】选选C.C.频数频数32320.3750.37512.12.2.2.甲、乙两位同学都参加了由学校举办的篮球比赛,他们都参甲、乙两位同学都参加了由学校举办的篮球比赛,他们都参加了全部的加了全部的7 7场比赛,平均得分均为场比赛,平均得分均为1616分,标准差分别为分,标准差分别为5.095.09和和3.723.72,则甲、乙两同学在这次篮球比赛活动中,发挥得更稳,则甲、乙两同学在这次篮球比赛活动中,发挥得更稳定的是定的是( )( )(A)(A)甲甲 (B)(B)乙乙(C)(C)甲、乙相同甲、乙相同 (D)(D)不能确定不能确定【解析【解析】选选B.B.因为甲、乙两位同学的标准差分别为因为甲、乙两位同学的标准差分别为5.095.09和和3.723.72,5.095.093.723.72,所以乙同学发挥得更稳定,所以乙同学发挥得更稳定. .3.3.如图是某学校抽取的学生体重的频率分布直方图,已知图中如图是某学校抽取的学生体重的频率分布直方图,已知图中从左到右的前从左到右的前3 3个小组的频率之比为个小组的频率之比为123123,第,第2 2小组的频数小组的频数为为1010,则抽取的学生人数为,则抽取的学生人数为( )( )(A A)20 20 (B B)30 30 (C C)40 40 (D D)5050【解析【解析】选选C.C.前前3 3组的频率之和等于组的频率之和等于1 1(0.012 5(0.012 50.037 5)0.037 5)5 50.750.75,第,第2 2小组的频率是小组的频率是 设样本容量为设样本容量为n n,则,则 即即 n n40.40.20.750.251 2 3, 100.25n,4.4.若某校高一年级若某校高一年级8 8个班参加合唱比赛的得分如茎叶图所示,个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是则这组数据的中位数和平均数分别是( )( )(A A)91.591.5和和91.5 91.5 (B B)91.591.5和和9292(C C)9191和和91.5 91.5 (D D)9292和和9292【解析【解析】选选A.A.中位数为中位数为 (91(9192)92)91.5.91.5.平均数为平均数为 (87(8789899090919192929393949496)96)91.5.91.5.12185.5.如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人比赛得分的中位数之和是则甲、乙两人比赛得分的中位数之和是_._.【解析【解析】甲比赛得分的中位数为甲比赛得分的中位数为2828,乙比赛得分的中位数为,乙比赛得分的中位数为3636,所以甲、乙两人比赛得分的中位数之和为所以甲、乙两人比赛得分的中位数之和为2828363664.64.答案:答案:6464考向考向 1 1 统计图表的应用统计图表的应用【典例【典例1 1】(1 1)()(20122012江西高考)小波一星期的总开支分布江西高考)小波一星期的总开支分布图如图图如图1 1所示,一星期的食品开支如图所示,一星期的食品开支如图2 2所示,则小波一星期的所示,则小波一星期的鸡蛋开支占总开支的百分比为鸡蛋开支占总开支的百分比为( )( )(A A)30% 30% (B B)10% 10% (C C)3% 3% (D D)不能确定)不能确定(2 2)从甲、乙两个品种的棉花中各抽测了)从甲、乙两个品种的棉花中各抽测了2525根棉花的纤维长根棉花的纤维长度(单位:度(单位:mmmm),结果如下:),结果如下:甲品种:甲品种:271 273 280 285 285271 273 280 285 285 287 292 287 292294 295 301 303 303294 295 301 303 303 307 308 310 314 307 308 310 314319 323 325 325319 323 325 325 328 331 334 337 352 328 331 334 337 352乙品种:乙品种:284 292 295 304 306 307 312284 292 295 304 306 307 312313 315 315 316 318 318 320 322 322313 315 315 316 318 318 320 322 322324 327 329 331 333 336 337 343 356324 327 329 331 333 336 337 343 356由以上数据设计了茎叶图如图所示由以上数据设计了茎叶图如图所示 根据以上茎叶图,对甲、乙两个品种棉花的纤维长度作比较,根据以上茎叶图,对甲、乙两个品种棉花的纤维长度作比较,写出两个统计结论:写出两个统计结论:_;_;_._.(3)(3)(20122012广东高考改编)某校广东高考改编)某校100100名学生期中考试语文成绩名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:的频率分布直方图如图所示,其中成绩分组区间是:505060,6060,6070,7070,7080,8080,8090,9090,90100.100.求图中求图中的值的值. .根据频率分布直方图,估计这根据频率分布直方图,估计这100100名学生语文成绩的平均分名学生语文成绩的平均分. .若这若这100100名学生语文成绩某些分数段的人数(名学生语文成绩某些分数段的人数(x x)与数学成绩)与数学成绩相应分数段的人数(相应分数段的人数(y y)之比如下表所示,求数学成绩在)之比如下表所示,求数学成绩在50509090之外的人数之外的人数. .【思路点拨【思路点拨】(1 1)由图)由图2 2求出小波一星期的食品开支,再由图求出小波一星期的食品开支,再由图1 1求出小波一星期的总开支,进而可求鸡蛋开支占总开支的百求出小波一星期的总开支,进而可求鸡蛋开支占总开支的百分比分比. .(2)(2)从棉花的纤维长度的分布特点和平均长度两个方面进行比从棉花的纤维长度的分布特点和平均长度两个方面进行比较较. .(3)(3)本小题根据每个区间上的矩形的面积和为本小题根据每个区间上的矩形的面积和为1 1,可建立关于,可建立关于的方程,解出的方程,解出的值的值. .由频率分布直方图求平均分:每个由频率分布直方图求平均分:每个区间的中点值乘以区间上矩形面积的和区间的中点值乘以区间上矩形面积的和. .本题关键是先把语本题关键是先把语文成绩在文成绩在505060,6060,6070,7070,7080,8080,809090的人数求出来,即根的人数求出来,即根据每段的频率求出每段的频数据每段的频率求出每段的频数. .【规范解答【规范解答】(1 1)选)选C.C.由图由图2 2知,小波一星期的食品开支为知,小波一星期的食品开支为300300元,其中鸡蛋开支为元,其中鸡蛋开支为3030元,而由图元,而由图1 1食品开支占总开支的食品开支占总开支的30%30%,故小波一星期的总开支为,故小波一星期的总开支为 所以小波一星期所以小波一星期的鸡蛋开支占总开支的百分比为的鸡蛋开支占总开支的百分比为(2)(2)由茎叶图可以看出甲棉花纤维的长度比较分散,乙棉花纤由茎叶图可以看出甲棉花纤维的长度比较分散,乙棉花纤维的长度比较集中(大部分集中在维的长度比较集中(大部分集中在312312到到337337之间),还可以看之间),还可以看出乙的平均长度应大于出乙的平均长度应大于310310,而甲的平均长度要小于,而甲的平均长度要小于310310等,通等,通过分析可以得到答案过分析可以得到答案. .3001 00030%元,303%.1 000答案:答案:甲棉花纤维的长度比较分散,乙棉花纤维的长度比较甲棉花纤维的长度比较分散,乙棉花纤维的长度比较集中集中甲棉花纤维的长度的平均值小于乙棉花纤维长度的平均值甲棉花纤维的长度的平均值小于乙棉花纤维长度的平均值(答案不唯一)(答案不唯一)(3)(3)由频率分布直方图知由频率分布直方图知(0.04+0.03+0.02+2)(0.04+0.03+0.02+2)10=1,=0.005.10=1,=0.005.55550.05+650.05+650.4+750.4+750.3+850.3+850.2+950.2+950.05=73.0.05=73.所以平均分为所以平均分为73.73.分别求出语文成绩在分别求出语文成绩在50506060,60607070,70708080,80809090的人的人数依次为数依次为0.050.05100=5,0.4100=5,0.4100=40,0.3100=40,0.3100=30,0.2100=30,0.2100=20.100=20.所以数学成绩在所以数学成绩在505060,6060,6070,7070,7080,8080,809090的人数依次的人数依次为为:5,20,40,25.:5,20,40,25.所以数学成绩在所以数学成绩在50509090之外的人数有之外的人数有100-(5+20+40+25)100-(5+20+40+25)=10(=10(人人).).【拓展提升【拓展提升】各种统计图表的优点与不足各种统计图表的优点与不足【变式训练【变式训练】(1 1)为了了解某地区高三学生的身体发育情况,)为了了解某地区高三学生的身体发育情况,抽查了该地区抽查了该地区100100名年龄为名年龄为17.517.51818岁的男生的体重岁的男生的体重(kg) ,(kg) ,得得到频率分布直方图如下:到频率分布直方图如下:根据上图可得这根据上图可得这100100名学生中体重在名学生中体重在56.556.564.5 kg64.5 kg的学生人数的学生人数是是( )( )(A A)20 20 (B B)30 30 (C C)40 40 (D D)5050【解析【解析】选选C.C.体重在体重在56.556.564.5 kg64.5 kg的学生的累计频率为的学生的累计频率为2 20.030.032 20.050.052 20.050.052 20.07=0.40.07=0.4,则体重在,则体重在56.556.564.5 kg64.5 kg的学生人数为的学生人数为0.40.4100=40.100=40.(2 2)为了调查甲、乙两个网站受欢迎的程度,随机选取了)为了调查甲、乙两个网站受欢迎的程度,随机选取了1414天,统计上午天,统计上午8 8:00001010:0000各自的点击量,得到如图所示的各自的点击量,得到如图所示的茎叶图,求茎叶图,求甲网站点击量在甲网站点击量在10104040间的频率是多少?间的频率是多少?甲、乙两个网站哪个更受欢迎?请说明理由甲、乙两个网站哪个更受欢迎?请说明理由. .【解析【解析】甲网站点击量在甲网站点击量在10104040间的频率为间的频率为甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎. . 42.147考向考向 2 2 数字特征的应用数字特征的应用【典例【典例2 2】(1 1)()(20122012陕西高考)从甲、乙两个城市分别随陕西高考)从甲、乙两个城市分别随机抽取机抽取1616台自动售货机,对其销售额进行统计,统计数据用茎台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示)叶图表示(如图所示). .设甲、乙两组数据的平均数分别为设甲、乙两组数据的平均数分别为 中位数分别为中位数分别为m m甲甲,m m乙乙,则,则( )( )xx甲乙, ,(A A) m m甲甲m m乙乙 (B B) m m甲甲m m乙乙(C C) m m甲甲m m乙乙 (D D) m m甲甲m m乙乙xx ,甲乙xx ,甲乙xx ,甲乙xx ,甲乙(2 2)某校为了选派一名学生参加全市实践活动技能竞赛,)某校为了选派一名学生参加全市实践活动技能竞赛,A A,B B两位同学在校实习基地现场进行加工直径为两位同学在校实习基地现场进行加工直径为20 mm20 mm的零件测试,的零件测试,他们各加工他们各加工1010个零件的相关数据依次如图所示:(单位:个零件的相关数据依次如图所示:(单位:mmmm)根据测试的有关数据,试解答下列问题:根据测试的有关数据,试解答下列问题:考虑平均数与完全符合要求的个数,你认为谁的成绩好些?考虑平均数与完全符合要求的个数,你认为谁的成绩好些?计算出计算出A A,B B两人的标准差,考虑平均数与标准差,说明谁的两人的标准差,考虑平均数与标准差,说明谁的成绩好些?成绩好些?考虑图中折线走势及竞赛加工零件的个数远远超过考虑图中折线走势及竞赛加工零件的个数远远超过1010个的实个的实际情况,你认为派谁去更合适?简述理由际情况,你认为派谁去更合适?简述理由【思路点拨【思路点拨】(1)(1)平均数的大小可以根据茎叶图中数据的分布平均数的大小可以根据茎叶图中数据的分布的集中位置进行判断的集中位置进行判断, , 或直接根据平均数和中位数的计算公式或直接根据平均数和中位数的计算公式进行计算进行计算. .(2)(2)由图可以发现:符合要求的零件个数由图可以发现:符合要求的零件个数B B的多于的多于A A;计算计算出出s sB B,再比较两人的成绩;,再比较两人的成绩;根据图,哪个越来越接近标准直根据图,哪个越来越接近标准直径,则派哪个去径,则派哪个去【规范解答【规范解答】(1)(1)选选B.B.方法一:观察茎叶图可知方法一:观察茎叶图可知 甲组甲组数据中的中位数是数据中的中位数是 (18+2218+22)=20=20,乙组数据中的中位数是,乙组数据中的中位数是 (27+3127+31)=29=29,m m甲甲m m乙乙. .方法二:方法二: (41+43+30+30+38+22+25+27+10+10+14(41+43+30+30+38+22+25+27+10+10+14+18+18+5+6+8)=+18+18+5+6+8)= (42+43+48+31+32+34+34+38+20+22+23+23+27+(42+43+48+31+32+34+34+38+20+22+23+23+27+10+12+18)=10+12+18)=所以所以 又又m m甲甲=20=20,m m乙乙=29,m=29,m甲甲m m乙乙, ,故选故选B.B.xx ,甲乙12121x16甲345,161x16乙457,16xx ,甲乙(2 2)因为两人的平均数相同,而符合要求的零件个数因为两人的平均数相同,而符合要求的零件个数B B的多的多于于A A,所以,所以B B 的成绩好些的成绩好些0.089 4,0.089 4,又又s sA A=0.161 2,=0.161 2,所以所以s sA AssB B,在平均数相同的情况,在平均数相同的情况下,下,B B的波动性小,所以的波动性小,所以B B的成绩好些的成绩好些. .从折线走势看,从折线走势看,A A的成绩越来越接近的成绩越来越接近20 mm20 mm,并趋于稳定,所,并趋于稳定,所以派以派A A去更合适去更合适2222B1s52020319.92020.12020.22010 【互动探究【互动探究】在本例第(在本例第(2 2)题的数据图中,将)题的数据图中,将B B同学的数据均同学的数据均上移上移0.10.1个单位,其他条件不变,求个单位,其他条件不变,求B B同学的平均数与标准差同学的平均数与标准差. .【解析【解析】由题意知由题意知B B同学的数据为同学的数据为20.120.1,20.120.1,20.120.1,2020,20.1,20.1,20,20,20.2,20.3.20.1,20.1,20,20,20.2,20.3.方法一:方法一: (20.1+20.1+20.1+20+20.1+20.1+20+20+20.2+20.3)(20.1+20.1+20.1+20+20.1+20.1+20+20+20.2+20.3)=20.1=20.1,方法二:因为各数据加上方法二:因为各数据加上0.10.1后,平均数比原来多后,平均数比原来多0.10.1,而标准,而标准差不变,故差不变,故 =20.1=20.1,s sB B0.089 4.0.089 4.B1x102222B1s520.120.132020.120.220.1(20.320.1)100.089 4. Bx【拓展提升【拓展提升】样本数据的意义及计算公式的推广样本数据的意义及计算公式的推广(1)(1)意义:平均数与标准差都是重要的数字特征,是对总体的意义:平均数与标准差都是重要的数字特征,是对总体的一种简明地描述,平均数、中位数、众数描述其集中趋势,标一种简明地描述,平均数、中位数、众数描述其集中趋势,标准差描述波动大小准差描述波动大小(2)(2)平均数、标准差公式的推广平均数、标准差公式的推广若数据若数据x x1 1,x x2 2,x xn n的平均数为的平均数为 那么那么mxmx1 1a a,mxmx2 2a a,mxmx3 3a a,mxmxn na a的平均数是的平均数是m m a.a.x,x若数据若数据x x1 1,x x2 2,x xn n的标准差为的标准差为s s,那么,那么(i)(i)数据数据x x1 1a a,x x2 2a a,x xn na a的标准差也为的标准差也为s s;(ii)(ii)数据数据axax1 1,axax2 2,axaxn n的标准差为的标准差为as.as.【提醒【提醒】标准差的简化计算公式:标准差的简化计算公式:s=s=或写成或写成s=s=即标准差等于原数据平方的平均数减去平均数的平方后再开即标准差等于原数据平方的平均数减去平均数的平方后再开平方的值平方的值. .222212n1(xxx )nxn ,222212n1(xxx )xn,【变式备选【变式备选】(1 1)样本中共有五个个体,其值分别为)样本中共有五个个体,其值分别为a,0,1,a,0,1,2,3.2,3.若该样本的平均值为若该样本的平均值为1 1,则样本标准差为,则样本标准差为( )( )【解析【解析】选选C.C.样本的平均值为样本的平均值为1 1,所以,所以 解得解得a=-1,a=-1,所以样本的标准差为所以样本的标准差为66ABC2D 255( )( )( )( ) a01231,5 2222211 10 11 12 13 12.5 (2)(2)甲、乙两人在相同的条件下练习射击甲、乙两人在相同的条件下练习射击, ,每人打每人打5 5发子弹发子弹, ,命中命中的环数如下的环数如下: :甲甲:6,8,9,9,8;:6,8,9,9,8;乙乙:10,7,7,7,9.:10,7,7,7,9.则两人的射击成绩较稳定的是则两人的射击成绩较稳定的是_._.【解析【解析】甲命中环数的平均数是甲命中环数的平均数是8 8环,乙命中环数的平均数环,乙命中环数的平均数是是8 8环环, ,同理同理ss甲甲s s乙乙,甲的射击成绩比乙的稳定甲的射击成绩比乙的稳定. .答案:答案:甲甲222221s68889898885甲305(环),2 10s.5乙(环)考向考向 3 3 频率分布与数字特征的综合应用频率分布与数字特征的综合应用【典例【典例3 3】某地区遭遇严重干旱,某乡计划向上级申请支援,某地区遭遇严重干旱,某乡计划向上级申请支援,为上报需水量,乡长事先抽样调查了为上报需水量,乡长事先抽样调查了100100户村民的月均用水量,户村民的月均用水量,得到这得到这100100户村民月均用水量的频率分布表如下表:(月均用户村民月均用水量的频率分布表如下表:(月均用水量的单位:吨)水量的单位:吨)(1 1)请完成该频率分布表,并画出相对应的频率分布直方图)请完成该频率分布表,并画出相对应的频率分布直方图和频率折线图和频率折线图. .(2 2)估计样本的中位数是多少?)估计样本的中位数是多少?(3 3)已知上级将按每户月均用水量向该乡调水,若该乡共有)已知上级将按每户月均用水量向该乡调水,若该乡共有1 2001 200户,请估计上级支援该乡的月调水量是多少吨?户,请估计上级支援该乡的月调水量是多少吨?【思路点拨【思路点拨】(1 1)由频率计算公式和各频率之和为)由频率计算公式和各频率之和为1 1求解求解. .(2 2)根据中位数前频率之和为)根据中位数前频率之和为0.50.5求解求解. .(3 3)先求出样本中的月用水量平均值,再估计上级支援该乡)先求出样本中的月用水量平均值,再估计上级支援该乡的月调水量的月调水量. .【规范解答【规范解答】(1 1)频率分布表与相应的频率分布直方图和频)频率分布表与相应的频率分布直方图和频率折线图如下:率折线图如下:(2 2)设中位数为)设中位数为x x,因为月用水量在,因为月用水量在0.50.54.54.5内的频率是内的频率是(0.06+0.12)(0.06+0.12)2=0.362=0.36,月用水量在,月用水量在0.50.56.56.5内的频率是内的频率是(0.06+0.12+0.20)(0.06+0.12+0.20)2=0.762=0.76,所以,所以x x在在4.54.56.56.5内,则内,则(x-(x-4.5)4.5)0.2 = 0.5 - 0.360.2 = 0.5 - 0.36,解得,解得 x=5.2.x=5.2.故中位数是故中位数是5.2.5.2.(3)(3)该乡每户月均用水量估计为该乡每户月均用水量估计为(1.51.50.12+3.50.12+3.50.24+5.50.24+5.50.40+7.50.40+7.50.18+9.50.18+9.50.060.06)=5.14.=5.14.又又5.145.141 2001 2006 168(6 168(吨)吨). .答答: :上级支援该乡的月调水量是上级支援该乡的月调水量是6 1686 168吨吨. .【拓展提升【拓展提升】利用频率分布直方图估计样本的数字特征利用频率分布直方图估计样本的数字特征(1)(1)中位数中位数: :在频率分布直方图中在频率分布直方图中, ,中位数左边和右边的直方图中位数左边和右边的直方图的面积应该相等的面积应该相等, ,由此可以估计中位数的值由此可以估计中位数的值. .(2)(2)平均数平均数: :平均数的估计值等于频率分布直方图中每个小矩形平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和的面积乘以小矩形底边中点的横坐标之和. .(3)(3)众数众数: :在频率分布直方图中在频率分布直方图中, ,众数是最高的矩形的中点的横众数是最高的矩形的中点的横坐标坐标. .【变式训练【变式训练】为了了解高一学生的体能情况为了了解高一学生的体能情况, ,某校抽取部分学某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图布直方图( (如图如图) ),图中从左到右各小长方形面积之比为,图中从左到右各小长方形面积之比为2417159324171593,第二小组频数为,第二小组频数为12.12.(1)(1)第二小组的频率是多少?样本容量是多少?第二小组的频率是多少?样本容量是多少?(2)(2)若次数在若次数在110110以上(含以上(含110110次)为达标,试估计该学校全体次)为达标,试估计该学校全体高一学生的达标率是多少?高一学生的达标率是多少?(3)(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由请说明理由. . 【解析【解析】(1 1)由于频率分布直方图以面积的形式反映了数据)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:落在各小组内的频率大小,因此第二小组的频率为:又因为第二小组频率又因为第二小组频率= =所以样本容量所以样本容量= =40.08.24 171593第二小组频数,样本容量12150.0.08第二小组频数第二小组频率(2 2)由图可估计该学校高一学生的达标率约为)由图可估计该学校高一学生的达标率约为(3 3)由已知可得各小组的频数依次为)由已知可得各小组的频数依次为6 6,1212,5151,4545,2727,9 9,所以前三组的频数之和为,所以前三组的频数之和为6969,前四组的频数之和为,前四组的频数之和为114114,所,所以跳绳次数的中位数落在第四小组内以跳绳次数的中位数落在第四小组内. .171593100%88%.24 171593【易错误区【易错误区】概念不清导致错误概念不清导致错误【典例【典例】(20122012陕西高考)对某商店一个月内每天的顾客人陕西高考)对某商店一个月内每天的顾客人数进行了统计数进行了统计, ,得到样本的茎叶图得到样本的茎叶图( (如图所示如图所示),),则该样本的中位则该样本的中位数、众数、极差分别是数、众数、极差分别是( )( )(A A)46 45 56 46 45 56 (B B)46 45 5346 45 53(C C)47 45 4647 45 46(D D)45 47 5345 47 53【误区警示【误区警示】本题易出现的错误主要有两个方面:本题易出现的错误主要有两个方面:(1 1)中位数计算时中间两数找不准)中位数计算时中间两数找不准. .(2 2)极差与标准差概念混淆导致错误)极差与标准差概念混淆导致错误. . 【规范解答【规范解答】选选A. A. 茎叶图中共有茎叶图中共有3030个数据,所以中位数是第个数据,所以中位数是第1515个和第个和第1616个数字的平均数,即个数字的平均数,即 (45+4745+47)=46=46,排除,排除C C,D D;再计算极差,最小数据是;再计算极差,最小数据是1212,最大数据是,最大数据是6868,所以,所以68-68-12=5612=56,故选,故选A.A.【思考点评【思考点评】(1 1)极差是数据的最大值与最小值的差,它反)极差是数据的最大值与最小值的差,它反映了一组数据变化的最大幅度,它对一组数据中的极端值非常映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感敏感. .标准差,是样本数据到平均数的一种平均距离,也表示标准差,是样本数据到平均数的一种平均距离,也表示波动幅度,但它与样本数据的单位一致波动幅度,但它与样本数据的单位一致. .12(2 2)中位数仅与数据的排列位置有关,某些数据的变动一般)中位数仅与数据的排列位置有关,某些数据的变动一般对中位数没有影响对中位数没有影响. .中位数可能出现在所给数据中,也可能不中位数可能出现在所给数据中,也可能不在所给数据中在所给数据中. .当一组数据中的个别数据较大时,可用中位数当一组数据中的个别数据较大时,可用中位数描述其集中趋势描述其集中趋势. . 1.1.(20122012湖北高考改编)容量为湖北高考改编)容量为2020的样本数据的样本数据, ,分组后的频分组后的频数如下表数如下表: :则样本数据落在区间则样本数据落在区间10104040的频率为的频率为( )( )(A A)0.35 0.35 (B B)0.45 0.45 (C C)0.55 0.55 (D D)0.650.65【解析【解析】选选B.B.数据落在区间数据落在区间10104040内的频数为内的频数为9,9,样本容量为样本容量为20,20,所求频率为所求频率为90.45.202.(20122.(2012安徽高考)甲、乙两人在一次射击比赛中各射靶安徽高考)甲、乙两人在一次射击比赛中各射靶5 5次,次,两人成绩的条形统计图如图所示,则两人成绩的条形统计图如图所示,则( )( )(A A)甲的成绩的平均数小于乙的成绩的平均数)甲的成绩的平均数小于乙的成绩的平均数(B B)甲的成绩的中位数等于乙的成绩的中位数)甲的成绩的中位数等于乙的成绩的中位数(C C)甲的成绩的标准差小于乙的成绩的标准差)甲的成绩的标准差小于乙的成绩的标准差(D D)甲的成绩的极差小于乙的成绩的极差)甲的成绩的极差小于乙的成绩的极差【解析【解析】选选C.C.甲的平均数为甲的平均数为 (4+5+6+7+8)=6,(4+5+6+7+8)=6,乙的平均数为乙的平均数为 (5(53+6+9)=6,3+6+9)=6,甲的成绩的标准差为甲的成绩的标准差为乙的成绩的标准差为乙的成绩的标准差为 所以甲的成绩的标所以甲的成绩的标准差小于乙的成绩的标准差准差小于乙的成绩的标准差. .151522122 1225,2212 151331.55 3.3.(20122012山东高考)在某次测量中得到的山东高考)在某次测量中得到的A A样本数据如下:样本数据如下:8282,8484,8484,8686,8686,8686,8888,8888,8888,88.88.若若B B样本数据恰好样本数据恰好是是A A样本数据都加样本数据都加2 2后所得数据,则后所得数据,则A A,B B两样本的下列数字特征两样本的下列数字特征对应相同的是对应相同的是( )( )(A A)众数)众数 (B B)平均数)平均数(C C)中位数)中位数 (D D)标准差)标准差【解析【解析】选选D.BD.B样本数据恰好是样本数据恰好是A A样本数据都加样本数据都加2 2后所得数据,后所得数据,众数、中位数、平均数比原来的都多众数、中位数、平均数比原来的都多2 2,而标准差不变,而标准差不变. .4.4.(20122012江西高考)样本江西高考)样本(x(x1 1,x,x2 2,,x,xn n) )的平均数为的平均数为 样样本本(y(y1 1,y,y2 2,yym m) )的平均数为的平均数为 若样本若样本(x(x1 1,x,x2 2,x,xn n,y,y1 1, ,y y2 2,y,ym m) )的平均数的平均数 则则n,mn,m的大的大小关系为小关系为( )( )(A A)n nm m (B B)n nm m(C C)n=m n=m (D D)不能确定)不能确定y(xy , )1zx1y02 ,其中 ,x,【解析【解析】选选A.A.由已知得由已知得x x1 1+x+x2 2+ +x+xn n= =y y1 1+y+y2 2+ +y+ym m= =nx,my,12n12m(xxx )(yyy )zmnnxmyx1y,mn 整理得整理得xym1 n0, ()xy,m1 n0,n1,(0,m12n01,1,nm.1m 即又)5.5.(20132013宜春模拟)为了宜春模拟)为了解某校高三学生的视力情解某校高三学生的视力情况,随机地抽查了该校况,随机地抽查了该校100100名高三学生的视力情况,得名高三学生的视力情况,得到频率分布直方图如图,由到频率分布直方图如图,由于不慎将部分数据丢失,只知道前于不慎将部分数据丢失,只知道前4 4组的频数成等比数列,后组的频数成等比数列,后6 6组的频数成等差数列,设最大频率为组的频数成等差数列,设最大频率为a a,视力在,视力在4.64.6到到5.05.0之间之间的学生人数为的学生人数为b b,则,则a,ba,b的值分别为的值分别为_._.【解析【解析】前两组的人数分别为前两组的人数分别为0.10.10.10.1100=1100=1,0.30.30.10.1100=3100=3,由于前,由于前4 4组的频数成等比数列,所以前组的频数成等比数列,所以前4 4组的人数分组的人数分别为别为1 1,3 3,9 9,2727,设后设后6 6组的频数所成等差数列的公差为组的频数所成等差数列的公差为d d,则,则6 627+27+=100-(1+3+9)=87=100-(1+3+9)=87,得,得d=-5d=-5,则,则b=4b=427+ 27+ (-5-5)=78.=78.答案:答案:0.270.27,787827a0.27.100 5 6d23 421.1.已知一组数据:已知一组数据:a a1 1,a a2 2,a a3 3,a a4 4,a a5 5,a a6 6,a a7 7构成公差为构成公差为d d的的等差数列,且这组数据的标准差等于等差数列,且这组数据的标准差等于1 1,则公差,则公差d d等于等于( )( ) (D) (D)无法求解无法求解 111ABC4228 【解析【解析】选选B.B.这组数据的平均数为这组数据的平均数为 又因为这组数据的标准差等于又因为这组数据的标准差等于1 1,所以,所以 (a(a1 1a a4 4) )2 2(a(a2 2a a4 4) )2 2(a(a3 3a a4 4) )2 2(a(a4 4a a4 4) )2 2(a(a5 5a a4 4) )2 2(a(a6 6a a4 4) )2 2(a(a7 7a a4 4) )2 2 即即4d4d2 21 1,解,解得得d d . .1234567aaaaaaa7 447aa7 ,172222229d4dd0d4d9d17 ,122.2.某初一年级有某初一年级有500500名同学,将他们的身高名同学,将他们的身高( (单位:单位:cm)cm)数据绘数据绘制成频率分布直方图制成频率分布直方图( (如图如图) ),若要从身高在,若要从身高在120120130130,130130140140,140140150150三组内的学生中,用分层抽样的方法选取三组内的学生中,用分层抽样的方法选取3030人人参加一项活动,则从身高在参加一项活动,则从身高在130130140140内的学生中选取的人数应内的学生中选取的人数应为为_._.【解析【解析】由频率分布直方图可得,频率之和为由频率分布直方图可得,频率之和为1010(0.035(0.035a a0.0200.0200.0100.0100.005)0.005)1 1,解得,解得a a0.0300.030,由此可得身高,由此可得身高在在120120130130,130130140140,140140150150的频率分别为的频率分别为10100.0300.0300.3,100.3,100.0200.0200.2,100.2,100.0100.0100.10.1,由此可得此三组的人,由此可得此三组的人数分别为数分别为150,100,50150,100,50,共,共300300人,要从中抽取人,要从中抽取3030人,则每一个人,则每一个个体被抽入样的概率为个体被抽入样的概率为 其中身高在其中身高在130130140140内的学生内的学生中选取的人数为中选取的人数为100100 10.10.答案:答案:101030130010,110
展开阅读全文