资源描述
专题11 统计易错点1 不能正确区分总体、样本、样本容量为了了解2016年参加市运动会的240名运动员的身高情况,从中抽取40名运动员进行测量下列说法正确的是A总体是240名运动员B个体是每一名运动员C40名运动员的身高是一个个体D样本容量是40【错解】选择A、B、C中的一个. 【错因分析】对于选项A、B,对总体、个体、样本的概念把握不准,误将考察的对象当作运动员;对于选项C,把个体和样本混淆致误【试题解析】选D根据统计的相关概念并结合题意可得,此题的总体、个体、样本这三个概念的考察对象都是运动员的身高,而不是运动员,并且一个个体是指一名运动员的身高,选项A,B表达的对象都是运动员,选项C未将个体和样本理解透彻在这个问题中,总体是240名运动员的身高,个体是每名运动员的身高,样本是40名运动员的身高,样本容量是40.因此选D【参考答案】D1明确相关概念对总体、个体、样本、样本容量的概念要熟练把握,要明确总体与样本的包含关系及样本与样本容量的区别,如本例选项C,是对概念把握不准2注意考察对象解决考查总体、个体、样本、样本容量的概念问题时,关键是明确考察对象,根据相关的概念可知总体、个体与样本的考察对象是相同的,如本例中选项A,B表达的对象都是运动员的身高而不是运动员1为了了解中国好声音第二季的56名学员的年龄情况,从中抽取14名学员进行调查,则下列说法正确的是A总体是56 B个体是每一名学员C样本是14名学员 D样本容量是14【答案】D易错点2 对随机抽样的概念理解不透彻 对于下列抽样方法:运动员从8个跑道中随机抽取1个跑道;从20个零件中一次性拿出3个来检验质量;某班50名学生,指定其中成绩优异的2名学生参加一次学科竞赛;为了保证食品安全,从某厂提供的一批月饼中,拿出一个检查后放回,再拿一个检查,反复5次,拿了5个月饼进行检查.其中,属于简单随机抽样的是_.(把正确的序号都填上)【错解】【错因分析】对简单随机抽样的概念理解不透彻.【试题解析】对于,一次性拿出3个来检验质量,违背简单随机抽样特征中的“逐个”抽取;对于,指定其中成绩优异的2名学生,不满足等可能抽样的要求;对于,不满足不放回抽样的要求.故填. 【参考答案】1简单随机抽样是不放回抽样,抽样过程中,每个个体被抽到的机会(概率)相等.2应用简单随机抽样应注意的问题:(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀一般地,当总体容量和样本容量都较小时可用抽签法(2)在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去(3)简单随机抽样需满足:被抽取的样本总体的个体数有限;逐个抽取;是不放回抽取;是等可能抽取2从52名学生中选取5名学生参加全国“希望杯”数学竞赛,若采用简单随机抽样抽取,则每人入选的可能性A都相等,且为B都相等,且为C都相等,且为D都不相等【答案】C简单随机抽样在抽样过程中每一个个体被抽取的机会都相等(随机抽样的等可能性).若样本容量为n,总体的个体数为N,则用简单随机抽样时,每一个个体被抽到的可能性都是,体现了这种抽样方法的客观性和公平性. 易错点3 对系统抽样的特点理解不到位 从2003名学生中抽取一个容量为40的样本,应如何抽取?【错解】将2003名学生按0001到2003编上号;将号码随机分成40份,每一份再用抽签法随机抽取一名学生,即得到了一个容量为40的样本. 【错因分析】由于2003不能被40整除,误以为只能用简单随机抽样进行抽取,对两种抽样方法的特点理解不到位.【试题解析】先将2003名学生按0001到2003编上号,利用随机数表法从中剔除3名学生,再对剩余的2000名学生重新从0001到2000编号,按编号顺序分成40组,每组50人,先在第一组中用抽签法抽出某一号,如0006,依次在其他组抽取0056,0106,1956,这样就得到了一个容量为40的样本.【参考答案】见试题解析1当总体容量较大,总体可以分为均匀的几个部分时,用系统抽样较为合理,但当总体容量除以样本容量不是整数时,要先在总体中剔除部分个体.2系统抽样的操作步骤:第一步编号:先将总体的N个个体编号;第二步分段:确定分段间隔k,对编号进行分段,当(n是样本容量)是整数时,取k=;第三步确定首个个体:在第1段用简单随机抽样确定第一个个体编号l(lk);第四步获取样本:按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号,再加k得到第3个个体编号,依次进行下去,直到获取整个样本系统抽样是等距抽样,用系统抽样法抽取样本,当不为整数时,取,即先从总体中用简单随机抽样的方法剔除(Nnk)个个体,且剔除多余的个体不影响抽样的公平性3某装订厂平均每小时大约装订图书362册,需要检验员每小时抽取40册图书检验其质量状况,请你设计一个抽样方案.【答案】抽样方案见解析.【解析】由于总体容量较大,样本容量也较大,且个体间无明显差异,所以采用系统抽样的方法,步骤如下:第一步,先从362册图书中剔除2册图书(剔除方法可用随机数法);第二步,将余下的360册图书编号为1,2,360,并均匀分成40段,每段含k=9个个体;第三步,从第1段即1,2,9这9个编号中,用简单随机抽样的方法抽取一个编号(如6)作为起始号;第四步,从6开始,再将编号为15,24, ,357的个体抽出,得到一个容量为40的样本.易错点4 对个体的入样可能性与抽样间隔理解不透中央电视台动画城节目为了对本周的热心观众给予奖励,要从2014名小观众中抽取50名幸运小观众先用简单随机抽样从2014人中剔除14人,剩下的2000人再按系统抽样方法抽取50人,则在2014人中,每个人被抽取的可能性A均不相等B不全相等C都相等,且为D都相等,且为【错解】选A或D.【错因分析】对于选项A,误认为剔除14人,被抽取到的机会就不相等了,错选A;对于选项D,认为被抽取的机会相等,但利用了剔除后的数据计算,错选D【试题解析】选C因为在系统抽样中,若所给的总体个数不能被样本容量整除,则应先剔除几个个体,本题先剔除14人,然后再分组,在剔除过程中,每个个体被剔除的机会相等所以,每个个体被抽到的机会都相等,均为.【参考答案】C1明确系统抽样的操作要领系统抽样操作要领是先将个体数较多的总体分成均衡的若干部分,然后按照预先指定的规则,从每一部分中抽取一个个体,得到所需样本系统抽样是等距离抽样,每个个体被抽到的机会是相等的,如本题中2000人要分为50段2对系统抽样合理分段在系统抽样过程中,为将整个编号分段,要确定分段间隔,当在系统抽样过程中比值不是整数时,要从总体中剔除一些个体(用简单随机抽样),但每一个个体入样的机会仍然相等如本题中剔除14人后,每个人被抽取的可能性不变4从72名志愿者中抽取10名志愿者进行专业兴趣调查,若采用系统抽样,则每名志愿者被抽到的可能性是ABCD【答案】D在系统抽样中,总体的每个个体被剔除的机会是均等的,也就是每个个体不被剔除的机会也是均等的,由此可知在整个抽样过程中每个个体被抽到的机会仍然相等. 若计算为:每名志愿者被抽到的可能性为,则是错误的.易错点5 忽略分层抽样的特点某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从中抽取一个容量为36的样本,则适合的抽样方法是A简单随机抽样B系统抽样C直接运用分层抽样D先从老年人中剔除1人,再用分层抽样【错解】因为总体由差异明显的三部分组成,所以考虑用分层抽样.因为总人数为28+54+81=163,样本容量为36,由于按抽样,无法得到整数解,因此考虑先剔除1人,将抽样比变为.若从老年人中随机地剔除1人,则老年人应抽取27=6(人),中年人应抽取54=12(人),青年人应抽取81=18(人),从而组成容量为36的样本.故选D【错因分析】如果用简单随机抽样先从老年人中剔除1人的话,老年人被抽到的概率显然比其他人群小了,这不符合随机抽样的特征每个个体入样的几率相等.注意题干明确地说“先从老年人中剔除1人”,这和以前做的从总体中随机剔除1人是不一样的.【试题解析】直接运用分层抽样,老年人、中年人和青年人中应抽取的人数分别为286,5412,8118,故选C【方法点睛】分层抽样的一个很重要的特点是每个个体被抽到的概率是一样的.当按照比例计算出的值不是整数时,一般是采用四舍五入的方法取值,若四舍五入后得到的样本容量与要求的不尽相同,则可根据问题的实际意义适当处理,使之相同,这只是细节性问题,并未改变分层抽样的本质. 【参考答案】C.1分层抽样的前提和遵循的两条原则(1)前提:分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占比例抽取(2)遵循的两条原则:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比2与分层抽样有关问题的常见类型及解题策略:(1)求某一层的样本数或总体个数可依据题意求出抽样比,再由某层总体个数(或样本数)确定该层的样本(或总体)数(2)求各层的样本数可依据题意,求出各层的抽样比,再求出各层样本数进行分层抽样时应注意以下几点:(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,两层之间的样本差异要大,且互不重叠(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样5某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12000人,其中持各种态度的人数如下表所示:很喜爱喜爱一般不喜爱2435456739261072电视台为了进一步了解观众的具体想法和意见,打算从中再抽取60人进行更为详细的调查,应怎样进行抽样? 在分层抽样中,确定抽样比k是抽样的关键.一般地,抽样比k=(N为总体容量,n为样本容量),再按抽样比k在各层中抽取个体,就能确保抽样的公平性.在每层抽样时,应采用简单随机抽样或系统抽样的方法进行.易错点6 误将频率分布直方图的纵坐标当作频率中小学生的视力状况受到社会的关注.某市有关部门从全市6万名高一学生中随机抽取400名学生,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图所示,从左至右五个小组的频率之比为5712106,则该市6万名高一学生中视力在3.95,4.25)范围内的学生约有多少人?【错解】由图可知,第五小组的频率为0.5,所以第一小组的频率为0.5.所以该市6万名高一学生中视力在3.95,4.25)范围内的学生约有60000=25000(人).【错因分析】表面上看本题的回答似乎正确无误,其实答案是错误的,其错因在于没有看懂所提供的频率分布直方图中的数据的含义,误将该频率分布直方图中的纵坐标(频率与组距的比)看成了频率,从而导致问题的解答出错. 【试题解析】由图可知,第五小组的频率为0.50.3=0.15,所以第一小组的频率为0.15=0.125.所以该市6万名高一学生中视力在3.95,4.25)范围内的学生约有600000.125=7500(人).【参考答案】7500.在数据的频率分布直方图中,纵坐标表示的是频率与组距的比, 每个小长方形的面积组距频率,将频率与组距的比错认成频率是初学者经常犯的错误之一,解题过程中要引起足够的重视.1画频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值).2频率分布直方图的性质(1)落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于1.(2)频率分布直方图与众数、中位数与平均数的关系最高的小长方形中的某个(些)点的横坐标即是众数;中位数左边和右边的小长方形的面积和是相等的;平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和绘制频率分布直方图的注意事项:(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率6为了解今年某校高三毕业班准备报考飞行员学生的体重(单位:千克)情况,将所得的数据整理后,画出了频率分布直方图,如图所示,已知图中从左到右的前三个小组的频率之比为,其中第2小组的频数为12,则该校报考飞行员的总人数为_【答案】48频率分布直方图是用样本估计总体的一种重要方法,是高考命题的一个热点,多以选择题或填空题的形式呈现,试题难度不大,多为容易题或中档题,且主要有以下几个命题角度:(1)已知频率分布直方图中的部分数据,求其他数据可根据频率分布直方图中的数据求出样本与总体的关系,利用频率和等于1就可求出其他数据(2)已知频率分布直方图,求某种范围内的数据可利用图形及某范围结合求解(3)与概率有关的综合问题,可先求出频率,再利用古典概型等知识求解.易错点7 对茎叶图的画法规则认识不够 某市对上下班情况作了抽样调查,上下班时间各抽测了12辆机动车的车速如下(单位:km/h):上班时间:30,33,18,27,32,40,26,28,21,28,35,20;下班时间:27,19,32,29,36,29,30,22,25,16,17,30.用茎叶图表示以上数据.【错解】机动车行驶速度的茎叶图如图所示.【错因分析】茎叶图对于重复出现的数据要重复记录.【试题解析】机动车行驶速度的茎叶图如图.【方法点睛】画茎叶图需要注意,将每个数据分为茎和叶两部分,将表示茎的数字按照大小顺序由上到下排列,在写每行叶子的时候,重复出现的数字应该按原次数写入叶子部位,不能只按一次写入.【参考答案】见试题解析.1茎叶图将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序)2绘制茎叶图的关键是分清茎和叶一般地说,当数据是两位数时,十位上的数字为“茎”,个位上的数字为“叶”;如果是小数,通常把整数部分作为“茎”,小数部分作为“叶”解题时要根据数据的特点合理地选择茎和叶3应用茎叶图对两组数据进行比较时,要从数据分布的对称性、中位数、稳定性等几方面来比较4茎叶图只适用于样本数据较少的情况在样本数据较少时,用茎叶图表示数据的效果较好它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便但是当样本数据较多时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一个空间,如果数据很多,枝叶就会很长7甲、乙两位学生参加数学竞赛培训,在培训期间他们参加的5次预赛成绩记录如下:甲:82,82,79,95,87乙:95,75,80,90,85(1)用茎叶图表示这两组数据;(2)求甲、乙两人成绩的平均数与方差;(3)若现要从中选派一人参加数学竞赛,你认为选派哪位学生参加合适,说明理由?【答案】(1)见解析;(2)甲的成绩的平均数为85,方差为31.6,乙的成绩的平均数为85,方差为50;(3)派甲参赛比较合理,理由见解析.【解析】(1)以十位数字为茎,个位数字为叶,作出茎叶图如图所示:(3)派甲参赛比较合理.理由是甲,乙的平均分一样,证明平均成绩一样,而甲的方差小于乙的方差,则证明甲的成绩更稳定.易错点8 忽略方差的统计意义 甲、乙两种冬小麦实验品种连续5年的平均单位面积产量如下(单位:t /km2):品种第1年第2年第3年第4年第5年甲9.89.910.11010.2乙9.410.310.89.79.8若某村要从中引进一种冬小麦大量种植,给出你的建议.【错解】由题意得(9.8+9.9+10.1+10+10.2)=10,(9.4+10.3+10.8+9.7+9.8)=10,甲、乙两种冬小麦的平均产量都等于10,所以引进两种冬小麦的任意一种都可以.【错因分析】上述错误在于只对两种冬小麦的平均产量做了比较,而忽略了对冬小麦产量稳定性的讨论.【试题解析】由题意得(9.8+9.9+10.1+10+10.2)=10,(9.4+10.3+10.8+9.7+9.8)=10,(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2=0.02,(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2=0.244,甲、乙两种冬小麦的平均产量都等于10,且,所以产量比较稳定的为甲种冬小麦,推荐引进甲种冬小麦大量种植.【方法点睛】平均数反映的是样本个体的平均水平,方差和标准差则反映了样本的波动、离散程度.对于形如“谁发挥更好、谁更稳定、谁更优秀”之类的题目,除比较数据的平均值外,还应该比较方差或标准差的大小,以作出更为公正、合理的判断.【参考答案】推荐引进甲种冬小麦大量种植.用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据的平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况. 1平均数与方差都是重要的数字特征,是对总体的一种简明的描述.2众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”.3数据的离散程度可以通过极差、方差或标准差来描述,极差反映了一组数据变化的最大幅度,它对一组数据中的极端值极为敏感.一般情况下,极差大,则数据波动性大;极差小,则数据波动性小.极差只需考虑两个极端值,便于计算,但没有考虑中间的数据,可靠性较差.方差和标准差反映了数据波动程度的大小标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定83月是植树造林的最佳季节,某公园打算在3.12植树节前后引种一批名优树种.现有甲、乙两家苗木场各送来一批同种树苗,该公园园林部从中分别抽取100棵测量其高度,得到如下频率分布表:高度(cm)60,70)70,80)80,90)90,100频率甲苗木场0.180.240.260.32乙苗木场0.200.300.300.20(1)分别算出甲、乙两家苗木场树苗样本高度的平均值,;(2)根据样本数据可算得两个方差:=120.16,=105.0,结合(1)中算出的数据,如果你是该公园园林部主管,你将选择哪家苗木场的树苗?说明你的观点.【答案】(1);(2)见解析.(2)观点一:选择乙场的树苗,因为其提供的树苗高度方差较小,成长较整齐,种在公园里比较好看.观点二:选择甲场的树苗,因为其提供的树苗平均高度较大,说明长势较好,且方差较大,种在公园里显得高矮错落有致,更能体现空间美感.(注:两种观点写一种即可)一组数据的平均数、中位数都是唯一的,众数不唯一,可以有一个,也可以有多个,还可以没有.如果有两个数据出现的次数相同,并且比其他数据出现的次数都多,那么这两个数据都是这组数据的众数.易错点9 运用数字特征作评价时考虑不周一次数学知识竞赛中,两组学生成绩如下:分数5060708090100人数甲组251013146乙组441621212经计算,已知两个组的平均分都是80分,请根据所学过的统计知识,进一步判断这次竞赛中哪个组更优秀,并说明理由.【错解】由于乙组90分以上的人数比甲组90分以上的人数多,所以乙组更优秀.【错因分析】对一组数据进行分析的时候,应从平均数、众数、中位数、方差、极差等多个角度进行判断.【试题解析】(1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数这一角度看,甲组成绩好些.(2)2(50-80)2+5(60-80)2+10(70-80)2+13(80-80)2+14(90-80)2+6(100-80)2=172.同理=256.因为,所以甲组的成绩比乙组的成绩稳定.(3)甲、乙两组成绩的中位数、平均数都是80分,其中甲组成绩在80分以上(含80分)的有33人,乙组成绩在80分以上(含80分)的有26人,从这一角度看,甲组成绩总体较好.(4)从成绩统计表看,甲组成绩大于或等于90分的有20人,乙组成绩大于或等于90分的有24人,所以乙组成绩在高分段的人数多.同时,乙组满分比甲组多6人,从这一角度看,乙组成绩较好. 【参考答案】见解析.1平均数受个别极端数据(比其他数据大很多或小很多的数据)的影响较大,因此若在数据中存在少量极端数据时,平均数对总体估计的可靠性较差,往往用众数或中位数去估计总体.有时也采用剔除最大值与最小值后所得的平均数去估计总体.2运用数字特征进行评价时,要全面考虑各数字特征的优缺点,从不同层面或两两综合进行评价,才能得到较为可靠的估计.9小明是班里的优秀学生,他的历次数学成绩是96,98,95,93分,但最近的一次考试成绩只有45分,原因是他带病参加了考试期末评价时,怎样给小明评价? 【答案】优秀.这5次数学考试的平均分是85.4,则按平均分给小明的评价是“良好” 这种评价是不合理的,尽管平均分是反映一组数据平均水平的重要特征,但任何一个数据的改变都会引起它的变化,而中位数则不受某些极端值的影响本题中的5个成绩从小到大排列为:45,93,95,96,98,中位数是95,较为合理地反映了小明的数学水平,因而应该用中位数来衡量小明的数学成绩易错点10 弄错回归方程中,的位置某班5名学生的数学和物理成绩如下表:(1)画出散点图.(2)求物理成绩y对数学成绩x的线性回归方程.【错解】(1)散点图如图所示:(2)计算得,所以,.所以y对x的线性回归方程是.【错因分析】错解中回归方程记忆错误,应为.【试题解析】(1)散点图如图所示:(2)计算得,所以,.所以y对x的线性回归方程是.【参考答案】.由回归直线方程得到的预报值不是预报变量的精确值,事实上,它是预报变量的可能取值的平均值. 1求回归直线方程的一般步骤:(1)作出散点图,依据问题所给的数据在平面直角坐标系中描点,观察点的分布是否呈条状分布,即是否在一条直线附近,从而判断两变量是否具有线性相关关系(2)当两变量具有线性相关关系时,求回归系数,写出回归直线方程(3)根据方程进行估计.2不要受前面学习的直线方程的影响,而将回归方程写为,实际上,回归方程应为.10某地区2008年至2016年粮食产量的部分数据如下表:(1)求该地区2008年至2016年的粮食年产量与年份之间的线性回归方程;(2)利用(1)中的回归方程,分析2008年至2016年该地区粮食产量的变化情况,并预测该地区 2018年的粮食产量.附:回归直线的斜率和截距的最小二乘估计公式分别为.【答案】(1);(2)299. 2万吨.(2)由(1)知,故2008年至2016年该地区粮食产量逐年增加,平均每两年增加6. 5 万吨.将代入(1)中的线性回归方程,得,故预测该地区2018 年的粮食产量为299. 2万吨.回归系数的含义是:(1)代表x每增加一个单位,y的平均增加单位数,而不是增加单位数.(2)当0时,两个变量呈正相关关系,含义为:x每增加一个单位,y平均增加个单位数;当0时,表明两个变量正相关;当r0时,表明两个变量负相关;|r|越接近于1,表明两个变量的线性相关性越强;|r|越接近于0,表明两个变量的线性相关性越弱.6非线性回归分析对某些特殊的非线性关系,可以通过变量转换,把非线性回归问题转化成线性回归问题,然后用线性回归的方法进行研究在大量的实际问题中,所研究的两个变量不一定都呈线性相关关系,当两变量y与x不具有线性相关关系时,要借助散点图,与已学过的函数(如指数函数、对数函数、幂函数等)的图象相比较,找到合适的函数模型,利用变量代换转化为线性函数关系,从而使问题得以解决求非线性回归方程的步骤:确定变量,作出散点图根据散点图,选择恰当的拟合函数变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程分析拟合效果:通过计算相关指数或画残差图来判断拟合效果根据相应的变换,写出非线性回归方程7刻画回归效果的方式方式方法计算公式刻画效果越接近于1,表示回归的效果越好残差图称为相应于点的残差,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这样的带状区域的宽度越窄,说明模型拟合精确度越高.残差平方和残差平方和越小,模型的拟合效果越好四、独立性检验1独立性检验利用随机变量(也可表示为)(其中为样本容量)来判断“两个变量有关系”的方法称为独立性检验2独立性检验的一般步骤(1)根据样本数据列出列联表;(2)计算随机变量的观测值k,查下表确定临界值k0:(3)如果,就推断“X与Y有关系”,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”(1)通常认为时,样本数据就没有充分的证据显示“X与Y有关系”(2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释(3)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断1从总体为的一批零件中使用简单随机抽样抽取一个容量为40的样本,若某个零件在第2次抽取时被抽到的可能性为1%,则A100B4000C101D4001【答案】B2某中学进行初中与高中各年级的期末考试,该校共有50个考场,每个考场有30个考生,每个考生的座位号按130号随机编排,每个考场抽取座位号为18号考生的试卷进行评分,这种抽样方法是A简单随机抽样B系统抽样C分层抽样D分组抽样【答案】B【解析】如果将每个考场的考生的座位号按从小到大的顺序排列,在50个考场中每个考场抽取座位号为18号的考生的试卷,即系统抽样,故选B3对两个变量进行线性回归分析,计算得到相关系数,则下列说法中正确的是A与正相关B与具有较强的线性相关关系C与几乎不具有线性相关关系D与的线性相关关系还需进一步确定【答案】B4福利彩票“双色球”中红色球的号码由编号为01,02,33的33个个体组成,某彩民利用下面的随机数表选取6组数作为6个红色球的编号,选取方法是从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第6个红色球的编号为49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 6457 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76A23B09C17D02【答案】D【解析】从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出的6个红色球的编号依次为21,32,09,16,17,02,故选出的第6个红色球的编号为02.5某疾病研究所想知道吸烟与患肺病是否有关,于是随机抽取1000名成年人调查是否吸烟及是否患有肺病,得到22列联表,经计算得,已知在假设吸烟与患肺病无关的前提条件下,则该研究所可以A有95%以上的把握认为“吸烟与患肺病有关”B有95%以上的把握认为“吸烟与患肺病无关”C有99%以上的把握认为“吸烟与患肺病有关”D有99%以上的把握认为“吸烟与患肺病无关”【答案】A【解析】由独立性检验的结论结合题意可知:有95%以上的把握认为“吸烟与患肺病有关”.故选A.6某市疾病控制中心对某校高二学生进行了某项健康调查,调查的方法是采取分层抽样的方法抽取样本.我校高二学生共有2000人,抽取了一个200人的样本,其中男生103人,请问该校共有女生A970人B1030人C997人D206人【答案】A7如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数之和是A51B58C61D62【答案】D【解析】由茎叶图可知,甲的这几场比赛得分的中位数为27,乙的这几场比赛得分的中位数为35,所以甲、乙两人这几场比赛得分的中位数之和是27+35=62.8已知一组数据3,5,7,x,10的平均数为6,则这组数据的方差为AB6CD5【答案】C【解析】由题意,得3+5+7+x+10=65,得x=5,所以这组数据的方差为s2=(9+1+1+1+16)=.9采用系统抽样方法从1000人中抽取50人做问卷调查,为此将他们随机编号为1,2,1000,适当分组后在第一组采用简单随机抽样的方法抽到的号码为8.抽到的50人中,编号落入区间1,400的人做问卷A,编号落入区间401,750的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷C的人数为A12B13C14D15【答案】A10为了全面推进素质教育,教育部门对某省500所中小学进行调研考评,考评分数在80以上(包括80分)的授予“素质教育先进学校”称号,考评统计结果按50,60),60,70),70,80),80,90),90,100绘制成如图所示的频率分布直方图,则应授予“素质教育先进学校”称号的学校的个数为A175B145C180D240【答案】A【解析】由频率和为1可知x=0.1-(0.040+0.020+0.010+0.005)=0.025,故应授予“素质教育先进学校”称号的学校有(0.025+0.010)10500=175(所). 11某厂家为了解销售轿车台数与广告宣传费之间的关系,得到如表所示的统计数据表:根据数据表可得回归直线方程其中据此模型预测广告费用为9万元时,销售轿车台数为广告费用万元)23456销售轿车台数)3461012A17B18C19D20【答案】C12采用系统抽样的方法从800名学生中抽取50名学生进行视力检査.为此,将他们随机编号为1,2,3,800,若在116号中随机抽到的号码数为7,则从3348这16个号码数中应抽取的号码为_.【答案】39【解析】3348应在第3组中,故应抽取的号码为.13已知x1,x2,x6的标准差为10,则10x1-1,10x2-1,10x6-1的标准差是_.【答案】100【解析】根据标准差的定义可得10x1-1,10x2-1,10x6-1的标准差是100.14九章算术第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之,问各几何?”其意为:“仅有甲带了560钱,乙带了350钱,丙带了180钱,三人一起出关,共需要交关税100钱,依照钱的多少按比例出钱”,则丙应出_钱(所得结果四舍五入,保留整数).【答案】17【解析】设丙应出x钱,由题意可得,求解可得钱.15为了判断高中二年级学生选修文科或理科是否与性别有关,现随机抽取50名学生,得到如下的22列联表:理科文科总计男131023女72027总计203050已知P(K23.841)0.05,P(K25.024)0.025,根据表中数据,可得有_的把握认为选修文科或理科与性别有关.【答案】95%16某市在每年的春节后,市政府都会发动公务员参与到植树活动中去.林管部门在植树前,为保证树苗的质量,都会在植树前对树苗进行检测.现从甲、乙两种树苗中各抽取了10株树苗,量出的高度如下(单位:厘米).甲:37,21,31,20,29,19,32,23,25,33;乙:10,30,47,
展开阅读全文