资源描述
课时跟踪训练(十八) 独立性检验的基本思想及其初步应用(时间45分钟)题型对点练(时间20分钟)题组一用等高条形图分析两个分类变量间的关系1如图是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出()A性别与喜欢理科无关B女生中喜欢理科的百分比为80%C男生比女生喜欢理科的可能性大些D男生不喜欢理科的比为60%解析从图中可以分析,男生喜欢理科的可能性比女生大一些答案C2观察下列各图,其中两个分类变量x,y之间关系最强的是()解析在四幅图中,D图中两个深色条的高相差最明显,说明两个分类变量之间关系最强答案D3为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:父母吸烟父母不吸烟总计子女吸烟23783320子女不吸烟6785221200总计9156051520利用等高条形图判断父母吸烟对子女吸烟是否有影响?解等高条形图如图所示:由图形观察可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”题组二用22列联表分析两个分类变量间的关系4分类变量X和Y的列联表如下:y1y2总计x1ababx2cdcd总计acbdabcd则下列说法正确的是()Aadbc越小,说明X与Y关系越弱Badbc越大,说明X与Y关系越强C(adbc)2越大,说明X与Y关系越强D(adbc)2越接近于0,说明X与Y关系越强解析|adbc|越小,说明X与Y关系越弱,|adbc|越大,说明X与Y关系越强答案C5假设有两个变量X与Y,它们的取值分别为x1,x2和y1,y2,其列联表为:y1y2总计x1ababx2cdcd总计acbdabcd以下各组数据中,对于同一样本能说明X与Y有关系的可能性最大的一组为()Aa50,b40,c30,d20Ba50,b30,c40,d20Ca20,b30,c40,d50Da20,b30,c50,d40解析当(adbc)2的值越大,随机变量K2的值越大,可知X与Y有关系的可能性就越大显然选项D中,(adbc)2的值最大答案D6某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:文艺节目新闻节目总计20至40岁401858大于40岁152742总计5545100由表中数据直观分析,收看新闻节目的观众是否与年龄有关:_(填“是”或“否”)解析因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的答案是题组三独立性检验7在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A平均数与方差 B回归分析C独立性检验 D概率解析判断两个分类变量是否有关的最有效方法是进行独立性检验答案C8对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是()Ak越大,“X与Y有关系”的可信程度越小Bk越小,“X与Y有关系”的可信程度越小Ck越接近于0,“X与Y没有关系”的可信程度越小Dk越大,“X与Y没有关系”的可信程度越大解析k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大,即k越小,“X与Y有关系”的可信程度越小答案B9在吸烟与患肺病是否相关的判断中,有下面的说法:若K2的观测值k6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误其中说法正确的是_解析K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法不正确;说法中对“确定容许推断犯错误概率的上界”理解错误;说法正确答案综合提升练(时间25分钟)一、选择题1利用独立性检验对两个分类变量是否有关系进行研究时,若有99.5%的把握认为事件A和B有关系,则具体计算出的数据应该是()Ak6.635 Bk6.635Ck7.879 Dk7.879解析有99.5%的把握认为事件A和B有关系,即犯错误的概率为0.5%,对应的k0的值为7.879,由独立性检验的思想可知应为k7.879.答案C2某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()A成绩 B视力 C智商 D阅读量解析因为K,K,K,K,则有KKKK,所以阅读量与性别有关联的可能性最大答案D3某卫生机构抽取了366人进行健康体验,阳性家族史者糖尿病发病的有16人,不发病的有93人,阴性家族史者糖尿病发病的有17人,不发病的有240人,则认为糖尿病与遗传有关系出错的概率不超过()A0.001 B0.005 C0.01 D0.025解析可先作出如下列联表(单位:人)糖尿病患者与遗传列联表糖尿病发病糖尿病不发病总计阳性家族史者1693109阴性家族史者17240257总计33333366根据列联表中的数据,得到K2的观测值k6.0675.024.故在犯错误的概率不超过0.025的前提下认为糖尿病患者与遗传有关系答案D二、填空题4下列关于K2的说法中,正确的有_K2的值越大,两个分类变量的相关性越大;K2的计算公式是K2;若求出K243.841,则有95%的把握认为两个分类变量有关系,即有5%的可能性使得“两个分类变量有关系”的推断出现错误;独立性检验就是选取一个假设H0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H0的推断解析对于,K2的值越大,只能说明我们有更大的把握认为二者有关系,却不能判断相关性大小,故错;对于,(adbc)应为(adbc)2,故错;对答案5某班主任对全班50名学生作了一次调查,所得数据如表:认为作业多认为作业不多总计喜欢玩电脑游戏18927不喜欢玩电脑游戏81523总计262450由表中数据计算得到K2的观测值k5.059,于是_(填“能”或“不能”)在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关解析查表知若要在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关,则临界值k06.635,本题中,k5.0596.635,所以不能在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关答案不能三、解答题6某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品总计南方学生602080北方学生101020总计7030100(1)根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”;(2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.P(K2k0)0.1000.0500.010k02.7063.8416.635解(1)将22列联表中的数据代入公式计算,得K24.762.由于4.7623.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”(2)从5名数学系学生中任取3人的一切可能结果所组成的基本事件空间(a1,a2,b1),(a1,a2,b2),(a1,a2,b3),(a1,b1,b2),(a1,b1,b3),(a1,b2,b3),(a2,b1,b2),(a2,b1,b3),(a2,b2,b3),(b1,b2,b3)(其中ai表示喜欢甜品的学生,i1,2.bi表示不喜欢甜品的学生,j1,2,3)由10个基本事件组成,且这些基本事件的出现是等可能的用A表示“3人中至多有1人喜欢甜品”这一事件,则A(a1,b1,b2),(a1,b1,b3),(a1,b2,b3),(a2,b1,b2),(a2,b1,b3),(a2,b2,b3),(b1,b2,b3)事件A是由7个基本事件组成,因而P(A).7某学校为了解该校高三年级学生在市一练考试的数学成绩情况,随机从该校高三文科与理科各抽取50名学生的数学成绩,作出频率分布直方图如图,规定考试成绩在120,150内为优秀(1)由以上频率分布直方图填写下列22列联表若按是否优秀来判断,是否有99%的把握认为该校的文理科数学成绩有差异.文科理科总计优秀非优秀总计5050100(2)某高校派出2名教授对该校随机抽取的学生成绩中一练数学成绩在140分以上的学生进行自主招生面试,每位教授至少面试一人,每位学生只能被一位教授面试若甲教授面试的学生人数为,求的分布列和均值解(1)由频率分布直方图知,该校文科学生中数学成绩优秀的人数为(0.0100.0040.002)10508,故非优秀人数为50842.该校理科学生中数学成绩优秀的人数为(0.0200.0140.006)105020,故非优秀人数为502030.则22列联表如下:文科理科总计优秀82028非优秀423072总计5050100K2的观测值k7.1436.635,故有99%的把握认为该校文理科数学成绩有差异(2)由(1)知,该校随机抽取的学生成绩中一练数学成绩在140分以上的学生为4人,的可能取值为1,2,3.将4人分给两名教授每名教授至少1名学生的不同分法种数为A14,则P(1),P(2),P(3).的分布列为123PE()1232.
展开阅读全文