统计学测试卷及答案

上传人:软*** 文档编号:172650060 上传时间:2022-12-05 格式:DOCX 页数:9 大小:34.84KB
返回 下载 相关 举报
统计学测试卷及答案_第1页
第1页 / 共9页
统计学测试卷及答案_第2页
第2页 / 共9页
统计学测试卷及答案_第3页
第3页 / 共9页
点击查看更多>>
资源描述
一、单项选择题1. 下面各族有两个变量,前一个是连续变量,后一个是离散的一组( D ) A 计划 程度和设备的能力B 工人数和工时利用率C 工人的技术等级数和劳动生产率D 劳动生产率和工人的技术等级数2、假设职工用于上下班路途的时间服从正态分布,凭抽样调查得知,这一时间为1.2 小时。 调查人员根据调查经验,认为这一时间没有多大变化,为证实这一看法,所采取假设检验方 法有( A )A 双侧检验 B 单侧检验 C 左侧检验 D 右侧检验3在估计某一总均值时,随机抽取n各单元做样本,用样本均值作估计量,在构造置信区间 时,发现置信区间太宽,其中原因是( A )A. 样本容量太小B.估计量缺乏有效性C.选择的估计量有偏D.抽取样本时破坏了随机性 4根据某地区关于工人工资的样本资料估计出的该地区的工人平均工资的95%的置信区间 为(700, 1500),下列说法最准确( C )A 该地区平均工资有95%的可能性落入该置信区间B 该地区平均工资只有95%的可能性落入该置信区间C 该置信区间有95%的概率包含该地区的平均工资D 该置信区间的误差不会超过5 %5. 某一贫困地区估计营养不良人数高达20%,然而有人认为这个比例还要高,随机抽取100 人中发现有30人营养不良,被检验该说法是不正确,取显著性水平a =0.05,则(A )A 假设形式为HO:n 0.2可能犯第一类错误B 假设形式为HO:n 0.2可能犯第二类错误C 假设形式为H0: n0.2, Hl: n 0.2, Hl: n 0.2可能犯第二类错误6. 一个由n=50的随机样本,算得样本均值x =32,总体标准差为6。总体均值卩的95% 的置信区间为( A )A 32土 1.66B 32 土 2.66 C 32 土 3.66 D 32 土 4.667. 一项新的减肥计划声称:在计划实施的第一周内,参加者的体重平均至少可以减轻8 磅。 随机抽取40位参加该计划的样本,结果显示:样本的体重平均减少7磅,标准差为3.2磅, 则其原假设和备择假设是( B )A H0:8 B H0:卩三8 , H1:卩 V8C H0:卩 W7 , H1:卩 7 D H0:卩三7 , H1:卩 V78在进行区间估计时(B )A、置信概率越小,相应的置信区间长度越大B、置信概率越小,相应的置信区间长度越小C、置信概率越大,相应的置信区间长度越小D、置信概率的大小不影响置信区间的长度9、某研究人员发现,举重运动员的体重与他能举起的重量之间的相关系数为 0.6,则( C )A 体重越重,运动员平均能举起的重量越多B 平均来说,运动员能举起其体重60%的重量C 如果运动员体重增加10公斤,则可多举6公斤的重量D 举重能力的 60%归因于其体重10、一元回归方程中,y+12.840.14x,则下列说法中正确(C )A 自变量平均增长一个单位,因变量减少0.14个单位B 自变量和因变量之间成正相关关系C y+0.14x = 12.84D y-0.14x = 12.8411、对于样本均值为估计量,对总体均值进行区间估计,且总体方差已知 ( A)A 95%的置信区间比 90%置信区间宽B 样本容量较小的置信区间较大C 相同置信区间下, 样本容量大的置信区间较小 D 样本均越值小,区间越大 12下面属于连续变量的是( C )A、职工人数B、机器台数C、工业总产值D、车间数13现有两个指标,一个是全国人均粮食产量,另一个是全国农民人均粮食产量,则( D )A、两个都是平均指标B、两个都是强度相对指标C、第一个是平均指标,第二个是强度相对指标D、第一个是强度相对指标,第二个是平均指标14. 加权算术平均数的大小(C)A、只受各组标志值大小的影响,而与各组次数的多少无关B、只受各组次数多少的影响,而与各组标志值的大小无关C、既受各组次数多少的影响,也受各组标志值的大小的影响D、与各组标志值大小及各组次数的多少无关15. 下列时间数列属于时期数列的是( B )A、高校在校学生人数时间数列B、出生人口数时间数列C、耕地面积时间数列D、工业劳动生产率时间数列16. 为了解女性对某种品牌的化妆品的购买意愿,调查者在街头随意拦截部分女性进行调 查。这种调查方式是( C )A 简单随机抽样 B 分层抽样 C 方便抽样 D 自愿抽样17. 某居民小区的物业管理者怀疑有些居民户有偷电行为。为了解住户的每月用电情况,采 取抽样调查方式对部分居民户进行调查。发现有些居民户有虚报或瞒报情况。这种调查产生 的误差属于( A )A 有意识误差 B 抽样框误差 C 回答误差 D 无回答误差18. 不同总体间的标准差不能进行简单对比,这是因为(B)A、总体单位数不一致B、平均数不一致C、离散程度不一致D、离差平方和不一致19. 如果生活费用指数上涨20%,则现在1 元钱(A )A、只值原来的0.83元B、只值原来的0.17元C、与原来的1元钱等值D、只值原来的0.78元20. 在方差分析中,用于度量自变量与因变量之间关系强度的统计量是R2,其计算方法是 ( B )组间平方和组间平方和A R2B=B R2=组内平方和总平方和C R2= DR2= 月 内 干方禾组内方差总平方和二、名词解释1. 简单随机抽样:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为 样本(nWN),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法 叫做简单随机抽样。2. 方差分析:就是通过检验个总体的均值是否相等来判断分类型自变量对数值型因变量是否 有显著影响3. 单因素方差分析:方差分析中只涉及一个分类型自变量区间估计:是在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统 计量加减估计误差得到4. 离散系数:一组数据的标准差与其相应的平均数之比,也称变异系数5最小二乘法:也称最小平方法,它是通过因变量的观察值Yi与估计值Xi,之 6间的离差平方和达到最小估计P。和0 1的方法7条件概率:当某一时间B已经发生时,求事件A的概率,称这种概率为事件B 发生条件下事件 A 发生的条件概率8中心极限定理:设从均值为p、方差为O辽;(有限)的任意一个总体中抽 取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为p、 方差为O八2/n的正态分布9. 集中趋势:是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。 集中趋势测度就是寻找数据水平的代表值或中心值,低层数据的集中趋势测度值适用于高层 次的测量数据,能够揭示总体中众多个观察值所围绕与集中的中心,反之,高层次数据的集 中趋势测度值并不适用于低层次的测量数据。10. 系统抽样:将总体中的所有单位(抽样单位)按一定顺序排列,在规范的范围内随机的 抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位,这种抽样方法被 称为系统抽样三、简答1. 简述分类数据、顺序数据和数值型数据的区别。答:分类数据:1 只能归于某一类的非数字型数据,2对事物进行分类的结果,数据表示为类 别,用文字表示。顺序数据:只能归于某一类有序的非数字型数据 数值型数据:按照数字尺度测量的观察值,其结果表现为具体的数值。2. 众数、中位数与平均数的特点和应用场合。答:众数是一组数据分布的峰值,是一种位置代表值,不受极端值的影响。其缺点是具有不 唯一性,对于一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数 只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。众数主要适合于作为分类 数据的集中趋势测度值。中位数是一组数据中间位置上的代表值,它也是位置代表值,其特点是不受数据极端值的 影响。当一组数据的分布偏斜程度较大时,使用中位数也许是一个较好的选择,中位数主要 适合于顺序数据的集中趋势测度值。 平均数是就数值型数据计算的,是实际中应用最广泛的集中趋势测度值。平均数容易受数据 极端值的影响,对于偏态分布的数据,平均数多的代表性较差。平均数主要适合于作为数值 型数据的集中趋势测度值。3. 编制频数分布表的具体步骤。答: 第一步:确定组数。一组数据分多少组一般与数据本身 的特点及数据的多少有关。一 般情况下,一组数据所分的组数不应该少于五组且不应该多于十五组,即5WkW15。第二步确定各组的组距。组距是一个组的上限与下限的差。组距=(最大值最小值) 组数。第三步:根据分组整理成频数分布表。4. 条形图和直方图的区别和联系。 答:区别:首先,条形图是用条形的长度表示各类别频数的多少,其宽度则是固定的;直方 图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或者频率,宽度则表示各组 的组距,因此高度宽度均有意义。其次,由于分组数据的连续性,直方图的各个矩形通常是 连续排列的,而条形图则是分开排列的。最后,条形图主要用于展示分类数据,而直方图则 主要是用于展示数值型数据。联系:高度表视频数5. 简述经验法则和切比雪夫不等式。答:经验法则当一组数据对称分布时,经验法则表明:约有 68的数据在平均数加减一个标准差的范围内。约有 95的数据在平均数加减两个标准差的范围内约有 99的数据在平均数加减单个标准差的范围内切比雪夫不等式 如果一组数据不是对称分布,经验法则就不再适用,这是可以用切比雪夫不等式,它对任何 分布形状的数据都适用。切比雪夫不等式提供的是“下界”,也就是“所占比列至少是多少”, 对于任意形态分布的数据,根据切比雪夫不等式,至少有(11/k2)的数据落在k个标准 差之内。其中k是大于1的任意值,但不一定是整数。对于k=2,3,4,该不等式的含义是 至少有75的数据落在平均数加减2个标准差的范围内。至少有89的数据落在平均数加减3个标准差的范围内。至少有94的数据落在平均数加减4个标准差的范围内。6评价估计量的主要标准有哪些?请对每一个标准作出说明。答:1 无偏性无偏性是指估计量抽样分布的数学期望等于被估计总体参数。2 有效性 一个无偏的估计量并不是意味着它就非常接近被估计的参数,它还必须与总体参数的离散程度比较小。有效性是指对同一总体参数的两个无偏的估计量,有更小标准的估计量更有效。在无 偏估计下,估计量的方差越小,估计也就越有效。3 一致性 一致性是指随着样本量的增大,点估计量的值越来越接近被估计总体的参数。换言之,一个大样本给出的估计量要比一个小样本给出的估计量更加接近总数的参数。7价设检验的理论基础和推理方法是什么?答:1 :假设的表达式统计的语言是用一个等式或者不等式表达问题的原假设。H。表示原假设,|J是我们要检验的参数,|J。表示感兴趣的数值,原假设一般的表达式为:H。: J =J o 或者 Ho: J J o =0尽管原假设陈述的是两个总体的均值相等,却并不表示它是既定的事实,仅仅是假设而已。如果原假设不成立就要拒绝原假设,而需要在另一个假设中做出选择。这个假设称为备择假设。H1 表示备择假设:备择假设一般的表达式为:Hf p工。 或者斗:p p。工02:两类错误一类错误是原假设H。为真却被我们拒绝了,犯这种错误的概率用a表示,所以也称a错误 或者弃真错误。另一个错误是原假设为伪我们却没有拒绝,犯这种错误的概率用B表示,所以也称为B错误 或者取伪错误。3 假设检验的流程 提出原假设和备择假设 需要确定适当的检验统计量,并计算其数值。在进行假设检验时利用的是小概率原理,小概率原理是指发生的概率很小随机事件在一次试 验中几乎不可能发生的。根据这一原理可以作出是否拒绝原假设的决定。著名的英国统计学 家费希尔把小概率的标准定为 0.05,虽然费希尔没有对为什么选择0.05 给出充分的解释, 但是人们还是沿用了这个标准,吧0.05或者比0.05更小的概率看成为小概率。进行统计决策。8. 假设检验和区间估计的区别和联系是什么?答:联系:区间估计和假设检验是统计推断的两个组成部分,两者都是利用样本对未知参数 进行统计推断。区别:区间估计是在一定的概率条件下,利用样本信息推断总体参数的可能区间范围;而假设检验则是先对总体参数提出假设,然后用样本信息判断这一假设是否成立9. 说明计算 2统计量的步骤。答:步骤一:用观察值f。减去期望值fe步骤二:将(f。一fe)之差平方。步骤三:将(f0fe)2的结果除以fe步骤四:将步骤三的结果加以总结。10单因素方差分析的实质是什么?并说明单因素方差分析的步骤。答:实质:单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响。分析步骤:1 提出假设H。自变量对因变量没有显著影响,H1自变量对因变量有显著影响2 构造检验的统计量(1)计算各个样本的均值(2)计算全部观测值的总均值( 3)计算各个误差平方和( 4)计算统计量四、计算题1.在某电视节目收视率一直保持在30%,即 100人中有30 人在收看。在最近一次电视收视 率调查中,调查了 400 人,其中有 100 人收看了该电视节目,可否认为电视节目的收视率人 保持在原来的水平。(a =0.01)解:H0:三0. 3, H1 : , Z ,所以拒绝原假设,即该批产品的平均重量不合格。a3. 某企业 2011年 11月 11日对 12 名员工的抽样调查表明,他们从居住地点到达工作地点 花费的时间如下(分钟):10 ,55 ,70 ,25 ,30 ,45 ,30 ,50 ,25 ,40 ,55 ,90(1) 计算数据的均值、中位数和众数。你认为哪一个结果最能反映这组数据的一般水平? 为什么?(2) 已知总体服从正态分布,样本标准差等于 22.1 ,计算总体均值 95%的置信区间。 t 0.02(511) =2.20(3) 根据以上数据,在 5%的显著性水平下能否认为总体中职工的平均上班时间等于 35 分 钟?解:(1)数据的均值为:x = 10 + 55 +二9 = 43.7512将表中数据排序可得:10 25 25 30 30 40 45 50 55 55 70 90中位数的位置是2 = 6.5,中位数是40 + 45 = 42 .5 22众数有三个分别是 25、30、55由于众数有多个,且众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众 数反映数据的一般水平。且平均数的主要特点是易受数据极端值的影响,对于偏态分布的数 据,平均数的代表性较差。因此中位数的最能反映这组数据的一般水平,它是一组数据中间 位置的代表值,不受数据极端值的影响。(2)已知:t (11) = 2.20, s = 22.1, x = 43 .75。因此,总体均值95%的置信区0.025一s22 1间是:x 土 t= 43 .75 土 2.20 X = 43 .75 土 14.04,即为(29.71,57.79 )0.025 UnV12( 3 )提出假设:H 0: |Li = 35 , H 1: y h 35检验统计量的值为x I 43 .75 35t = 1.37s M-n 22.1/ v12由于t| = 1.37 t (11) = 2.20,所以不能拒绝原假设,即在5%的显著性水平认为总体中0.025职工的平均上班时间等于35 分钟。4. 娱乐时光影剧院公司的老板希望估计每周营业总收入作为广告费用的函数。以往8 周的 样本数据如下:每周营业总收入(千美元)广告费用(千美元)965.0902.0954.0922.5953.0943.5942.5943.0(1)建立估计回归方程。(2)F 检验来确定检验显著性关系。在 0.05 的显著性水平下,你的结论是什 么?(3)计算尺。并评述拟合优度。(4)当电视广告费用是 3500 美元时,周营业总收入的估计值是多少?解:设广告费用为自变量x,销售额为因变量y(1)建立回归方程:X(2)检验统计量f = 込1 = 11.269,结论x与y的线性关系是显著的。SSE . 6R2 = = 0.653(3),拟合优度较好。4)当 x=3500 美元时,销售额的估计值是 94254 美元。
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸设计 > 毕设全套


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!