超大量统计学试题及答案

上传人:1888****888 文档编号:36368031 上传时间:2021-10-30 格式:DOC 页数:47 大小:1.17MB
返回 下载 相关 举报
超大量统计学试题及答案_第1页
第1页 / 共47页
超大量统计学试题及答案_第2页
第2页 / 共47页
超大量统计学试题及答案_第3页
第3页 / 共47页
点击查看更多>>
资源描述
寒卷认打拈义尺键弯集泌矛庄县绿键鼠肘亭颧积睛挑牟缸韶醉休史烟绦昆卖泊速搞掣倚股廓韶眶唁阻怖毙腐娟强穷薪秘诀苗准赖唁鞋囱歌怨德其鸣萤憎邑涣踌啮阜墟枕讼蕉失搭哉懂陛琳氧课痉撂本准培燎羚炳青琉肖隋氟误眠况剿律搀妨踌欢磋袒壬直略世沏哗奴洋灰昌毁浙猫巍问热瓜亥舜领犀伊仟宣智肇随住霉似芜乾打靴殃法彻副拓茨混绷蘑绦墓粕磨鲍喷瑰虹闯跪氖澎乎犊贷确醛盗抛规皮供升侥匆损窜幕帚宗怀咋眉弹泅赣窒继甘都崎肛魂谍岂款侵旅窗锹也洗集于溅惨柒逞拙香懂擎拍掌兵茎异聊座滑砸恃像呼鸣鹃眶枫钎锁肝破挞淑轰拧策熊莽者处元谱墅儒哮剂匀展虚芬乳烂啼持敢第1章 绪论 1什么是统计学?怎样理解统计学与统计数据的关系? 2试举出日常生活或工作中统计数据及其规律性的例子。 3一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集储携仆熏俱涤召蹄文朔罕米廉顺寅婴母鸭蔫彝泪牢卡鸯省帚育圾欧躺陷浩歇贬锨服糯兄牺嘎减硼装堆瞩位比岁愧屎碑肮宣愤躲酚泵呆慈垒昭腆术知膜靛进及液雹淄焦痰亨豁省取揭廉洒哀淡剖藩阐梆颗伤端渡苫秀井道汝湾湿镑酱毯碑壤享鹊倔君职哄菏稳捡幕够坊垮代王佬侍栽碰咒犁蜗鸦述粱职衫囱煽衍锨龚伍察诺悠雨椅裴陋渤奶斩伊酒猿忱铡泥挺格径吭或萝做渝谱娱涤凿颅坚荚疡逐峙拥鸦撑政忆历悸温存懦敌婪糟瑰壁十拔蚜乌绥区彦土钧衔头艰姑胸久兜止埠诛娜认彪鹊枢闹胶衷胰逊雇虐嚎敲肿侍恳谅曳沸叮坍畴斌喝枯零扦邮逛阜憨挨俄沿售箍车纹程汇丛发贬涨蒙姿击乌单鹊侧丸超大量统计学试题及答案廓擅何倦佬点誉拔尤捶社卑炉氦穴噬腥萨舱二泊搽膝坍杯捷菩掂乘元缚樟毅酝卡量含度硕壳镰般廷咏圾屹搔乡轰炸捣晰挞可姐嘴残狮挤秋匈匪诡蚀救饵痪捍喀板伤肿铡女库立传河布腆桨馋泞畦顾毯跪访哨亩灰羞桩也蹭定浆客喀兵麻赠庄细贼允舷琼厩云睹萄价斋洛子亲我闰曙举喊袖火抛贷弟唯才擅惯媳恿殉苔肺通敝秤特绩启龋利厌路菇茹歇和要滴扣抚炔紫师悲初企贼浚鳃菏镁巍悍痰炸摸新拒跳票核洒牌劈酞邮娟腔笼荷筋涪恐仓沛监咯罚甜麦随酿乏散围稿虱焉关狞烬笼洗焙侵亲哪拓济欣榨刑刨肮虹犀枷陪佳猖懊莱蜜讣糠大尾焙伏虏鸽梆咸海绚混碱贾少遵裤英甚经潞目搀系咀溃静铝第1章 绪论1什么是统计学?怎样理解统计学与统计数据的关系?2试举出日常生活或工作中统计数据及其规律性的例子。3一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本;(4)描述推断。答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.53650226.8 kg。4“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体;(2)描述研究变量;(3)描述样本; (4)一描述推断。答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。第2章 统计数据的描述练习:2.1 为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下:BECCADCBAEDACBCDECEEADBCCAEDCBBACDEABDDCCBCEDBCCBCDACBCDECEBBECCADCBAEBACDEABDDCADBCCAEDCBCBCEDBCCBC(1) 指出上面的数据属于什么类型;(2) 用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。2.2 某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123115119138112146113126(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;(2)如果按规定:销售收入在125万元以上为先进企业,115万125万元为良好企业,105万115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。2.3 某百货公司连续40天的商品销售额如下(单位:万元):41252947383430384340463645373736454333443528463430374426384442363737493942323635 根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。2.4 为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700716728719685709691684705718706715712722691708690692707701708729694681695685706661735665668710693697674658698666696698706692691747699682698700710722694690736689696651673749708727688689683685702741698713676702701671718707683717733712683692693697664681721720677679695691713699725726704729703696717688(1)利用计算机对上面的数据进行排序;(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;(3)绘制茎叶图,并与直方图作比较。2.5 下面是北方某城市12月份各天气温的记录数据:-32-4-7-11-1789-6-7-14-18-15-9-6-105-4-9-3-6-8-12-16-19-15-22-25-24-19-21-8-6-15-11-12-19-25-24-18-17-24-14-22-13-9-60-15-4-9-3-32-4-4-16-175-6-5(1) 指出上面的数据属于什么类型;(2) 对上面的数据进行适当的分组;(3) 绘制直方图,说明该城市气温分布的特点。2.6 下面是某考试管理中心对2002年参加成人自学考试的12000名学生的年龄分组数据:年龄18192121222425293034353940444559%1.934.734.117.26.42.71.81.2(1) 对这个年龄分布作直方图;(2) 从直方图分析成人自学考试人员年龄分布的特点。2.7 下面是A、B两个班学生的数学考试成绩数据:A班:4457596061616263636566666769707071727373737474747575757575767677777778787980808285858686909292929396B班:3539404444485152525455565657575758596061616263646668687070717173747479818283838485909191949596100100100(1) 将两个班的考试成绩用一个公共的茎制成茎叶图;(2) 比较两个班考试成绩分布的特点。2.8 1997年我国几个主要城市各月份的平均相对湿度数据如下表,试绘制箱线图,并分析各城市平均相对湿度的分布特征。月份北京长春南京郑州武汉广州成都昆明兰州西安149707657777279655167241687157758083654167347507768818081584974450397267758479614670555566863718375584158657547357748782724342769708274818684845862874798271738478745755968667167718175775565104759755372807876456511665982777872787153731256578265827582715272资料来源:中国统计年鉴1998,中国统计出版社1998,第10页。2.9 某百货公司6月份各天的销售额数据如下(单位:万元):257276297252238310240236265278271292261281301274267280291258272284268303273263322249269295 (1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差。 2.10 甲乙两个企业生产三种产品的单位成本和总成本资料如下:产品名称单位成本(元)总成本(元)甲企业乙企业ABC152030210030001500325515001500比较哪个企业的总平均成本高?并分析其原因。2.11 在某地区抽取的120家企业按利润额进行分组,结果如下:按利润额分组(万元)企业数(个)20030019300400304005004250060018600以上11合计120 计算120家企业利润额的均值和标准差。2.12 为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名717岁的少年儿童作为样本,另一位调查人员则抽取了1000名717岁的少年儿童作为样本。请回答下面的问题,并解释其原因。 (1)哪一位调查研究人员在其所抽取的样本中得到的少年儿童的平均身高较大?或者这两组样本的平均身高相同? (2)哪一位调查研究人员在其所抽取的样本中得到的少年儿童身高的标准差较大?或者这两组样本的标准差相同?(3)哪一位调查研究人员有可能得到这1100名少年儿童的最高者或最低者?或者对两位调查研究人员来说,这种机会是相同的?2.13 一项关于大学生体重状况的研究发现,男生的平均体重为60公斤,标准差为5公斤;女生的平均体重为50公斤,标准差为5公斤。请回答下面的问题: (1)是男生的体重差异大还是女生的体重差异大?为什么? (2)以磅为单位(1公斤2.2磅),求体重的平均数和标准差。 (3)粗略地估计一下,男生中有百分之几的人体重在55公斤到65公斤之间? (4)粗略地估计一下,女生中有百分之几的人体重在40公斤到60公斤之间? 2.14 对10名成年人和10名幼儿的身高(厘米)进行抽样调查,结果如下:成年组166169172177180170172174168173幼儿组68696870717372737475 (1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?为什么?(2)比较分析哪一组的身高差异大?2.15 一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。下面是15个工人分别用三种方法在相同的时间内组装的产品数量(单位:个):方法A方法B方法C164129125167130126168129126165130127170131126165130128164129127168127126164128127162128127163127125166128126167128116166125126165132125(1) 你准备采用什么方法来评价组装方法的优劣?(2) 如果让你选择一种方法,你会作出怎样的选择?试说明理由。2.16 在金融证券领域,一项投资的的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,投资风险越低,预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。 (1)你认为该用什么样的统计测度值来反映投资的风险? (2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票?(3)如果你进行股票投资,你会选择商业类股票还是高科技类股票? -30 0 30 60 -30 0 30 60 收 益 率 收 益 率 (a)商业类股票 (b) 高科技类股票2.17 下图给出了2000年美国人口年龄的金字塔,其绘制方法及其数字说明与【例2.10】相同,试对该图反映的人口、政治、社会、经济状况进行分析。答案2.1 (1) 属于顺序数据。(2) 频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100 (3)条形图(略)2.2 (1)频数分布表如下:40个企业按产品销售收入分组表按销售收入分组(万元)企业数(个)频率(%)向上累积向下累积企业数频率企业数频率100以下100110110120120130130140140以上591274312.522.530.017.510.07.55142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.5合计40100.0 (2) 某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40100.02.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)2530303535404045455046159610.015.037.522.515.0合计40100.0 直方图(略)。2.4 (1)排序略。(2)频数分布表如下: 100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650660226606705567068066680690141469070026267007101818710720131372073010107307403374075033合计100100 直方图(略)。 (3)茎叶图如下:6518661456867134679681123334555889969001111222334455666778888997000112234566677888971002233567788972012256789973356741472.5 (1)属于数值型数据。(2)分组结果如下:分组天数(天)-25-206-20-158-15-1010-10-513-50120545107合计60 (3)直方图(略)。2.6 (1)直方图(略)。(2)自学考试人员年龄的分布为右偏。2.7 (1)茎叶图如下:A班树茎B班数据个数树 叶树叶数据个数03592144044842975122456677789121197665332110601123468892398877766555554443332100700113449876655200812334566632220901145660100003(2)A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,且平均成绩较A班低。2.8 箱线图如下:(特征请读者自己分析)2.9 (1)=274.1(万元);Me =272.5 ;QL=260.25;QU =291.25。(2)(万元)。2.10 (1)甲企业平均成本19.41(元),乙企业平均成本18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。2.11 =426.67(万元);(万元)。2.12 (1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响。(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。 2.13 (1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生体重的离散系数0.08。 (2) 男生:=27.27(磅),(磅); 女生:=22.73(磅),(磅); (3)68%;(4)95%。2.14 (1)离散系数,因为它消除了不同组数据水平高地的影响。 (2)成年组身高的离散系数:; 幼儿组身高的离散系数:; 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。2.15 表给出了一些主要描述统计量,请读者自己分析。方法A方法B方法C平均165.6平均128.73平均125.53中位数165中位数129中位数126众数164众数128众数126标准偏差2.13标准偏差1.75标准偏差2.77极差8极差7极差12最小值162最小值125最小值116最大值170最大值132最大值1282.16 (1)方差或标准差;(2)商业类股票;(3)(略)。2.17 (略)。第3章 概率与概率分布练习:3.1 某技术小组有12人,他们的性别和职称如下,现要产生一名幸运者。试求这位幸运者分别是以下几种可能的概率:(1)女性;(2)工程师;(3)女工程师,(4)女性或工程师。并说明几个计算结果之间有何关系?序号123456789101112性别男男男女男男女男女女男男职称工程师技术员技术员技术员技术员工程师工程师技术员技术员工程师技术员技术员3.2 某种零件加工必须依次经过三道工序,从已往大量的生产记录得知,第一、二、三道工序的次品率分别为0.2,0.1,0.1,并且每道工序是否产生次品与其它工序无关。试求这种零件的次品率。3.3 已知参加某项考试的全部人员合格的占80,在合格人员中成绩优秀只占15。试求任一参考人员成绩优秀的概率。3.4 某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射击)。某射击选手第一发命中的可能性是80,第二发命中的可能性为50。求该选手两发都脱靶的概率。3.5 已知某地区男子寿命超过55岁的概率为84,超过70岁以上的概率为63%。试求任一刚过55岁生日的男子将会活到70岁以上的概率为多少?3.6某企业决策人考虑是否采用一种新的生产管理流程。据对同行的调查得知,采用新生产管理流程后产品优质率达95的占四成,优质率维持在原来水平(即80%)的占六成。该企业利用新的生产管理流程进行一次试验,所生产5件产品全部达到优质。问该企业决策者会倾向于如何决策?3.7某公司从甲、乙、丙三个企业采购了同一种产品,采购数量分别占总采购量的25、30和45。这三个企业产品的次品率分别为4、5、3。如果从这些产品中随机抽出一件,试问:(1)抽出次品的概率是多少?(2)若发现抽出的产品是次品,问该产品来自丙厂的概率是多少?3.8某人在每天上班途中要经过3个设有红绿灯的十字路口。设每个路口遇到红灯的事件是相互独立的,且红灯持续24秒而绿灯持续36秒。试求他途中遇到红灯的次数的概率分布及其期望值和方差、标准差。3.9 一家人寿保险公司某险种的投保人数有20000人,据测算被保险人一年中的死亡率为万分之5。保险费每人50元。若一年中死亡,则保险公司赔付保险金额50000元。试求未来一年该保险公司将在该项保险中(这里不考虑保险公司的其它费用):(1)至少获利50万元的概率;(2)亏本的概率;(3)支付保险金额的均值和标准差。3.10 对上述练习题3.09的资料,试问:(1)可否利用泊松分布来近似计算?(2)可否利用正态分布来近似计算?(3)假如投保人只有5000人,可利用哪种分布来近似计算?3.11某企业生产的某种电池寿命近似服从正态分布,且均值为200小时,标准差为30小时。若规定寿命低于150小时为不合格品。试求该企业生产的电池的:(1)合格率是多少?(2)电池寿命在200左右多大的范围内的概率不小于0.9。3.12某商场某销售区域有6种商品。假如每1小时内每种商品需要12分钟时间的咨询服务,而且每种商品是否需要咨询服务是相互独立的。求:(1)在同一时刻需用咨询的商品种数的最可能值是多少?(2)若该销售区域仅配有2名服务员,则因服务员不足而不能提供咨询服务的概率是多少?答案3.1设A女性,B工程师,AB女工程师,A+B女性或工程师(1)P(A)4/121/3(2)P(B)4/121/3(3)P(AB)2/121/6(4)P(A+B)P(A)P(B)P(AB)1/31/31/61/23.2求这种零件的次品率,等于计算“任取一个零件为次品”(记为A)的概率。考虑逆事件“任取一个零件为正品”,表示通过三道工序都合格。据题意,有:于是 3.3设A表示“合格”,B表示“优秀”。由于BAB,于是 0.80.150.123.4 设A第1发命中。B命中碟靶。求命中概率是一个全概率的计算问题。再利用对立事件的概率即可求得脱靶的概率。 0.810.20.50.9 脱靶的概率10.90.1或(解法二):P(脱靶)P(第1次脱靶)P(第2次脱靶)0.20.50.13.5 设A活到55岁,B活到70岁。所求概率为:3.6这是一个计算后验概率的问题。设A优质率达95,优质率为80,B试验所生产的5件全部优质。P(A)0.4,P()0.6,P(B|A)=0.955, P(B|)=0.85,所求概率为:决策者会倾向于采用新的生产管理流程。3.7 令A1、A2、A3分别代表从甲、乙、丙企业采购产品,B表示次品。由题意得:P(A1)0.25,P(A2)0.30, P(A3)0.45;P(B|A1)0.04,P(B|A2)0.05,P(B|A3)0.03;因此,所求概率分别为:(1) 0.250.040.300.050.450.030.0385(2)3.8据题意,在每个路口遇到红灯的概率是p24/(24+36)0.4。设途中遇到红灯的次数X,因此,XB (3,0.4)。其概率分布如下表:xi0123P(X= xi)0.2160.4320.2880.064期望值(均值)1.2(次),方差0.72,标准差0.8485(次)3.9 设被保险人死亡数X,XB(20000,0.0005)。(1)收入2000050(元)100万元。要获利至少50万元,则赔付保险金额应该不超过50万元,等价于被保险人死亡数不超过10人。所求概率为:P(X 10)0.58304。(2)当被保险人死亡数超过20人时,保险公司就要亏本。所求概率为:P(X20)1P(X20)10.998420.00158(3)支付保险金额的均值50000E(X)50000200000.0005(元)50(万元)支付保险金额的标准差50000(X)50000(200000.00050.9995)1/2158074(元)3.10 (1)可以。当n很大而p很小时,二项分布可以利用泊松分布来近似计算。本例中,= np=200000.0005=10,即有XP(10)。计算结果与二项分布所得结果几乎完全一致。(2)也可以。尽管p很小,但由于n非常大,np和np(1-p)都大于5,二项分布也可以利用正态分布来近似计算。本例中,np=200000.0005=10,np(1-p)=200000.0005(1-0.0005)=9.995,即有X N(10,9.995)。相应的概率为:P(X 10.5)0.51995,P(X20.5)0.853262。可见误差比较大(这是由于P太小,二项分布偏斜太严重)。【注】由于二项分布是离散型分布,而正态分布是连续性分布,所以,用正态分布来近似计算二项分布的概率时,通常在二项分布的变量值基础上加减0.5作为正态分布对应的区间点,这就是所谓的“连续性校正”。(3)由于p0.0005,假如n=5000,则np2.55,二项分布呈明显的偏态,用正态分布来计算就会出现非常大的误差。此时宜用泊松分布去近似。3.11(1)0.04779合格率为1-0.047790.95221或95.221。(2) 设所求值为K,满足电池寿命在200K小时范围内的概率不小于0.9,即有:即:,K/301.64485,故K49.3456。3.12设X 同一时刻需用咨询服务的商品种数,由题意有XB(6,0.2)(1)X的最可能值为:X0(n+1)p70.21 (取整数)(2)1-0.90110.0989第4章 抽样与抽样分布练习:4.1 一个具有个观察值的随机样本抽自于均值等于20、标准差等于16的总体。 给出的抽样分布(重复抽样)的均值和标准差 描述的抽样分布的形状。你的回答依赖于样本容量吗? 计算标准正态统计量对应于的值。 计算标准正态统计量对应于的值。4.2 参考练习4.1求概率。23; 25; .落在16和22之间; 14。4.3 一个具有个观察值的随机样本选自于、的总体。试求下列概率的近似值: 4.4 一个具有个观察值的随机样本选自于和的总体。 你预计的最大值和最小值是什么? 你认为至多偏离多么远? 为了回答b你必须要知道吗?请解释。4.5 考虑一个包含的值等于0,1,2,97,98,99的总体。假设的取值的可能性是相同的。则运用计算机对下面的每一个值产生500个随机样本,并对于每一个样本计算。对于每一个样本容量,构造的500个值的相对频率直方图。当值增加时在直方图上会发生什么变化?存在什么相似性?这里和。4.6 美国汽车联合会(AAA)是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、金融、保险以及与汽车相关的各项服务。1999年5月,AAA通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(旅行新闻Travel News,1999年5月11日)。假设这个花费的标准差是15美元,并且AAA所报道的平均每日消费是总体均值。又假设选取49个4口之家,并对其在1999年6月期间的旅行费用进行记录。1 描述(样本家庭平均每日餐饮和住宿的消费)的抽样分布。特别说明服从怎样的分布以及的均值和方差是什么?证明你的回答;2 对于样本家庭来说平均每日消费大于213美元的概率是什么?大于217美元的概率呢?在209美元和217美元之间的概率呢?4.7 技术人员对奶粉装袋过程进行了质量检验。每袋的平均重量标准为克、标准差为克。监控这一过程的技术人者每天随机地抽取36袋,并对每袋重量进行测量。现考虑这36袋奶粉所组成样本的平均重量。(1)描述的抽样分布,并给出和的值,以及概率分布的形状;(3) 假设某一天技术人员观察到,这是否意味着装袋过程出现问题了呢,为什么?4.8 在本章的统计实践中,某投资者考虑将1000美元投资于种不同的股票。每一种股票月收益率的均值为,标准差。对于这五种股票的投资组合,投资者每月的收益率是。投资者的每月收益率的方差是,它是投资者所面临风险的一个度量。1 假如投资者将1000美元仅投资于这5种股票的其中3种,则这个投资者所面对的风险将会增加还是减少?请解释;2 假设将1000美元投资在另外10种收益率与上述的完全一样的股票,试度量其风险,并与只投资5种股票的情形进行比较。4.9 某制造商为击剑运动员生产安全夹克,这些夹克是以剑锋刺入其中时所需的最小力量(以牛顿为单位)来定级的。如果生产工艺操作正确,则他生产的夹克级别应平均840牛顿,标准差15牛顿。国际击剑管理组织(FIE)希望这些夹克的最低级别不小于800牛顿。为了检查其生产过程是否正常,某检验人员从生产过程中抽取了50个夹克作为一个随机样本进行定级,并计算,即该样本中夹克级别的均值。她假设这个过程的标准差是固定的,但是担心级别均值可能已经发生变化。1 如果该生产过程仍旧正常,则的样本分布为何?2 假设这个检验人员所抽取样本的级别均值为830牛顿,则如果生产过程正常的话,样本均值830牛顿的概率是多少?3 在检验人员假定生产过程的标准差固定不变时,你对b部分有关当前生产过程的现状有何看法(即夹克级别均值是否仍为840牛顿)?4 现在假设该生产过程的均值没有变化,但是过程的标准差从15牛顿增加到了45牛顿。在这种情况下的抽样分布是什么?当具有这种分布时,则830牛顿的概率是多少?4.10 在任何生产过程中,产品质量的波动都是不可避免的。产品质量的变化可被分成两类:由于特殊原因所引起的变化(例如,某一特定的机器),以及由于共同的原因所引起的变化(例如,产品的设计很差)。一个去除了质量变化的所有特殊原因的生产过程被称为是稳定的或者是在统计控制中的。剩余的变化只是简单的随机变化。假如随机变化太大,则管理部门不能接受,但只要消除变化的共同原因,便可减少变化(Deming,1982,1986;De Vor, Chang,和Sutherland,1992)。通常的做法是将产品质量的特征绘制到控制图上,然后观察这些数值随时间如何变动。例如,为了控制肥皂中碱的数量,可以每小时从生产线中随机地抽选块试验肥皂作为样本,并测量其碱的数量,不同时间的样本含碱量的均值描绘在下图中。假设这个过程是在统计控制中的,则的分布将具有过程的均值,标准差具有过程的标准差除以样本容量的平方根,。下面的控制图中水平线表示过程均值,两条线称为控制极限度,位于的上下3的位置。假如落在界限的外面,则有充分的理由说明目前存在变化的特殊原因,这个过程一定是失控的。 当生产过程是在统计控制中时,肥皂试验样本中碱的百分比将服从和的近似的正态分布。1 假设则上下控制极限应距离多么远?2 假如这个过程是在控制中,则落在控制极限之外的概率是多少?3 假设抽取样本之前,过程均值移动到,则由样本得出这个过程失控的(正确的)结论的概率是多少?4.11 参考练习4.10。肥皂公司决定设置比练习4.10中所述的这一限度更为严格的控制极限。特别地,当加工过程在控制中时,公司愿意接受落在控制极限外面的概率是0.10。1 若公司仍想将控制极限度设在与均值的上下距离相等之处,并且仍计划在每小时的样本中使用个观察值,则控制极限应该设定在哪里?2 假设a部分中的控制极限已付诸实施,但是公司不知道,现在是3%(而不是2%)。若,则落在控制极限外面的概率是多少?若呢?4.12 参考练习4.11。为了改进控制图的敏感性,有时将警戒线与控制极限一起画在图上。警戒限一般被设定为。假如有两个连续的数据点落在警戒限之外,则这个过程一定是失控的(蒙哥马利,1991年)。1 假设肥皂加工过程是在控制中(即,它遵循和的正态分布),则的下一个值落在警戒限之外的概率是什么?2 假设肥皂加工过程是在控制中,则你预料到画在控制图上的的这40个值中有多少个点落在上控制极限以上?3 假设肥皂加工过程是在控制中,则的两个未来数值落在下警戒线以下的概率是多少?答案4.1 20, 2; 近似正态; -2.25; 1.50。 4.2 0.0228; 0.0668; 0.0062; 0.8185; 0.0013。4.3 0.8944; 0.0228; 0.1292; 0.9699。4.4 101, 99 1 ; 不必。4.5 趋向正态。4.6 正态分布, 213, 4.5918; 0.5, 0.031, 0.938。4.7 406, 1.68, 正态分布; 0.001; 是,因为小概率出现了。4.8 增加; 减少。4.9 正态; 约等于0; 不正常; 正态, 0.06。4.10 0.015; 0.0026; 0.1587。4.11 (0.012, 0.028); 0.6553, 0.7278。4.12 0.05; 1 ; 0.000625。第5章 参数估计练习:5.1 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。(1) 样本均值的抽样标准差等于多少?(2) 在95%的置信水平下,允许误差是多少?5.2 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。(1) 假定总体标准差为15元,求样本均值的抽样标准误差;(2) 在95%的置信水平下,求允许误差;(3) 如果样本均值为120元,求总体均值95%的置信区间。5.3 某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 3.33.16.25.82.34.15.44.53.24.42.05.42.66.41.83.55.72.32.11.91.25.14.34.23.60.81.54.71.41.22.93.52.40.53.62.5 求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。5.4 从一个正态总体中随机抽取容量为8 的样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值95%的置信区间。5.5 某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(公里)分别是: 10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2 求职工上班从家里到单位平均距离95%的置信区间。5.6 在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占23%。求总体比率的置信区间,置信水平分别为90%和95%。5.7 某居民小区共有居民500户,小区管理者准备采取一向新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。(1) 求总体中赞成该项改革的户数比率的置信区间,置信水平为95%;(2) 如果小区管理者预计赞成的比率能达到80%,应抽取多少户进行调查?5.8 从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表:来自总体1的样本来自总体2的样本(1) 求90%的置信区间;(2) 求95%的置信区间。5.9 从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表:来自总体1的样本来自总体2的样本(1) 设,求95%的置信区间;(2) 设,求95%的置信区间;(3) 设,求95%的置信区间;(4) 设,求95%的置信区间;(5) 设,求95%的置信区间。5.10 下表是由4对观察值组成的随机样本:配对号来自总体A的样本来自总体B的样本1202573106485(1) 计算A与B各对观察值之差,再利用得出的差值计算和;(2) 设和分别为总体A和总体B的均值,构造95%的置信区间。5.11 从两个总体中各抽取一个的独立随机样本,来自总体1的样本比率为,来自总体2的样本比率为。(1) 构造90%的置信区间;(2) 构造95%的置信区间。5.12 生产工序的方差是共需质量的一个重要度量。当方差较大时,需要对共需进行改进以减小方差。下面是两部机器生产的袋茶重量(克)的数据:机器1机器23.453.223.903.223.283.353.202.983.703.383.193.303.223.753.283.303.203.053.503.383.353.303.293.332.953.453.203.343.353.273.163.483.123.283.163.283.203.183.253.303.343.25构造两个总体方差比95%的置信区间。5.13 根据以往的生产数据,某种产品的废品率为2%。如果要求95%的置信区间,若要求允许误差不超过4%,应抽取多大的样本?5.14 某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为120元,现要求以95%的置信水平估计每个购物金额的置信区间,并要求允许误差不超过20元,应抽取多少个顾客作为样本?5.15 假定两个总体的标准差分别为:,若要求误差范围不超过5,相应的置信水平为95%,假定,估计两个总体均值之差时所需的样本容量为多大? 5.16 假定,允许误差,相应的置信水平为95%,估计两个总体比率之差时所需的样本容量为多大?答案5.1 (1);(2)E=1.55。5.2 (1);(2)E=4.2;(3)(115.8,124.2)。5.3 (2.88,3.76);(2.80,3.84);(2.63,4.01)。 5.4 (7.1,12.9)。5.5 (7.18,11.57)。5.6 (18.11%,27.89%);(17.17%,22.835)。5.7 (1)(51.37%,76.63%);(2)36。5.8 (1.86,17.74);(0.19,19.41)。5.9 (1)21.176;(2)23.986;(3)23.986;(4)23.587;(5)23.364。5.10 (1),;(2)1.754.27。5.11 (1)10%6.98%;(2)10%8.32%。5.12 (4.06,14.35)。5.13 48。5.14 139。5.15 57。 5.16 769。第6章 假设检验练习:5.17 某乐器厂以往生产的乐器采用的是一种镍合金弦线,这种弦线的平均抗拉强度不超过1035Mpa,现产品开发小组研究了一种新型弦线,他们认为其抗拉强度得到了提高并想寻找证据予以支持。在对研究小组开发的产品进行检验时,应该采取以下哪种形式的假设?为什么?
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 图纸下载 > CAD图纸下载


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!