资源描述
第第4 4章章 数据分布特征的测数据分布特征的测度度4.2 4.2 随机抽取2525个网络用户,得到他们的年龄数据如下:(1)(1)计算众数、中位数;(2)(2)根据定义公式计算四分位数;(3)(3)计算平均数和标准差;1919151529292525242423232121383822221818303020201919191916162323272722223434242441412020313117172323要求:,和和2323190eMM,5 .2619ULQQ,65. 61)(2nxxsi,24x第1页/共85页第第4 4章章 数据分布特征的测数据分布特征的测度度(5)(5)对网民年龄的分布特征进行综合分析。(4)(4)计算偏态系数和峰态系数;ExcelExcel08. 1)2)(1()(33snnxxnSKi77. 0) 3)(2)(1() 1()( 3)() 1(4224snnnnxxxxnnKii样本数据的均值为24岁,但标准差较大,说明网民年龄之间差异较大.从偏态和峰度系数来看,网民年龄呈现右偏尖峰分布 第2页/共85页第第4 4章章 数据分布特征的测数据分布特征的测度度4.3 4.3 某银行为缩短到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列;另一种是顾客在三个业务窗口处列队3 3排等待。为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取9 9名顾客,得到第一种排队方式的平均等待时间为7.27.2分钟,标准差为1.971.97分钟,第二种排队方式的等待时间( (单位:分钟) )如下: 5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.87.8(1)(1)画出第二种排队方式等待时间的茎叶图;要求:第3页/共85页第第4 4章章 数据分布特征的测数据分布特征的测度度(2)(2)计算第二种排队时间的树茎树茎 树叶树叶频数频数5.5.5 51 16.6.6786783 37.7.13488134885 5平均数和标准差;(3)(3)比较两种排队方式等待时间的离散程度;,71. 01)(2nxxsi,7x102. 0274. 021xsvxsv,(4)(4)如果让你选择一种排队方式,你会选择哪一种?说明理由。选方法二,因为离散程度小。第4页/共85页 4.4 4.4 某百货公司6 6月份各天的销售额数据如下(单位:万元) 见习题4.44.4。第第4 4章章 数据分布特征的测度数据分布特征的测度(1)(1)计算该百货公司日销售额的平均数和中位数;(2)(2)按定义公式计算四分位数;(3)(3)计算日销售额的标准差。 ,万万元元5 .272)( 1 .274eMx,5 .2875 .259ULQQ,万万元元)(17.211)(2nxxsi第5页/共85页 4.5 4.5 甲乙两个企业生产三种产品的单位成本和总成本资料如下:第第4 4章章 数据分布特征的测度数据分布特征的测度要求:比较两个企业的总平均成本, ,那个高? ?并分析原因. . 产品产品单位成本单位成本总成本(元)总成本(元)名称名称(元)(元)甲企业甲企业乙企业乙企业A A15152100210032553255B B20203000300015001500C C30301500150015001500平均成本甲=19.41(=19.41(元) ),平均成本乙=18.29(=18.29(元) );原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。 第6页/共85页4.6 4.6 在某地区抽取120120家企业,按利润额进行分组,结果如右图:第第4 4章章 数据分布特征的测度数据分布特征的测度(1)(1)计算120120家企业利润额的均值和标准差;按利润额分组(万元)按利润额分组(万元)企业数(个)企业数(个)20030019300400304005004250060018600以上以上11合计合计120(2) (2) 计算分布的偏态系数和峰态系数。 要求:688. 0203. 0KSK,万万元元)(67.426x,万万元元)(48.116s第7页/共85页4.7 4.7 为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100100名7 71717岁的少年儿童作为样本,另一位调查人员则抽取了10001000名717717岁的少年儿童作为样本。请回答下面的问题,并解释其原因。(1)(1)哪一位调查研究人员在其所抽取的样本中得到的少年儿童的平均身高较大?或者这两组样本的平均身高相同?(2)(2)哪一位调查研究人员在其所抽取的样本中得到的少年儿童身高的标准差较大?或者这两组样本的标准差相同?第第4 4章章 数据分布特征的测度数据分布特征的测度第8页/共85页第第4 4章章 数据分布特征的测度数据分布特征的测度(3)(3)哪一位调查研究人员有可能得到这11001100名少年儿童的最高者或最低者?或者对两位调查研究人员来说,这种机会是相同的? (1)(2)(1)(2)两位调查研究人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响。具有较大样本的调查研究人员有更大的机会取得最高或最低者,因为样本越大,变化的范围就可能越大。第9页/共85页第第4 4章章 数据分布特征的测度数据分布特征的测度 4.8 4.8 一项关于大学生体重状况的研究发现,男生的平均体重为60kg60kg,标准差为5kg5kg;女生的平均体重为50kg50kg,标准差为5kg5kg。请回答下面的问题: (1)(1)是男生的体重差异大还是女生的体重差异大?为什么?(2)(2)以磅为单位(1kg=2.21b1kg=2.21b),求体重的平均数和标准差。女生的体重差异大,因为女生体重的离散系数为0.10.1,男生体重的离散系数为0.080.08。)(05.11)(6 .132磅磅,磅磅男男生生:sx)(05.11)(5 .110磅磅,磅磅女女生生:sx第10页/共85页第第4 4章章 数据分布特征的测度数据分布特征的测度(4)(4)粗略地估计一下,女生中有百分之几的人体重在40kg40kg60kg60kg之间? (3)(3)粗略地估计一下,男生中有百分之几的人体重在55kg55kg65kg65kg之间?内内落落在在kg)560(%68内内落落在在kg)2550(%95第11页/共85页 4.9 4.9 一家公司在招收职员时,首先要通过两项能力测试。在A A项测试中,其平均分数是100100分,标准差是1515分;在B B项测试中,其平均分数是400400分,标准差是5050分。一位应试者在A A项测试中得了115115分,在B B项测试中得了425425分。与平均分数相比,该位应试者哪一项测试更为理想? 第第4 4章章 数据分布特征的测度数据分布特征的测度,通通过过标标准准分分数数来来判判断断,5 . 01BAzz说明在A A项测试中该应试者比平均分数高1 1个标准差,而在B B项测试中只高出平均分数0.50.5个标准差,由于A A项测试的标准化值高于B B项测试,所以A A项测试比较理想。第12页/共85页 4.10 4.10 一条成品生产线平均每天的产量为37003700件,标准差为5050件。如果某一天的产量低于或高于平均产量,并落入正负两个标准差的范围之外,就认为该生产线“失去控制”。下面是一周各天的产量,时间时间周一周一周二周二周三周三周四周四周五周五周六周六周日周日产量(件)产量(件) 38503850367036703690369037203720361036103590359037003700第第4 4章章 数据分布特征的测度数据分布特征的测度该生产线哪几天失去了控制? 时间时间周一周一 周二周二周三周三周四周四周五周五周六周六周日周日标准化值标准化值3 3-0.6-0.6-0.2-0.20.40.4-1.8-1.8-2.2-2.20 0用标准分数来判断:周一和周六失去控制。 第13页/共85页4.11 4.11 对1010名成年人和1010名幼儿的身高(cmcm)进行抽样调查,结果如下:第第4 4章章 数据分布特征的测度数据分布特征的测度要求: (1)(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?为什么?(2)(2)比较分析哪一组的身高差异大? 成年组成年组166166169169172172177177180180170170172172174174168168173173幼儿组幼儿组68696968687070717173737272737374747575离散系数,因为它消除了不同组数据水平高低的影响。,:成成年年组组身身高高的的离离散散系系数数024. 0sv,:幼幼儿儿组组身身高高的的离离散散系系数数035. 0sv由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。ExcelExcel第14页/共85页第第4 4章章 数据分布特征的测度数据分布特征的测度4.13 4.13 在金融证券领域,一项投资的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,投资风险越低;预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了200200种商业类股票和200200种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。第15页/共85页第第4 4章章 数据分布特征的测度数据分布特征的测度(2)(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票?03030060商业类股票科技类股票方差或标准差(1)(1)你认为该用什么样的统计测度值来反映投资的风险?(3)(3)如果你进行股票投资,你会选择商业类股票还是高科技类股票? 商业类股票第16页/共85页第第3 3章章 数据的整理与显示数据的整理与显示3.1 为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.较差;E.差。调查结果如下表:BECCADCBAEDACBCDECEEADBCCAEDCBBACDEABDDCCBCEDBCCBCDACBCDECEBBECCADCBAEBACDEABDDCADBCCAEDCBCBCEDBCCBC第17页/共85页第第3 3章章 数据的整理与显示数据的整理与显示(1)指出上面的数据属于什么类型?(2)用Excel制作一张频数分布表;服务质量等级服务质量等级频数频数频率频率好好141414%14%较好较好212121%21%一般一般323232%32%较差较差181818%18%差差151515%15%合计合计100100100%100%顺序数据第18页/共85页第第3 3章章 数据的整理与显示数据的整理与显示(3)绘制一张条形图,反映评价等级的分布。(4)绘制一张评价等级的帕累托图。ExcelExcel第19页/共85页第第3 3章章 数据的整理与显示数据的整理与显示 3.2 某行业管理局所属40个企业2002年的产品销售收入数据(单位:万元)见习题3.2。要求:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;40个企业按产品销售收入分组表个企业按产品销售收入分组表按销售收入分组按销售收入分组/万元万元企业数企业数(个)(个)频率频率(%)向上累积向上累积向下累积向下累积企业数企业数频率频率企业数企业数频率频率100以下以下100110110120120130130140140以上以上591274312.522.530.017.510.07.55142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.5合计合计40100.0第20页/共85页第第3 3章章 数据的整理与显示数据的整理与显示(2)如果按规定:销售收入在125万元以上为先进企业,115125万元为良好企业,105115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。 ExcelExcel操作某管理局下属某管理局下属40个企分组表个企分组表按销售收入分组按销售收入分组(万元万元)企业数企业数(个个)频率频率(%)先进企业先进企业良好企业良好企业一般企业一般企业落后企业落后企业11119927.527.522.522.5合计合计40100.0第21页/共85页第第3 3章章 数据的整理与显示数据的整理与显示3.3 某百货公司连续40天的商品销售额(单位:万元)ExcelExcel某百货公司日商品销售额分组表按销售额分组按销售额分组( (万元万元) )频数频数( (天天) )频率频率(%)(%)25253030303035353535404040404545454550504 46 615159 96 610.010.015.015.037.537.522.522.515.015.0合计合计4040100.0100.0要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。 第22页/共85页 3.10 A、B两个班学生的数学考试成绩数据第第3 3章章 数据的整理与显示数据的整理与显示A班班树茎树茎B班班数据个数数据个数树树 叶叶树叶树叶数据个数数据个数03592144044842975122456677789121197665332110601123468892398877766555554443332100700113449876655200812334566632220901145660100003(1)将两个班的考试成绩用一个公共的茎制成茎叶图;A A班考试成绩的分布比较集中,且平均分数较高;B B班考试成绩的分布比A A班分散,且平均成绩较A A班低。第23页/共85页第第3 3章章 数据的整理与显示数据的整理与显示 3.15 19973.15 1997年我国几个主要城市各月份的平均相对湿度数据见习题3.153.15。试绘制箱线图,并分析各城市平均相对湿度的分布特征。35455565758595北京 长春 南京 郑州 武汉 广州 成都 昆明 兰州 西安第24页/共85页第第1 1章章 导论导论 1.1 指出下面的数据类型:数值型数据(1)年龄;(2)性别;(3)汽车产量;(4)员工对企业某项改革措施的态度(赞成、中立、反对);(5)购买商品时的支付方式(现金、信用卡、支票)。分类数据数值型数据分类数据顺序数据第25页/共85页第第1 1章章 导论导论 1.2 某研究部门准备抽取2000个职工家庭推断该城市所有职工家庭的年人均收入。(1)描述总体和样本;要求:(2)指出参数和统计量。总体是“该城市所有的职工家庭”,样本是“抽取的20002000个职工家庭”参数是城市所有职工家庭的年人均收入,统计量是抽取的20002000个职工家庭计算出的年人均收入。第26页/共85页第第1 1章章 导论导论 1.3 一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60回答他们的月收入在5000元以上,50的人回答他们的消费支付方式是用行用卡。要求:(1)这一研究的总体是什么?(2)月收入是分类变量、顺序变量还是数值型变量?(3)消费支付方式是分类变量、顺序变量还是数值型变量?(4)这一研究涉及截面数据还是时间序列数据?总体是所有IT从业者顺序变量,根据题意,应是在问卷中提出了您的月收入符合下列哪一项?的选择题 分类变量截面数据第27页/共85页第第1 1章章 导论导论1.4 一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。要求:总体是所有网上购物者(1)这一研究的总体是什么?(3)研究者所关心的参数是什么?(4)“消费者每月在网上的平均花费是200元”是参数还是统计量?(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值型变量?(5)研究者所使用的主要是描述统计还是推断统计方法?分类变量所有网上购物者的月平均花费统计量推断统计方法第28页/共85页每每个个瓶瓶子子的的灌灌装装量量调调节节一一个个装装瓶瓶机机使使其其对对【习6.1】解:解:瓶瓶机机对对每每个个瓶瓶子子的的盎盎司司,通通过过观观察察这这台台装装均均值值为为抽抽取取盎盎司司的的正正态态分分布布。随随机机灌灌装装量量服服从从标标准准差差0 . 1并并测测定定每每个个个个瓶瓶子子形形成成一一个个样样本本,由由这这台台机机器器灌灌装装的的 9不不超超过过样样本本均均值值偏偏离离总总体体均均值值瓶瓶子子的的灌灌装装量量。试试确确定定盎盎司司的的概概率率有有多多大大?3 . 0由由题题意意知知,)(2nNX,)91(,故故NX)3 . 0(XP)3/13 . 03/13/13 . 0(XP)9 . 0()9 . 0(ZPZP1)9 . 0(2ZP6318. 018159. 02第29页/共85页盎盎司司的的偏偏差差在在与与中中,如如果果希希望望在在习习题题3 . 01Y【习6.2】解:解:?,应应当当抽抽取取多多大大的的样样本本之之内内的的概概率率达达到到95. 0由由题题意意知知,)(2nNY,)1(nNY,故故95. 0)3 . 0(YP95. 01)3 . 0(2nZP即即:95. 0)/13 . 0/1(nnYP975. 0)3 . 0(nZP,由由96. 1975. 0Z,故故96. 13 . 0n68.42n即即的的样样本本。为为所所以以应应当当抽抽取取容容量量至至少少43第30页/共85页随随机机表表示示从从标标准准正正态态总总体体中中,621ZZZ【习6.3】解:解:,使使得得数数的的一一个个样样本本,试试确确定定常常抽抽取取的的容容量量bn6由由题题意意知知,95. 0)(2bZPi)6(22iZX,得得由由卡卡方方分分布布的的分分位位数数表表5916.1205. 0X5916.12b所所以以第31页/共85页的的灌灌装装量量中中,假假定定装装瓶瓶机机对对瓶瓶子子在在习习题题1【习6.4】解:解:计计划划随随机机抽抽取取的的标标准准正正态态分分布布。假假定定服服从从方方差差12到到每每个个瓶瓶子子的的灌灌装装量量,得得个个瓶瓶子子组组成成样样本本,观观测测1021010s方方差差个个观观测测值值可可以以求求出出样样本本个个观观测测值值,用用这这使使得得有有,确确定定一一个个合合适适的的范范围围)(11(22YYnsi由由题题意意知知,) 1() 1(222nsn212bbs,求求落落入入其其中中是是有有用用的的,试试较较大大的的概概率率保保证证90. 0)(221bsbP使使得得,)9)9(9()9) 1(9(2212221bbPbsnbP第32页/共85页习题选讲 解解:【习题7.47.4】从总体中抽取一个n=100=100的简单随机样本,得到 =81=81,s=12s=12。要求:(1)(1)构建总体均值 的9090的置信区间;(2)(2)构建总体均值 的9595的置信区间;(3)(3)构建总体均值 的9999的置信区间。x974. 18110012645. 181) 1 (22/xzx352. 2811001296. 181)2(22/xzx096. 3811001258. 281)3(22/xzx第33页/共85页习题选讲 解解:【习题7.67.6】利用下面的信息,构建总体均值的置信区间。,已已知知总总体体服服从从正正态态分分布布,且且15500) 1 (n。,置置信信水水平平为为%958900 x,且且已已知知总总体体不不服服从从正正态态分分布布,35500)2(n。,置置信信水水平平为为%958900 x25389001550096. 189002/xzx解解:16689003550096. 189002/xzx第34页/共85页习题选讲 解解:,未未知知,总总体体不不服服从从正正态态分分布布,890035)3(xn。,置置信信水水平平为为%90500s,未未知知,总总体体不不服服从从正正态态分分布布,890035)4(xn。,置置信信水水平平为为%99500s139890035500645. 189002/xszx21889003550058. 289002/xszx解解:第35页/共85页习题选讲 解解:【习题7.117.11】某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100g100g。现从某天生产的一批产品中按重复抽样随机抽取5050包进行检查,测得每包重量(单位:g g)见Book7.11Book7.11。已知食品重量服从正态分布,要求:(1)(1)确定该种食品平均重量的95%95%的置信区间。(2)(2)如果规定食品重量低于100g100g属于不合格,确定该批食品合格率的95%95%的置信区间。63. 132.101sx,样样本本标标准准差差计计算算得得:45. 032.1015063. 196. 132.1012/xszx,计计算算得得:%90p%8%9050%)901 (%9096. 1%90)1 (2/nppzp第36页/共85页【习题7.207.20】顾客到银行办理业务时往往需要等待一些时间,而等待时间的长短与许多因素有关,比如,银行的业务员办理业务的速度,顾客等待排队的方式等等。为此,某银行准备采取两种排队方式进行试验,第一种排队方式是所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取了1010名顾客,他们在办理业务时所等待的时间(单位:minmin)见Book7.20Book7.20。习题选讲 第37页/共85页习题选讲 (1)(1)构建第一种排队方式等待时间标准差的9595的置信区间。(2)(2)构建第一种排队方式等待时间标准差的9595的置信区间。根据(1)(1)和(2)(2)的结果,你认为哪种排队方式更好?解解:8216. 115. 7222sx,:方方法法,7004. 2)9(0228.19)9(2975. 02025. 087. 033. 0133. 325. 12第第一一种种排排队队方方式式好好。,:计计算算得得,方方法法4767. 015. 7111sx第38页/共85页习题选讲 解解:的的置置信信区区间间。的的,求求设设95100) 1 (2121 nn【习题7.227.22】从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表: ,的的样样本本:来来自自总总体体16251211sx,的的样样本本:来来自自总总体体20232222sx2221212/21)(nsnszxx由由于于大大样样本本,100201001696. 1)2325(176. 12第39页/共85页习题选讲 解解:的的置置信信区区间间。的的,求求,设设9510)2(21222121 nn的的置置信信区区间间。的的,求求,设设9510)3(21222121 nn解解:21212/2111)2()(nnsnntxxp2) 1() 1(212222112nnsnsnsp222121212/21)2()(nsnsnntxx64. 4264. 42第40页/共85页习题选讲 解解:的的置置信信区区间间。的的,求求,设设952010)5(21222121nn的置信区间。的置信区间。的的,求,求,设设952010)4(21222121nn解解:21212/2111)2()(nnsnntxxp2) 1() 1(212222112nnsnsnsp2221212/21)()(nsnsvtxx,1)/(1)/(22222121212222121nnsnnsnsnsv9 . 3202. 42第41页/共85页习题选讲 解解:【习题7.247.24】一家人才测评机构对随机抽取的1010名小企业的经理人用两种方法进行自信心测试,得到的自信心测试分数见Book7.24Book7.24。构建两种方法平均自信心得分之差 的的置置信信区区间间。的的9521dnsntdd) 1(2/53. 611dsd,计计算算得得:1053. 66850. 21154. 511第42页/共85页习题选讲 解解:【习题7.257.25】从两个总体中各抽取一个n1 1= =n2 2=250=250的独立随机样本,来自总体1 1的样本比例为p1 1=40%=40%,来自总体2 2的样本比例为p2 2=30%=30%的的置置信信区区间间。的的构构造造要要求求:90) 1 (21的的置置信信区区间间。的的构构造造95)2(212221112/21)1 ()1 ()(1 (nppnppzpp%7%102221112/21)1 ()1 ()(2(nppnppzpp%3 . 8%10第43页/共85页习题选讲 解解:【习题7.267.26】生产工序的方差是工序质量的一个重要度量。当方差较大时,需要对工序进行改进以减小方差。两部机器生产的袋茶重量(单位:g g)的数据见Book7.26Book7.26。构造两个总体方差比 的的置置信信区区间间。的的95/22212/1222122212/2221/FssFss由由0058. 00584. 02221ss,计计算算得得,4058. 02020(4645. 22020(2/12/),),分分布布表表,查查FFF81.2409. 42221则则第44页/共85页习题选讲 解解:【习题7.167.16】一位银行的管理人员想估计每位顾客在该银行的月平均存款额。他假设所有顾客月存款额的标准差为10001000元,要求估计误差在200200元以内,置信水平为9999,应选取多大的样本?16741.1662001000)58. 2()(2222222Ezn所所以以,已已知知:58. 220010002zE第45页/共85页习题选讲 解解:【习题7.177.17】要估计总体比例 ,计算下列个体所需的样本容量。 。,置置信信水水平平为为,%9640. 002. 0) 1 (E。未未知知,置置信信水水平平为为,%9504. 0)2(E。,置置信信水水平平为为,%9055. 005. 0)3(E222/)1 ()() 1 (Ezn252202. 0)40. 01 (40. 005. 222222/)1 ()()2(Ezn60104. 05 . 05 . 096. 122222/)1 ()()3(Ezn26805. 0)55. 01 (55. 0645. 122第46页/共85页习题选讲 解解:【习题7.297.29】假定两个总体的标准差分别为: 1 11212, 2 21515 ,若要求误差范围不超过5 5,相应的置信水平为95%95%,假定n1 1= =n2 2,估计两个总体均值之差 1 12 2时所需的样本量为多大。2222122/21)()(Eznn575)1512(96. 12222第47页/共85页习题选讲 解解:【习题7.307.30】,相相应应的的,边边际际误误差差假假定定05. 021Enn时时之之差差,估估计计两两个个总总体体比比例例置置信信水水平平为为2195所所需需的的样样本本量量为为多多大大?2221122/21)1 ()1 ()(Eznn76905. 0)5 . 01 (5 . 0)5 . 01 (5 . 096. 122第48页/共85页习题选讲 解解:79. 0405) 1 (2x【习题7.17.1】从一个标准差为5 5的总体中采用重复抽样抽出一个样本量为4040的样本,样本均值为2525。(1)(1)样本均值的抽样标准差 等于多少?(2)(2)在9595的置信水平下,边际误差是多少?x55. 179. 096. 1)2(2/1xz边边际际误误差差为为:第49页/共85页【习题7.27.2】某快餐店想要估计每位顾客午餐的平均花费金额,在为期3 3周的时间里选取4949名顾客组成了一个简单随机样本。(1)(1)假定总体标准差为1515元,求样本均值的抽样标准误差。(2)(2)在9595的置信水平下,求边际误差。(3)(3)如果样本均值为120120元,求总体均值 的9595的置信区间。习题选讲 解解:14. 24915) 1 (2x19. 414. 296. 1)2(2/1xz边边际际误误差差为为:)19.12481.115(19. 4120)3(,第50页/共85页习题选讲 解解:【习题7.37.3】从一个总体中随机抽取n=100=100的随机样本,得到 =104560=104560,假定总体标准差8541485414,试构建总体均值 的9595的置信区间。x1008541496. 110456022/xzx16741104560)12130187819(,第51页/共85页习题选讲 解解:89. 025605 . 396. 125) 1 (2/xzx【习题7.57.5】利用下面的信息,构建总体均值的置信区间。,置置信信水水平平为为,%95605 . 325) 1 (nx。,置置信信水水平平为为,%987589.236 .119)2(nsx。,置置信信水水平平为为,%9032974. 0419. 3)3(nsx43. 66 .1197589.2333. 26 .119)2(2/xszx283. 0419. 332974. 0645. 1419. 3)3(2/xszx第52页/共85页习题选讲 解解:27. 03632. 3sx,计计算算得得:【习题7.77.7】某大学为了解学生每天上网的时间,在全校75007500名学生中采取不重复抽样方法随机抽取3636人,调查他们每天上网的时间,得到的数据见Book7.7Book7.7(单位:h h)。求该校大学生平均上网时间的置信区间,置信水平分别为90%90%、95%95%和99%99%。44. 032. 327. 0645. 132. 32/xszx53. 032. 327. 096. 132. 32/xszx70. 032. 327. 058. 232. 32/xszx第53页/共85页习题选讲 解解:【习题7.87.8】从一个正态总体中随机抽取样本量为8 8的样本,各样本值:1010,8 8,1212,1515,6 6,1313,5 5,1111求总体均值 的95%95%的置信区间。22. 110 xsx,标准误差计算得:第54页/共85页习题选讲 解解:【习题7.97.9】某居民小区为研究职工上班从家里到单位的距离,抽取了由1616个人组成的一个随机样本,他们到单位的距离(单位:kmkm)分别是:1010,3 3,1414,8 8,6 6,9 9,1212,1111,7 7,5 5,1010,1515,9 9,1616,1313,2 2。求职工上班从家里到单位平均距离的95%95%的置信区间。 03. 1375. 9xsx,标标准准误误差差计计算算得得:第55页/共85页习题选讲 解解:【习题7.107.10】从一批零件中随机抽取3636个,测得其平均长度为149.5cm149.5cm,标准差为1.93cm1.93cm。(1)(1)试确定该种零件平均长度95%95%的置信区间。(2)(2)在上面的估计中,你使用了统计中的哪一个重要定理?请简要解释这一定理。 93. 15 .149sx,样样本本标标准准差差已已知知:63. 05 .1493693. 196. 15 .1492/xszx第56页/共85页习题选讲 解解:【习题7.127.12】假设总体服从正态分布,利用Book7.12的数据构建总体均值的99%的置信区间 174. 0128.16xsx,样样本本标标准准误误差差计计算算得得:45. 0128.16174. 058. 2128.162/xszx第57页/共85页习题选讲 解解:【习题7.137.13】一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了1818名员工,得到他们每周加班的时间数据见Book7.13Book7.13(单位:h h)。假定员工每周加班的时间服从正态分布,估计网络公司员工平均每周加班时间的90%90%的置信区间。84. 156.13xsx,样样本本标标准准误误差差计计算算得得:2 . 356.1384. 17396. 156.132/xstx第58页/共85页习题选讲 解解:【习题7.147.14】利用下面的样本数据构建总体比例 的置信区间。,置置信信水水平平为为,%9951. 044) 1 (pn。,置置信信水水平平为为,%9582. 0300)2(pn。,置置信信水水平平为为,%9048. 01150)3(pn19. 051. 044)51. 01 (51. 058. 251. 0)1 (2/nppzp04. 082. 0300)82. 01 (82. 096. 182. 0)1 (2/nppzp02. 048. 01150)48. 01 (48. 0645. 148. 0)1 (2/nppzp第59页/共85页习题选讲 解解:【习题7.157.15】在一项家电市场调查中,随机抽取了200200个居民户,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占23%23%。求总体比例的置信区间,置信水平分别为90%90%和95%95%。,已已知知:%23p%6%23200%)231 (%2396. 1%23)1 (2/nppzp%5%23200%)231 (%23645. 1%23)1 (2/nppzp第60页/共85页【习题7.187.18】某居民小区共有居民500500户, ,小区管理者准备采取一项新的供水设施, ,想了解居民是否赞成。采取重复抽样方法随机抽取了5050户, ,其中有3232户赞成,18,18户反对。(1)(1)求总体中赞成该项改革的户数比例的置信区间,置信水平为95%95%。(2)(2)如果小区管理者预计赞成的比例能达到80%80%,估计的边际误差不超过1010. .应抽取多少户进行调查( ( =0.05)=0.05)?习题选讲 解解:,计计算算得得:%64p%13%64)1 (2/nppzp222/)1 ()()2(Ezn621 . 0)8 . 01 (8 . 096. 122第61页/共85页习题选讲 解解:【习题7.197.19】根据下面的样本结果,计算总体标准差 的9090的置信区间。 。,50221) 1 (nsx。,1502. 03 . 1)2(nsx。,2231167)3(nsx22/12222/2) 1() 1(snsn,93.33)49(34.66)49() 1 (295. 0205. 0403. 272. 1,5706. 6)14(6848.23)14()2(295. 0205. 0029. 0015. 0,5913.11)21(6706.32)21()3(295. 0205. 073.4185.24第62页/共85页习题选讲 解解:的的置置信信区区间间。的的求求90) 1 (21【习题7.217.21】未未知知和和差差已已知知两两个个正正态态总总体体的的方方2221,的的样样本本:来来自自总总体体8 .962 .531412111sxn取取两两个个独独立立。从从两两个个总总体体中中分分别别抽抽但但相相等等,即即2221值值和和方方差差如如下下表表:的的随随机机样样本本,它它们们的的均均,的的样样本本:来来自自总总体体0 .1024 .43722222sxn要要求求:44.9827140 .102) 17(8 .96) 114(2ps合合并并估估计计量量得得21212/2111)2()(nnsnntxxp第63页/共85页习题选讲 解解:的的置置信信区区间间。的的求求95)2(21的的置置信信区区间间。的的求求99)3(216 . 98 . 97114144.98093. 2)4 .432 .53(解解:2 .118 . 97114144.984334. 2)4 .432 .53(6 .148 . 97114144.981737. 3)4 .432 .53(第64页/共85页习题选讲 解解:【习题7.237.23】下表是由4 4对观察值组成的随机样本。用用得得出出的的差差值值计计算算各各对对观观察察值值之之差差,再再利利与与计计算算BA) 1 (dsd和和2121)2(dBA的的均均值值,构构造造与与分分别别为为总总体体和和设设的的置置信信区区间间。的的95nsntdd) 1()2(2/63. 275. 1) 1 (dsd,计计算算得得:463. 21765. 475. 149. 575. 1第65页/共85页习题选讲 解解:【习题7.277.27】根据以往的生产数据,某种产品的废品率为2%2%。如果要求95%95%的置信区间,若要求边际误差不超过4%4%,应抽取多大的样本?222/)1 ()(Ezn4804. 0)02. 01 (02. 096. 122第66页/共85页习题选讲 解解:【习题7.287.28】某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为120120元,现要求以95%95%的置信水平估计每个购物金额的置信区间,并要求边际误差不超过2020元,应抽取多少个顾客作为样本? 2222)(Ezn1392012096. 1222第67页/共85页习题选讲 解解:【习题8.18.1】已知某炼铁厂的含碳量服从正态分布N(4.55N(4.55,0.1080.1082 2) ),现在测定了9 9炉铁水,其平均含碳量为4.4844.484。如果估计方差没有变化,可否认为现在生产的铁水平均含碳量为4.554.55(0.05)0.05)55. 40:H,由由已已知知:108. 055. 4484. 490 xn55. 41:H83. 10nxZ构构造造96. 105. 02/Z,得得由由02/|HZZ受受,落落在在接接受受域域内内,故故接接由由第68页/共85页习题选讲 解解:【习题8.28.2】一种元件,要求其使用寿命不得低于700700小时。现从一批这种元件中随机抽取3636件,测得其平均寿命为680680小时。已知该元件寿命服从正态分布,6060小时,试在显著性水平0.050.05下确定这批元件是否合格。7000:H,由由已已知知:60700680360 xn7001:H20nxZ构构造造645. 105. 0Z,得得由由。绝绝,落落在在拒拒绝绝域域内内,故故拒拒由由0|HZZ第69页/共85页习题选讲 解解:【习题8.38.3】某地区小麦的一般生产水平为亩产250250公斤,其标准差为3030公斤。现用一种化肥进行试验,从2525个小区抽样,平均亩产为270270公斤。这种化肥是否使小麦明显增产( ( =0.05)=0.05)?2500:H,由由已已知知:30250270250 xn2501:H33. 30nxZ构构造造645. 105. 005. 0Z,得得由由。绝绝,落落在在拒拒绝绝域域内内,故故拒拒由由0|HZZ第70页/共85页习题选讲 解解:%50:H,由由已已知知:%1250650pn%51:H2711. 2)1 (000npZ构构造造645. 105. 005. 0z,得得由由。绝绝,落落在在拒拒绝绝域域内内,故故拒拒由由005. 0Hzz 【习题8.58.5】某种大量生产的袋装食品,按规定不得少于250250克。今从一批该食品中任意抽取5050袋,发现有6 6袋低于250250克。若规定不符合标准的比例超过5 5就不得出厂,问该批食品能否出厂 ( ( =0.05)=0.05)?第71页/共85页习题选讲 解解:,由由已已知知计计算算得得:6667.2875.31122121xxnn【习题8.108.10】装配一个部件时可以采用不同的方法,所关心的问题是哪一个方法的效率更高。劳动效率可以用平均装配时间反映。现从不同的装配方法中各抽取1212件产品,记录各自的装配时间( (单位:分钟) )如下:甲:31 34 29 32 35 38 34 30 29 32 31 2631 34 29 32 35 38 34 30 29 32 31 26乙:26 24 28 29 30 29 32 26 31 29 32 28 26 24 28 29 30 29 32 26 31 29 32 28 两总体为正态总体,且方差相同。问两种方法的装配时间有无显著不同 ( ( =0.05)=0.05)?00211210:,:HH0606. 62046.102221ss,第72页/共85页习题选讲 0739. 2)22(05. 0025. 0t,得得由由。绝绝,落落在在拒拒绝绝域域内内,故故拒拒由由0025. 0)22(Htt 1326. 82) 1() 1(212222112nnsnsnsp由由,6484. 211)()(2102121nnsxxtp构构造造第73页/共85页习题选讲 解解:,由由已已知知:0375. 097. 6802sxn7710:,:HH【习题8.148.14】某工厂制造螺栓,规定螺栓口径为7.0cm,7.0cm,方差为0.03cm.0.03cm.今从一批螺栓中抽取8080个测量其口径,得平均值为6.97cm6.97cm,方差为0.0375cm0.0375cm。假定螺栓口径为正态分布,问这批螺栓是否达到规定的要求( ( =0.05)?=0.05)?3856. 10nsxz构构造造,由由96. 105. 0025. 0z03. 003. 02120:,:HH75.98) 1(22snz构构造造。落在接受域内,故接受落在接受域内,故接受0H,由由3089.5605. 02025. 0.4729.10502975. 0H,接受,接受第74页/共85页习题选讲 解解:1000:H,由由已已知知:2122. 110098.9990sxn1001:H049. 00nsxt构构造造2622. 2)9(05. 0025. 0t,得得由由。受受,落落在在接接受受域域内内,故故接接由由0025. 0)9(|Htt 【习题8.48.4】糖厂用自动打包机,每包标准重量是100100千克。每天开工后需要检验一次打包机工作是否正常。某日开工后测得9 9包重量( (单位:千克) )如下:99.3 98.7 99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5100.5 101.2 98.3 99.7 99.5 102.1 100.5已知包重服从正态分布,试检验该日打包机工作是否正常 ( ( =0.05)=0.05)?第75页/共85页习题选讲 解解:250000:H,由由已已知知:50002500027000150sxn250001:H55. 10nsxt构构造造7531. 1)15(05. 005. 0t,得得由由。受受,落落在在接接受受域域内内,故故接接由由005. 0)15(|Htt 【习题8.68.6】某厂家在广告中声称,该厂生产的汽车轮胎在正常行驶条件下超过目前的平均水平2500025000公里。对一个由1515个轮胎组成的随机样本做了试验,得到样本均值和标准差分别为2700027000公里和50005000公里。假定轮胎寿命服从正态分布,问该厂家的广告是否真实 ( ( =0.05)=0.05)?第76页/共85页习题选讲 解解:2250:H,由由已已知知计计算算:73.982255 .241160sxn2251:H6685. 00nsxt构构造造7531. 1)15(05. 005. 0t,得得由由。受受,落落在在接接受受域域内内,故故接接由由005. 0)15(Htt 【习题8.78.7】某种电子元件的寿命x(x(单位:小时) )服从正态分布。现测得1616只元件寿命如下:159 280 101 159 280 101 212 224 379 179 264 222 362 168 250 212 224 379 179 264 222 362 168 250 149 260 485 170 149 260 485 170 问是否有理由认为元件的平均寿命显著地大于225225小时 ( ( =0.05)=0.05)?第77页/共85页习题选讲 解解:,由由已已知知计计算算:75.21592sn26.17) 1(2022sn构构造造5073.15)8(05. 0205. 0,得,得由由。绝绝,落落在在拒拒绝绝域域内内,故故拒拒由由0205. 02)8(H【习题8.88.8】随机抽取9 9个单位,测得结果分别为:85 59 66 81 35 57 55 63 66 85 59 66 81 35 57 55 63 66 以0.050.05的显著性水平对下述假设进行检验:1001002120:,:HH第78页/共85页习题选讲 解解:,由由已已知知:2263107081AAAxn【习题8.98.9】A A,B B两厂生产同样材料。已知其抗压强度个个取取厂生产的材料中随机抽厂生产的材料中随机抽。从。从,8157632222ABA生生产产的的材材料料中中随随机机,从从样样本本,测测得得BcmkgxA21070。根据以上调查。根据以上调查个样本,测得个样本,测得抽取抽取2102064cmkgxB?相相同同)05. 0(,2257102064BBBxn0010BABAHH:,:压压强强度度两两厂厂生生产产的的材材料料平平均均抗抗,结结果果,能能否否认认为为BA第79页/共85页习题选讲 0059. 5)()(220BBAABABAnnxxz构构造造96. 105. 0025. 0z,得得由由。绝绝,落在拒绝域内,故拒,落在拒绝域内,故拒由由0025. 0Hzz 第80页/共85页习题选讲 解解:,由由已已知知:451 .68144sxn606010:,:HH【习题8.128.12】 为了控制贷款规模,某商业银行有个内部要求,平均每项贷款数额不能超过6060万元. .随着经济的发展,贷款规模有增大的趋势。银行总经理想了解在同样项目条件下,贷款的平均规模是明显地超过6060万元,还是维持着原来的水平. .一个n=144=144的随机样本被抽出,测得 =68.1=68.1万元,s=45=45。用 =0.01=0.01的显著性水平,采用p p值进行检验。x16. 20nsxz构构造造0154. 09846. 0116. 2zPp。受受,落在接受域内,故接,落在接受域内,故接由由0Hp第81页/共85页习题选讲 解解:,由由计计算算:01718. 000945. 0110002121ppnn00211210:,:HH【习题8.138.13】有一种理论认为服用阿司匹林有助于减少心脏病的发生,为了进行验证,研究人员把自愿参与实验的2200022000人随机平均分成两组,一组人员每星期服用三次阿司匹林( (样本1)1),另一组人员在相同的时间服用安慰剂( (样本2)2),持续3 3年之后进行检测,样本1 1中有104104人患心脏病,样本2 2中有189189人患心脏病。以 =0.05=0.05的显著性水平检验服用阿司匹林是否可以降低心脏病发生率。002. 5)1 ()1 (0)(22211121nppnppppz构构造造。绝绝,落在拒绝域内,故拒,落在拒绝域内,故拒,由由005. 0645. 105. 0Hz第82页/共85页习题选讲 【习题8.158.15】有人说在大学中男生的学习成绩比女生的学习成绩好。现从一个学校中随机抽取了2525名男生和1616名女生,对他们进行了同样题目的测试。测试结果表明,男生的平均成绩为8282分,方差为5656分,女生的平均成绩为7878分,方差为4949分。假设显著性水平 =0.02=0.02,从上述数据中能得到什么结论?解解:,由由49781656822522222111sxnsxn00211210 xxHxxH:,:。拒绝拒绝,落在接受域内,
展开阅读全文