统计学习题集

上传人:优*** 文档编号:36142285 上传时间:2021-10-29 格式:DOC 页数:67 大小:937.50KB
返回 下载 相关 举报
统计学习题集_第1页
第1页 / 共67页
统计学习题集_第2页
第2页 / 共67页
统计学习题集_第3页
第3页 / 共67页
点击查看更多>>
资源描述
真诚为您提供优质参考资料,若有不当之处,请指正。第一章 导论【重点】了解统计的科学涵义,明确统计学的学科性质及基本研究方法,掌握统计数据的特点及其不同类型,牢固掌握统计学的基本概念。【难点】准确掌把数据不同类型,牢固掌握统计学的基本概念并结合实例分析。思考题1.1 什么是描述统计学、推断统计学?怎样理解描述统计学和推断统计学在探索事物数量规律性中的地位和作用?1.2 统计学发展史上有哪几个主要学派?1.3 “统计学”一词有哪几种含义?1.4 什么是统计学?怎样理解统计学与统计数据的关系?1.5 统计数据可分为哪几种类型?不同类型的数据各有什么特点?1.6 举例说明总体、样本、参数、统计量、变量这几个概念。练习题一、单项选择题1、指出下面的数据哪一个属于分类数据( )A、年龄 B、工资C、汽车产量 D、购买商品的支付方式(现金、信用卡、支票) / 672、指出下面的数据哪一个属于顺序数据( )A、年龄 B、工资C、汽车产量 D、员工对企业某项制度改革措施的态度(赞成、中立、反对)3、某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是( ) A、2000个家庭 B、200万个家庭C、2000个家庭的人均收入 D、200万个家庭的人均收入4、了解居民的消费支出情况,则( ) A、居民的消费支出情况是总体 B、所有居民是总体C、居民的消费支出情况是总体单位 D、所有居民是总体单位5、统计学研究的基本特点是( )A、从数量上认识总体单位的特征和规律B、从数量上认识总体的特征和规律C、从性质上认识总体单位的特征和规律D、从性质上认识总体的特征和规律6、一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。这里的“月收入”是( ) A、分类变量 B、顺序变量C、数值型变量 D、离散变量7、要反映我国工业企业的整体业绩水平,总体单位是( ) A、我国每一家工业企业 B、我国所有工业企业C、我国工业企业总数 D、我国工业企业的利润总额8、一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均消费是200元,他们选择在网上购物的主要原因是“价格便宜”。这里的参数是( ) A、1000个消费者 B、所有在网上购物的消费者C、所有在网上购物的消费者的平均消费额 D、1000个消费者的平均消费额9、一名统计学专业的学生为了完成其统计作业,在统计年鉴中找到的2006年城镇家庭的人均收入数据属于( ) A、分类数据 B、顺序数据C、截面数据 D、时间序列数据10、一家公司的人力资源部主管需要研究公司雇员的饮食习惯,改善公司餐厅的现状。他注意到,雇员要么从家里带饭,要么在公司餐厅就餐,要么在外面的餐馆就餐。他收集数据的方法属于( ) A、访问调查 B、邮寄调查C、个别深度访问 D、观察调查二、多项选择题1、 欲了解某地高等学校科研情况( )A、 该地所有高等学校所有的科研项目是总体B、 该地所有的高等学校是总体C、 该地所有高等学校的每一科研项目是总体单位D、 该地每一所高等学校是总体单位E、 该地所有高等学校的所有科研人员是总体2、下表是财富杂志提供的按销售额和利润排列的500强公司的一个样本数据:公司名称销售额(百万美元)利润额(百万美元)行业代码Banc One102721427.08CPC Intl.9844580.019Tyson Foods645487.019. .Woolworth8092168.748在这个例子中( )A、总体是500强公司,总体单位是表中所列的公司B、总体是500强公司,总体单位是其中每一家公司C、总体是500强公司,样本是表中所列的公司D、总体是500强公司,样本是表中所列公司的销售额和利润额E、总体是表中所有的公司,总体单位是表中每一家公司3、一家具制造商购买大批木材,木材不干会影响家具的尺寸和形状。家具制造商从每批货中随机抽取5块木材检验湿度,如果其中任何一块木材的湿度超过标准,就把整批货退回。这个问题中( )A、样本是从所有木材批次中随机抽取的部分批次木材B、样本是从每批木材中随机抽取的5块木材C、总体单位是从所有木材批次中随机抽取的部分批次木材D、总体单位是购买的每一块木材E、总体是购买的全部木材三、判断分析题(判断正误,并简要说明理由)统计运用大量观察法必须对所有的总体单位进行观察。( )四、简答题1、报纸上报道一项民意调查的结果说:“43%的美国人对总统的整体表现感到满意。”报道最后写到:“这份调查是根据电话访问1210位成人所得,访问对象遍布美国各地。”这个调查的总体是什么?总体单位是什么?样本是什么?2、一个公司正致力于测试一种新的电视广告的效果。作为测试的一部分,广告在某市的当地新闻节目中下午6:30播出。两天以后,一市场调查公司进行了电话采访以获取记忆率信息(观众记得看过广告的百分比)和对广告的印象。这一研究的总体是什么?总体单位是什么?样本是什么?这种情况下为什么使用样本?简要解释原因。答案:一、D,D,C,B,B;C,A,C,C,D。二、BD,BC,BDE。三、,统计运用大量观察法的目的是消除个别事物的差异,显现想象总体的数量特征。只要部分单位对总体有代表性,只要对足够多的总体单位进行观察,也能达到这个目的。四、1、答:总体是电视台覆盖范围内的所有成年观众;总体单位是电视台覆盖范围内的每一位成年观众;样本是受到电话采访的所有成年观众。 2、答:总体是所有在6:30看到广告的观众;总体单位是每一位在6:30看到广告的观众;样本是受到电话采访的观众。第二章 数据的搜集【重点】 了解统计数据的不同渠道来源,掌握调查方案设计要领,学会调查问卷的设计,掌握抽样调查的特点及其基本的 组织方式和方法。【难点】调查问卷的设计及应用。思考题2.1 数据的来源有哪几种渠道? 2.2 常用的统计调查方式有哪些?2.3 普查、抽样调查、重点调查和典型调查有何区别?2.4 简述普查和抽样调查的特点。2.5 调查方案包括哪几个方面的内容?2.6 什么是问卷?它由哪几个部分组成?练习题一、单项选择题1、从含有N个元素的总体中抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为( )A、简单随机抽样 B、分层抽样 C、系统抽样 D、整群抽样2、为了调查某校学生的购书费用支出,从全校抽取4个班级的学生进行调查,这种调查方法是( )A、简单随机抽样 B、分层抽样 C、系统抽样 D、整群抽样3、为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名进行调查,这种调查方式是( )A、简单随机抽样 B、分层抽样 C、系统抽样 D、整群抽样4、在一项调查中,调查单位和填报单位( )A、无区别,是一致的 B、有区别,是不一致的C、无区别,是人为确定的 D、有区别,但有时是一致的5、对家用电器的平均寿命进行调查,应该采用( )A、普查 B、重点调查 C、典型调查 D、抽样调查二、多项选择题1、下列属于原始数据的是( )A、统计部门掌握的数据 B、说明总体单位特征的数据C、说明总体特征的数据 D、还没有经过分组汇总的数据E、直接向调查单位登记得到的数据2、统计调查方案的内容包括有( )A、确定调查目的 B、确定调查对象、调查单位和报告单位C、确定调查项目和调查表 D、确定调查方法和调查时间E、确定调查人员、经费等3、重点调查的“重点”单位指( )A、在国民经济中作用重要的单位 B、标志值在总体标志总量中所占比重比较大的单位C、全部单位中的一小部分单位D、在国民经济中地位显赫的单位E、能反映总体基本情况的单位三、简答题1、抽样调查与重点调查、典型调查有哪些主要区别?2、进行产品质量调查和市场占有率调查,你认为采用什么调查方法最合适?简要说明理由。3、简述普查和抽样调查的特点。答案:一、A,D,C,D,D。二、BDE,ABCDE,BCE。三、1、答:选取调查单位的方式不同;调查的目的和作用不同;对代表性误差的处理不同。 2、答:抽样调查,理由略。 3、答:(1)普查:周期性;数据准确;规定统一时间;范围比较窄等; (2)抽样调查:经济性;时效性强;适应面广;准确性高等等。第三章 数据的整理与显示【重点】了数据整理的全过程,掌握分组方法及变量数列编制的原则,灵活设计统计表和统计图。【难点】针对不同类型的数据进行图、表的设计,区分不同图、表的应用。思考题3.1 分类数据和顺序数据的整理和图示方法各有哪些?3.2 数值型数据的分组方法有哪些?简述组距分组的步骤。3.3 直方图与条形图有何区别?3.4 茎叶图与直方图相比有什么优点?3.5 统计表由哪几个主要部分组成?练习题一、单项选择题1、在累计次数分布中,某组的向下累计次数表明( )A、大于该组上限的次数是多少 B、大于该组下限的次数是多少C、小于该组上限的次数是多少 D、小于该组下限的次数是多少2、数据筛选的主要目的是( )A、发现数据的错误 B、对数据进行排序C、找出所需要的某类数据 D、纠正数据中的错误3、样本或总体中各不同类别数值之间的比值称为( )A、频率 B、频数 C、比例 D、比率4、将比例乘以100得到的数值称为( )A、频率 B、频数 C、比例 D、比率5、下面的哪一个图形最适合描述结构性问题( )A、条形图 B、饼图 C、雷达图 D、直方图6、下面的哪一个图形适合比较研究两个或多个总体或结构性问题( )A、环形图 B、饼图 C、直方图 D、茎叶图7、将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组,这样的分组方法称为( )A、单变量值分组 B、组距分组 C、等距分组 D、连续分组8、下面的哪一个图形最适合描述大批量数据分布的图形( )A、条形图 B、茎叶图 C、直方图 D、饼图9、由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的,反映原始数据分布的图形,称为( )A、环形图 B、茎叶图 C、直方图 D、箱线图10、10家公司的月销售额数据(万元)分别为72,63,54,54,29,26,25,23,23,20。下面哪种图形不宜用于描述这些数据( )A、茎叶图 B、散点图 C、条形图 D、饼图二、多项选择题1、下列属于定性变量的有( )A、职业 B、居住区域 C、体重 D、身高 E、汽车产量2、下面的数列属于( )身高(厘米)人数比重(%)1501554020155160100501601656030合计200100A、变量数列 B、品质数列 C、等距数列 D、异距数列 E、闭口数列三、简答题1、数值型数据的分组方法有哪些?2、直方图与条形图有何区别?3、茎叶图与直方图相比有什么优点?四、应用题1、下面是一个班50个学生的经济学考试成绩:88569179699088718279988534744810075956092836465699964457663696874948167818453912484628183698429667594(1)对这50名学生的经济学考试成绩进行分组并将其整理成频数分布表,绘制直方图。(2)用茎叶图将原始数据表现出来。2、下表中的数据为2001年全国研究生入学考试报考某专业的12名考生的5门课程的成绩。考生编号123456789101112英语664439585234747151416451政治696658566840736562485864专业课154252036214824228353919专业课2906285816454737868668075专业课3815645627063768665217473对英语和政治两门课程做直方图。答案:一、B,C,D,B,B;A,B,C,D,B。二、AB,ACE。三、1、答:主要有单变量值分组,这种分组方法通常只适合于离散变量,且在变量值较少的情况下使用;在连续变量或变量值较多的情况下,通常采用组距分组,它是将全部变量值依次划分成若干个区间,并将这一区间的变量作为一组。 2、答:(1)条形图用条形的长度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数多少,矩形高度表示每一组的频数或频率,宽度表示各组组距,宽度和高度均有意义。(2)直方图的各矩形通常是连续排列;条形图则是分开排列。(3)条形图主要用于分类数据;直方图主要用于数值型数据。 3、答:茎叶图是由“茎”“叶”两部分组成、反映原始数据分布的图形,其图形是由数字组成。通过茎叶图,可以看数据的分布形状及数据的离散状况,与直方图相比,茎叶图既能给出数据的分布状况,又能给出一个原始数据,即保留了原始数据的信息,而直方图不能给出原始数值。四、1、解:(1)组距频数百分比(%)累积百分比(%)203024.004.00304012.006.00405024.0010.00506024.0014.0060701326.0040.007080816.0056.0080901224.0080.0090100918.0098.0010012.00100.00合计501 (2) 茎叶频数占总数的比重24924.00%3412.00%45824.00%53624.00%602344567899991326.00%714455699816.00%81112334445881224.00%9011244589918.00%10012.00%合计501.002、解: 第四章 数据分布特征的测度【重点】掌握各类统计指标的计算方法和应用原则,并进行初步的分析。【难点】结合实例准确进行集中趋势和离散程度的测度及分析。思考题4.1 偏度和峰度是描述频数分布的哪些特征的方法?4.2 一组数据的分布特征可以从哪几个方面进行侧度?4.3 简述众数、中位数和均值的特点及应用场合。4.4 简述异众比率、四分位差、方差或标准差的适用场合。4.5 标准分数有哪些用途?4.6 为什么要计算离散系数?练习题一、单项选择题1、一组数据排序后处于25%和75%位置上的值称为( )A、众数 B、中位数 C、四分位数 D、均值2、如果一个数据的标准分数是2,表明该数据( )A、比平均数高出2个标准差 B、比平均数低2个标准差C、等于2倍的平均数 D、等于2倍的标准差3、经验法则表明,当一组数据对称分布时,在均值加减1个标准差的范围内大约有( )A、68%的数据 B、95%的数据 C、99%的数据 D、100%的数据4、离散系数的主要用途是( )A、反映一组数据的离散程度 B、反映一组数据的平均水平C、比较多组数据的离散程度 D、比较多组数据的平均水平5、离散系数( )A、只能消除一组数据的水平对标准差的影响 B、只能消除一组数据的计量单位对标准差的影响C、可以同时消除数据的水平和计量单位对标准差的影响 D、可以准确反映一组数据的离散程度6、峰态通常是与标准正态分布相比较而言的,如果一组数据服从标准正态分布,则峰态系数的值( )A、等于0 B、大于0 C、小于0 D、等于17、如果峰态系数K0,表明该组数据是( )A、尖峰分布 B、扁平分布 C、左偏分布 D、右偏分布8、某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。在上面的描述中,众数是( )A、1200 B、经济管理学院 C、200 D、理学院9、某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。描述该组数据的集中趋势宜采用( )A、众数 B、中位数 C、四分位数 D、均值10、某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户,描述该组数据的集中趋势宜采用( )A、众数 B、中位数 C、四分位数 D、均值11、对于分类数据,测度其离散程度使用的统计量主要是( )A、众数 B、异众比率 C、标准差 D、均值12、甲、乙两组工人的平均日产量分别为18件和15件。若甲、乙两组工人的平均日产量不变,但是甲组工人数占两组工人总数的比重下降,则两组工人总平均日产量( )A、上升 B、下降 C、不变 D、可能上升,也可能下降13、权数对平均数的影响作用取决于( )A、各组标志值的大小 B、各组的次数多少C、各组次数在总体单位总量中的比重 D、总体单位总量14、当各个变量值的频数相等时,该变量的( )A、众数不存在 B、众数等于均值C、众数等于中位数 D、众数等于最大的数据值15、有8名研究生的年龄分别为21,24,28,22,26,24,22,20岁,则他们的年龄中位数为( )A、24 B、23 C、22 D、2116、下列数列平均数都是50,在平均数附近散布程度最小的数列是( )A、0 20 40 50 60 80 100B、0 48 49 50 51 52 100C、0 1 2 50 98 99 100D、0 47 49 50 51 53 10017、下列各项中,应采用加权算术平均法计算的有( )A、已知计划完成百分比和实际产值,求平均计划完成百分比B、已知计划完成百分比和计划产值,求平均计划完成百分比C、已知各企业劳动生产率和各企业产值,求平均劳动生产率D、已知生产同一产品的各企业产品单位成本和总成本,求平均单位成本18、如果你的业务是提供足球运动鞋的号码,那么,哪一种平均指标对你更有用?( )A、算术平均数 B、几何平均数 C、中位数 D、众数19、假定某人5个月的收入分别是1800元,1840元,1840元,1840元,1840元,8800元,反映其月收入一般水平应该采用( )A、算术平均数 B、几何平均数 C、众数 D、调和平均数20、某组数据分布的偏度系数为正时,该数据的众数、中位数、均值的大小关系是( )A、众数中位数均值 B、均值中位数众数 C、中位数众数均值 D、中位数均值众数二、多项选择题1、变量数列中,各组变量值与频数的关系是( )A、各组变量值作用的大小由各组频数的多少反映B、各组变量值作用的大小由各组变量值的大小反映C、频数越大的变量值对总体一般水平的影响也越大D、频数越大的变量值对总体一般水平的影响越小E、频数越大,变量值也越大2、应该用加权算术平均法计算平均数的有( )A、已知各组职工工资水平和各组职工人数,求平均工资B、已知各组职工工资水平和各组工资总额,求平均工资C、已知各组计划完成百分数和各组计划产值,求平均计划完成百分数D、已知各组计划完成百分数和各组实际产值,求平均计划完成百分数E、已知各组职工的劳动生产率和各组职工人数,求平均劳动生产率3、下列应该用几何平均法计算的有( )A、生产同种产品的三个车间的平均合格率 B、平均发展速度C、前后工序的三个车间的平均合格率 D、平均劳动生产率E、以复利支付利息的年平均利率4、下列说法那些是正确的?( )A、应该用均值来分析和描述地区间工资水平B、宜用众数来描述流行的服装颜色 C、考试成绩中位数的含义是有一半考生的成绩超过此数D、在数据组高度偏态时,宜用中位数而不是用众数来作为平均数E、一般常用算术平均法来计算年平均增长率三、填空题1、某班的经济学成绩如下表所示:435556565960676973757777787980818283838384868788888990909597 该班经济学成绩的平均数为 ,众数为 ,中位数为 ,上四分位数为 ,下四分位数为 ,四分位差为 ,离散系数为 。从成绩分布上看,它属于 ,你觉得用 描述它的集中趋势比较好,理由 。2、在某一城市所做的一项抽样调查中发现,在所抽取的1000个家庭中,人均月收入在200300元的家庭占24%,人均月收入在300400元的家庭占26%,在400500元的家庭占29%,在500600元的家庭占10%,在600700元的家庭占7%,在700元以上的占4%。从此数据分布状况可以判断: (1)该城市收入数据分布形状属 (左偏还是右偏)。 (2)你觉得用均值、中位数、众数中的 ,来描述该城市人均收入状况较好。理由是 。 (3)从收入分布的形状上判断,我们可以得出中位数和均值中 数值较大。上四分位数所在区间为 ,下四分位数所在区间为 。四、判断分析题(判断正误,并简要说明理由)1、 并非任意一个变量数列都可以计算其算术平均数、中位数和众数。( )2、 某企业某年各季度销售额和利润资料如下:季度1234销售额(百万元)利润率(%)15030180322003521036则该年各季度平均利润率为(30%+32%+35%+36%)/4=33.25%。( )3、某企业计划劳动生产率比上年提高10%,实际只提高了5%,表明劳动生产率计划只完成了一半。( )4、若数据组的均值是450,则所有的观察值都在450周围。( )五、简答题1、简述众数、中位数和均值特点及应用场合。2、某公司下属两个企业生产同一种产品,其产量和成本资料如下:基期报告期单位成本(元)产量(吨)单位成本(元)产量(吨)甲企业乙企业6007001200180060070024001600合计6603006404000试问:报告期与基期相比,该公司下属各企业单位成本都没有变化,但该公司总平均成本却下降了20元,这是为什么?3、一项民意测验询问了2050个成年人,“你对今天的生活状况满意程度如何?”回答分类为满意、不满意和说不清。(1)这一调查的样本规模有多大?(2)回答的答案是属于品质型还是数量型?(3)使用平均数或百分比作为对这一问题的数据的汇总,哪一个更有意义?(4)回答中,8%的人说他们对今天的生活状况不满意,作出这种回答的人是多少?六、计算题1、下表中的数据反映的是1992年到2001年我国职工工资和居民消费价格增长指数:年份1992199319941995199619971998199920002001职工工资增长指数(%)118.5124.8135.4121.7112.1103.6100.2106.2107.9111.0居民消费价格指数(%)106.4114.7124.1117.1108.3102.899.298.6100.4100.7 试根据上表数据比较我国1992年到2001年间职工工资平均增长指数与平均居民消费价格指数的大小。2、下面是甲地区空气质量指数(050表示良好,50100表示适中)的一组数据:28,42,58,48,45,55,60,49,50。(1)计算全距、方差和标准差;(2)已知同期观察到的乙地区空气质量指数的平均数为48.5,标准差为11.66,试对两地区的空气质量作出比较。3、 某一牧场主每年饲养600头牛。现在有人向他推荐一种个头较小的改良品种牛,每头牛吃草量较少,这样在原来同样面积的牧场上可以多养150头牛。饲养原品种牛和改良品种牛的利润如下:净利润(元/头)原品种牛改良品种牛频数频率(%)频率(%)20036610122220018531574003676140合计600100100 (1)牧场主应该选择哪一种品种?为什么? (2)改良品种牛的利润和频率可能与上表的计算值有差异。当饲养改良品种牛的利润有什么变化时,牧场主会改变他在(1)中所做的选择?答案:一、C,B,A,C,C;A,A,B,A,B;B,B,C,A,B;B,B,D,C,B二、AC,ACE,BCE,ABCD。三、1、77,83,80.5,68.5,87.25,18.75,0.173。左偏,中位数,是数据分布明显左偏又是顺序数据。2、(1)右偏;(2)中位数,数据分布明显右偏,频数较多的几个组家庭百分比相差不大;(3)均值,300400,400500。四、1、,任意一个变量数列都可以计算算术平均数和中位数,但众数的计算和应用则是又条件的,对于呈均匀分布、U形分布或J形分布的数列,众数就不存在或没有意义,此外对于总体单位数不多的情况,众数也缺乏代表性。 2、,应为=33.54%。 3、,劳动生产率计划完成程度为=95.45%。 4、,均值是一组数列的集中趋势,所有的观察值以450为中心,有的比它大,有的比它小。五、1、答:众数是一组数据中出现最多的变量值,是位置代表值,不受极端值的影响,适合于作为分类数据的集中趋势测度值;中位数是一组数据经过排序后,处于中间位置的变量值,是位置代表值,不受极端值的影响,适合于作为顺序数据的集中趋势测度值;均值是一组数据相加后除以数据个数而得到的结果,利用了全部数据信息,主要适用于数值型数据,当数据呈对称分布或接近对称分布时,应选择均值作为集中趋势代表值,但易受极端值的影响,对于偏态分布数据,考虑选择众数或中位数等位置代表值。 2、答:虽然两个组平均数即两个企业的平均成本不变,但由于两个企业产量占公司总产量的比重(权数)发生了变化,所以总平均数就会变化。由于单位成本较低的甲企业的产量所占比重上升而单位成本较高的乙企业产量比重相应相应下降,这种变化必然导致总平均数下降。 3、答:(1)2050;(2)品质型;(3)百分比;(4)164。六、1、解:根据几何平均数公式计算职工工资平均增长指数和平均消费价格指数为: =1.137 =1.069可以看出,因此1992年到2001年间职工工资平均增长速度快于居民消费价格的平均增长速度。2、解:(1)R=32;=48.333;2=82.444;=9.0799; (2)V甲=0.188,V乙=0.24。可见两地区空气质量指数的平均水平很接近,甲地区微微优于乙地区;而从标准差或标准差系数来看,甲地区空气质量状况更稳定。总的来说,甲地区空气质量状况较好。 3、解:(1)原品种=294元 改良品种=272元; 原品种牛的利润总额=294600=176400元; 改良品种牛的利润总额=272750=204000元; 所以应该选择改良品种牛。 (2)若改良品种牛的平均利润少于235.2(176400750)元时,牧场主会选择原品种牛。第五章 概率与概率分布【重点】掌握离散型概率分布和连续型概率分布。【难点】区分不同类型随机变量的概率分布。思考题5.1 全概率公式和逆概率公式分别用于什么场合?5.2 基本事件与复合事件。5.3 概率的分配(计算)方法。5.4 常用的离散、连续变量的概率分布。练习题一、单项选择题1、根据概率的统计定义,可用以近似代替某一事件的概率的是( )。A、大量重复试验中该随机事件出现的次数占试验总次数的比重B、该随机事件包含的基本事件数占样本空间中基本事件总数的比重C、大量重复随机试验中该随机事件出现的次数D、专家估计该随机事件出现的可能性大小2、下列事件中不属于严格意义上的随机事件的是( )。A、从一大批合格率为90的产品中任意抽出的一件产品是不合格品B、从一大批合格率为90的产品中任意抽出的20件产品都是不合格品C、从一大批优质品率为15的产品中任意抽出的20件产品都是优质品D、从一大批合格率为100的产品中任意抽出的一件产品是合格品3、假设A、B为两个互斥事件,则下列关系中,不一定正确的是( )。A、P(A+B)=P(A)+P(B) B、P(A)=1P(B)C、P(AB)=0 D、P(A|B)=04、同时抛3枚质地均匀的硬币,巧合有2枚正面向上的概率为( )。A、0.125 B、0.25 C、0.375 D、0.55、下列由中心极限定理得到的有关结论中,正确的是( )。A、只有当总体服从正态分布时,样本均值才会趋于正态分布B、只要样本容量n充分大,随机事件出现的频率就等于其概率C、无论样本容量n如何,二项分布概率都可以用正态分布近似计算D、不论总体服从何种分布,只要样本容量n充分大,样本均值趋于正态分布二、多项选择题1、下列关于随机变量的数学期望的表述中正确的是( )。A、它又称为随机变量的均值B、它表示该随机变量所有可能取值的平均水平C、它度量的是随机变量的离中趋势D、任一随机变量都存在一个有限的数学期望E、它与加权算术平均数的不同之一是它以概率或分布密度为权数2、下列关于几种概率分布之间的关系的陈述中,正确的有( ):A、二点分布(01分布)是二项分布的特例B、当n很大而p又很小时,二项分布可用参数np的泊松分布近似C、当N很大而M / N很小是,超几何分布趋于二项分布D、当n30时,不管p大小,二项分布的概率都可用正态分布来近似计算E、当n无限增大时,二项分布趋近于正态分布三、判断分析题(判断正误,并简要说明理由)1、频率的极限是概率。2、若某种彩票中奖的概率为5,那么随机购买1000注彩票将有5注中奖。四、简答题1、全概率公式与逆概率公式分布用于什么场合?五、计算题1、某厂生产的某种节能灯管的使用寿命服从正态分布,对某批产品测试的结果,平均使用寿命为1050小时,标准差为200小时。试求:(1)使用寿命在500小时以下的灯管占多大比例?(2)使用寿命在8501450小时的灯管占多大比例?(3)以均值为中心,95%的灯管的使用寿命在什么范围内?答案:一、A,D,B,C,D;二、ABE; ABCE三、1、错误。当观察次数n很大时,随机事件发生的频率的稳定值就是概率,频率可作为概率的近似值。但是并不能认为概率就是频率的极限。因为当n很大时,频率稳定地在概率附近摆到,二者出现显著偏差的可能性极小,但并不意味着二者的偏差肯定越来越小。2、错误。中奖的概率为5,意味着在试验次数非常多的情况下,平均每1000注彩票大约有5注会中奖。并不意味着每1000注彩票必然有5注中奖。四、1、全概率公式:某一事件B的发生有各种可能的原因Ai(i1,2,n),每一Ai都可能导致B发生,求B发生的概率。 逆概率公式:在事件B已发生的条件下,寻找导致A发生的每个原因Ai的概率。五、1、(1)PX500=()=(-2.75)=1-(2.75)=1-0.99702=0.00298(2)P850X1450=()- ()=(2)- (-1)=0.977250.15865=0.8186(2) 由标准正态函数分布表可知,P|Z|1.96=0.95,即有:P|Z|1.96= P|X-1050|392=0.95所以95%的灯管的使用寿命在均值左右392小时(6581442小时)的范围内。第六章 抽样与参数估计【重点】深刻理解抽样分布的概念及中心极限定理的意义,灵活掌握均值和比例的区间估计方法的应用。【难点】在不同条件下的区间估计。思考题6.1 什么是抽样误差?影响抽样误差的主要因素有哪些?6.2 确定必要的抽样数目(样本容量)有何意义?必要抽样数目受哪些因素影响?6.3 什么叫统计量?什么是参数?评价统计量优劣有哪些标准?6.4 分层抽样与整群抽样的分组作用及方法各是什么?6.5 解释抽样推断的含义。6.6 解释简单随机抽样、分层抽样、系统抽样和整群抽样的含义。6.7 什么是抽样分布?6.8 样本统计量的分布与总体分布的关系是什么?6.9 样本均值抽样分布的两个主要特征值是什么? 它们与总体参数有什么关系?练习题一、单项选择题1、某品牌袋装糖果重量的标准是(5005)克。为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。下列说法中错误的是( )A、样本容量为10 B、抽样误差为2 C、样本平均每袋重量是估计量 D、498是估计值2、设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都服从或近似服从趋近于( )A、N(100,25) B、N(100,5/) C、N(100/n,25) D、N(100,25/n)3、在其他条件不变的情况下,要使置信区间的宽度缩小一半,样本量应增加( )A、一半 B、一倍 C、三倍 D、四倍4、在其他条件不变时,置信度(1)越大,则区间估计的( )A、误差范围越大 B、精确度越高 C、置信区间越小 D、可靠程度越低5、其他条件相同时,要使抽样误差减少1/4,样本量必须增加( )A、1/4 B、4倍 C、7/9 D、3倍6、在整群抽样中,影响抽样平均误差的一个重要因素是( )A、总方差 B、群内方差 C、群间方差 D、各群方差平均数7、在等比例分层抽样中,为了缩小抽样误差,在对总体进行分层时,应使( )尽可能小A、总体层数 B、层内方差 C、层间方差 D、总体方差8、一般说来,使样本单位在总体中分布最不均匀的抽样组织方式是( )A、简单随机抽样 B、分层抽样 C、等距抽样 D、整群抽样9、为了了解某地区职工的劳动强度和收入状况,并对该地区各行业职工的劳动强度和收入情况进行对比分析,有关部门需要进行一次抽样调查,应该采用( )A、分层抽样 B、简单随机抽样 C、等距抽样 D、整群抽样10、某企业最近几批产品的优质品率分别为88%,85%,91%,为了对下一批产品的优质品率进行抽样检验,确定必要的抽样数目时,P应选( )A、85% B、87.7% C、88% D、90%二、多项选择题1、影响抽样误差大小的因素有( )A、总体各单位标志值的差异程度 B、调查人员的素质C、样本各单位标志值的差异程度 D、抽样组织方式E、样本容量2、某批产品共计有4000件,为了了解这批产品的质量,从中随机抽取200件进行质量检验,发现其中有30件不合格。根据抽样结果进行推断,下列说法正确的有( )A、n=200 B、n=30 C、总体合格率是一个估计量 D、样本合格率是一个统计量 E、合格率的抽样平均误差为2.52%3、用样本成数来推断总体成数时,至少要满足下列哪些条件才能认为样本成数近似于正态分布( )A、np5 B、np5 C、n(1p)5 D、p1% E、n30三、填空题1、对某大学学生进行消费支出调查,采用抽样的方法获取资料。请列出四种常见的抽样方法: 、 、 、 ,当对全校学生的名单不好获得时,你认为 方法比较合适,理由是 。 四、简答题1、分层抽样与整群抽样有何异同?它们分别适合于什么场合?2、解释抽样推断的含义。五、计算题1、某糖果厂用自动包装机装糖,每包重量服从正态分布,某日开工后随机抽查10包的重量如下:494,495,503,506,492,493,498,507,502,490(单位:克)。对该日所生产的糖果,给定置信度为95%,试求: (1)平均每包重量的置信区间,若总体标准差为5克; (2)平均每包重量的置信区间,若总体标准差未知;();2、某广告公司为了估计某地区收看某一新电视节目的居民人数所占比例,要设计一个简单随机样本的抽样方案。该公司希望有90%的信心使所估计的比例只有2个百分点左右的误差。为了节约调查费用,样本将尽可能小,试问样本量应该为多大?3、为调查某单位每个家庭每天观看电视的平均时间是多长,从该单位随机抽取了16户,得样本均值为6.75小时,样本标准差为2.25小时。 (1)试对家庭每天平均看电视时间进行区间估计。 (2)若已知该市每个家庭看电视时间的标准差为2.5小时,此时若再进行区间估计,并且将边际误差控制在(1)的水平,问此时需要调查多少户才能满足要求?(=0.05)答案:一、B,D,C,A,C;C,B,D,A,A。二、ADE,ADE,BCE。三、简单随机抽样,分层抽样,等距抽样,整群抽样,分层抽样,不用调查单位的名单,以院系为单位,而且各院系的消费差异也大,不宜用整群抽样。四、1、答:都要事先按某一标志对总体进行划分的随机抽样。不同在于:分层抽样的划分标志与调查标志有关,而整群抽样不是;分层抽样在层内随机抽取一部分,而整群抽样对一部分群做全面调查。分层抽样用于层间差异大而层内差异小,以及为了满足分层次管理决策时;而整群抽样用于群间差异小而群内差异大时,或只有以群体为抽样单位的抽样框时。 2、答:简单说,就是用样本中的信息来推断总体的信息。总体的信息通常无法获得或者没有必要获得,这时我们就通过抽取总体中的一部分单位进行调查,利用调查的结果来推断总体的数量特征。五、1、解:n=10,小样本 (1)方差已知,由z/2得,(494.9,501.1) (2)方差未知,由t/2得,(493.63,502.37) 2、解:n=1691 3、解:(1)t/2=6.752.131=(5.55,7.95) (2)边际误差E= t/2=2.131=1.2 n=17第七章 假设检验【重点】深刻理解假设检验的逻辑思想,了解假设检验含义和具体方法。【难点】区分不同条件选择检验方法。思考题7.1 理解原假设与备择假设的含义,并归纳常见的几种建立原假设与备择假设的规则。7.2 检验统计量具备怎样的特征和用途?7.3 第一类错误和第二类错误分别是什么?它们发生的概率大小之间存在怎样的关系?7.4 简述假设检验的一般步骤。练习题一、单项选择题1、按设计标准,某自动食品包装及所包装食品的平均每袋中量应为500克。若要检验该机实际运行状况是否符合设计标准,应该采用( )。A、左侧检验 B、右侧检验C、双侧检验 D、左侧检验或右侧检验2、假设检验中,如果原假设为真,而根据样本所得到的检验结论是否定元假设,则可认为( )。A、抽样是不科学的 B、检验结论是正确的C、犯了第一类错误 D、犯了第二类错误3、当样本统计量的观察值未落入原假设的拒绝域时,表示( )。A、可以放心地接受原假设 B、没有充足的理由否定与原假设C、没有充足的理由否定备择假设 D、备择假设是错误的4、进行假设检验时,在其它条件不变的情况下,增加样本量,检验结论犯两类错误的概率会( )。A、都减少 B、都增大C、都不变 D、一个增大一个减小5、关于检验统计量,下列说法中错误的是( )。A、检验统计量是样本的函数 B、检验统计量包含未知总体参数C、在原假设成立的前提下,检验统计量的分布是明确可知的
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 大学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!