资源描述
数量方法(二)(代码00994)自学考试复习提纲第一章 数据的整理和描述基本知识点:一、 数据的分类:按照描述的事物分类:1 分类型数据:描述的是事物的品质特征,本质表现是文字形式;2 数量型数据:事物的数量特征,用数据形式表示;3 日期和时间型数据。按照被描述的对象与时间的关系分类:1 截面数据:事物在某一时刻的变化情况,即横向数据;2 时间序列数据:事物在一定的时间范围内的变化情况,即纵向数据;3 平行数据:是截面数据与时间序列数据的组合。二、 数据的整理和图表显示:1 组距分组法:1) 将数据按上升顺序排列,找出最大值max和最小值min;2) 确定组数,计算组距c;3) 计算每组的上、下限(分组界限)、组中值及数据落入各组的频数vi (个数)和频率(),形成频率分布表;4) 唱票记频数; 5) 算出组频率,组中值;6) 制表。2 饼形图:用来描述和表现各成分或某一成分占全部的百分比。注意:成分不要多于6个,多于6个一般是从中选出5个最重要的,把剩下的全部合并成为“其他”;成分份额总和必须是100;比例必须于扇形区域的面积比例一致。3 条形图:用来对各项信息进行比较。当各项信息的标识(名称)较长时,应当尽量采用条形图。4 柱形图:如果是时间序列数据,应该用横坐标表示时间,纵坐标表示数据大小,即应当使用柱形图,好处是可以直观的看出事物随时间变化的情况。5 折线图:明显表示趋势的图示方法。简单、容易理解,对于同一组数据具有唯一性。6 曲线图:许多事物不但自身逐渐变化,而且变化的速度也是逐渐变化的。具有更加自然的特点,但是不具有唯一性。7 散点图:用来表现两个变量之间的相互关系,以及数据变化的趋势。8 茎叶图:把数据分成茎与叶两个部分,既保留了原始数据,又直观的显示出了数据的分布。三、 数据集中趋势的度量:1 平均数:容易理解,易于计算;不偏不倚地对待每一个数据;是数据集地“重心”;缺点是它对极端值十分敏感。平均数2 中位数:将数据按从小到大顺序排列,处在中间位置的一个数或最中间的两个数的平均数。它的优点是它对极端值不像平均数那么敏感,因此,如果包含极端值的数据集来说,用中位数来描述集中趋势比用平均数更为恰当。3 众数:数据中出现次数最多的数。缺点是一个数据集可能没有众数,也可能众数不唯一;优点在于它反映了数据集中最常见的数值,而且它不仅对数量型数据(数据都是数值)有意义,它对分类型数据集也有意义;并且能够告诉我们最普遍、最流行的款式、尺寸、色彩等产品特征。4 分组数据的平均数(加权平均): ,为组数,vi为第i组频数,yi为第i组组中值。 5平均数,中位数和众数的关系:数据分布是对称分部时:众数=中位数=平均数数据分布不是对称分部时:左偏分布时:众数中位数平均数 右偏分布时:众数中位数平均数四、 数据离散趋势的度量:1 极差R最大值max最小值min2 四分位点:第二四分位点就是整个数据集的中位数;第一四分位点是整个数据按从小到大排列后第个(若不是整数,取左右两个的平均);第三四分位点是整个数据按从小到大排列后第个(若不是整数,取左右两个的平均)。四分位极差,它不像极差R那么容易受极端值的影响,但是仍然存在着没有充分地利用数据所有信息地缺点。3 方差:离平均数地集中位置地远近;是频数,是组中值,即数据的个数,即用分组数据计算的平均数。4 标准差:。变异系数:表示数据相对于其平均数的分散程度。基本运算方法:1、一组数据3,4,5,5,6,7,8,9,10中的中位数是( )A5B5.5C6D6.5解析:按从小到大排列,此九个数中,正中间的是6,从而答案为C。2、某企业30岁以下职工占25%,月平均工资为800元;3045岁职工占50%,月平均工资为1000元;45岁以上职工占25%,月平均工资1100元,该企业全部职工的月平均工资为( )A950元B967元C975元D1000元解析:25%*800+50%*1000+25%*1100975,故选C。3、有一组数据的平均数和标准差分别为50、25,这组数据的变异系数为()A.0.2B.0.4C.0.5D.0.7解析:变异系数,故选C。4、若两组数据的平均值相差较大,比较它们的离散程度应采用()A极差B变异系数C方差 D标准差解析:考变异系数的用法,先B。5、一组数据4,4,5,5,6,6,7,7,7,9,10中的众数是()A6 B6.5 C7 D7.5解析:出现最多的数为众数,故选C。6、对于峰值偏向左边的单峰非对称直方图,一般来说( )A平均数中位数众数B众数中位数平均数C平均数众数中位数 D中位数众数平均数解析:数据分布是对称分部时: 众数=中位数=平均数数据分布不是对称分部时:左偏分布时:众数中位数平均数 右偏分布时:众数中位数平均数需要记住提,峰值偏向左边的单峰非对称直方图称为右偏分布,峰值偏向右边的单峰非对称直方图称为左偏分布,从而此题答案为B。第二章 随机事件及其概率基本知识点:一、 随机试验与随机事件:1 随机试验:a) 可以在相同的条件下重复进行;b) 每次试验的可能结果可能不止一个,但是试验的所有可能的结果在试验之前是确切知道的;c) 试验结束之前,不能确定该次试验的确切结果。2 样本空间:a) 所有基本事件的全体所组成的集合称为样本空间,是必然时间;b) 样本空间中每一个基本事件称为一个样本点;c) 每一个随机事件就是若干样本点组成的集合,即随机事件是样本空间的子集;d) 不包含任何样本点的随机事件就是不可能事件。3 样本空间的表示方法:a) 列举法:如掷骰子b) 描述法:若掷骰子出现可描述为:掷骰子出现奇数点。二、 事件的关系和运算1. 事件的关系:a) 包含关系:事件A的每一个样本点都包含在事件B中,或者事件A的发生必然导致事件B的发生,成为事件B包含事件A,记做。若则称事件A与事件B相等,记做AB。b) 事件的并:事件A和事件B至少有一个发生的事件称为事件A与事件B的并,记做。c) 事件的交:事件A与事件B同时发生的事件称为事件A与事件B的交,记做。d) 互斥事件:事件A与事件B中,若有一个发生,另一个必定不发生,则称事件A与事件B是互斥的,否则称这两个事件是相容的。e) 对立事件:一个事件B若与事件A互斥,且它与事件A的并是整个样本空间,则称事件B是事件A的对立事件,或逆事件。事件A的对立事件是,。f) 事件的差:事件A发生,但事件B不发生的事件,称为事件A与事件B的差,记做AB。2运算律:a) 交换律:b) 结合律:c) 分配律:d) 对偶律:。三、 事件的概率与古典概型:1. 事件A发生的频率的稳定值 称为事件A发生的概率,记做:,。2. 概率的性质:a) 非负性:;b) 规范性:;c) 完全可加性:;d) ;e) 设A,B为两个事件,若,则有,且;3. 古典概型试验与古典概率计算:a) 古典概型试验是满足以下条件地随机试验: 它的样本空间只包含有限个样本点; 每个样本点的发生是等可能的。b) 古典概率的计算:;c) 两个基本原理: 加法原理:假如做一件事情有两类办法,在第一类办法中有m种不同方法,而在第二类办法中有n种不同方法,那么完成这件事情就有m+n种不同方法。加法原理可以推广到有多类办法的情况; 乘法原理:假设做一件事情可以分成两步来做,做第一步有m种不同方法,做第二步有n种不同方法,那么完成这件事情有mn种不同方法。乘法原理也可以推广到多个步骤的情形。4. 条件概率:在事件B发生的条件下(假定P(B)0),事件A发生的概率称为事件A在给定事件B下的条件概率,简称A对B的条件概率,记做:;5. 概率公式:a) 互逆:对于任意的事件A,;b) 广义加法公式:对于任意的两个事件A和B,广义加法公式可以推广到任意有限个事件的并的情形,特别地:c) 减法公式:;d) 乘法公式:P(AB)P(A)P(B|A),P(A)0;e) 事件独立:若,则相互独立。f) 全概率公式:设事件A1,A2,, An两两互斥,A1+A2+An(完备事件组),且P(Ai)0,i1,2,n则对于任意事件B,有: ;g) 贝叶斯公式:条件同上, 则对于任意事件B,如果P(B)0,有:;基本运算方法:1、事件的表示:例1、设A、B、C是三个随机事件,用A、B、C的运算关系表示事件:A不发生但B与C发生为( )AB.C.D.解析:本题考察事件的表示方法,选B。例2、对随机事件A、B、C,用E表示事件:A、B、C三个事件中至少有一个事件发生,则E可表示为()A.AUBUCB.ABCC.D.解析:选A。2、古典概型例1、正方体骰子六个面点数分别为2、4、6、8、10、12,掷二次所得点数之和大于等于4的概率为( )A.B.C.D.1解析:样本空间中样本点一共有36个,两次掷得点数和不可能小于4,从而选D。例2、在一次抛硬币的试验中,小王连续抛了3次,则全部是正面向上的概率为()ABCD解析:样本空间一共有8个样本点,全部正面向上只有一次,故选B。例3、某夫妇按国家规定,可以生两胎。如果他们每胎只生一个孩子,则两胎全是女孩的概率为( )A.B.C.D.解析:生两胎,样本空间共有4个样本点,故选C。3、加法公式、减法公式、条件概率例1、设A、B为两个事件,P(A)=0.4,P(B)=0.3。如果BA,则P(AB)=( )A0.1B0.3C0.4D0.7解析:BA,则P(AB)P(B),故选B。例2、设A、B为两个事件,P(A)=0.4,P(B)=0.8,P()=0.5,则P(BA)=()A0.45B0.55C0.65D0.375解析:由P()P(B)P(),从而P()0.3,P(BA)= 0.375,故选D。例3、事件和B相互独立,且P()=0.7,P(B)=0.4,则P(AB)=( )A0.12B0.21C0.28D0.42解析:事件和B相互独立知事件A与B独立,从而P(AB)=P(A)P(B)=0.12,A。例4、事件A,B相互独立,P(A)=0.3,P(B|)=0.6,则P(A)+P(B)=( )A.0.B.0.3C.0.9D.1解析:由事件A,B相互独立知P(B|)= P(B)=0.6,从而选C。4、事件的互斥、对立、独立关系:例1、A与B为互斥事件,则A为( )A.ABB.BC.AD.A+B解析:A与B为互斥事件,即AB,从而选C。例2、事件A、B相互对立,P(A)=0. 3,P(AB)=0.7,则P(A-B)=( )A.0B.0.2C.0.3D.1解析:由事件A、B相互对立知AB,从而P(AB)=P(A)=0.3,选C。例3、事件A、B相互独立,P(A)=0.2,P(B)=0.4,则P(A+B)=( )A.0.50B.0.51C.0.52D.0.53解析:P(A+B)P(A)+P(B)-P(AB),由A、B相互独立知P(AB)P(A)P(B),从而P(A+B)P(A)+P(B)- P(A)P(B)0.52,选C。例4、事件A、B互斥,P(A)=0.3,P(B|)=0.6,则P(A-B)=( )A0B0.3C0.9D1解析:事件A、B互斥有AB,从而P(A-B)=P(A)-P(AB)=P(A)=0.3,选B。5、全概率公式和贝叶斯公式:例1、在厂家送检的三箱玻璃杯中,质检部门抽检其中任一箱的概率相同。已知第一箱的次品率为0.01,第二箱的次品率为0.02,三箱玻璃杯总的次品率为0.02。求第三箱的次品率。若从三箱中任抽一只是次品,求这个次品在第一箱中的概率。解析:设表示抽到第箱,1,2,3. B表示次品,则,从而,即第三箱的次品率为0.03.即从三箱中任抽一只是次品,这个次品在第一箱中的概率为1/6。例2、实战演习中,在甲、乙、丙三处射击的概率分别为0.2,0.7,0.1,而在甲、乙、丙三处射击时命中目标的概率分别为0.8,0.4,0.6。若最终目标被命中,求目标是由乙处射击命中的概率。解析:设表示在甲处射击,表示在乙处射击,表示在丙处射击,B表示命中,则,从而目标是由乙处射击命中的概率为0.56.第三章 随机变量及其分布基本知识点:一、 离散型随机变量:取值可以逐个列出1. 数学期望:1) 定义:,以概率为权数的加权平均数;2) 性质:E(C) =C (常数期望是本身)E(aX) =aE(X) (常数因子提出来)E(aX+b) =aE(X)+b (一项一项分开算)E(aX+bY)=aE(X)+bE(Y) (线性性)2. 方差:1) 定义:;2) 性质:D(c) =0 (常数方差等于0)D(aX) =a2D(X) (常数因子平方提)D (aX+b) =a2D(X)3) 公式:(方差平方的期望期望的平方);3. 常用随机变量:1) 0-1分布:a) 随机变量X只能取0,1这两个值;b) XB(1,p);c) E(X)pD(X)p(1-p)2) 二项分布:a) 分布律:;b) XB(n,p)c) E(X)=npd) D(X)=np(1-p)e) 适用:随机试验具有两个可能的结果A或者,且P(A)=p,P()1p,将试验独立重复n次得到n重贝努里试验。3) 泊松分布:a) 分布律:,0b) XP()c) E(X)d) D(X)e) 适用:指定时间内某事件发生的次数。二、 连续型随机变量:1. 设X是一个连续型随机变量:1) X的均值,记做,就是X的数学期望,即 EX;2) X的方差,记做D(X)或,是的数学期望,即:3) X的标准差,记做,是X的方差的算术平方根,即;2. 常用连续型随机变量:名称分布律或密度记法E(X)D(X)均匀分布指数分布,0正态分布标准正态分布XN(0,1)013. 正态分布的密度曲线y=P(x)是一条关于直线x=的对称的钟形曲线,在x=处最高,两侧迅速下降,无限接近X轴;越大(小),曲线越矮胖(高瘦)。4. 标准正态分布的密度曲线y(x),是关于Y轴对称的钟形曲线。5. 随机变量的标准化 (减去期望除标差)。6. 标准化定理:设。三、 二维随机变量:1. 用两个随机变量合在一起(X,Y)描述一个随机试验,(X,Y)的取值带有随意性,但具有概率规律,则称(X,Y)为二维随机变量。2. X,Y的协方差:cov(X,Y)E(XEX)(YEY)=E (XY)-EXEY,cov(X,Y)0说明X与Y之间存在一定程度的正相关关系,cov(X,Y)0称X与Y不相关,cov(X,Y)0说明X与Y存在一定程度的负相关关系;3. X,Y的相关系数:,取值范围是,越接近1,表明X与Y之间的正线性相关程度越强,越接近于1,表明X与Y之间的负线性相关程度越弱,当等于0时,X与Y不相关。4. 随机变量的线性组合:1) E(aX+bY)=aE(X)+bE(Y);2)四、 决策准则与决策树:1. 对不确定的因素进行估计,从几个方案中选择一个,这个过程称为决策;2. 决策三准则:1) 极大极小原则:将各种方案的最坏结果(极小收益)进行比较,从中选择极小收益最大的方案;2) 最小期望损失原则:选择期望损失最小的方案;3) 最大期望收益原则:选择期望收益最大的方案。3. 决策树:使我们把不确定因素的过程以图解的形式表示出来,有简单、直观的优点。基本运算方法:1、随机变量的含义:例1、某一事件出现的概率为1/4,试验4次,该事件出现的次数将是( )A1次B大于1次C小于1次D上述结果均有可能解析:答案为D,此题考察对随机变量的理解。2、六种常见分布例1、某企业出厂产品200个装一盒,产品分为合格与不合格两类,合格率为99%,设每盒中的不合格产品数为X,则X通常服从( )A正态分布B泊松分布C均匀分布D二项分布解析:将任一个合格品记为0,不合格记为1,则XB(200,0.01),选D。例2、一般正态分布N(,2)的概率分布函数F(x)转换为标准正态分布N(0,1)的概率分布函数时表示为()A.(x)B.C.(x-)D.解析:本题考察正态分布的标准化,选B.例3、掷一枚不均匀硬币,正面朝上的概率为,将此硬币连掷3次,则恰好2次正面朝上的概率是()ABCD解析:记X表示正面向上的次数,则XB(3,), C。例4、若随机变量X服从正态分布,则随机变量Y=aX+b(a0)服从()A正态分布B二项分布C泊松分布D指数分布解析:本题考察正态分布的线性组合仍为正态分布,选A。例5、某电梯一星期发生故障的次数通常服从( )A.两点分布B.均匀分布C.指数分布D.泊松分布解析:选D,泊松分布描述不常发生的事情。例6、一个服从二项分布的随机变量,其方差与期望之比为13,则该二项分布的参数P为( )A.13B.23C.1D.3解析:此题考察二项分布的方差与期望,从而选B。例7、设随机变量X的概率密度函数为(x)=()则X的方差D(X)=()A1B2C3D4解析:此题考察正态分布的密度函数,选D。例8、随机变量X分布律为P(x=k)=,k=0,1,2,3,则X的方差D(X)=( )A0.4B2C2.5D3解析:此题考察泊松分布的方差,选A。例9、据调查,某单位男性员工中吸烟者的比例为20%,在一个由10人组成的该单位男性员工的随机样本中,恰有3人吸烟的概率是多少?解析:设X表示10人中抽烟的人数,则XB(10, 0.2),从而(自行用计算器计算出概率)。例10、某零件的寿命服从均值为1200小时,标准差为250小时的正态分布。随机地抽取一个零件,求它的寿命不低于1300小时的概率。(0.3)=0.6179, (0.4)=0.6554, (0.5)=0.6915)解析:设某零件的寿命为X,则XN(1200, ),从而1 (0.4)0.34463、随机变量期望、方差及协方差的运算和性质:例1、设X和Y为两个随机变量,D(X)=10,D(Y)=1,X与Y的协方差为-3,则D(2X-Y)为( )A18B24C38D53解析:由知,答案为D。例2、设X和Y是两个相互独立的随机变量,已知D(X)=60,D(Y)=80,则Z=2X-3Y+7的方差为( )A100B960C1007D1207解析:由于常数方差为0,且由X和Y独立知其协方差为0,从而由公式知答案为B。例3、设X为随机变量,E(X)=2,D(X)= 6,则E(X2)为( )A5B10C20D30解析:由方差的等价定义:D(X)E(X2)E2 (X)知,答案为B。例4、若已知,则X与y相关系数r为A0.2B0.6C0.7D0.8解析:由相关系数计算公式知答案为C。例5、设X、Y为随机变量,D(X)=6,D(Y)=7,Cov(X,Y)=1,试计算D(2X3Y).解析:由知D(2X3Y)4D(X)12Cov(X,Y)+9D(Y)=75。4、概率分布、密度函数:例1、离散型随机变量X只取-1,0,2三个值,已知它取各个值的概率不相等,且三个概率值组成一个等差数列,设P(X=0)=,则=( )A.14B.13C.12D.1解析:由于三者成等差数列,故设X取1的概率为d, 取2的概率为+d,而三者相加为1,从而1/3,答案为B。例2、设随机变量X的概率密度函数为P(x)=则x的数学期望E(X)=( )A1B1.25C1.5D2解析:显然,从概率密度函数知XU(1,1.5),从而期望为1.25,答案为B。第四章 抽样方法与抽样分布基本知识点:一、 抽样基本概念:1. 总体:研究对象的全体;2. 个体:组成总体的每一个个体;3. 抽样:从总体中抽取一部分个体的过程;4. 样本:从总体中抽出的一部分个体构成的集合;5. 样本值:在一次试验或观察以后得到一组确定的值;6. 随机样本:1) 个体被抽到的可能性相同;2) 相互独立;3) 同分布。二、 抽样方法:1. 简单随机抽样:总体中有n个单元,从中抽取r个单元作为样本,使得所有可能的样本都有同样的机会被抽中。有放回抽样的样本个数为;无放回抽样的样本个数为。2. 系统抽样(等距抽样):将总体单元按照某种顺序排列,按照规则确定一个起点,然后每隔一定的间距抽取样本单元。3. 分层抽样:在抽样之前将总体划分为互不交叉重叠的若干层,然后从各个层中独立地抽取一定数量的单元作为样本。4. 整群抽样:在总体中由若干个总体单元自然或人为地组成的群体称为群,抽样时以群体为抽样单位,对抽中的各群的所有总体单元进行观察。三、 抽样中经常遇到的三个问题:1. 抽样选取不当;2. 无回答:处理无回答常用的方法:1) 注意调查问卷的设计和加强调查员的培训;2) 进行多次访问;3) 替换无回答的样本单元;4) 对存在无回答的结果进行调整。3. 抽样本身的误差。四、 抽样分布与中心极限定理:1. 不包含任何未知参数的样本函数称作统计量;2. 常用的统计量:1) 样本均值:;2) 样本方差:;3) 样本标差:。3. 统计量的分布叫做抽样分布,当样本容量n增大时,不论原来的总体是否服从正态分布,其样本均值都将趋向于正态分布,当n30时,样本均值就可以近似的服从正态分布。4. 中心极限定理:设随机变量X1,X2,Xn独立同分布,且EXi,DXi2,i1,2,n,;1) 设随机变量X1,X2,Xn独立同分布,且EXi,DXi2,i1,2,n,则;2) 设随机变量X1,X2,Xn独立同(0,1)分布,则,且。五、 常用的抽样分布1. 样本均值的抽样分布:总体均值、方差抽样方式样本的期望样本方差有限总体重复抽样有限总体不重复抽样无限总体任意若有限总体不重复抽样5%时,其修正系数近似为1,样本均值的方差可以简化为。 2. 样本比例的抽样分布:总体比例抽样方法EPDP无限总体任意有限总体有放回抽样有限总体无放回抽样若有限总体无放回抽样5%时,其修正系数近似为1,样本比例的方差可以简化为。六、 三种小样本的抽样分布:名称统计量记法上分位点2分布1,2n分布22(n)分布XN(0,1),Y2(n)X,Y相互独立F分布,U,V相互独立,七、 几种重要统计量的分布:设XN(,2),X1,X2,Xn是X的样本,样本均值,样本方差:1. 分布:;2. 2分布:;3. 设X1,X2,Xn是的样本,Y1,Y2,Yn是的样本,并且都相互独立,则:;基本运算方法:1、基本概念及抽样方法:例1、如果抽选10人作样本,在体重50公斤以下的人中随机抽选2人,5065公斤的人中随机选5人,65公斤以上的人中随机选3人,这种抽样方法称作()A简单随机抽样B系统抽样C分层抽样 D整群抽样解析:本题考察概率抽样方法的分类,答案为C。例2、将总体单元按某种顺序排列,按照规则确定一个随机起点,然后每隔一定的间隔逐个抽取样本单元。这种抽选方法称为()A系统抽样B简单随机抽样C分层抽样 D整群抽样解析:本题考察概率抽样方法的分类,答案为A。2、抽样分布与中心极限定理:例1、一个具有任意分布形式的总体,从中抽取容量为n的样本,随着样本容量的增大,样本均值将逐渐趋向于( )A泊松分布B分布CF分布 D正态分布解析:本题考察中心极限定理,答案为D。例2、在简单随机抽样中,如果将样本容量增加9倍,则样本均值抽样分布的标准误差将变为原来的( )A19倍B13倍C3倍D9倍解析:由于D(), 从而标准误差为,答案为B。例3、对于容量为N的总体进行不重复抽样(样本容量为n),样本均值的方差为()A.B.C.D.解析:本题考察样本均值的抽样分布,答案为A。例4、设X1,X2,Xn是从正态总体N(,2)中抽得的简单随机样本,其中已知,2未知,n2,则下列说法中正确的是()A是统计量B是统计量C是统计量 D是统计量解析:本题考察的是统计量的概念,不能含有未知参数,故答案为D。例5、一个具有任意分布形式的总体,从中抽取容量为n的样本,随着样本容量的增大,样本均值逐渐趋向正态分布,这一结论是( )A.抽样原理B.假设检验原理C.估计原理D.中心极限定理解析:本题考察的是中心极限定理的内容,答案为D。3、三种小样本分布与几种重要统计量的分布例1、从总体XN()中抽取样本,,计算样本均值,样本方差,当n30时,随机变量服从()A分布BF分布Ct分布D标准正态分布解析:本题考察的是几种重要统计量的分布中的t分布,答案为C。例2、从总体XN()中重复抽取容量为n的样本,则样本均值标准差为( )ABCD解析:本题考察的仍然是样本均值的抽样分布,由D()知答案为D。第五章 参数估计基本知识点:一、 参数估计1. 参数点的估计:设总体分布中含有未知参数,从总体中抽取一个样本X1,X2,Xn,用来估计未知参数的统计量(X1,X2,Xn)称为参数的一个估计量,若X1,X2,Xn是样本的一组观察值,则(X1,X2,Xn)称为参数的一个点估计值。2. 估计量的评价标准:1) 无偏性:设是总体中未知参数的估计量,若则称是的无偏估计量。样本均值是总体均值的无偏估计量,;样本方差S2是总体方差2的无偏估计量,ES22。2) 有效性:的方差最小的无偏估计量称为的有效估计量;正态总体的样本均值是总体均值的有效估计量。(以上两种情况在样本容量固定的情况下发生;当样本容量增大是越来越接近真值。)3) 一致性:若当样本容量增大时,估计量的值越来越接近未知参数的真值,则称是的一致估计量。样本均值方差是总体均值方差的一致估计量。二、 总体均值的区间估计:1. 设是总体分布中的未知参数,X1,X2,Xn是总体的一个样本,若对给定的(01),参在两个估计量1(X1,X2,Xn)和2(X1,X2,Xn),使,则称随即区间(1,2)位参数的置信度位1的置信区间。称为显著水平。2. 意义:随机区间(1,2)包含真值的概率是1。3.4. 总体均值的置信区间(置信度1)总体分布样本量已知未知正态分布大样本正态分布小样本非正态分布大样本三、 总体比例的区间估计:总体比例的置信区间(置信度1)样本量抽样方式置信区间大样本有放回抽样无放回抽样四、 两个总体均值之差的置信区间(置信度1)总体分布样本量已知未知正态分布大样本用S1代替1用S2代替2正态分布小样本非正态分布大样本用S1代替1用S2代替2五、 大样本,两个总体比例之差()的置信区间,置信度(1):六、 样本容量的确定(置信度1):抽样方式置信区间允许误差样本容量有放回抽样(或抽样比DT2,则称()AT1比T2有效BT1是的一致估计量CT2比T1有效DT2是的一致估计量解析:本题考察估计量的有效性这一概念,答案为C。例3、设总体X服从正态分布N(,2),和2未知,(X1,X2,Xn)是来自该总体的简单随机样本,其样本均值为,则总体方差2的无偏估计量是( )ABCD解析:本题考察一个重要结论样本方差是总体方差的无偏估计,答案为A。2、区间估计:例1、若置信水平保持不变,当增大样本容量时,置信区间()A将变宽B将变窄C保持不变 D宽窄无法确定解析:答案为B。例2、置信系数1-表示区间估计的( )A精确性B显著性C可靠性D准确性解析:本题考察置信系数的概念,答案为C。例3、设总体X服从正态分布N(,),已知,用来自该总体的简单随机样本X1,X2,Xn建立总体未知参数的置信水平为1-的置信区间,以L表示置信区间的长度,则()A越大L越小B越大L越大C越小L越小D与L没有关系解析:由于总体方差已知,从而L2*,越大L越小,故选A。例4、对于成对观测的两个正态总体均值差的区间估计,可以采用的统计量是( )A.t统计量B.Z统计量C.统计量D.F统计量解析:本题考察不同条件下,选取不同统计量进行区间估计,答案为A。例5、在小样本情况下,如果总体服从正态分布且方差未知,则总体均值的置信度为1的置信区间( )A.xZ/2snB. xZ/2nC.xt/2(n-1)snD. xt/2(n-1)n解析:本题考察不同条件下,选取不同统计量进行区间估计,答案为C。例6、假设某单位员工每天用于阅读书籍的时间服从正态分布,现从该单位随机抽取了16名员工,已知他们用于阅读书籍的平均时间为50分钟,样本标准差为20分钟,试以95%的置信度估计该单位员工用于阅读书籍的平均时间的置信区间。(解析:本题是正态总体,总体方差未知,小样本,显然采用下面公式计算:(以下具体计算略)例7、某餐馆欲估计每位顾客午餐的平均消费数额,依据以往的经验,顾客午餐消费的标准差为15元。假设中午在该餐馆就餐的顾客非常多,现要以95%的置信度估计每位顾客午餐的平均消费数额,并要求允许误差不超过3元,应抽取多少位顾客作为样本?(Z0.05=1.645,Z0.025=1.96)解析:题设条件是总体分布未知,大样本,其区间估计公式为,从而允许误差为(以下具体计算略)例8、某企业采用两种不同的促销方式进行销售。使用甲促销方式进行销售的30天里,日均销售额为50万元,样本标准差为5万元;使用乙促销方式进行销售的30天里,日均销售额为40万元,样本标准差为4万元。求使用甲、乙促销方式进行销售的日均销售额之差的置信度为95%的置信区间。(Z0.05=1.645,Z0.025=1.96)解析:本题显然是双总体均值之差的区间估计,采用公式:(以下具体计算略)例9、某市场调查机构对某品牌家电进行市场调查,一共随机调查了1000名顾客,其中有700人表示喜欢该品牌家电。试以95%的可靠性估计喜欢该品牌家电的顾客比例P的置信区间。(Z0.05=1.645,Z0.025=1.96)解析:本题考察的是比例的区间估计,应用公式(以下具体计算略)第六章 假设检验基本知识点:一、 假设检验的基本概念:1. 小概率原理:小概率事件在一次试验中很难发生,但并不意味着绝对不会发生。2. 对总体参数的取值所作的假设,称为原假设(或零假设),记做H0;原假设的对立假设称为备选假设(备择假设),记做H1。3. 犯“H0为真,但拒绝H0”这种错误的概率称为显著水平;这种错误称为第一类错误(弃真错误);4. “H0不成立,但接受H0”的这种错误称为第二类错误;犯这种错误的概率记做。5. 用来判断是否接受原假设的统计量称为检验统计量。6. 当检验统计量取某个范围D内的值时,我们拒绝原假设H0;这是D称为拒绝域;拒绝域的边界点称为临界点。7. 假设检验的基本思想:先假定H0成立,在这个前提下用样本数据进行推导、计算,如果导致小概率事件发生,择拒绝H0,否则就接受H0。8. 当检验的统计量N(0,1)时:H0:0H1:0双假检验:H0:0H1:0左侧检验:H0:0H1:0右侧检验:9. 假设检验的五个步骤:1) 提出原假设与备选假设。原则:1、把含有等号的式子作为原假设;2、从样本做出猜测而希望证实的问题作为备选假设;2) 选取统计量。通过选取适当的统计量来构造小概率事件;3) 按P(拒绝H0/H0真)确定拒绝域;4) 计算统计量的值;5) 做出判断:当样本值落在拒绝域内,小概率事件发生,拒绝H0;当样本值不落在拒绝域内,小概率事件没发生,接受H0。二、 总体均值的假设检验:已知条件H0H1检验统计量及其分布拒绝域XN(,2)0,已知0,或大样本0000XN(,2)未知,小样本0000三、总体比例的假设检验:已知条件H0H1检验统计量及其分布拒绝域大样本三、 两个总体均值(比例)之差的假设检验:已知条件H0H1检验统计量及其分布拒绝域,1,2已知,或大样本1212(设)1212,1,2未知,或小样本12121212大样本基本计算方法:1、假设检验的基本概念:例1、显著性水平是指( )A原假设为假时,决策判定为假的概率B原假设为假时,决策判定为真的概率C原假设为真时,决策判定为假的概率D原假设为真时,决策判定为真的概率解析:第一类错误又称拒真(弃真)错误,犯此类错误的概率为,故也称其为错误,表示原假设为真,决策判定为假从而拒绝接受原假设,故选C。例2、下列关于第一类、第二类错误的说法中正确的是( )A.原假设H0为真而拒绝H0时,称为犯第一类错误B.原假设H0为真而拒绝H0时,称为犯第二类错误C.原假设H0为假而接受H0时,称为犯第一类错误D.原假设H0为假而拒绝H0时,称为犯第一类错误解析:本题考察第一类错误和第二类错误的概率,选A。例3、在假设检验中,记Ho为待检假设,则犯第二类错误指的是( )AH0成立,经检验接受H0BH0不成立,经检验接受H0CH0成立,经检验拒绝HoDH0不成立,经检验拒绝H0解析:本题考察第一类错误和第二类错误的概率,选B。例4、设是假设检验中犯第一类错误和第二类错误的概率。在其他条件不变的情况下,若增大样本容量n,则( )ABC D解析:若样本容量不变,减小必增大,减小必增大,若要二者同时减小,必增大样本容量,从而答案为B。2、假设检验:例1、在比较两个非正态总体的均值时,采用Z检验必须满足()A两个总体的方差已知B两个样本都是大样本C两个样本的容量要相等 D两个总体的方差要相等解析:本题考察的是不同条件下,选用不同的检验统计量进行检验,选B。例2、对于假设H0:0,H1:0,若抽得一个随机样本,其样本均值小于0,则( )A.肯定拒绝H0B.有可能拒绝H0C.肯定接受H1D.有1-的可能性接受H0解析:本题考察是的假设检验的拒绝域问题,答案为B。例3、对方差已知的正态总体均值的假设检验,可采用的方法为()AZ检验Bt检验CF检验D检验解析:本题考察的是不同条件下,选用不同的检验统计量进行检验,选A。例4、假设总体服从正态分布,在总体方差未知的情况下,检验的统计量为t=,其中n为样本容量,S为样本标准差,则H0的拒绝域为( )ABCD解析:本题考察是的假设检验的拒绝域问题,显然双侧检验,t分布,答案为B。例5、假设XN(),H0,Hl,则( )A.肯定拒绝原假设B.肯定接受原假设C.有可能拒绝原假设D.有可能接受原假设解析:本题考察是的假设检验的拒绝域问题,答案为B。例6、对正态总体N(,9)中的进行检验时,采用的统计量是( )At统计量BZ统计量CF统计量D统计量解析:正态总体,总体方差已知,选取Z统计量,故答案为B。例7、在假设检验中,如果仅仅关心总体均值与某个给定值是否有显著区别,应采用( )A.单侧检验B.单侧检验或双侧检验C.双侧检验D.相关性检验解析:答案为C。例8、已知XN(,),0已知,对于假设H0:=0,H1:0,抽取样本X1,Xn,则其检验统计量为_。解析:正态总体,总体方差已知,故选取统计量例9、在对正态总体XN(,2)的均值的区间估计中,当置信系数1-增大时,置信区间会_。解析:置信系数1-增大时,置信区间会减小。例10、在对总体XN(,2)中的假设H0=0进行检验时,若总体方差2较大,此时H0的接受域_。解析:依题意,总体方差已知,且是双侧检验,故拒绝域为,从而接受域为。例11、某饮料生产商声称其生产的某种瓶装饮料中营养成分A的含量不低于6克,现随机抽取100瓶该饮料,测得其营养成分A含量的平均值为5.65克,样本标准差为1.2克。试问该饮料生产商的声明是否真实可信?(可靠性取95%,Z0.05=1.645,Z0.025=1.96)解析:,: 从而拒绝域为,即 计算得Z2.91,从而 从而拒绝,即认为该饮料生产商的声明不真实。例12、已知2003年某地人均消费为6000元。2004年,从该地个人消费总体中随机取得的一个样本为:7000、7500、8000、8000、7000、9000、8000、8500、9000(单位:元)。假设该地个人消费服从正态分布。(1)求2004年该地个人消费的样本均值。(2)求2004年该地个人消费的样本方差。(3)请以95的可靠性检验2004年该地人均消费是否比2003年有显著上涨?并给出相应的原假设、备择假设及检验统计量。(t0.025(8)=2.306,t0.025(9)=2.26,t0.025(10)=2.228,t0.05(8)=1.8595,t0.05(9)=1.8331,t0.05(10)=1.8125)解析:(1)8000元(2)562500元(3):,: 拒绝域为1.8595 计算得81.8595 从而拒绝,即认为有显著上涨。例13、某培训中心采用A、B两种培训方法对学员进行培训。从使用A培训方法和使用B培训方法的学员中分别随机抽取了10人,测得他们完成培训所需的时间分别为10,15,8,13,18,20,17,12,12,15小时和10,15,7,8,6,13,14,15,12,10小时。假设使用A培训方法和使用B培训方法所需培训时间均服从正态分布,且方差相等。(1)求使用A培训方法和使用B培训方法的学员所需培训时间的平均值及样本方差。(2)请给出检验A、B两种培训方法所需培训时间是否有显著性差异的检验的原假设和备择假设。(3)检验A、B两种培训方法所需培训时间是否有显著性差异(显著性水平取5%)。(t0.05(18)=1.734,t0.05(19)=1.729,t0.05(20)=1.7247,t0.025(18)=2.1,t0.025(19)=2.09,t0.025(20)=2.086)解析:(1)均值公式: 样本方差公式: (此处具体计算略) (2):,: (3)选用检验统计量 其拒绝域为 (下面具体计算略)第七章 相关与回归分析基本知识点:一、 相关分析:1. 线性相关:数量的关系近似线性函数;1) 正线性相关:变量是同向变化;2) 负线性相关:变量是反向变化;2. 非线性相关:变量的关系近似非线性函数;3. 完全相关:变量是函数关系;1) 完全线性相关:变量的关系是线性函数;2) 完全非线性相关:变量的关系是非线性函数;4. 不相关:变量之间没有任何规律。5. 协方差:总体相关系数:样本相关系数:二、 一元线性回归:1. 若对控制变量X的每一个确定值,随机变量的数学期望存在,则此数学期望是X的函数,称为Y关于X的回归函数;2. 若一元回归函数是线性函数,则称为一元线性回归(回归直线);3. 回归直线,其中称为斜率,称为截距。4. 总变差平方和剩余平方和回归平方和SSTSSESSR总变差平方和:Y1,Y2,Yn的分散程度;回归平方和:X1,X2,Xn的分散性引起的Y1,Y2,Yn的分散程度;剩余平方和:其他因素引起的分散程度。5. 判定系数:6. 最小二乘法:是使因变量的观察值yi与估计值的SSE(剩余平方和)达到最小来求得a和b的方法;即:。7. 估计标准误差:8. 判定系数的意义:0r21SSE意义r21SSE0, 观察点落在回归直线上,X,Y完全线性相关r21SSE0,观察点接近回归直线,X,Y高度线性相关r20SSE=SSTX的变化与Y无关,无线性相关关系9. 给定,置信度为1,的预测区间与的置信区间:的点估计:的预测区间:;的置信区间:。三、 多元线性回归和非线性回归:1. 多元线性回归:2. 可线性化的非线性回归:名称方程变量代换线性回归双曲函数对数函数幂函数多项式函数,基本计算方法:1、相关分析及基本概念:例1、如果相关系数r=-1,则表明两个随机变量之间存在着( )A完全反方向变动关系B完全同方向变动关系C互不影响关系D接近同方向变动关系解析:本题考察相关系数的概念,A。例2、当所有观察点都落在回归直线y=a+bx上,则x与y之间的相关系数为( )Ar=0Br2=1C-1r1D0r1解析:本题同样考察相关系数的概念,由于不确定a比
展开阅读全文