资源描述
统计学原理(2)第六章 假设检验一、假设检验的含义如,某厂生产一批产品产品总数N1000件,必须经检验合格方能出厂,按规定次品率不能超过5,否则不准出厂。我们事先对这1000件产品(称为总体)的次品率(称为总体未知参数)一无所知。但是我们可以根据以往的资料假设其次品率不超过5(称为原假设),然后随机抽取50件样品,检验出其次品率为8(称为样本参数值),现在的问题是我们能否根据这8的样本次品率来判断整批产品的次品率不超过5,且伴有一定的可信程度呢?含义:像这种根据一定随机样本所提供的信息,用它来判断总体未知参数事先所作的假设是否可信的统计分析方法,叫作假设检验。二、假设检验的基本思想:首先对研究的命题提出一种假设。称为原假设或0假设,即从原来总体没有变化出发,这样就有一个总体参数,而且它的分布也是知道的。例如某轴承厂生产某型号轴承,按规定轴承标准承载压力4 000公斤,标准差为200公斤,承载压力按正态分布。我们就可以4 000公斤压力作为总体参数建立比较标准。从实际总体中抽取样本,根据实际观察的资料计算统计量的取值,通过样本统计量取值与假设的总体参数比较来判断。要求两者完全一致的可能性是极少的,那么差异要达到多大才算是显著呢?所谓显著性是指差异程度而言的,程度不同说明引起差异的原因也有不同:一种是条件差异。即由于工艺或试验条件的改变所引起的差异;一种是随机差异。即由于生产或试验过程中受偶然因素的影响,所引起结果的差异。两种原因的共同作用导致各种各样的误差,如果样本统计量与假设总体参数之间的差异超过了通常偶然因素起作用的程度,它说明所发生的差异,除了随机因素之外还存在条件差异的因素,因此我们可以据此否定总体的变动纯粹由随机原因引起,没有显著差异的原假设。其次,确定显著性水平。我们所以拒绝原假设,并不是因为它存在逻辑的绝对矛盾,或实际上不可能存在这种假设,而仅仅因为它存在的可能性很小。根据小概率事件原理,概率很小的事件在一次试验中几乎是不会发生的。如果根据原假设的条件正确计算出某一结果发生的概率很小,理应在一次试验中不至于发生,然而在一次试验中事实上又发生了,则我们认为原假设不正确,而拒绝接受。进行假设检验时应该事先规定一个小概率的标准,作为判断的界限,这个小概率标准称为显著性水平。由于原假设的分布是已知的,因而样本统计量和总体参数的离差在一定范围内的概率也可以知道,离差超过这个范围的概率也同样知道,如果统计量与参数的差异过大,以至发生这种事件的概率很小,而且小到低于给定的标准,我们就拒绝原假设,如果计算出的统计量与参数差异的相应概率大于给定标准,我们就接受原假设。这样,我们把概率分布分为两个区间:例如给定小概率标准0.05,凡概率小于5的差异都是小概率事件,属于拒绝区间,如图中分布两端的阴影部分,而10.95,则是对立事件的概率,其概率在95以内的,为接受区间,如图中央部分所示。事件属于接受区间,原假设成立,判断总体无显著差异;事件属于拒绝区间,推翻原假设,认为总体有显著差异,其区间以小概率标准0.05为界限,所以称为显著性水平,所对应的概率度称为显著性水平的临界值。例如0.05时,在正态分布的情况下,则临界值Z1.96。我们以概率小于0.05的事件作为小概率事件,也就等于说大于临界值Z1.96的事件作为小概率事件,这样我们可以直接利用概率表查找临界值作为判断的依据。显著性水平主要视拒绝区间所可能承担的风险来决定,应该根据研究问题的性质和对结论准确性的要求而有所不同。通常多采用0.1、0.05、0.01、0.001等显著性水平。例如民意测验采用显著性水平0.1,其他社会经济现象的检验取0.05,产品质量检验取o0.01,工程技术检验取0.001,甚至取0.0001等等。1.设立假设,2.确定显著性水平和相应临界值.3.抽取样本计算统计量和相应概率区间的概率度,4.加以比较判断,从而作出接受或拒绝假设的决定。三、假设检验的一般步骤:(一)设立假设 首先提出原假设,记为H0,原假设总是假定总体没有显著性差异,所有差异都是由随机原因引起的。所以这种假设又称无效假设。其次提出备择假设,记为H1,如果原假设被拒绝等于接受了备择假设,所以备择假设也就是原假设的对立事件。1.双侧检验:检验样本平均数(或成数)和总体平均数(或成数)有没有显著性的差异,而不问差异的方向是正差或负差时,则原假设取等式,如:2.单侧检验:如果不仅仅检验样本平均数(或成数)和总体平均数(或成数)有没有显著的差异,而且追究是否发生预先指定方向的差异(正差异或负差异),则原假设取不等式形式,如:(二)决定检验的显著性水平,以及相应的Z临界值 1.双侧检验:给定显著性水平,按对称分布的原理平均分配到左右两方,每方各为/2,相应得到下临界值为-Z/2,上临界值为Z/2。如图2.单侧检验:给定显著性水平,根据问题的要求确定是左单侧检验,还是右单侧检验,其临界值为-Z或Z,如图表示右单侧检验,其临界值为Z。(三)求Z值 抽取一个随机样本,并从H0假设为真出发,计算抽样平均数或抽样成数,再求相应概率区间的概率度Z值。(四)将实际求得的Z值和事先给它的临界值作比较 双侧检验:如果ZZ/2或Z-Z/2,就拒绝原假设H0,而接受备择假设H1;如果ZZ/2或Z-Z/2,就不能否定原假设,而接受原假设是真实的.左单侧检验:如果Z-Z,就拒绝原假设H0,而接受备择假设H1;如果Z-Z,就不能否定原假设,而接受原假设是真实的。右单侧检验:如果ZZ,就拒绝原假设H0,而接受备择假设H1;如果Z1.96,所以我们有理由拒绝原假设,即否定新生产轮胎的耐用里程与原产品没有显著差异的假设,而接受备择假设H1,认为新生产的产品质量有明显的提高,或者说,新生产的产品和原来的产品并非同一总体。例2 假日饭店有500张客床,正常时间每床位日租金为100元,平均订位率70。现在经理进行一项试验,采取优惠措施把房价降低15,经过36天,平均每天出租床位406张,其标准差 78张。试以0.05的显著性水平评估优惠措施是否有明显的效果。解答:这是对总体平均数进行单侧检验的问题,而且要求检验是否超过原总体平均数,因而属于右单侧检验。1设立假设。根据题意,我们以等于或小于原平均数为原假设,而以大于原平均数为备择假设。2给定显著性水平。由于要求检验订位数是否有显著提高,因此只需右侧临界值,不存在左侧临界值。给定显著性水平=0.05是单侧的要求,考虑到“正态分布概率表”是双侧的,如果单侧要求0.05,则双侧就应为20.050.1,查概率分布表F(Z)12=0.9,Z=1.645。3计算检验统计量的样本观察值。4作出检验决策。因为Z Z,即4.31.645,检验统计量的样本观察值落入拒绝区域,所以在0.05显著性水平下,拒绝原假设。就是说假日饭店的优惠措施使订位率有显著的提高。例3 生产某产品的公司称有75以上的消费者满意其产品的质量。一家市场调查公司受托调查该公司此项声明是否属实,随机抽样调查了625位消费者,表示满意该公司产品质量者有500人。试问在显著性水平005下,该公司的声明是否属实。解答:由于公司的声明称75以上的消费者满意其产品的质量,现在要检验该声明是否属实,属于总体成数的右单侧检验问题。1原假设H0:P75,备择假设H1:P75。五、总体成数的检验3根据抽样资料,计算检验统计量的样本观察值。4作出检验决策。由于Z=2.887Z0.05=1.65,所以拒绝原假设H0,认为该公司的此项声明属实。2给定显著水平=0.05。由于是单侧检验,查正态分布表,得临界值Z0.05=1.65。第七章 相关分析教学目的与要求 相关分析是研究变量之间相互关系的密切程度和相互联系方式的重要方法。本章详细讲述了相关分析的概念、相关关系的确定、回归方程的建立和应用等内容。通过本章的学习,要理解相关分析的有关概念,掌握计算相关系数和配合回归方程的方法,并能够结合实际资料对变量进行相关分析。本章主要内容第一节 相关的意义和种类第二节 相关图表和相关系数第三节 回归分析第一节 相关的意义和种类一、相关分析的含义:相关分析有广义和狭义之分。狭义的相关分析,简称为相关分析,它以现象之间是否相关、相关的方向和密切程度等为主要研究内容。其主要分析方法有编制相关表、绘制相关图、计算相关系数。广义的相关分析包括对现象间具体的相关形式的分析即回归分析。在回归分析中根据研究的目的,区分出自变量和因变量并研究确定自变量和因变量之间的具体关系的数学表达式。其主要方法有:建立回归模型求解回归模型中的参数、对回归模型进行检验等。广义的相关分析主要由下列几个基本步骤所构成(1)确定现象之间是否确存依存关系,这是相关分析的前提。(2)根据研究的目的,通过观察或实验以取得资料并进行加工整理。(3)确定相关关系的密切程度。根据整理好的资料编制相关表,绘制相关图,进而计算出相关系数,帮助我们判断相关的密切程度。(4)选择合适的回归模型,对变量之间的联系给以近似的描述,反映变量之间的变动关系。(5)运用数理统计方法对回归模型进行检验和评价二、相关关系的概念函数关系:是指现象之间客观存在的,在数量变化上按一定法则严格确定的相互依存关系。在此种关系中,对于某一变量的每一个数值,都有另一个变量的确定值与之对应并且可以用一个数学表达式表达出来。例如,商品销售额是商品销售价格与商品销售量的乘积。这类现象的变化关系是确定的,已知某现象数值,可求解出另一现象的数值。相关关系:相关关系是一种不完全确定的随机关系。1)相关关系是现象之间确实存在着数量上的相互依存关系。例如,在两个现象之间,一个现象发生了数量上的变化另一个也必然地发生相应的变化。2)现象之间的依存关系不是确定的和严格的,对于现象的一个标志值,可以有若干的变量与之相对应。这就是说,由于个现象的变量往往受到多种因素影响关系错综复杂,偶然性因素很多,造成了变量之间的依存关系不确定。2.对具有相关关系的现象进行分析时,必须利用相应的函数关系的数学表达式来表明现象之间相关的数量表现形式。函数关系与相关关系的联系:1.由于在观察或实验中出现的误差,函数关系可能会通过相关关系反映出来;而当现象之间的内在联系和规律性拿捏清楚时,相关关系又可能转化为函数关系.1.按变量之间相关的程度,分为完全相关、不相关(也称零相关)和不完全相关。因变量数值完全随自变量数值变动而变动称为完全相关。这时相关关系实际上就转化为函数关系。变量之间的变动完全不存在任何依存关系时,称为不相关。变量之间关系介于完全相关与不相关之间相关关系,称为不完全相关。三、相关的种类2.按变量之间相互关系的方向分为正相关和负相关。当自变量的数值增加,因变量的数值也随之相应的增加,即相关的变量同一方向变化,称为正相关。例如施肥量增加,亩产量也增加,企业固定资产价值增加,产品产量也随之增加等这种关系就是正相关。自变量数值增加时,因变量数值随之减少,即相关的变量反方向变化,称为负相关。例如劳动生产率提高单位产品的消耗时间就会随之减少等这种关系就是负相关。3.按变量之间相互关系的表现形式,分为线性相关(也称直线相关)和非线性相关(也称曲线相关)。当自变量数值发生变动,因变量数值随着发生大致均等的变动(增加或减少),从图形上看,其观察点的分布近似地表现为一条直线形式,称为线性相关。当自变量数值发生变动因变量数值随着也发生变动,但不是均等的变动,从图形上看,其观察点的分布近似地表现为各种不同的曲线形式如抛物线、双曲线等,称为非线性相关。4.按研究变量的多少,分为一元相关(也称单相关)和多元相关(也称复相关)。两个变量之间的相关关系称为一元相关,其中的因变量只与一个自变量有联系。如居民的收入和储蓄额,产品销售额与销售价格的相关关系等,它只涉及一个自变量和一个因变量。三个和三个以上变量的相关关系称为多元相关它有一个因变量和两个或两个以上的自变量,例如施肥量、浇水量、密植量和亩产量之间的相关关系就是多元相关。第二节相关图表和相关系数一、相关图表相关图表是相关分析的重要方法。通过相关图表可以直观地判断现象之间呈现的相关的形态和方向。相关表简单相关表是资料未经分组的相关表它是把因素标志值按照从小到大的顺序并配合结果标志值一一对应平行排列起来的统计表。通过观察结果标志值的顺序来对现象标志之间相关关系进行初步研究。单变量分组相关表:是在具有相关关系的两个变量中,只对自变量进行分组的相关表双变量分组相关表:对两种有关变量都进行分组,交叉排列,并列出两种变量各组间的共同次数,这种统计表称为双变量分组相关表。分组相关表相关图利用直角坐标系第一象限,把自变量置于横轴上,因变量置于纵轴上,并将两变量相对应的变量值用坐标点形式描绘出来即可。二、相关系数相关系数是测定变量之间相关密切程度的统计指标。1、相关系数的计算方法:它是通过两变量与各自平均值的离差的乘积来反映两变量之间的相关程度。公式为:计算相关系数的简化式:2、相关系数的性质 (2)相关系数的取值范围在绝对值的之间。其值大小反映两变量之间相关的密切程度,具体判断方法。的数值愈大,愈接近1,表示x和Y直线相关程度愈高;反之 的数值愈小,愈接近0,相关程度愈低。通常的判断标准是 0.3称为微弱相关,0.3 0.5称为低度相关,0.5 0.8称为显著相关,0.8 1称为高度相关。(1)相关系数有正负号,分别表示正相关和负相关。(3)相关系数表明两变量完全相关;表明两变量完全不相关;相关系数计算分析例题 880 36.4 62 86 80 110 115 132 135 160 1.2 2.0 3.1 3.8 5.0 6.1 7.2 8.0 1 2 3 4 5 6 7 8生产费用 月产量序 号1.444.009.6114.4425.0017.2151.8464.00207.54384473966400121001322517424182252560010421474.4172.0248.0418.0575.0805.2972.01280.04544.6根据计算结果可知:则相关系数为:说明产量和生产费用之间存在高度正相关。第三节 回 归 分 析一、回归分析的意义 回归分析是对具有相关关系的两个或两个以上变量之间的数量变化的一般关系进行测定,确立一个相应的数学表达式,以便从一个已知量来推测另一个未知量,为估算预测提供一个重要的方法。二、回归的种类按自变量的个数分一元回归(只有一个自变量)多元回归(有两个或两个以上的自变量)按回归线的形状分线性回归(直线回归)非线性回归(曲线回归)三、简单线性回归方程简单线性方程式的一般形式:(当两变量的增长比率为常数时,它们之间就呈现为一种简单线性关系。)利用简单线性回归方程进行回归分析的前提:所分析的两个变量之间必须存在相关关系,且相关程度在显著相关以上。对两变量进行简单线性回归分析的任务:设法在分散的、具有线性关系的相关点之间配合一条最优的直线,以表明两变量之间具体的变动关系。在两变量相关的散点图中,引出一条最优的直线,这条直线就是估计回归线。它表明了两变量数量变动的一般关系。估计回归线:配合估计回归线的方程称为回归方程方程式为:回归系数b的经济涵义:当自变量变动一个单位时,因变量的平均变动值。配合直线回归方程的方法配合直线回归方程的过程就是求解方程系数a、b的过程,求解a、b的方法一般采用最小平方法。用最小平方法配合回归直线的基本思想是:在所有的相关点中,通过数学方法配合一条较为理想的直线,这条直线必须满足两点:2、原数列与趋势线的离差平方和为最小值。即1、原数列与趋势线的离差之和为零。即:通过求a、b的一阶偏导可得到求解a、b的联立方程:解联立方程得到:4544.6 74.4 172.0 248.0 418.0 575.0 805.2 972.0 1280.0104214 3844 7396 6400 12100 13225174241822525600207.54 1.44 4.00 9.61 14.44 25.00 37.21 51.84 64.00 880 36.4 62 86 80 110 115 132 135 160 1.2 2.0 3.1 3.8 5.0 6.1 7.2 8.0 1 2 3 4 5 6 7 8生产费用 月产量序 号根据前面例题资料配合生产费用依产量变化的回归方程:则回归方程为:回归系数b的涵义:月产量每增加1000吨,生产费用平均增加12.9万元。计算得到:670 82 90 100 114 140 144耐用消费品销售额(万元)2820 340 380 450 470 560 620人均年收入(元)合计199019911992199319941995时间要求:分析两变量相关密切程度,若为显著相关以上,则对两变量进行回归分析。有某地区人均年收入与耐用消费品销售额资料如下:答案:相关系数r=0.98 b=0.24 a=-1.13 yc=-1.13+0.24x回归系数b的涵义:人均年收入每增加一元,耐用消费品销售额平均增加0.24万元。四 回归系数的与相关系数关系因为:所以:即:五 回归分析与相关分析的特点1、回归分析必须区分自变量和因变量,而相关分析不必区分。2、回归分析的两个变量一个是自变量,一个是因变量,通过给定自变量的值来推算因变量的可能值;而相关分析的两个变量都是随机变量。3、回归分析中对于因果关系不甚明确的两个变量,可以建立两个回归方程;而相关分析只能计算出一个相关系数。4、一种回归方程只能做一种推算,即只能给出自变量的值来推算因变量的值,不能逆推。六 估 计 标 准 误 差1、估计标准误差的含义:2、估计标准误差的计算公式:是用来说明回归方程代表性大小的统计指标,其计算原理与标准差基本相同。若估计标准误差小,表明回归方程准确度高代表性大,反之,估计不够准确,代表性小。简化公式下面举例说明估计标准误差的计算方法,结果表明估计标准误差是2.27百万元,这是就平均来说的,离差有正有负,平均起来等于2.27百万元。当实际观察值甚多且数值较大时,根据上述公式计算估计标准误差十分麻烦,可改用简化式。已知y28924.08,y221,x y16731,a4.853,b4.68,n6。两种方法的计算结果应该相等但由于计算(yyc)2时约等的原因,可能稍有误差,一般不影响结果的代表性。七估计标准误差与相关系数的关系根号前面的正负号表明正相关或负相关,具体取舍由回归系数的符号来确定。回归系数为正,则取正;回归系数为负、则取负。在给定相关系数的情况下,估计标准误差的计算公式又为:估计标准误差与相关系数存在着密切的关系,二者的关系可由如下去达式描述 r越小,Syx就越大,这表明现象间的相关关系越不密切,直线回归方程的精度越差。特别地,当ro时,Syx取得最大值。这时、现象间不存在直线相关关系,直线回归方程与y轴重合,此时X无论怎样变化,Y始终保持平均水平。r越大,Syx就越小,表明现象间的相关关系密切,直线回归方程的估计精度就高。持别地,当r1,Syx=0时,现象间完全相关,各相关点均落在回归直线上,此时,对x的任何变化,y总有一个相应的确定值与之对应。某银行各月存款平均增加额 165万元,各月放款平均增加额为 124万元。又知各月存款放款增加额的标准差分别为 =5万元,4万元。存款、放款增加额两变量的相关系数为r0.8,试求放款增加额y与存款增加额x的直线回归方程及估计标谁误差?(1)先求直线回归方程(2)求估计标准误差八 应用相关分析与回归分析应注意的问题(一)注意定性分析与定量分析的结合 现象之间是否一定存在相关关系,主要是靠定性分析,即依据社会经济理论、专业知识、实际经验对事物进行分析来判定的。不通过定性分析,直接根据样本观测数据进行量化分析构建模型,有时就可能得出错误的结论。因为,任何两列数据,即使是毫不相关的两个现象,都可以计算出相关系数,构建出回归模型。因此,相关分析中的切量化分析都应建方在定性分析基础之上。(二)注意客观现象质的规定性 现象间所存在的相互依存关系都是有一定数量界限的。也就是说,某些现象之间的相关关系在一定的限度内是正相关,而超过某一界限,则可能是负相关,在一定的限度内是直线相关,而在另一界限内可能是曲线相关。如果进行统计分析时不加区别,不注意现象间质的数量界限,就可能影响统计分析结论的可信度。(三)注意社会经济现象的复杂性客观社会经济现象间彼此有着干丝万缕的联系,某一现象发生的原因,有可能是另一现象出现的结果。而且,有时某一事件的出现可能导致诸多事件的发生,产生一系列的连锁反映。因此,进行统计分祈时,要充分考虑现象间的复杂性,注意偶然和个别因素的影响,这样才能保证统计分析的质量。(四)注意对相关系数和回归直线方程的有效性进行检验 相关分析中所得出的回归系数、回归直线方程、估计标准误差等都是根据样本数据求得的,但所作的结论却是对总体的。显然,这里存在一个由样本代表总体的问题。因此,使用相关系数、回归模型进行统计分析时,要对其有效性进行检验。第八章 指 数 分 析教学目的与要求指数分析是一种重要的统计分析方法,该方法解决了复杂经济现象进行综合对比的问题。本章详细介绍了指数的概念、种类、各种指数的编制方法、作用等内容。通过本章的学习,要求理解各种指数的含义、作用、掌握编制方法,能运用指数体系进行因素分析。本章主要内容第一节 指数的意义和种类第二节 综合指数和平均指数第三节 现实中的几种经济指数第四节 因素分析第五节 指数数列第一节 指数的意义和种类一、统计指数的涵义广义理解:一切相对数都可以称为指数。狭义理解:反映复杂现象总体数量变动的相对数。复杂现象总体是相对于简单现象总体而言的。简单现象总体指总体的单位和标志值可以直接加以总计,如某种产品产量、产品成本等;复杂现象总体指总体单位和标志值不能直接加以总计,如不同产品的产量、不同商品的价格。1、综合反映复杂现象总 体数量上的变动状态。2、分析现象总体变动 中受各个因素变动 的影响程度。如商 品销售额的变动受 商品销售量和销售 价格的影响程度。3、利用连续编制的指数数列对复杂现象总体长时间发展变化趋势进行分析。三、统计指数的种类按反映对象范围个体指数总指数按指标性质数量指标指数质量指标指数按采用基期定基指数环比指数第二节 综合指数和平均指数(一)综合指数的编制方法综合指数的编制方法是“先综合,后对比”1、综合通过解决不同度量单位的问题,来解决综合的问题。解决的方法:找到与所分析的指数化指标相联系的因素,使得指数化指标与这个因素的乘积成为价值量指标。这个与指数化指标相联系的因素就是同度量因素。一、综合指数同度量因素的作用当研究销售量的变动时,销售量是数量指标,则与之相联系的质量指标价格,就是同度量因素当研究价格的变动时,商品价格是质量指标,则与之相联系的数量指标销售量,就是同度量因素例如:研究多种商品销售量和销售价格的综合变动情况(商品销售量商品销售价格)=商品销售总额所研究的指数化指标同度量因素价值量指标(商品销售量商品销售价格)=商品销售总额所研究的指数化指标同度量因素价值量指标2、对比通过解决同度量因素的时期,来解决对比的问题。指数分析是利用价值量指标的形式,分析其中的数量指标或质量指标的综合变动,分析的方法就是将引进的同度量因素的时期固定,即假定同度量因素不变,从而通过对比反映所研究指标的变动情况。如前例:反映多种商品销售量变动的指数公式有:拉氏指数帕氏指数不变价指数反映多种商品销售价格变动的指数公式有:拉氏指数帕氏指数编制综合指数时的同度量因素时期的固定方法:数量指标综合指数应以基期的质量指标为同度量因素质量指标综合指数应以报告期的数量指标为同度量因素数量指标综合指数:公式中:下标1 代表报告期,0 代表基期质量指标综合指数:当所研究的指数化指标为数量指标时,称为数量指标综合指数,其同度量因素为基期质量指标。当所研究的指数化指标为质量指标时,称为质量指标综合指数,其同度量因素为报告期数量指标。即:(二)综合指数分析方法公式分子与分母的比值反映了所研究的数量指标报告期比基期相对综合变动程度。公式分子减分母的差额,反映了由于所分析的数量指标的变动,使价值量指标增加或减少的数额。1、数量指标综合指数分析相对数分析:绝对数分析:2、质量指标综合指数分析公式分子与分母的比值反映了所研究的质量指标报告期比基期相对综合变动程度。公式分子减分母的差额,反映了由于所分析的质量指标的变动,使价值量指标增加或减少的数额。相对数分析:绝对数分析:0.18 0.40 0.45报告期 500 125 80报告期基期基期 万斤万斤万斤计量单位 合计 0.2 0.4 0.5 400 120 80 甲乙丙 单价(元)销售量商品名称例:某农贸市场销售三种农产品资料如下:要求:1、分析三种农产品销售量的综合变动情况,以及销售量的变动对销售额的影响额。2、分析三种农产品销售价格的综合变动情况,以及价格的变动对销售额的影响额。所需数据列表计算如下:0.18 0.40 0.45 500 125 80 400 120 80 合计 0.2 0.4 0.5 甲乙丙 单价(元)销售量商品名称q0q1p0p1销售额(万元)q0p0q1p1q1p08048401689050361761005040190解:设q表示销售量,p表示价格,根据数量指标综合 指数和质量指标综合指数的公式,计算所需数据。计算得到:销售量总指数销售量变动对销售额产生的影响:说明:三种商品销售量报告期比基期总的上升了13.1%,由于三种商品销售量的上升使销售额增加了22万元。(1)分析三种商品销售量的变动:销售价格总指数销售价格的变动对销售额的影响:说明:三种商品销售价格报告期比基期总的下降 了7.37%,由于商品价格的下降,使商品销售 额减少了14万元。(2)分析三种商品销售价格的变动:二、平均指数(一)平均指数的编制方法从个体指数出发,并以价值量指标为权数,通过加权平均计算来测定复杂现象的变动程度。平均指数的计算形式1、算术平均数指数:表示数量指标个体指数,q0p0 表示基期价值量指标。公式中:2、调和平均数指数:表示质量指标个体指数,q1p1 表示报告期价值量指标。平均指数是总指数的另一种计算形式,因此通过编制平均指数的两个指数公式,也可以反映数量指标的总变动和质量指标的总变动。公式中:算术平均数指数1、算术平均数指数的应用 将个体指数代入公式数量指标综合指数推导结果表明:由算术平均数指数可以推导出数量指标综合指数,因此算术平均数指数反映的是数量指标的总变动。(二)平均指数的应用2、调和平均数指数的应用 调和平均数指数将个体指数代入公式质量指标综合指数推导结果表明:由调和平均数指数可以推导出质量指标综合指数,因此调和平均数指数反映的是现象质量指标的总变动。综合指数由于其组成内容具有明确的经济意义,因此是总指数的常用计算方法。算术平均数指数,当以数量指标的个体指数与基期价值量指标进行加权计算时,可以推导出综合指数中的数量指标指数;调和平均数指数,当以质量指标的个体指数与报告期价值量指标进行加权计算时,可以推导出综合指数中的质量指标指数。在满足上述条件下,平均指数可以说是综合指数的一种变形应用,这种变形应用也是经常采用的方法。例:有三种产品的生产资料如下:120 45 60 15 报告期 基期 112合计 25 0 50 36 64 12 甲乙丙 产量增长百分比(%)生产费用(万元)产品要求:计算三种产品产量总指数,并分析由于 三种产品产量的变动对生产费用的影响。解:设q 表示产量,p 表示单位成本,所需数据列表计算如下:120 45 60 15 112合计 25 0 50 36 64 12 甲乙丙产量增长百分比(%)生产费用(万元)产品q0p0q1p1产量个体指数k(%)125100150456418127假定的生产费用产量总指数:由于产量上升而增加的生产费用为:120 45 60 15 报告期 基期 112合计 0 6.2 16.7 36 64 12 甲乙丙单位成本降低百分比(%)生产费用(万元)产品例:有三种产品的生产资料如下:要求:计算三种产品单位成本总指数,并分析由于 三种产品单位成本的变动对生产费用的影响。解:设q 表示产量,p 表示单位成本,所需数据列表计算如下:120 45 60 15 112合计 0 6.2 16.7 36 64 12 甲乙丙单位成本降低百分比(%)生产费用(万元)产品q0p0q1p1单位成本个体指数k=p1/p010.9380.833假定的生产费用q1p1/k456418127单位成本总指数:由于单位成本下降而减少的生产费用为:第四节 因 素 分 析因素分析是借助于指数体系来分析社会经济现象变动中各种因素变动发生作用的影响程度。一、因素分析的含义例如:商品销售额的变动会受到商品销售量和销售价格两个因素的影响。利税额的变动会受到产品销售量、销售价格和利税率三个因素的影响。因素分析就是对影响现象变动的各个因素进行具体分析,目的是找出影响现象变动的主要因素。二、因素分析的指标因素分析的指标有两类:(一)总量指标变动的因素分析简单现象总体总量指标变动的因素分析复杂现象总体总量指标变动的因素分析(二)平均指标变动的因素分析如平均价格变动的分析、平均工资变动分析、平均单位成本变动分析、平均劳动生产率变动分析等。(一)总量指标变动的两因素分析总量指标如商品销售额、生产总值、总成本、工资总额、出口总额、进口总额等等。以上总量指标都可以分解为两个因素的乘积,其经济商品销售额=销售量 销售价格产品生产总值=产品产量出厂价格生产总成本=产品产量单位成本工资总额=工人人数平均工资关系式如:因素分析就是借助于以上经济关系式,建立指数体系,来分析各因素的变动对总量指标的影响程度的。指数体系的建立方法qpqp根据关系式:商品销售额=销售量 销售价格商品销售额指数=销售量指数 销售价格指数=1、简单现象总体总量指标变动因素分析相对数体系:绝对数体系:商品销售额指数=销售量指数 销售价格指数2、复杂现象总体总量指标变动因素分析=相对数分析:绝对数分析:例:三种农产品销售资料如下:0.18 0.40 0.45报告期 500 125 80报告期基期基期 万斤万斤万斤计量单位 合计 0.2 0.4 0.5 400 120 80 甲乙丙 单价(元)销售量商品名称要求:对三种农产品销售额的变动进行因素分析。解:商品销售额指数:绝对数分析:销售量指数:绝对数分析:计算得到分析结果说明:三种商品的销售额,报告期比基期总的上升了4.76%,绝对额增加了8万元。销售额的变动是由于销售量和销售价格的变动两个因素引起的。其中,销售量的变动使销售额提高了13.1%,绝对额增加了22万元;销售价格的变动使销售额下降了7.37%,绝对额减少了14万元。销售价格指数绝对数分析:指数体系:104.76%=113.1%92.63%8万元=22万元+(-14)万元(二)平均指标变动的两因素分析平均指标如:职工的平均工资、商品的平均价格、工人的平均劳动生产率、产品的平均单位成本等等。平均指标的变动受到哪些因素的影响呢?以职工的平均工资为例:其中:x 代表各组工资水平,f 代表各组的人数。平均工资公式表明,平均工资的高低受到两个因素的影响,一个是各组工资水平x,一个是各组的人数f。当对平均指标的变动进行分析时,也是从对这两个因素的变动分析来进行的。即平均工资的变动受到各组工资水平的变动和各组人员结构变动的影响。对平均指标进行因素分析,建立的指数体系如下:平均指标可变构成指数=平均指标固定构成指数平均指标结构变动影响指数=相对数体系绝对数体系平均指标固定构成指数反映了各组质量指标的变动对总平均指标变动的影响相对程度。平均指标结构变动影响指数反映了各组数量指标的变动对总平均指标变动的影响相对程度。总平均指标报告期比基期增减变动数值各组平均指标的变动对总平均指标变动的影响值各组数量指标结构的变动对总平均指标变动的影响值例:有关某企业资料如下:440 252 报告期 2500 1500 1000报告期 基期基期 1600合计 400 240 650 950甲乙劳动生产率(吨/人)工人人数(人)企业要求:对两个企业工人劳动生产率总平均变动情况进行因素分析。所需数据计算如下:440 252 2500 1500 1000 1600合计 400 240 650 950 甲乙劳动生产率工人人数 企业产量(万吨)2622.848.86625.291.2602484报告期总平均劳动生产率基期总平均劳动生产率假定总平均劳动生产率劳动生产率可变构成指数绝对数分析:劳动生产率固定构成指数绝对数分析:劳动生产率结构变动影响指数绝对数分析:指数体系:119.61%=108.57%110.16%59.8(吨/人)=28.8(吨/人)+31(吨/人)说明:两个企业工人劳动生产率报告期比基期总的上升了19.61%,人均产量增加了59.8吨。这一变动是由两个因素的变动引起的:其中由于各企业劳动生产率的提高使总平均劳动生产率提高了8.57%,人均产量增加了28.8吨;由于各企业人员结构的变动,使总平均劳动生产率提高了10.16%,人均产量增加了31吨。第九章 动态数列分析教学目的与要求 动态数列分析是一种广泛应用的、重要的统计分析方法。本章详细介绍了动态数列的种类、动态数列的构成内容、动态分析指标的计算方法及运用条件。通过本章的学习,要求能够区分各种动态数列,能够运用所学方法结合实际资料进行计算分析。本章主要内容第一节 动态数列的意义和种类第二节 现象发展的水平指标第三节 现象发展的速度指标第四节 现象变动的趋势分析第一节 动态数列的意义和种类一、动态数列的概念动态数列由两部分构成时间指标数值 500 2000 330 1999 100 1997 160生产总值(万元)1998年份例如:某企业各年生产总值资料如下:二、动态数列的种类1、总量指标动态数列时期数列时点数列特点?20001999199819971996 年份 50 100 79 74 60增加值(万元)某企业1996年2000年增加值数据表四月底三月底二月底一月底 时间 240 229 238 230职工人数(人)某企业14月职工人数统计表连续时点数列间断时点数列间隔相等时点数列间隔不等时点数列12月底八月底三月底一月底 时间 240 229 238 230职工人数(人)某企业某年职工人数统计表2、相对指标动态数列3、平均指标动态数列相对指标和平均指标动态数列的形成 120 三月 105 二月 98计划完成程度(%)一月 月份 68 三月 70 二月 60工人占全部职工比重(%)一月 月份 168 三月 170 二月 160工人劳动生产率(件/人)一月 月份第二节 现象发展的水平指标动态分析的指标两类反映现象发展的水平指标反映现象发展的速度指标一、发展水平发展水平就是动态数列中的每一项具体指标数值。其数值可以表现为绝对数、相对数或平均数。例如:某商业企业1月份销售额500万元;完成销售计划的120%。发展水平最初水平最末水平报告期水平基期水平根据各发展水平在动态数列中所处的地位和作用不同 二、平均发展水平(一)平均发展水平的含义:注意动态平均数与静态平均数的区别:主要区别:序时平均数所平均的是某一指标在不同时间上的指标数值,反映该指标在不同时间下达到的一般水平。而静态平均数所平均的是某一数量标志在总体各单位的数量表现标志值,反映该数量标志的标志值,在同一时间下在总体各单位达到的一般水平。(二)平均发展水平的计算1、由总量指标动态数列计算序时平均数(1)由时期数列计算序时平均数 公式 360 5月a5 310 4月a4 300 3月a3 240 2月a2 320 1月a1 销售额月份例:某商业企业15月份商品销售资料如下:单位万元则:15月份平均每月的销售额为:(2)由时点数列计算序时平均数由连续时点数列计算序时平均数以天为瞬间单位,每天都进行登记,形成的时点数列。例如:有某企业1号6号每天的职工人数资料:106 6日a6 108 5日a5 101 4日a4 99 3日a3 100 2日a2 98 1日a1职工人数(人)日期则:16号平均每天的职工人数为:例如:有某企业1号30号每天的职工人数资料:108 16日30日a3 1059日15日a2 102 1日8日a1职工人数(人)日期则:1号至30号平均每天的职工人数为:由间断时点数列计算序时平均数A、间隔相等时点数列 104 4月初a4 108 3月初a3 105 2月初a2 102 1月初a1职工人数(人)时间则:一季度平均每月的职工人数为:B、间隔不等时点数列 104 年底a4 108 9月初a3 105 3月初a2 102 1月初a1职工人数(人)时间则:该年平均每月的职工人数为:C、间隔相等时点数列与间隔不等时点数列的关系当 f1=f2 =fn-1 时,上式可变为:2、由相对指标或平均指标动态数列计算序时平均数基本公式公式表明:相对指标或平均指标动态数列的序时平均数,是由a、b两个数列的序时平均数对比得到的。a 数列的序时平均数b 数列的序时平均数因为a、b两个数列都是总量指标动态数列,所以ab两个数列的序时平均数,可根据数列的性质,分别采用相应的公式来计算。例如:有某企业产量和职工人数资料如下:64 1650 四月 65 1050 三月 60 1440 二月 1200产量(件)60 一月月初人数(人)项目时间要求:计算该企业一季度平均每月的劳动生产率。产量为a 数列,人数为b 数列时期指标时点指标即:其中:所以:例题:某商业企业商品销售额和库存额资料如下:75 150七月 45 240 六月 55 200 五月 150商品销售额(万元)45 四月月初库存额(万元)项目时间要求:根据资料计算二季度每月的商品流转次数。提示:解:平均每月的商品流转次数即:二季度的商品库存额平均每月周转3.69次。例:某地区某年各季度末零售网点和职工人数资料如下:320 2536四季末 304 2520三季末 255 2479二季末 256 2408一季末 250 2400上年末零售企业数(个)职工人数(人)要求:根据资料计算该地区平均每季度每网点职工人数。解:平均每季度每个零售网点的职工人数为:即:该地区该年平均每个零售网点约9名职工。第三节 现象发展的速度指标现象发展变化的速度指标反映了现象在不同时间上发展变化的程度。主要包括以下指标:发展速度 增长量 增长速度 平均发展速度和平均增长速度 增长百分之一的绝对值 一、发展速度发展速度是两个不同时间上的发展水平之比,反映现象报告期比基期发展变化的相对程度。基本公式根据采用基期的不同环比发展速度定基发展速度环比发展速度与定基发展速度的关系各期环比发展速度的连乘积等于定基发展速度相临两个时期的定基发展速度之商等于相应的环比发展速度例:已知1997年、1998年、1999年三年的环比发展速度分别为110%、150%、180%,试计算1998年和1999年的定基发展速度。解:根据环比发展速度与定基发展速度之间的关系1999年的定基发展速度=110%150%180%=297%1998年的定基发展速度=110%150%=165%例:已知1995年1998年的发展速度为180%,1985年1999年的发展速度为200%,试 计算1999年的环比发展速度。解:因为相临的两个定基发展速度之商等于相应 的环比发展速度,所以:1999年的环比发展速度=二、增长量增长量是以绝对数形式表示的速度分析指标基本公式:增长量=报告期水平基期水平根据采用基期的不同分为1、逐期增长量=报告期水平报告期前一期水平符号表示:2、累计增长量=报告期水平固定基期水平符号表示:3、逐期增长量与累计增长量的关系:4、平均增长量的计算计算方法(n代表动态数列的项数)三、增长速度增长速度是反映现象数量增长方向和程度的动态相对指标。计算方法有两种:第二种方法:第一种方法:增长速度=发展速度1当计算结果为正值,表示现象报告期比基期的增长程度。当计算结果为负值,表示现象报告期比基期的降低程度。根据采用基期的不同增长速度分为两种环比增长速度定基增长速度环比发展速度1(100%)定基发展速度1(100%)四、增长百分之一的绝对值增长百分之一的绝对值是速度指标与水平指标相结合运用的统计指标。它能够对现象发展变化规律作出更加深刻的分析。计算方法例:已知某企业1995年2000年生产总值资料如下:78320007031999 5481998 5191997 44719963431995生产总值年份单位:万元要求:2、计算各年的环比发展速度和定基发展速度3、计算各年的环比增长速度和定基增长速度4、计算各年的增长百分之一的绝对值5、计算1995年2000年生产总值的平均发展速度和平均增长速度。1、计算各年的逐期增长量和累计增长量解:列表计算如下:逐期增长量累计增长量环比发展速度%环比增长速度%定基发展速度%定基增长速度%增长百分之一的绝对值 7832000 7031999 5481998 5191997 4471996 3431995生产总值(万元)年份104722915580104176205360440100130116106128111 301662811100151130160205228 3051601051283.434.475.195.487.03五、平均发展速度和平均增长速度平均发展速度和平均增长速度统称为平均速度。平均发展速度反映现象逐期发展变化的平均速度平均增长速度反映了现象逐期递增的平均速度平均速度是各期环比速度的平均数,说明现象在较长时期内速度变化的平均程度。平均增长速度=平均发展速度1(100%)平均速度平均发展速度的计算方法 几何平均法这是计算平均发展速度的基本方法因为,平均发展速度是对各期的环比发展速度求平均数,对不同时期的环比速度求平均需采用几何平均法。公式为:平均发展速度公式中:x1xn表示各期环比发展速度(1)因为各期环比发展速度的连乘积等于定基发展速度,所以可以推导出计算平均发展速度的第二个公式:(2)即平均发展水平为动态数列的最末水平与最初水平之比的n次根。因为某一时期的定基发展速度就是这个时期现象发展的总速度,所以根据第二个公式可以推导出第三个公式:平均发展速度(3)公式中:R 代表现象在某一时期内发展变化的总速度例如:已知1996年至2000年各年生产总值的环比发展速度分别为130%、116%、106%、128%和110%,试计算1996年至2000年平均每年的发展速度。解:根据公式(1)计算如下:即96年至2000年生产总值平均每年的发展速度为125.66%。例如:某企业生产的某种产品2000年产量为500 吨,根据对市场需求情况进行预测,预计2005年市场需求量将达到5000吨。为满足市场需求,问该产品产量每年应以多大的速度增长?解:已知则:平均增长速度例如:某企业2000年生产总值为574.8万元,若预计每年平均增长13%,问2006年生产总值可达到多少万元?解:已知求?即按此速度增长,2006年产值可达到1196.7万元。根据公式可知例如:某企业计划20005年产量要比2000年增长2倍,问平均每年增长百分之几才能完成预计任务?解:因为2005年产量比2000年增长2倍,即2005年产量为2000年的3倍所以,2000年至2005年产量总速度为300%则平均增长速度=即每年平均增长25%,才能完成预计任务。第四节 现象变动的趋势分析影响动态数列变动的因素长期趋势季节变动循环变动不规则变动现象变动的趋势分析就是对影响动态数列变化的各种因素进行分析,目的是发现影响现象变化的原因,掌握现象发展变化的规律,为预测和决策提供依据。长期趋势的测定长期趋势测定就是用一定的方法对动态数列进行修匀,使修匀后的动态数列排除了季节变动、循环变动和无规则变动等因素的影响,显示出现象变动的基本趋势,此趋势可作为预测的依据。测定长期趋势的方法有时距扩大法移动平均法数学模型法一、时 距 扩 大 法时距扩大法就是把原有动态数列中各时期资料加以合并,扩大每段计算所包括的时间,得出一个较长时距的新动态数列,以消除由于时距较短受偶然因素影响所引起的波动,从而显示现象变动的趋势和方向。将原数列扩大时距后形成的新的动态数列,数列中各项指标数值可以用总量指标表示,也可以用平均指标表示。二、移 动 平 均 法对原数列采用逐期递推移动的方法计算一系列扩大时距的序时平均数,并以这一系列移动平均数作为对应时期的趋势值。具 体 方 法:从动态数列第一项数值开始,按一定项数(如两项、三项或更多项)求其序时平均数,并逐项移动,得出一个由移动平均数构成的新的动态数列。奇数项移动平均,所得数值对准移动项数的中间位置;偶数项移动平均,所得数值对准移动项数中间两项的中间位置,并需要移正平均一次。三、数 学 模 型 法数学模型法是根据动态数列的资料配合一个方程式,据以计算各期的趋势值。直线趋势的测定方法如果动态数列逐期增长量相对稳定,则采用直线作为趋势线,来描述动态数列的趋势变化,并进行预测。直线趋势方程为:公式中:yc 因变量,代表所研究现象的预测值t 自变量,代表时间的序号a、b为方程参数用最小平方法求解方程参数a、b:用最小平方法求解方程参数a、b 的简化公式如果让时间序号的合计数等于零,即t=0则求解 a、b 的公式可以简化为:令t=0 的方法为:当动态数列为奇数项时,可令数列的中间一项为原点,数列的前半部分序号从中间开始取负的1、2、3、;数列的后半部分序号从中间开始取正的1、2、3、。当动态数列为偶数项时,可令数列的中间两项的中点为原点,数列的前半部分序号从中间开始取负的1、3、5、7、;数列的后半部分序号从中间开始取正的1、3、5、7、。例如教材P404例题:某商业企业历年销售额资料如下:单位:万元 592000 561999 531998 551997 531996 531995 501994 481993销售额年份要求:根据资料配合销售额的直线趋势方程,并预测2001年的销售额。592000 561999 531998 551997 531996 531995 501994 481993销售额年份解题过程如下:t-1-3-5-71357t249259119 2549ty-336-250-159-5355159280413y预测2001年的销售额,t=9则预测值为:
展开阅读全文