统计学第三版ppt全-课件

上传人:陈** 文档编号:189670237 上传时间:2023-02-23 格式:PPT 页数:633 大小:11.93MB
返回 下载 相关 举报
统计学第三版ppt全-课件_第1页
第1页 / 共633页
统计学第三版ppt全-课件_第2页
第2页 / 共633页
统计学第三版ppt全-课件_第3页
第3页 / 共633页
点击查看更多>>
资源描述
出品人:蒋东明主 编:陈 红责 编:施高翔制作人:刘 倩n第一章 绪论n第二章 统计数据的搜集、整理和显示n第三章 分布数量特征的统计描述n第四章 统计推断的理论基础n第五章 参数估计n第六章 假设检验n第七章 相关性分析与回归分析n第八章 时间序列分析与预测n第九章 统计指数与因素分析n第十章 统计综合评价第一章 绪论n主要内容:l第一节 统计的含义及其研究对象l第二节 统计学的基本概念l第三节 统计学与其他学科的关系n学习思考题 第一章第一节第一节 统计的含义及其研究对象n一、统计的含义l统计学是关于数据的搜集、整理、归纳和分析的方法论的科学。l它研究的是如何应用科学的手段向客观实际搜集数据,对搜集到的数据如何进行加工和整理,又如何从这些复杂纷繁的数据中,探索其数量特征、数量关系以及变动趋势并得出结论,并应用统计语言解释这个结论,以达到对客观现象更正确、更深刻的认识。第一章第一节第一节 统计的含义及其研究对象n二、统计学的研究对象及其特点:l统计学的研究对象是根据统计研究的目的所要认识的客体,具体说来,是指客观事物的数量特征和数量关系。l统计学的研究对象具有如下特点:u1.数量性:它是统计学研究对象的基本特点u2.总体性:统计研究虽然是从个别入手,对个别单位的具体事实进行观察研究,但其目的是认识总体数量特征u3.变异性:统计研究的是同质总体的数量特征,其前提是总体各单位的特征表现存在着差异,而这些差异不是由某些特定的原因事先给定的 第一章第一节第一节 统计的含义及其研究对象n三、统计数据的类型n(一)按数据的计量尺度分类 l定性数据:常用文字表述,其计量结果表现为类别。又可以分为:u定类数据:亦称为列名数据,它是按照客观现象的某种属性对其进行平行的分类,若用数字表示,该数字仅作为各类的代码,度量各类之间的类别差,不反映各类的优劣、量的大小或顺序。u定序数据:顺序数据,它是对客观现象各类之间的等级差或顺序差测度的数据,比定类数据的计量尺度更高一级。l定量数据:比定序数据的计量尺度又更高一级。定量数据是对客观现象进行计量的结果,表现为具体的数值。第一章第一节第一节 统计的含义及其研究对象n(二)按对客观现象观察的时间状态分类l横截面数据:又称为静态数据,它是指在同一时间对不同单位的数量表现进行观察而获得的数据,例如,2010年1月我国各省市的消费价格指数、2010年2月我市各个商品房楼盘的销售量等是横截面数据。l时间序列数据:时间序列数据又称为动态数据,它是指在不同时间对同一单位、同一现象的数量表现进行观察而获得的数据,例如,1978年2010年我国的消费价格指数是时间序列数据。第一章第一节第一节 统计的含义及其研究对象n(三)按数据的表现形式分类:l绝对数:现象的规模、水平一般以绝对数形式表现,例如,国内生产总值、产品总产量、人口数、进出口额和股票的交易额等。绝对数按其反映的时间状态不同,分为时期数据和时点数据l相对数:相对数是由两个绝对数对比而得的l平均数:用于反映现象总体的一般水平或分布的集中趋势,数值平均数是由总体标志总量对比总体单位数而计算的 第一章第一节第一节 统计的含义及其研究对象n四、变量及其分类n(一)变量与变量值l统计数据是客观现象量的表现,在统计中,说明现象的某一数量特征的概念一般也被称为变量,变量的具体取值是变量值。n(二)变量的分类l连续型变量和离散型变量u连续型变量是指变量的取值连续不断,无法一一列举,即在一个区间内可以取任意实数值。例如,人的身高、体重、年龄,气象的温度、湿度,零件的尺寸,电子元件的使用寿命等。第一章第一节第一节 统计的含义及其研究对象u离散型变量是指变量的数值只能用计数的方法取得,其数值可以一一列举。例如,企业数、职工人数和机器台数等l确定性变量和随机变量u确定性影响,使变量沿着一定的方向呈上升或下降的变动趋势u随机变量变量是指变量的取值受到某种起决定性作用因素的是指影响变量值变动的因素有多种,变量的取值是随机的。关于随机变量这一概念,我们将在第四章中进行详细的介绍 第一章第一节第二节统计学的基本概念 第一章第二节第二节 统计学的基本概念n一、统计总体和样本n(一)统计总体l1.统计总体的概念:统计总体就是根据一定的目的确定的所要研究对象的全体。它是由客观存在的、具有某种共同性质的许多个别单位所构成的整体。同质性和大量性是统计总体的两个特点。l2.统计总体的类型:凡变量取值是有限的,我们称之为有限总体;凡变量取值是无限的,我们称之为无限总体。n(二)样本 样本是从总体中抽取出的、作为总体的代表、由部分单位组成的集合体。第一章第二节第二节 统计学的基本概念n二、总体单位与标志n(一)总体单位:总体单位简称为单位,它是组成总体的个体统计总体和单位的概念是相对的,它们会随着研究目的的不同而发生相互变化。第一章第二节第二节 统计学的基本概念n(二)标志:l1.标志的含义:总体各单位所具有的属性或特征称为标志,它是反映总体各单位属性或特征的。对总体中每一个单位从不同的侧面观察,它们都具有许多的属性或特征,使它们可以被识别l2.标志的分类:u(1)按照标志所反映的单位的特征不同,标志可分为品质标志和数量标志。u(2)按照标志在总体中各单位的具体表现是否相同,标志可分为不变标志和可变标志。第一章第二节第二节 统计学的基本概念n三、统计描述和统计推断l(一)统计描述u统计描述指对由试验或调查所获得的资料进行整理、归类,计算出各种用于说明总体数量特征的数据,并运用图形或表格的形式将它们显示出来。l(二)统计推断u统计推断是指利用概率论的理论,根据试验或调查获得的样本信息,科学地推断总体的数量特征。第一章第二节第三节统计学与其他学科的关系 第一章第三节第三节 统计学与其他学科的关系n一、统计学与会计学的关系l统计学和会计学各自都是一门独立的、完整的学科,它们各有自己的理论体系,自己的研究对象、研究方法。统计学与会计学这两门学科不能互相替代,但两门学科又相互联系、相互渗透。第一章第三节第三节 统计学与其他学科的关系n二、统计学与计量经济学的关系l统计学和计量经济学是相互独立的两门学科。统计学侧重于数据的搜集、整理、归纳和分析,而计量经济学则侧重于经济理论的验证、经济政策的评议和经济量未来值的预测。l统计学的研究过程经历了统计设计、统计调查、统计整理、统计分析和统计资料的积累等阶段。计量经济学的研究过程一般经历了确定用于测量经济现象的模型,求出模型的参数估计值,对估计值进行评价,对模型预测的有效性进行评价。l统计学对变量的描述,其目的是为了从统计数据中认识所要研究的现象,解释现象,寻找现象的规律,并在不同的事物间、不同的时间上、不同的空间中进行评判、比较、推算。计量经济学利用联立方程“回归”模型,目的是研究多个经济变量之间的相互作用关系或递推关系。第一章第三节第三节 统计学与其他学科的关系n三、统计学与数学的关系l统计学与数学都是研究数量的关系和数量的规律的科学,都要与大量的数字打交道。l统计学和数学都有利用各种数学公式进行数字演算的特点,但两者研究的数是存在差别的。l统计学和数学都是研究数量规律的,统计学研究的是具体的实际现象的规律,而数学研究的是抽象的数量规律。第一章第三节第三节 统计学与其他学科的关系l统计学的研究方法是归纳与演绎相结合的方法,其中归纳占主要地位。数学的研究方法主要是逻辑推理和演绎论证的方法。l数学为统计学提供了数量分析方法论的基础。第一章第三节思考与练习1.何谓统计学?统计学的研究对象有什么特点?2.统计数据有几种类型?它们各有什么特点?3.简要解释统计变量的含义,并说明变量的几种分类。4.统计数据中,相对数有几种形式?请以实例具体说明。5.说明统计总体、样本和单位的含义,它们三者之间有什么联系?第一章思考题思考与练习6.总体与单位的概念是不是一成不变的?以一实例说明总体与单位的概念的相对性。7.总体的两个特点是什么?8.抽取样本应注意什么问题?9.简要说明标志的含义与分类。10.以一实例说明总体的同质性与变异性的具体表现,并阐明两者的辩证关系 第一章思考题第二章 统计数据的搜集、整理和显示n主要内容:l第一节 统计数据的搜集l第二节 数据整理l第三节 频数分布l第四节 数据显示n学习思考题 第二章第一节第一节 统计数据的搜集n一、统计数据搜集的基本理论与方法n(一)统计数据搜集的概念l统计数据搜集是根据统计研究预定的目的要求和任务,运用相应的科学的方法与手段,有计划、有组织地向客观实际搜集数字资料的过程。l搜集的方式有两种:一种是直接向调查单位搜集资料,即原始资料,又称为初始资料;另一种是根据研究的目的,搜集已经加工、整理过的,说明总体现象的资料,一般称为次级资料或第二手资料。第二章第一节n(二)调查数据与实验数据l人们要获得社会经济现象的相关数据,运用相应的调查方法,向客观实际搜集数字资料的过程就是统计调查。通过统计调查获得的数据就是调查数据。l搜集数据的另一个途径是实验。在实验中控制一个或多个变量,在一定的控制条件下观测实验对象,从实验过程中获得数据。这种在实验中控制实验对象、观测整个实验过程而搜集到的数据就是实验数据第一节 统计数据的搜集 第二章第一节n(三)统计数据的搜集方法l直接观察法l报告法(通讯法)l采访法l登记法l实验设计调查法第一节 统计数据的搜集 第二章第一节第一节 统计数据的搜集n二、统计调查的组织形式n(一)全面调查与非全面调查l全面调查:是对调查对象的所有单位一一进行调查。普查、全面统计报表都属于全面调查。u普查。普查是专门组织的一种全面调查,它主要是用以调查某些不能或不宜用定期的全面报表搜集的统计资料。u全面统计报表制度。全面统计报表制度是依照国家有关法规,自上而下地统一布置,以一定的原始记录为依据,按照统一的表式、统一的指标项目、统一的报送时间和报送程序,自下而上、逐级地定期提供统计资料的一种调查方式。第二章第一节第一节 统计数据的搜集l非全面调查:是对调查对象中的一部分单位进行调查,以取得调查对象的部分资料,用来推断总体或反映总体的基本情况。分为抽样调查、重点调查和典型调查。u抽样调查:抽样调查分为概率抽样与非概率抽样。概率抽样:是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据所获得的样本数据,对调查对象总体特征作出具有一定可靠程度的推算。抽样调查的适用范围:对一些不可能或不必要进行全面调查的社会现象。对普查资料进行必要的修正 第二章第一节第一节 统计数据的搜集抽样调查原则:必须遵循随机原则 必须遵循最大抽样效果原则u重点调查:指在调查对象中,只选择一部分重点单位进行的非全面调查。u典型调查:根据调查的目的,在对所研究的对象进行初步分析的基础上,有意识地选取若干具有代表性的单位进行调查和研究,借以认识事物发展变化的规律。第二章第一节第一节 统计数据的搜集n(二)连续性调查与非连续性调查l连续(经常)性调查是指随着研究现象的变化,连续不断地进行调查登记。l非连续性调查是指间隔一段较长的时间,对事物的变化进行一次性调查。如普查、典型调查、重点调查等一般是不连续性调查。n(三)定期报表形式与专门调查l定期报表制度是按国家统一规定的表式和内容,定期地向各级领导机构报送统计资料的一种形式。l专门调查是为某一专题研究而组织的专项调查,一般而言,普查、抽样调查和典型调查等可以是专门调查。第二章第一节第一节 统计数据的搜集n三、统计调查体系l我国统计法对统计调查计划和统计制度作了明确的规定:统计调查应当以周期性的普查为基础,以经常性的抽样调查为主体,以必要的统计报表、重点调查、综合分析等为补充,搜集、整理基本统计资料。l在统计调查体系中,适度地采用了科学的推算方法。第二章第一节第一节 统计数据的搜集n四、统计调查方案的设计l确定调查目的,明确统计调查要解决什么问题。l确定调查对象和调查单位l确定调查项目,调查中所要登记的调查单位的特征l调查表格和问卷的设计l确定调查时间l确定调查的组织实施计划 第二章第一节第一节 统计数据的搜集n五、统计调查误差衡量统计调查数据的准确性l可以分为:抽样误差和非抽样误差l抽样误差,在抽样调查中,由于随机性的原因致使样本的结构无法充分地代表总体的特征,由此而产生的误差即抽样误差。l各种形式的调查,都可能出现非抽样误差。非抽样误差的产生原因多种,难以准确地计量。第二章第一节 第二章第二节第二节 数据整理n一、数据整理的内容与程序n(一)统计数据整理的内容l根据研究目的设计整理汇总方案。l根据汇总方案,利用相应的统计软件进行数据处理,对各个调查项目的资料进行汇总并计算出各项指标。l通过统计表或统计图的形式,对整理的结果进行统计描述。第二章第二节第二节 数据整理n(二)数据整理的程序l审核统计资料。l对资料进行分组和汇总。l利用相应的统计软件对经过预处理后的数据进行运算,形成各项统计指标。l用统计表或绘制统计图的形式显示整理的结果。l保管、积累和公布统计资料。第二章第二节第二节 数据整理n二、统计分组n(一)统计分组的概念与种类l根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。l统计分组的原则:u穷尽原则,就是使总体中的每一个单位都应有组可归,或者说各分组的空间足以容纳总体所有的单位。u互斥原则,就是在特定的分组标志下,总体中的任何一个单位只能归属于某一组,而不能同时或可能归属于几个组。第二章第二节第二节 数据整理l统计分组的种类:u按分组标志的多少,可分为简单分组和复合分组。u按分组标志的性质不同,分为品质分组(或称属性分组)和数量分组(或称变量分组)。u按分组的作用和任务不同,分为类型分组、结构分组和分析分组。n(二)统计分组的方法l品质分组的方法:u1.分组标志。u2.取决于统计分析对分组层次的不同要求。第二章第二节第二节 数据整理u3.采用统一标准。l数量分组的方法:u1.单项式分组与组距式分组u2.间断组距式分组和连续组距式分组u3.等距分组与异距分组u组距、组数、组限与组中值的计算:连续组距分组的组距计算公式是:组距=本组上限-本组下限 (2.1)间断式分组的组距大小的计算,采用如下公式:组距=本组上限-本组下限+1 (2.2)第二章第二节第二节 数据整理确定组数和组距的经验公式斯特杰斯经验公式,即:n=1+3.3 lg(N)(2.3)d=Rn=xmax-xmin+3.3lg(N)(2.4)【公式(2.3)、(2.4)中,n为组数;N为总体单位数;d为组距;R为全距(或称极差),即最大变量值Xmax与最小变量值Xmin之差】根据公式组数参考标准根据公式组数参考标准 组中值=(上限+下限)/2 (2.5)N N1524152425442544458945899017990179180359180359n56789 第二章第二节第二节 数据整理n三、统计指标n(一)统计指标的含义l统计指标是反映统计总体数量特征的范畴,其相应的数值是指标值。指标值是一种变量。n(二)统计指标的分类l数量指标:反映现象的总规模、总水平或工作总量。l质量指标:是反映现象的相对水平或工作质量。第二章第二节第二节 数据整理n(三)统计指标体系l统计指标体系是由一系列相互联系的统计指标所组成的有机整体。n(四)主要经济统计指标解释l国内生产总值(Gross Domestic Product,简称GDP):指一个国家(或地区)所有常住单位在一定时期内生产活动的最终成果。l国民总收入(Gross National Income,简称GNI):指一个国家(或地区)的国民一定时期内在国内外生产的最终产品和劳务的价值总和。第二章第二节第二节 数据整理l就业人员:指在16周岁及以上,从事一定社会劳动并取得劳动报酬或经营收入的人员。l全社会固定资产投资额:指以货币表现的建造和购置固定资产活动的工作量。l社会消费品零售总额:指国民经济各行业直接售给城乡居民和社会集团的消费品总额。l能源生产总量:指一定时期内全国一次能源生产量的总和,包括原煤、原油、天然气、水电、核电及其他动力能发电量。第二章第二节第二节 数据整理l财政收入:指国家财政参与社会产品分配所取得的收入,它是实现国家职能的财力保证。l财政支出:指国家财政对所筹集的资金进行分配使用,以满足经济建设和各项事业的需要。l居民消费价格指数(CPI):指反映一定时期内城乡居民所购买的生活消费品价格和服务项目价格变动趋势和程度的相对数,是对城市居民消费价格指数和农村居民消费价格指数进行综合汇总计算的结果。第二章第二节第二节 数据整理l房地产价格指数:是反映一定时期内房地产价格变动趋势和程度的相对数,包括房屋销售价格指数、房屋租赁价格指数、土地交易价格指数和物业管理价格指数。l全国城乡居民储蓄存款余额:指反映某一时点城乡居民存入银行及农村信用社的储蓄余额。l农林牧渔业总产值:指以货币表现的农林牧渔业全部产品的总量,反映一定时期内农业生产总规模和总成果。第二章第二节第二节 数据整理l进出口总额:指实际进出我国国境的货物总金额l全员劳动生产率:指根据产品价值量指标计算的平均每一从业人员在单位时间内的产品生产量,它是考核企业经济效益的主要指标。全员劳动生产率=工业增加值全部从业人员平均人数。l城镇家庭可支配收入:指家庭成员得到可用于最终消费支出和其他非义务性支出以及储蓄的总和,即居民家庭可以用来自由支配的收入。l恩格尔系数:指食物支出金额在消费性总支出金额中所占的比例。第二章第二节第二节 数据整理l工业增加值:指工业行业在报告期内以货币表现的工业生产活动的最终成果。l能源消费总量:指一定时期内全国物质生产部门、非物质生产部门和生活消费的各种能源的总和。l农户纯收入:指农村住户当年从各个来源得到的总收入相应地扣除所发生的费用后的收入总和。l商品房销售面积:指报告期内出售商品房屋的合同总面积。由现房销售建筑面积和期房销售建筑面积两部分组成。第二章第二节第三节频数分布 第二章第三节第三节 频数分布n一、频数分布及分布数列的两个要素n(一)频数分布l在统计分组的基础上,将总体所有的单位按某一标志进行归类排列。n(二)分布数列的两个要素l分布数列由两个要素构成,一个是总体按某标志所分的组,另一个是各组所出现的单位数,即频数,亦称次数,f。第二章第三节第三节 频数分布n二、频率、频数密度与频率密度l【例2-1】搜集2009年12月日60只股票个股交易金额(百万元)数据,并对个股交易的变量值从小到大排序,形成如下数列:28 31 32 34 35 37 39 50 51 53 55 56 57 59 60 61 64 69 70 71 74 80 81 84 85 87 88 89 90 92 94 94 100 101 102 103 106 107 108 110 112 113 115 127 150 151 154 156 166 170 182 206 214 221 235 253 256 277 300 302l要求:对以上述数据进行整理,编制次数分配数列。第二章第三节第三节 频数分布l解:对上述资料采用等距分组,分为7组,组距为50。l经过整理,得出计算结果如表2-3所示。l表2-3中第1列是变量xi;第2列是各组出现的次数,即频数fi,各组频数之和等于总体单位数;第3列是频率,频率反映了各组频数的大小对总体所起的作用的相对强度,它是各组频数与总体单位总和之比。l计算公式如下:u 频率=fi/fi (2.6)fi表示第i组频数 第二章第三节第三节 频数分布u 结果分布:60只股票个股交易金额分布表(单位:百万元)按交易金额分组(xi)频数(fi)频率(fi/fi)50以下 7 0.116 7 50100 25 0.416 6 100150 12 0.200 0 150200 7 0.116 7 200250 4 0.066 7 250300 3 0.050 0 300以上 2 0.033 3 合计 60 1.000 0 第二章第三节第三节 频数分布l频率具有如下两个性质:u任何频率都是界于0和1之间的一个分数,即:0fi/fi1。u各组频率之和等于1,即:fi/fi=1。l频数密度的计算公式如下:u频数密度=频数组距(2.7)u频率密度=频率组距(2.8)l各组频数密度与各组组距乘积之和等于总体单位数,各组频率密度与各组组距乘积之和等于1。第二章第三节第三节 频数分布n三、累计频数与累计频率n(一)向上累计和向下累计l向上累计频数(或频率)分布,其方法是先列出各组的上限,然后由标志值低的组向标志值高的组依次累计。l向下累计频数表明某组下限以上的各组单位数之和是多少,向下累计频率表明某组下限以上的各组单位数之和占总体单位数比重的大小。第二章第三节第三节 频数分布n表2-4 P38 第二章第三节第三节 频数分布n(二)累计频数和累计频率的特点l累计频数分布的特点:u第一组的累计频数等于第一组本身的频数;u最后一组累计频数等于总体单位数。l累计频率的特点:u第一组的累计频率等于第一组本身的频率;u最后一组的累计频率等于1。第二章第三节第三节 频数分布n四、频数分布的类型n(一)钟形分布n(二)U形分布 P39 2-3 第二章第三节第三节 频数分布n(三)J形分布 第二章第三节 第二章第四节第四节 数据显示n一、统计表 n(一)统计表的定义和结构l统计表:表现经过整理的统计数据的表格。l从表式上看:标题总标题、横行标题、纵栏标题和指标数值四个部分l从内容上看:由主词栏和宾词栏两个部分组成。n(二)统计表的分类l按主词的结构分类:简单表、分组表和复合表。l按宾词设计分类:宾词简单排列、分组平行排列和分组层叠排列等三种。第二章第四节第四节 数据显示n(三)统计表的设计l统计表设计总的要求是:简练、明确、实用、美观,便于比较。统计表的设计应注意如下几个具体事项:u线条的绘制u合计栏的设置u标题的设计u数值的填写u计量单位的填写u注解或资料来源 第二章第四节第四节 数据显示n二、统计图n(一)直方图l【例2-3】现仍以例2-1 中的2009年12月日60只股票个股交易金额的资料为例,利用表2-3的数据绘制直方图。解:利用Excel软件处理,所绘制的直方图见图2-5图2-5个股交易次数分布直方图 第二章第四节第四节 数据显示n(二)折线图l【例2-4】现仍利用表2-3的数据绘制折线图。解:利用Excel软件处理,所绘制的折线图见图2-6图2-6个股交易次数分布折线图 第二章第四节第四节 数据显示n(三)曲线图l分布曲线图:当变量数列的组数无限增多时,折线便近似地表现为一条平滑曲线。u【例2-5】现仍利用表2-3的数据绘制曲线图。解:利用Excel软件处理,所绘制的曲线图见图2-7。图2-7个股交易次数分布曲线图 第二章第四节第四节 数据显示l累计曲线图:分为向上累计频数(频率)分布图和向下累计频数(频率)分布图u【例2-6】利用表2-4的资料绘制累计分布图。解:利用Excel软件处理,绘制累计曲线图。图2-8累计频数(频率)分布示意图 第二章第四节第四节 数据显示l洛伦茨曲线图l雷达图 第二章第四节思考与练习1.何谓统计调查?2.如何根据调查目的与被调查对象特点,选择不同的统计数据搜集方法?3.统计调查按调查范围可分为几类?各类特点是什么?4.简要说明统计调查的各种组织形式的特点及其适用场合。5.比较三种非全面调查的特点及适用场合。6.为什么普查与全面报表不能互相替代?第二章思考题思考与练习7.简要说明我国现行的统计调查体系的内容,并阐明该体系在社会主义市场经济形势下的具体运用。8.简要解释调查对象、调查单位与报告单位的含义及它们之间的联系。简要说明调查时间的两种含义。9.何谓统计调查误差?它有几种类型?10.何谓统计分组?统计分组有几种类型?11.以一实例说明统计分组应遵循的两个原则。第二章思考题思考与练习12.进行品质分组或数量分组各应注意什么问题?13.间断组距分组和连续组距分组各有什么特点?当总体中一个变量值是相邻两组的界限值时,应如何处理?14.何谓等距分组?何谓异距分组?说明它们各自的适用场合。15.说明组距、组限、组数与组中值的含义及它们的计算方法。如何提高组中值代表各组标志值的代表性?第二章思考题思考与练习16.何谓统计指标?统计指标与总体、单位、标志之间的关系如何?17.以实例说明数量指标与质量指标的区别与联18.什么是统计指标体系?为什么利用统计指标体系才能全面地评价客观现象?19.何谓频数分布?以一实例说明频数分布数列的两个要素的含义。20.何谓频率?频率有什么性质?第二章思考题思考与练习21.何谓频率密度?为什么要计算频率密度?886 928 999 946 950 864 1050 927 949 852 1027 928 978 816 1000 918 1040 854 1100 900 866 905 954 890 1006 926 900 999 886 1120 893 900 800 938 864 919 863 981 916 818 946 926 895 967 921 978 821 924 651 850要求:(1)试根据上述资料编制次(频)数分布数列。(2)编制向上和向下累计频数、频率数列。(3)根据所编制的次数分布数列绘制直方图、折线图与曲线图 第二章思考题思考与练习(4)根据所编制的向上(向下)累计频数(频率)数列绘制累计曲线图。(5)根据累计曲线图,指出人均月消费支出额在1 000元以上的有多少?占多大比重?人均月消费支出额在900元以下的有多少?占多大比重?(6)根据频数分布曲线图说明人均月消费支出额的分布是属于哪一种类型?23.如何利用洛伦茨曲线对社会财富分配的公平与否进行评价?第二章思考题思考与练习24.频数分布的主要类型有几种?它们各有什么特点?25.何谓统计表?从表式看,它由几部分构成?从内容看,它可分为几部分?请以一实例说明。26.统计表按主词结构和按宾词设计分类有什么不同?第二章思考题第三章 分布数量特征的统计描述n主要内容:l第一节 分布的平均水平、集中趋势和位置的度量l第二节 分布离散程度的度量l第三节 分布的偏度和峰度n学习思考题 第三章第一节第一节 分布的平均水平、集中趋势和位置的度量n一、统计平均数的含义与作用n(一)统计平均数的含义l反映分布的平均水平的指标n(二)统计平均数的作用l反映总体各单位变量分布的一般水平和集中趋势。l比较同类现象在不同单位的发展水平。l比较同类现象在不同时期的发展变化趋势或规律。l分析现象之间的依存关系。第三章第一节第一节 分布的平均水平、集中趋势和位置的度量n(三)统计平均指标的基本分类l数值平均数:u以统计数列的所有各项数据来计算平均数,用以反映统计数列的所有各项数值的平均水平。u这类平均数的特点是,统计数列中任何一项数据的变动,或大或小,都会在一定程度上影响到数值平均数的计算结果。l位置平均数:u是根据标志值的位置来确定的。u常用的位置平均数有众数和中位数两种。第三章第一节n二、数值平均数n(一)算术平均数l表明总体单位标志值的平均水平。l算术平均数=总体标志总量总体单位数u1.简单算术平均数:简单算术平均数主要用于未分组资料,用总体各单位标志值简单加总得到的标志总量除以单位总量而得。uX=(X1+X2+XN)/N (3.2)第一节 分布的平均水平、集中趋势和位置的度量 第三章第一节u2.加权算术平均数:加权算术平均数主要用于原始资料已经分组,并得出次数分布的条件。u X=(X1*f1+X2*f2+Xn*fn)/(f1+f2+fn)(3.3)u【例3-1】根据第二章例2-1数据资料,计算简单算术平均数和加权算术平均数。解:计算简单算术平均数x=28+31+32+30260=112.45(百万元)计算加权算术平均数:依据表2-3的分组资料,用各组频数做权数计算:X=257+7525+12512+1757+2254+2753+32527+25+12+7+4+3+2=7150/60=119.17(百万元)或者=2511.67%+7541.67%+12520%+17511.67%+2256.67%+2755%+3253.33%100%=119.17(百万元)第一节 分布的平均水平、集中趋势和位置的度量 第三章第一节【例3-2】某公司所属15个企业资金利润率分组资料如表3-1,要求计算该公司15个企业的平均利润率。表表3-13-1某公司所属某公司所属1515个企业资金利润率资料个企业资金利润率资料资金利润率xi 企业数 平均占用资金 fi 利润总额xifi 12 6 50 6 15 6 80 12 24 3 150 36 合计 15 280 54平均资金利润率=5012%+8015%+15024%50+80+150=54280=19.3%第一节 分布的平均水平、集中趋势和位置的度量 第三章第一节u3.是非标志的平均数:用p表示具有“是”的属性的单位数占总体单位数的比重,用q表示具有“非”的属性的单位数占总体单位数的比重。以1作为“是”的单位的标志值,以0作为“非”的单位的标志值,把用文字表示的品质标志转化为数量标志。按加权算术平均数公式,得到是非标志的平均数:x=xifi/fi=(1p+0q)/(p+q)=p (3.5)u4.算术平均数的数学性质:算术平均数与标志值个数的乘积等于各标志值的总和 简单算术平均数:加权算术平均数:NiixxN1iNiiNiifxxf11第一节 分布的平均水平、集中趋势和位置的度量 第三章第一节各个标志值与算术平均数离差之和等于零。简单算术平均数:加权算术平均数:各标志值与算术平均数离差的平方和为最小值。设x0为任意值,x0 x时,0)(1iNixxf01niixx2012120 xxNxxxxniiniiniiniiniixxxxxxxxN121212020min0第一节 分布的平均水平、集中趋势和位置的度量 第三章第一节n(二)调和平均数n调和平均数也称倒数平均数l简单调和平均数:l加权调和平均数:n(三)几何平均数l简单几何平均数:l加权几何平均数:niixNH11niiiniixmmH11nNxxxG.*21nfxxxGNii1.*21第一节 分布的平均水平、集中趋势和位置的度量 第三章第一节n(四)幂平均数l设变量x1,x2,x3,xn,求各变量k次方的和:l (3.13)l l (3.14)第一节 分布的平均水平、集中趋势和位置的度量kNikikkkNikikNkkNxxxNxxxx11121)()(.2211111121)()(kNikkNikNxNxkk时,当 第三章第一节n三、众数、中位数和其他分位数 n(一)众数l从分布的角度看,众数是具有明显集中趋势的数值。在分配曲线图上,众数就是曲线的最高峰所对应的标志值。l1.由单项式分配数列确定众数l【例3-6】根据例2-1数据确定众数。u解:例2-1的60个数据中,仅94这个数据出现了两次,其余各数据都只出现一次,所以众数为94。第一节 分布的平均水平、集中趋势和位置的度量 第三章第一节l2.由组距式分配数列确定众数u【例3-7】根据例2-1数据的分组资料,计算60只股票成交金额的众数。u解:首先确定众数组,由表2-3分组资料可知,众数组是50100。用下限/上限公式计算:M0=79.03 第一节 分布的平均水平、集中趋势和位置的度量0000000000000000*)()(*)()(11101110MMMMMMMMMMMMMMMMdffffffUMdffffffLM下限公式:上限公式:第三章第一节u【例3-8】某村农户收入资料如表3-3所示,计算农户年收入众数。u解:表3-3资料是不等距分组,各组户数多少受到组距大小的影响,所以,应根据消除了组距影响的频数密度来确定众数组。表3-3中数据显示,频数密度最大的值是0.019,对应的组是年收入4 0005 000,所以这一组就是众数组。表3-3农户年收入众数计算表 农户年均收入(元)户数(f)频数密度 4 000以下 17 0.017 4 0005 000 19 0.019 5 0007 000 35 0.017 5 7 00010 000 15 0.005 10 000以上 4 0.001 3 合计 90 用下限用下限/上限公式计算:上限公式计算:M M0 0=4571.43=4571.43 元元第一节 分布的平均水平、集中趋势和位置的度量 第三章第一节n(二)中位数l中位数是将总体各个单位按其标志值的大小顺序排列,处于数列中点的那个单位的标志值。l1.由未分组资料确定中位数:u先将总体各单位的标志值按照大小顺序排列,然后确定中位数的位置,处于中位数位置的标志值就是中位数。u当总体单位数n为奇数时:中位数位置=N+12,则处于中间位置的标志值就是中位数。u当总体单位数N为偶数时,中位数是处于中间位置的两个单位标志值的算术平均数。第一节 分布的平均水平、集中趋势和位置的度量 第三章第一节l2.由单项式分组资料确定中位数:u单项式分组已经将资料的标志值序列化,这时总体单位数N=f,确定中位数位置的方法要通过累计次数计算。l3.由组距式分组资料确定中位数:第一节 分布的平均水平、集中趋势和位置的度量eeeeeeMMeMMeMMeMMdfSfUMdfSfLM*2*211e下限公式:上限公式:第三章第一节n(三)其他分位数l中位数:“1/2分位数”或“二分位数”l四分数位数:找出数列中的三个数值或三个点,将总体单位分为四个相等的部分,记为Q1,Q2,Q3。l十分位数:将分布数列按其标志值的大小等分为十个部分的九个数值,它们分别记为:D1,D2,D9。第一节 分布的平均水平、集中趋势和位置的度量 第三章第一节n(四)众数、中位数和算术平均数的关系l对称钟形分布情形下:l非对称左偏分布情形下:l非对称右偏分布情形下:第一节 分布的平均水平、集中趋势和位置的度量oemmxoemmxoemmx 第三章第一节 第三章第二节n一、变异指标的含义与作用 n(一)变异指标的含义l反映总体内部的离中趋势或变异状况。n(二)变异指标的作用l1.衡量平均指标的代表性l2.反映社会经济活动的均衡性l3.研究总体标志值分布偏离正态的情况l4.资产风险的度量l5.变异指标是进行抽样推断等统计分析的一个基本指标第二节 分布离散程度的度量 第三章第二节n二、极差与四分位差n(一)极差l也称全距,是最简单的变异指标,它是统计总体中两个极端标志值之差,表明总体中标志值变动的范围。用R表示极差,其计算公式是:R=Xmax-Xmin (3.20)/R=Umax-Lmin (3.21)l【例3-15】根据例3-13的数据计算极差。解:RA=xmax-xmin=1 300-1 100=200 RB=xmax-xmin=3 000-200=2 800 RC=xmax-xmin=1 600-800=80 第二节 分布离散程度的度量 第三章第二节n(二)四分位差l四分位差是从变量数列中剔除最大和最小各1/4的单位,用3/4位次与1/4位次的标志值之差除以2来表示。计算公式如下:Q.D=(Q3-Q1)/2 (3.22)l【例3-16】根据例2-1资料计算四分位差。解:该总体共有60个单位,剔除最大和最小的各15个单位,1/4位次和3/4位次单位的标志值是150和61,所以这60只股票成交金额的四分位差为(150-61)2=44.5。第二节 分布离散程度的度量 第三章第二节n三、平均差 l用未分组的资料计算平均差,其计算公式为:l用分组的资料计算平均差,其计算公式为:第二节 分布离散程度的度量nxxD.A .xxfA Df 第三章第二节n四、方差与标准差 n(一)总体数量标志的方差与标准差l1.数量标志方差与标准差的计算公式:u未分组的情况:u分组的情况:第二节 分布离散程度的度量nxx2222xxffnxx22xxff 第三章第二节l2.总方差、组间方差和组内方差l利用这个关系式,可以分析总体变异中,有多少是由于分组标志引起的变异(用 表示),有多少是其他因素引起的变异(用 表示)。通常是通过计算经验相关比指数来反映分组因素对总体变异的影响程度。经验相关比指数的取值范围在01之间。第二节 分布离散程度的度量代表组内方差代表组间方差;是总体方差;其中222222:ii22i22l3.方差与标准差的数学性质u变量的方差等于变量平方的平均数减去变量平均数的平方。即:u变量对算术平均数的方差小于对任意常数的方差。un个同性质独立变量和的方差等于各个变量方差的和。un个同性质独立变量平均数的方差等于各变量方差平均数的1/n。u变量线性变换的方差等于变量的方差乘以变量系数的平方。第二节 分布离散程度的度量222)(xx 第三章第二节n(二)是非标志的方差与标准差 l【例3-18】已知某产品的合格率为95%,求其合格率的方差和标准差。=p(1-p)=95%5%=4.75%=21.79%n五、变异系数 第二节 分布离散程度的度量p)-p(1p)-p(122xV 第三章第二节l【例3-19】某学校男子体操队5名队员的体重分别为55、54、52、52、51公斤;女子体操队6名队员的体重分别为46、45、44、44、43、42公斤。试比较哪个队的队员体重更均匀。u解:男=2 790-2 788=1.47(公斤)u女=1 938-1 936=1.29(公斤)uV男=1.47/52.8=2.78%uV女=1.29/44=2.93%第二节 分布离散程度的度量 第三章第二节n六、箱线图在统计描述中的运用l箱线图也称盒须图,由一个箱子(或盒子)和两条线段组成。其绘制的方法是,求出总体的五个数量特征值:极大值、极小值、中位数、上四分位数、下四分位数,连接上四分位数和下四分位数画出箱体,再将两个极值点与箱体相连。第二节 分布离散程度的度量 第三章第二节l【例3-21】某大学统计学专业60名学生8门专业主干课考试成绩分布的特征值如表3-9所示。表表3-9 83-9 8门专业主干课考试成绩的特征值门专业主干课考试成绩的特征值 课程名称 极大值 上四分位数 中位数 下四分位数 极小值 高等数学 90 82 71 63 56 概率论 93 81 75 66 60 统计学 94 82 71 69 60 计量经济学 88 80 78 66 58 抽样技术 80 78 68 67 62 贝叶斯统计 81 77 70 59 58 多元统计学 82 77 70 62 59 时间序列分析85 82 76 69 55第二节 分布离散程度的度量 第三章第二节 第三章第二节解:8门专业主干课考试成绩的箱线图 第三章第三节n一、统计动差:l原点动差:l以频数分配各组标志值xi对平均数x的k阶中心动差,Uk=第三节 分布的偏度和峰度NiiNiikffx11NiiNiikiffxx11)(第三章第三节n二、偏度:l当=0时为正态分布;当0时为正偏斜;当0时,表示频数分布比正态分布更集中,分布呈尖峰状态,平均数的代表性更大;第三节1.什么是统计分布的集中趋势?测定统计分布的集中趋势主要有哪几个指标?它们各有什么特点?2.什么是权数?权数的实质是什么?3.加权算术平均数和加权调和平均数之间有什么关系?试举例说明它们的应用条件。4.什么是众数?什么是中位数?众数和中位数与算术平均数有何联系和区别?5.什么是统计分布的离中趋势?测定统计分布的离中趋势主要有哪几个指标?它们各有什么特点?思考与练习 第三章思考题6.绝对数变异指标和相对数变异指标有什么适用条件?举例说明在什么条件下应当用相对数变异指标?7.什么是峰度和偏度?如何测定偏度和峰度?8.某班级80名学生统计学考试成绩资料如表,试求全班同学统计学的平均成绩。9.表中是50名工人完成某一装配工序所需时间,要求:(1)根据表中数据,计算工人完成该装配工序平均所需时间。(2)以5分钟为组距,对上表资料进行等距分组,并用加权平均法计算工人完成该装配工序平均所需时间。思考与练习 第三章思考题10.某公司男性经理的年薪为10万元,女性经理的年薪为8万元。如果公司有80%的男经理,20%女经理,试求该公司经理的平均年薪。11.甲乙两企业生产三种产品的单位成本和总成本资料如下表,试比较哪个企业的平均成本高,并分析其原因。12.甲、乙两市场农产品价格及成交量资料如下表,试比较哪个市场的平均价格高,并分析其原因。13.根据第8题资料计算未分组时的中位数、标准差、单项式分组的众数,及分组以后的中位数、众数、标准差。思考与练习 第三章思考题14.某城市对3 090户居民人均月支出进行调查,得到下表资料。要求:(1)计算居民总平均月支出;(2)计算居民月均支出标准差;(3)计算居民月均支出中位数和众数。15.某企业工人平均月工资为1 440元,月收入少于1 280元的占一半,试估计众数,并对该企业工人工资的分布情况作一简要说明。16.根据第9题资料计算极差、四分位差。思考与练习 第三章思考题17.下列两组数据中,哪一组具有更大的标准差?A.300,301,302,303,304,305 B.10,50,100,110,220,250 18.某企业生产线的质量控制标准是:平均每小时产量370件,标准差为每小时5件,如果产量低于或高于平均每小时产量,且大于两个标准差时,则认为失去均衡性。下面是某日各小时的产量,试问:该生产线在什么时候失去均衡性?19.已知标志值总和为415,标志值平方和为1 775,总体单位数为100,试求其方差和标准差思考与练习 第三章思考题20.某管理局下属8家企业的产品销售数据如下表,试比较其产品销售额和销售利润的离散程度。21.某生产班组11个工人日生产零件数为:15,17,19,20,22,22,23,23,25,26,30。要求:(1)计算平均数和方差;(2)按照1519、2024、24以上分成三组,计算组内方差和组间方差;(3)验证总方差等于组间方差与组内方差平均数之和;(4)计算经验判定系数。22.某高校学生参加英语四级考试的优秀率和合格率分别为15%和90%,试计算优秀率和合格率分布的方差和标准差。思考与练习 第三章思考题23.某粮食作物的产量和播种面积资料如下,试测定其偏度和峰度。思考与练习 第三章思考题第四章 统计推断的理论基础n主要内容:l第一节 概率与概率分布l第二节 随机变量的数值特征与随机向量l第三节 大数定律与正态分布定理l第四节 抽样分布l学习思考题 第四章第一节第一节 概率与概率分布n一、随机事件与概率 n(一)随机试验与频率l我们把要研究的一个随机现象称为一个随机试验。l一个随机试验的所有可能的结果的集合称为该随机试验的样本空间,可用大写的希腊字母表示。l样本空间的任一子集合就称为一个(随机)事件。第四章第一节l如果一个随机试验在相同的条件下重复进行n次,那么,当随机事件A发生的次数是m时,其发生的频率就定义为fn(m)=m/n。n(二)随机事件发生的概率l古典(等可能)概型:P(A)=m/n=A包含的样本点个数/样本点总数 (4.1)l概率的性质:u(1)0P(A)1,P()=1。u(2)记A=-A(称为A的对立事件),那么P()=1-P(A),特别地,P()=0。第一节 概率与概率分布A 第四章第一节u(3)P(AB)=P(A)+P(B)-P(AB),特别地,如果事件A与事件B互不相容,则P(AB)=P(A)+P(B)。u(4)如果事件A与事件B满足A B,那么P(B-A)=P(B)-P(A),从而P(B)P(A)。l【例4-6】假设经济系二年级有n位同学,求至少有两人生日相同(设为事件A)的概率。u解:因为每个人都可以在一年365天中任何一天出生,所以n位同学的生日可以排成365n种。uP(A)=1-P()=1-u假设该班人数n=64,P(A)有多大?u通过计算可得P(A)0.997。第一节 概率与概率分布AnnnC365!*365 第四章第一节第一节 概率与概率分布n(三)条件概率与事件的独立性l假设A、B为两事件,P(A)0,则称P(AB)P(A)为事件A已知的条件下事件B发生的条件概率,记为uP(B|A)=P(AB)/P(A)(4.2)uP(AB)=P(B|A)P(A),这称为乘法公式。l对事件A与B,若P(AB)=P(B)P(A),那么P(B|A)=P(AB)/P(A)=P(A)*P(B)/P(A)=P(B)uB发生的概率与A没有关系。l对事件A与B,若P(AB)=P(A)P(B),则称它们是统计独立的,简称相互独立。第四章第一节第一节 概率与概率分布n二、随机变量与概率分布n(一)随机变量的概念l随机变量X是定义在样本空间=上的一个函数,这个函数的取值随着试验的结果不同而变化,并且为了能计算随机事件的概率,还要求它满足条件:对任意的实数x,Xx是随机事件,即X第一节第一节 概率与概率分布n(二)离散型随机变量的概率分布l设离散型随机变量X的所有可能取值为x1,x2,xn,相应的概率为P(x1),P(x2),P(xn),。那么我们可以用表格的形式来表示它的统计规律性,如表4-2所示。lP(X=xi)=P(xi)(i=1,2,)l显然,离散型随机变量X的概率分布有以下性质:(1)0P(xi)第一节第一节 概率与概率分布l【例4-11】在一些问题中,我们只对试验中事件A是否出现感兴趣,如果A发生,称为“成功”,否则称为“失败”。这种试验称为贝努里(Bernoulli)试验。设A出现的概率为p,并且我们独立地重复进行了n次贝努里试验(称为n重贝努里试验)。以X=k表示n重贝努里试验中事件A恰好出现k次这一事件,则:uP(X=k)=(k=0,1,2,n)(4.3)u其中q=1-p。knkknqpC 第四章第一节第一节 概率与概率分布n(三)连续型随机变量的概率分布l设X是一个随机变量,若存在一个非负可积函数f(x),使得X的概率分布函数F(x)=P(Xx)可以表示为:-x+(4.4)l连续型随机变量的密度函数有以下的性质:u(1)f(x)0;u(2)=1;u(3)P(X第一节dxxf)(badxxf)(第一节 概率与概率分布l如果连续型随机变量X的密度函数为则称随机变量X服从均值为在统计推断中,为总体均值,方差为2的正态分布,也称为高斯(Gauss)分布,记为XN(,2)l如果一个正态分布的=0,=1,则称该正态分布为标准正态分布,ZN(0,1)(21)(222)(xexfx 第四章第一节)(21)(222zezz第一节 概率与概率分布l【例4-12】设随机变量Z服从标准正态分布。求以下概率:(1)P(Z0);(2)P(0Z1.25);(3)P(1Z1)解:(1)由于标准正态分布的密度函数直线z=0对称,所以概率P(Z0)。(2)根据对称性并查表得:P(0Z1.25)=1/2P(|Z|1.25)=1/20.7887=0.394 4(3)P(1Z1.25)=P(0Z1.25)-P(0Z1)=0.394 4-1/2P(|Z|1)=1-P(Z1)=1-P(Z0)-P(0Z1)=1-0.5-1/2P(|Z|第一节第一节 概率与概率分布l若随机变量X服从正态分布N(,2),则随机变量Z=(X-)/服从标准正态分布,即ZN(0,1)。lZ=(X-)/称为标准化变换。l【例4-13】假定一个学生某门课程的考试成绩服从均值为60分、方差122为的正态分布。该学生的成绩在60分到75分之间的概率应为多少?u解:设X表示该学生的成绩,要计算的概率是P(60X第一节第一节 概率与概率分布P(60X75)=P(60-60)/12(X-60)/12(75-60)/12=P(0Z第一节第一节 概率与概率分布解:(1)根据分布密度函数的性质:其次,由题目条件:故a=1,b=12。(2)当0 x1时,F(x)=因此,随机变量X的分布函数:0 ,x0 F(x)=1/2(x/2+x),0 x第一节 第四章第二节第二节 随机变量的数值特征与随机向量n一、随机变量的数值特征n(一)随机变量的(数学)期望l1.离散型:E(X)=xi*P(xi)l2.连续型:E(X)=l3.随机变量的数学期望的性质:E(
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!