统计数据的搜集及其整理

上传人:花里****1 文档编号:243712644 上传时间:2024-09-29 格式:PPT 页数:132 大小:1.30MB
返回 下载 相关 举报
统计数据的搜集及其整理_第1页
第1页 / 共132页
统计数据的搜集及其整理_第2页
第2页 / 共132页
统计数据的搜集及其整理_第3页
第3页 / 共132页
点击查看更多>>
资源描述
,*,STAT,统计学,统计,是“认识社会的最有力的武器之一”,列宁,2002年2月,1,统,计,整,理,统,计,调,查,客观,现象,数量,表现,统计,总体,数量,特征,统计研究的程序,统计研究目的,统计设计,推,断,分,析,描,述,分,析,第二章 统计数据的搜集与整理,2.1,统计数据的搜集,2.2,数据的搜集与整理,2.3 变量数列,返回,2.1 统计数据的搜集,2.1.1 统计测量尺度,2.1.2 原始数据的搜集方法,2.1.3 次级资料的搜集,2.1.4 统计调查误差,返回,2.1 统计测量尺度,一、统计测量尺度的概念与种类,二、统计测量尺度的作用,三、测量层次与测量尺度的正确应用,测量:,用仪器确定空间、时间、温 度、速度、功能等的有关数值。,统计测量:,运用,某种方法,使自然或社会经济现象量化。,测量结果:,形成变量或指标,分类、,标识,自然或,社会经,济现象,变量,或指标,某个人,口总体,人口总数及分类数、性别结构、比例等,按性别不同分类,男性,女性,按收入不同分类,1000元以下 1000元2000元,居民总收入、人均收入、收入差异等,分类、标识即统计测量过程,按数量不同分类,按性质不同分类,统计测量尺度的种类,定比测量(尺度、指标),定类测量(尺度、指标),定序测量(尺度、指标),定距测量(尺度、指标),定类尺度,按现象性质差异进行的辨别与区分。测量结果形成,定类变量,或,定类指标。,定类变量或指标确切的值是,以文字表述,的,可以用数值标识,但仅起标签作用。,定类变量或指标的,各类别间是平等,的,没有高低、大小、优劣之分。,性别、种族、运动项目等等,例如:,统计学第二章 统计数据的搜集,定序尺度,按现象顺序差异进行的辨别与区分。测量结果形成,定序变量,或,定序指标,。,定序变量或指标确切的,值是,以文字表述,的,也可以用数值标识,也仅起标签作用。,定序变量或指标,各类别间有高低优劣之分,,不能随意排列。,大学生,中学生,小学生,定距尺度,按现象绝对数量差异进行的辨别与区分。测量结果形成,定距变量,或,定距指标,。,定距变量或指标的,值以数字表述,,有,计量单位,,可以进行,加减运算,。,定距变量或指标各类别间自然有大小之分,但,没有绝对的零点,,不能乘除计算。,1971年出生,30岁,1986年出生,15岁,甲,乙,二人年龄 之差:19861971=15岁,或 3015=15岁,二人年龄之比:3015=2(倍),19861971=1.0076(倍),定比尺度,按现象绝对差异与相对差异进行的辨别与区分。测量结果形成,定比变量,或,定比指标,。,定比变量或指标确切的,值也以数字表述,有计量单位,,可以进行加减运算。,定比变量或指标,有绝对意义上的零点,既可以加减运算,也可以乘除运算,。,零高度,零重量,零体积,零面积,零人口,零产量,零资产,真正的零:,一无所有,返回,2.1 统计测量尺度,一、统计测量尺度的概念与种类,二、统计测量尺度的作用,三、测量层次与测量尺度的正确应用,第一,决定数据的整理、显示方法,第二,决定数据的分析方法,第三,决定计算机的处理方法,统计测量尺度的作用:,统计学第二章 统计数据的搜集,定序测量,定距测量,定比测量,顺序性差异,顺序性差异、绝对差异距离,顺序性差异、绝对差异距离、相对差异,文盲半文盲、小学、初中、高中、大专、大学本科、硕士研究生、博士研究生,(定序测量),对受教育程度的度量方法,文盲半文盲,博士研究生,对数量差异的度量,要注意层次,测量尺度的正确应用,定序测量,定距测量,定比测量,顺序性差异,顺序性差异、绝对差异距离,顺序性差异、绝对差异距离、相对差异,0年、6年、9年、12年、16年、19年、22年,(定比测量),对受教育程度的度量方法,文盲半文盲,博士研究生,对数量差异的度量,要注意层次,测量尺度的正确应用,一个指标体系中的指标应属于相同的测量尺度,实际值标准值,总资产贡献率1510.7,资本保值增值率130 120,资产负债率6060,全员劳动生产率 20000元 16500元,成本费用利润率4.83.71,流动资产周转率1.8次1.52次,产品销售率9790,环保等级优秀良好,对于指标体系,要注意统一性,测量尺度的正确应用,?,返回,2.2 原始数据的搜集方法,一、统计调查概述,二、统计调查方案,三、问卷设计,(初级资料),原始数据源,加工数据源,(次级资料),政府统计、企,业统计、民间,统计等机构,,数据库、出版,物、账册等形式,普,通,的,数,据,使,用,者,统,计,调,查,数,据,查,询,已存在数据源,实验数据源,对过程加以控制,指直接从各调查单位搜集的用来反映,个体,特征的数据资料,统计调查是整个统计认识活动的基础,,决定着统计认识过程及其结果的成败,搜集,原始数据资料,的统计活动过程,统计调查,要求:,准确、及时、,全面、系统,统计学第二章 统计数据的搜集,按调查单位的范围大小分为,全面调查,非全面调查,一次性调查,经常性调查,统计报表,专门调查,统计调查的种类,按调查时间是否连续分为,按调查的组织方式不同分为,普查,抽样调查,典型调查,重点调查,指按照国家统一规定的各项要求,,自下而上,地定期向国家和主管部门报送基本统计资料的一种报告制度,统计报表,制度,优点,局限,能保证统计资料的全面性和连续性,能保证统计资料的统一性和及时性,能满足各级部门对统计资料的需要,统计报表过多会增加基层负担,有可能由于虚报瞒报而影响统计资料质量,统计调查的组织方式,统计学第二章 统计数据的搜集,指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查,作用,局限,可以为抽样调查提供抽样框,可以搜集统计报表所不能提供的反映重大国情国力的基本统计信息,由于需要大量的人力、物力和财力,不宜经常进行,普查,统计调查的组织方式,统计学第二章 统计数据的搜集,为了解总体基本情况,在调查对象中只选择一部分,重点单位,进行调查的一种非全面调查组织方式,作用,局限,能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料,只适用于客观存在着重点单位的情况,重点调查,这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况,统计调查的组织方式,统计学第二章 统计数据的搜集,典型调查,在对调查对象有一定了解的基础上,有意识地选择少数,典型单位,进行调查的一种非全面调查组织方式,一定条件下能估计总体指标数值,可以补充全面调查的不足,可以用来研究新生事物,不能确定推断的把握程度,无法计算和控制推断误差,作,用,指在数量表现上具有普遍意义和代表性的总体单位,可以用来推断总体的数量,局,限,统计调查的组织方式,按照,随机原则,从调查对象中抽取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征的一种非全面调查组织方式,抽样调查,指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会,特,点,优,点,按随机原则抽取样本单位,目的是推断总体的数量特征,抽样误差可以事先计算并控制,能用较少的人力、物力和时间达到全面调查的目的,调查资料的准确性较高、受人为干扰的可能性较小,统计调查的组织方式,总体单位,调查单位,统计调查的组织方式,总体单位,调查单位,报表制度,可以全面调查,但通常是调查限定规模以上的总体单位,统计调查的组织方式,总体单位,调查单位,普 查,统计调查的组织方式,对全部单位进行调查,总体单位,调查单位,重点调查,只调查重点单位(单位数不多但其标志量占标志总量比重较大的单位),统计调查的组织方式,总体单位,调查单位,典型调查,对典型单位进行调查,典型单位的选择并不一定按规模,统计调查的组织方式,总体单位,调查单位,抽样调查,按随机原则选择调查单位,各单位被选中的机会相同。,统计调查的组织方式,我国统计调查方法体系改革的目标模式是:,建立以周期性普查为基础,以经,常性的抽样调查为主体,以必要,的统计报表、重点调查、综合分,析等为补充,搜集、整理基本统,计资料的统计调查方法体系模式,观 察记 录 法,报 告 法,采访 法,统计调查的主要技术方法,被调查者受调查者的强制与约束,调查者与被调查者平等合作,登记法,网络调查法,试验设计法,口头询问,被调查者自填,电话访问,统计调查方案,用来指导整个调查工作的纲领性文件,是统计设计在统计调查阶段的具体化,基本内容:,调查目的;,调查对象,与,调查单位,;,调查项目与,调查表,;,调查时间;,制定调查工作的组织实施计划。,(为什么调查),(向谁调查),(调查什么),调查对象,指被调查现象的物质承担者,是总体在调查阶段的具体化。,调查单位,指构成调查对象的每一个总体单位。,注意,调查单位,与,填报单位,的区别:,当调查单位自己负责向上报告时,它同时也是填报单位;当调查单位的资料由它的上级组织收集、整理,并向上报告时,填报单位与报告单位则不一致。,负责报告调查内容的单位,问卷调查,指非政府性统计机构或个人所从事的对人的主观意见的调查工作,也称作民意调查或民意测验,调查问卷的基本格式:,表头,表体,表脚,说明词:,解释调查意义、表达感激之情等,主题问句:,被调查者基本情况、调查项目,作业记录:,时间、操作者等,表头,表体,表脚,名称、编号、制表单位、填表日期等等,被调查者的基本情况、调查项目等等,备注、指标解释等,调查表的基本结构:,您认为吸烟有哪些害处?,危害自身健康,影响他人健康,浪费钱财,容易引起火灾,破坏家庭团结,封闭式问题,您认为吸烟有哪些害处?,开放式问题,容易控制,但不易全面,调查问卷的问题类型:,容易滋生腐败,您认为吸烟有哪些害处?,危害自身健康,影响他人健康,浪费钱财,容易引起火灾,破坏家庭团结,其他,不易控制,但内容丰富,问卷设计的基本要求:,问题的提出要紧扣主题,问句和标准答案要易于理解和回答,先易后难、先封闭后开放、先基本问题后派生问题,以不超过20分钟为宜,主题明确,提问科学,逻辑性强,容量适度,您是否吸烟(如果选,则跳过、 题)吸烟不吸,您每天大约吸多少支烟,5,支以下,5,-,10,支 ,10-15,支 ,15-20,20-25,支 ,25,支以上,您的吸烟历史大约有多长 ,1,年以下,1-5,年,5-10,年,10,年以上,您是否认为吸烟有害健康(请写出理由),调查单位中吸烟人所占比例,吸烟人群日吸烟数量情况,吸烟人群吸烟历史情况,调查对象对吸烟的看法,您是否吸烟(如果选,则跳过、 题)吸烟不吸,您每天大约吸多少支烟,5,支以下,5,-,10,支 ,10-15,支 ,15-20,20-25,支 ,25,支以上,您的吸烟历史大约有多长 ,1,年以下,1-5,年,5-10,年,10,年以上,您是否认为吸烟有害健康(请写出理由),调查单位中吸烟人所占比例,吸烟人群日吸烟数量情况,吸烟人群吸烟历史情况,2.3 次级资料的搜集,次级资料,指已经被收集、加工整理成型的数据信息,次级资料的主要收集渠道:,查阅公开出版物;,向政府统计机构咨询;,向其他机构咨询;,网上查询。,统计学第二章 统计数据的搜集,返回,2.1 统计数据的搜集,2.1 统计测量尺度,2.2 原始数据的搜集方法,2.3 次级资料的搜集,2.4 统计调查误差,2.4 统计调查误差,调查误差,指收集来的数据资料与真实情况间的差异,真值,调查值,调查误差,2.4 统计调查误差,调查误差,指收集来的数据资料与真实情况间的差异,调查值,调查误差,真值?,2.4 统计调查误差,调查误差,指收集来的数据资料与真实情况间的差异,真值?,调查值,调查误差?,研究调查误差的主要目的是找出导致误差产生的原因,进而采取对策避免、减少误差或控制误差水平。,调查误差的种类,由于人的主观故意或失误而产生的误差,理论上它可以用某种方法加以消除,登记误差,代表性误差,由部分单位数值来推断总体数值所产生的误差,它不可以消除,但可以加以控制,(随机误差),2.4 统计调查误差,2.2,数据整理,2.2.1,统计资料整理的基本程序,2.2.2,统计分组,3.3,分布数列的编制,3.4,统计整理中最常用的显示方法,2.2.1,统计资料整理的基本程序,(一)统计资料整理的概念,(二)统计资料整理的基本程序,统计整理,是指根据统计研究的目的和任务,将统计调查所得的原始资料进行科学的分类和汇总,或对已经加工的综合资料进行再加工,为统计分析准备系统化的、条理化的综合资料的工作过程。,统计数据的处理:,统计资料的分组、汇总及制表,统计数据的管理:,数据的传输、贮存、更新及输出,内,容,2.2.1,统计资料整理的基本程序,(一)统计资料整理的概念,(二)统计资料整理的基本程序,资料的审核,资料分组、汇总,汇总结果的显示,统计资料整理的基本程序,统计资料的积累、保管和公布,2.2.审核原始资料,完整性、准确性和客观性,内,容,就是对调查取得的原始资料进行审查与核实。,资料审核,是指原始资料是否准确可靠,准确性,一是逻辑检查,检查调查资料内容是否合理,各个项目之间有没有相互矛盾的地方,答案是否合乎逻辑,其审核,方法,是指所有的调查表格或问卷是否都已收齐,所有的问题是否都有答案。,完整性,二是计算检查,检查调查表格或问卷中各项数字在计算方法和计算结果上有无错误,数字的计量单位有没有差错,等等。,就是在调查资料搜集上来之后,再根据资料的内容、性质和特征进行分类。,事后分类,也称事前分类,它是在调查之前,设计调查提纲、调查表或问卷时,根据所要调查的事物或问题的性质与特征,分门别类地设计调查项目或指标,然后按照分类指标来搜集调查资料。,事先分类,2.2.2.统计分组,1.统计分组的概念,根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。,统计分组标志:品质标志或数量标志,2.分组的性质,兼有分和合双重含义,对于现象总体,是“分”,对于单位,是“合”。,按分组标志的多少,分为,简单分组和复合分组,按分组的标志的性质不同,分为品质分组(或称,属 性分组,)和数量分组(或称,变量分组,)。,3.统计分组的种类,1、简单分组,2、复合分组,即总体按一个标志进行分组。它只能从某一方面说明总体的分布状况和内部结构。,复合分组是指对所研究的总体按两个或两个以上的标志进行的多层次分组。可用于对事物多方面、多层次的分析研究。,统计分组的形式,性别,人数(人),比重%,男,30,75,女,10,25,合计,40,100,英语成绩,人数(人),比重%,优,3,7.5,良,9,22.5,中,12,30,及格,10,25,不及格,6,15,合计,40,100,英语成绩,性别,人数(人),比重%,优,男,2,5,女,1,2.5,良,男,6,15,女,2,5,中,男,11,27.5,女,5,12.5,及格,男,8,20,女,2,5,不及格,男,3,7.5,女,0,0,合计,40,100,学生按性别、英语成绩分组,简单分组,复合分组,分布数列种类,专业前途预期,人数,比重%,非常有前途,2,14.29,有前途,5,35.71,一般,5,35.71,没前途,1,7.14,不知道,1,7.14,合计,14,100.00,购买转移书数量,数量,比重%,1,4,28.57,2,3,21.43,3,3,21.43,4,1,7.14,5以上,3,21.43,合计,14,100.00,品质,数列,变量数列,单项数列,2.2.3、统计分组的原则和方法,穷尽原则,:使总体中的每一个单位都应有组可归,或者说各分组的空间足以容纳总体所有的单位。,互斥原则:,就是在特定的分组标志下,总体中的任何一个单位的只能归属于某一组,而不能同时或可能归属于几个,组。,1统计分组的原则:,品质分组:按品质标志分组,数量分组:按数量标志分组,单项式分组,组距式分组;,间断组距式分组和连续组距式分组;,“上限在不内” 原则:凡是总体某一个单位的变量值是相邻两组的界限值,这一个单位归入作为下限值的那一组内。,等距分组与异距分组,2统计分组的方法,组距数列,月生活费,人数(人),比重%,100以下,1,3,100200,3,10,200300,5,17,300400,12,40,400500,6,20,500以上,3,10,合计,30,100,职工人数,企业个数(个),比重%,10以下,2,1.27,1099,30,19,100-399,100,63.3,400999,20,12.7,1004999,5,3.16,5000以上,1,0.63,合计,158,100.00,连续组距式分组,间断组距式分组,学生按生活费支出分组,职工人数分组,组距数列,月生活费,人数,比重%,100以下,1,3,100200,3,10,200300,5,17,300400,12,40,400500,6,20,500以上,3,10,合计,30,100,双休课外学习时间,人数,比重%,1以下,2,14.29,12,3,21.43,2-3,3,21.43,35,3,21.43,58,2,14.29,8以上,1,7.14,合计,14,100.00,等距数列,异距数列,(1)组距,连续组距分组的组距=本组上限本组下限,间断式组距且等距分组的条件下: 组距=本组上限前组上限 或=本组下限前组下限 或=本组上限本组下限+1,(2)组数,(3)组中值上限+下限)/2,(4)开口组的组距与组中值,3组距式分组的相关概念,开口式组距数列组中值的计算:,首组假定下限首组上限相邻组组距,末组假定上限末组下限相邻组组距,先计算开口组的假定上、下限:,因此有:,首组,组中值,末组,组中值,某地区100个百货商店,月销售额与流通费用情况,销售额(万元),商店数(个),每百元商品销售额中支付的流通费(元),50以下,50100,100200,200300,300以上,10,20,30,25,15,14.2,11.4,10.1,9.2,8.5,上组限,U,下组限,L,如:组距,d=U-L,=100-50=50,(万元),如:组中值,x=(U+L)/2 =(100+200)/2,=150,(万元),假定上限,400,假定下限,0,2.2 统计数据的整理与显示,3.1,统计资料整理的基本程序,3.2,统计分组,3.3,分布数列的编制,3.4,统计整理中最常用的显示方法,统计分组的作用:,区分现象质的差别,反映总体的内部结构,研究现象之间的依存关系,统计分组的作用:,研究现象之间的依存关系,分组体系的选择,分组体系,指同时使用两个以上标志分组时,分组标志表现的组合形式。,对同一总体选择两个或两个以上标志分别进行简单分组。,各分组标志表现并列使用。,各分组标志表现交叉结合使用。,平行分组体系,交叉分组体系,平行分组体系,对教师的分类,按性别分类,男性,女性,按职称分类,按年龄分类,高级,中级,初级,青年,中年,共计7组 2+3+2,交叉分组体系,按性别分类,按职称分类,按年龄分类,男,女,高级,中级,初级,青年,中年,共计12组2,32,对教师的分类,2.3,分布数列,3.3,分布数列的编制,3.4,统计整理中最常用的显示方法,3.2 分布数列的编制,一、分布数列的概念与种类,二、变量数列的编制,三、累计次数与累计频率,变量数列,品质数列,是在统计分组的基础上,汇总计算各组的总体单位数(如为抽样资料,则为抽样单位数),借以说明总体单位数在各组之间的分配情况。,分布数列,种,类,分组标志的具体表现,各组的次数或频率,构成要素,是指将数据组依据非数值特性分类所形成的数列。,是指将数据组依据数值特性分类所形成的数列。,变量数列,品质数列,种,类,通常我们用X表示变量,,变量数列由两串数字组成,一串数字为变量的不同取值,另一串为次数或频率。,用,表示变量值,,表示次数。,用,变量数列,品质数列,种,类,异距数列,等距数列,组距数列,单项数列,变量数列按每个组的变量取值形式不同,将若干个相邻的变量值合并为一组,使每个组有一个变量值变动范围,以组距形式表示的变量数列 。组距数列的每组变量值为一个区间 。,是按数量标志分组后,用一个变量值代表一个组形成的数列。即一个变量值为一组。,3.2 分布数列的编制,一、分布数列的概念与种类,二、变量数列的编制,三、累计次数与累计频率,单项变量数列的编制,单项数列,同时,具备,变量是离散变量,变量的不同取值个数较少,编制条件:,编制步骤或内容,排序,汇总组单位数,(次数),制作单项变量数列统计表,【例】统计,某企业40名工人在一个工作日内生产的零件数量(见表33)。请根据表中资料编制变量数列。,表33 40名工人一个班次生产的零件数量,找出最大值和最小值,排序,汇总组单位数,(次数),制作单值变量数列统计表,【解】,【例】,己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。,日产量(件),X,工人数(人),f,20,21,22,23,24,25,26,3,5,6,4,3,2,1,合计,24,编制结果如下:,组距数列,指每个组的变量值用一个区间来表现的变量数列,变量数列的编制,变量是连续变量;,或:,总体单位数较多变量不同取值个数也较多的离散变量。,编制条件:,变量值变动区间的长度相等,变量值变动区间的长度不完全相等,等距数列,异距数列,组距数列的编制,编制步骤或内容,统计学第三章 统计数据的整理与显示,计算组中值,排序,确定组限,计算变异全距,确定组数、组距,汇总组单位数,【例】统计,某企业40名工人在一个工作日内生产的零件数量(见表33)。请根据表中资料编制组距数列。,制作组距数列统计表,确定组数及组距,等距数列,编制步骤:,统计学第三章 统计数据的整理与显示,【解】,排序,计算变异全距,计算组数(组数不宜过多,也不宜太少),计算组数(我们使用斯特基斯公式),其中,N是单位总数。,编制等距数列,统计学第三章 统计数据的整理与显示,本例中,(当 的结果为整数时),(当 的结果为小数时),因此,取,本例中,,m=7,,则有,(当 的结果为整数时),(当 的结果为小数时),统计学第三章 统计数据的整理与显示,确定组距的原则:,要能,区分各组的性质差异,要能反映总体资料的分布特征,由于R组距(d) 组数(m),确定组限,对于离散变量,相邻组组限可以,间断,,也可,重叠,;,对于连续变量,相邻组组限,必须重叠,;,符合“,上组限不计入,”原则;,首末两组可使用“,以下,”及“,以上,”的开口组。,组限的表示方法,编制等距数列,统计学第三章 统计数据的整理与显示,编制等距数列,日产量(件),组中值,次数,合计,统计学第三章 统计数据的整理与显示,试分组?,日产量(件),组中值,次数,82以下,8286,8690,9094,9498,98102,102以上,合计,计算次数,日产量(件),组中值,次数,82以下,8286,8690,9094,9498,98102,102以上,0,4,9,18,5,3,1,合计,40,?,日产量(件),组中值,次数,83以下,8387,8791,9195,9599,99103,103以上,1,3,17,10,6,2,1,合计,40,试分组?,编制等距数列,编制结果:,日产量(件),组中值,次数,83以下,8387,8791,9195,9599,99103,103以上,1,3,17,10,6,2,1,合计,40,统计学第三章 统计数据的整理与显示,?,?,制作组距数列,编制等距数列,练习题,己知某地区某年50个商店商品销售额的资料如下(单位:百万元):,7.4 12.6 29.0 2.0 12.4 7.0 14.8 17.5 15.0 18.2 18.7 15.5 12.8 26.0 17.3 8.3 14.7 12.0 3.5 6.8 25.0 19.3 6.4 4.0 11.9 8.5 13.2 14.5 17.1 15.6 13.4 4.5 9.5 20.0 15.7 6.0 11.4 23.0 14.2 16.7 21.0 16.0 13.6 10.0 13.9 5.0 5.8 10.5 16.3 22.0,要求编制组距数列。,统计学第三章 统计数据的整理与显示,确定组数及组距,等距数列,编制步骤:,统计学第三章 统计数据的整理与显示,【解】,排序,计算变异全距,计算组数(我们使用斯特基斯公式),其中,N=50,编制等距数列,统计学第三章 统计数据的整理与显示,本例中,因此,取,本例中,,m=7,,则有,统计学第三章 统计数据的整理与显示,确定组距的原则:,确定组限,编制等距数列,日产量(件),组中值,次数,合计,统计学第三章 统计数据的整理与显示,试分组?,日产量(件),组中值,次数,82以下,8286,8690,9094,9498,98102,102以上,合计,计算次数,日产量(件),组中值,次数,82以下,8286,8690,9094,9498,98102,102以上,0,4,9,18,5,3,1,合计,40,?,日产量(件),组中值,次数,83以下,8387,8791,9195,9599,99103,103以上,1,3,17,10,6,2,1,合计,40,试分组?,编制等距数列,编制结果:,日产量(件),组中值,次数,83以下,8387,8791,9195,9599,99103,103以上,1,3,17,10,6,2,1,合计,40,统计学第三章 统计数据的整理与显示,?,?,制作组距数列,3.2 分布数列的编制,一、分布数列的定义及种类,二、变量数列的编制,三、累计次数与累计频率,累计次数(频率),从变量值,低,的组开始,将各组次数(频率)逐次向变量值,高,的组累计,说明某一组,上限以下各组的累计次数(频率),。,向,上,累,计,向,下,累,计,从变量值,高,的组开始,将各组次数(频率)逐次向变量值,低,的组累计,说明某一组,下限以上各组的累计次数(频率),。,统计学第三章 统计数据的整理与显示,频率,各组单位数占总体单位总数的比重,销售额(百万元),商店数,频率(),累计次数,累计频率(),5以下,510,1015,1520,2025,25以上,4,10,16,13,4,3,8,20,32,26,8,6,合计,50,100,统计学第三章 统计数据的整理与显示,销售额(百万元),商店数,频率(),累计次数,累计频率(),向上累计,向上累计,5以下,510,1015,1520,2025,25以上,4,10,16,13,4,3,8,20,32,26,8,6,4,14,30,43,47,50,8,28,60,86,94,100,合计,50,100,统计学第三章 统计数据的整理与显示,销售额(百万元),商店数,频率(),累计次数,累计频率(),向上累计,向下累计,向上累计,向下累计,5以下,510,1015,1520,2025,25以上,4,10,16,13,4,3,8,20,32,26,8,6,4,14,30,43,47,50,50,46,36,20,7,3,8,28,60,86,94,100,100,92,72,40,14,6,合计,50,100,统计学第三章 统计数据的整理与显示,第三章 统计数据的整理与显示,3.1 统计整理与统计分组,3.2 分布数列的编制,3.3 统计图表,3.3 统计图表,一、统计图,二、统计表,统计图,以点、线条、面积等方法描述、显示统计数据的形式,具有直观、醒目、易于理解等特点,组成:,坐标系,图形,图例,单式图,复合图,叠加图,一个图只用来显示一种现象的数量特征,用一个图同时显示几种数量的分布或变化情况,统计学第三章 统计数据的整理与显示,几种常用的统计图,条形图,(Bar),用于显示离散型变量的次数分布。最主要是显示品质数列频数分布,统计学第三章 统计数据的整理与显示,几种常用的统计图,条形图,(Bar),用于显示离散型变量的次数分布,统计学第三章 统计数据的整理与显示,几种常用的统计图,条形图,(Bar),用于显示离散型变量的次数分布,统计学第三章 统计数据的整理与显示,条形图,(Bar),用于显示离散型变量的次数分布,统计学第三章 统计数据的整理与显示,直方图,(,Histogram,),用于显示连续型变量的次数分布,统计学第三章 统计数据的整理与显示,直方图,条形图,圆形图,(,饼图,Pie,),用于显示定类变量的次数分布,统计学第三章 统计数据的整理与显示,统计学第三章 统计数据的整理与显示,统计学第三章 统计数据的整理与显示,线图,(,Line,),主要用于显示连续型变量的次数分布和现象的动态变化,统计学第三章 统计数据的整理与显示,散点图,(,Scatter,),主要用来观察变量间的相关关系,也可显示数量随时间的变化情况,统计学第三章 统计数据的整理与显示,利用统计表31资料,借用Excel软件编制各类统计图,统计学第三章 统计数据的整理与显示,3.3 统计图表,一、统计图,二、统计表,具有容量大、方便计算等特点,统计表的常用结构:,统计表,以纵横交叉的线条所形成的表格来表现统计资料的形式,统计学第三章 统计数据的整理与显示,总 标 题,宾词栏,主词栏,数据栏,统计学第三章 统计数据的整理与显示,统计表的加工方法,对主词栏加工,对宾词栏加工,(对主体进行分组),单式加工,复式加工,(选择指标及对指标进行分组),简单分组,交叉分组,对主词栏的单式加工,统计学第三章 统计数据的整理与显示,对主词栏的复式加工,统计学第三章 统计数据的整理与显示,按月工资分组,按性别分(人),按级别分,小计,男,女,小计,技工,学徒工,300以下,300400,400500,500600,600700,700以上,4,16,22,15,10,5,1,6,10,11,8,4,3,10,12,4,2,1,4,16,22,15,10,5,0,2,4,5,8,5,4,14,18,10,2,0,合计,72,40,32,72,24,48,对宾词栏的简单分组,按月工资分组,按级别分(人),总计,技工,学徒工,小计,男,女,小计,男,女,对宾词栏的交叉分组,统计表的编制规则,统计学第三章 统计数据的整理与显示,选择合适的总标题;,主词栏与宾词栏要各归其位,相互对应;,表的上、下端用粗线或双线封口,左右两端一般不封口;,可在各列的文字标题下面设置编号加以标识;,数据栏不能有空白。,获金牌项目,金牌数 占总数比例,跳水枚,0.1786,举重枚,0.1786,乒乓球枚,0.1429,羽毛球枚,0.1429,体操枚,0.1071,射击枚,0.1071,柔道枚,0.0714,田径枚,0.0357,跆拳道枚,0.0357,中国体育代表团在悉尼奥运会上获金牌的项目,统计学第三章 统计数据的整理与显示,品质数列,某地区100个百货商店,月销售额与流通费用情况,销售额(万元),每百元商品销售额中支付的流通费(元),21,35,36,39,45,45,46,47,329,360,387,18.3,16.9,17.2,15.6,14.7,14.2,13.6,12.9,8.2,7.1,7.6,按销售额分组(万元),商店数(个),每百元商品销售额中支付的流通费(元),50以下,50100,100200,200300,300以上,10,20,30,25,15,14.2,11.4,10.1,9.2,8.5,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业管理 > 商业计划


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!