初级实用统计方法2

上传人:仙*** 文档编号:149343279 上传时间:2022-09-07 格式:PPT 页数:43 大小:726KB
返回 下载 相关 举报
初级实用统计方法2_第1页
第1页 / 共43页
初级实用统计方法2_第2页
第2页 / 共43页
初级实用统计方法2_第3页
第3页 / 共43页
点击查看更多>>
资源描述
南阳广播电视大学教务处 初级实用统计方法初级实用统计方法 南阳广播电视大学教务处主题二主题二数据资料的收集和整理方法 南阳广播电视大学教务处3有组织、有组织、有计划地有计划地搜集资料。搜集资料。要求:准确、要求:准确、完整、及时完整、及时对调查资料对调查资料去伪存真、去伪存真、去粗取精、去粗取精、科学分类、科学分类、浓缩简化浓缩简化描述性分析描述性分析推断分析、推断分析、决策分析。决策分析。要求:定性要求:定性定量结合定量结合 南阳广播电视大学教务处知识一知识一 数据资料的收集方法数据资料的收集方法n一、数据资料来源类型和收集要求一、数据资料来源类型和收集要求n 统计工作中的数据资料收集也称统计调查,统计工作中的数据资料收集也称统计调查,它是根据统计研究的具体目标和任务,有计划有它是根据统计研究的具体目标和任务,有计划有目的地收集被研究对象目的地收集被研究对象(即统计总体即统计总体)数据资料的数据资料的工作过程。工作过程。n 数据资料来源分为两类:一类是直接从被研数据资料来源分为两类:一类是直接从被研究对象处取得资料,这种资料称为原始资料,也究对象处取得资料,这种资料称为原始资料,也称第一手资料;另一类是从有关部门和单位那里称第一手资料;另一类是从有关部门和单位那里取得的已经加工处理好的现成的资料。取得的已经加工处理好的现成的资料。南阳广播电视大学教务处知识一知识一 数据资料的收集方法数据资料的收集方法 南阳广播电视大学教务处知识一知识一 数据资料的收集方法数据资料的收集方法n二、数据资料收集的方法二、数据资料收集的方法n(一一)按调查的组织方式不同,可分为统计报表和专项按调查的组织方式不同,可分为统计报表和专项调查调查n1.1.统计报表统计报表n 统计报表是根据我国社会经济制度的特点所采用统计报表是根据我国社会经济制度的特点所采用的收集统计资料的基本方式。的收集统计资料的基本方式。n2.2.专项调查专项调查n 专项调查是另一种统计调查,它是为了某一特定专项调查是另一种统计调查,它是为了某一特定目的专门组织的一种收集特定资料的统计调查。目的专门组织的一种收集特定资料的统计调查。专项调查常用的方法一般有普查、抽样调查、重点调专项调查常用的方法一般有普查、抽样调查、重点调查和典型调查四种。查和典型调查四种。n(二二)按对调查对象中的单位是否全数观察,可分为全按对调查对象中的单位是否全数观察,可分为全面调查和非全面调查面调查和非全面调查 南阳广播电视大学教务处7一、调查组织方式一、调查组织方式统计调查统计调查二、调查方案设计二、调查方案设计报表制度报表制度普普 查查重点调查重点调查典型调查典型调查抽样调查抽样调查方案内容方案内容调查表、调查表、问卷设计问卷设计制度化的制度化的经常性调查经常性调查专门组织调专门组织调查查全面调查全面调查非全面调查非全面调查 南阳广播电视大学教务处8统计报表制度统计报表制度由政府部门组织,采用统一的表格,由政府部门组织,采用统一的表格,自自上而下上而下布置,布置,自下而上自下而上报告。报告。任务:任务:搜集搜集国民经济和社会发展基本情况国民经济和社会发展基本情况的资的资料,为制订国民经济和社会发展计划和料,为制订国民经济和社会发展计划和检查计划执行情况服务。检查计划执行情况服务。优点:优点:精心周密设计、高度统一、规范。精心周密设计、高度统一、规范。回收率高,内容相对稳定,便于资料积回收率高,内容相对稳定,便于资料积累、对比。累、对比。层层上报、逐级汇总,可以满足各部门层层上报、逐级汇总,可以满足各部门需要。需要。特点:特点:南阳广播电视大学教务处9普查普查特点:特点:工作量大工作量大,时间性强时间性强,需要大量人力和财力。,需要大量人力和财力。任务:任务:搜集重要的搜集重要的国情国力和资源状况国情国力和资源状况的全面资的全面资料,为政府制定规划、方针政策提供依据。料,为政府制定规划、方针政策提供依据。方式:方式:建立专门机构,配备专门人员调查。建立专门机构,配备专门人员调查。利用基层单位原始记录和核算资料发表调查。利用基层单位原始记录和核算资料发表调查。原则:原则:规定统一的标准时点。规定统一的标准时点。规定统一的普查期限。规定统一的普查期限。规定调查的项目和指标。规定调查的项目和指标。南阳广播电视大学教务处10重点调查重点调查特点:特点:在总体中选择在总体中选择个别或部分个别或部分重点单位重点单位进行调查进行调查。任务:任务:及时了解总体基本情况,为主管部门指导工及时了解总体基本情况,为主管部门指导工作服务。作服务。方式:方式:一次性调查;专门设计和备配人员现场调查。一次性调查;专门设计和备配人员现场调查。重点单位重点单位指在总体中有举足轻重地位的单位,指在总体中有举足轻重地位的单位,其标志值在总体标志总量中占有绝大比重。其标志值在总体标志总量中占有绝大比重。经常性调查;同报表制度结合,用统计报表经常性调查;同报表制度结合,用统计报表调查。调查。南阳广播电视大学教务处11典型调查典型调查特点:特点:在全面分析的基础上,有在全面分析的基础上,有意识地意识地选择代表性选择代表性的的典型单位典型单位进行现场调查。进行现场调查。任务:任务:为研究某种特殊的社会经济问题,搜集详细为研究某种特殊的社会经济问题,搜集详细的第一手资料,借以认识事物的的第一手资料,借以认识事物的本质特征本质特征、因果关系因果关系、变化趋势变化趋势。为理论和政策性问题。为理论和政策性问题研究提供依据。研究提供依据。作用:作用:适宜于研究处于萌芽状态事物和倾向性问题;适宜于研究处于萌芽状态事物和倾向性问题;适宜于分析事物的类型,它们之间的差别和适宜于分析事物的类型,它们之间的差别和关系。关系。方法:方法:“解剖麻雀解剖麻雀;划类选典划类选典;抓两抓两头头”。南阳广播电视大学教务处12抽样调查抽样调查特点:特点:1按按随机原则随机原则从总体中抽取样本;从总体中抽取样本;2以样本指标(统计量)为依据以样本指标(统计量)为依据推断总体参数推断总体参数 或或检验总体的某种假设检验总体的某种假设;3抽样误差可以事先抽样误差可以事先计算计算并加以并加以控制控制。登记性误差登记性误差代表性误差代表性误差编编 差差随机误差随机误差抽样平均误差抽样平均误差实际误差实际误差统计推断中的抽样误差就是统计推断中的抽样误差就是抽样平均误差抽样平均误差。它是处。它是处于调查所固有的,是对抽样推断精确度的量度。于调查所固有的,是对抽样推断精确度的量度。南阳广播电视大学教务处13 南阳广播电视大学教务处知识一知识一 数据资料的收集方法数据资料的收集方法n(三三)按收集资料的方式不同,可分为直接观按收集资料的方式不同,可分为直接观察法、报告法和询问法察法、报告法和询问法 南阳广播电视大学教务处知识一知识一 数据资料的收集方法数据资料的收集方法n三、统计调查方案三、统计调查方案n(一一)确定调查的目的和任务确定调查的目的和任务n(二二)确定调查对象和调查单位确定调查对象和调查单位n 填报单位填报单位n(三三)确定调查项目和设计调查表确定调查项目和设计调查表n 指标、标志;指标、标志;单一表、一览表单一表、一览表n(四四)确定调查时间和调查方法确定调查时间和调查方法n 调查时限调查时限n(五五)制定调查工作的组织实施计划制定调查工作的组织实施计划 南阳广播电视大学教务处知识一知识一 数据资料的收集方法数据资料的收集方法n四、问卷调查表的设计四、问卷调查表的设计n(一一)问卷调查表的特点问卷调查表的特点n(1 1)通俗易懂,实施方便。通俗易懂,实施方便。n(2 2)适用范围广适用范围广n(3 3)节省调查时间,提高调查效率。节省调查时间,提高调查效率。n(二二)问卷调查表的提问类型问卷调查表的提问类型n1.1.开放式问卷表开放式问卷表n2.2.是非式问卷表是非式问卷表n3.3.多选式问卷表多选式问卷表n4.4.顺位式问卷表顺位式问卷表n5.5.评判式问卷表评判式问卷表n(三三)调查表设计的要点调查表设计的要点 南阳广播电视大学教务处休息一下!休息一下!南阳广播电视大学教务处知识二知识二 数据资料的整理方法数据资料的整理方法n一、数据排序一、数据排序n(一一)排序的含义排序的含义n 排序是数据资料整理中最常用的方法之一,排序是数据资料整理中最常用的方法之一,它是将所有总体单位按照字段中常量它是将所有总体单位按照字段中常量(即标志值即标志值)的大小按顺序重新排列,由此形成新的数据序列的大小按顺序重新排列,由此形成新的数据序列的方法。的方法。n(二二)用用ExcelExcel进行排序的方法进行排序的方法n(三三)用用ExcelExcel进行排序要注意的问题进行排序要注意的问题 南阳广播电视大学教务处知识二知识二 数据资料的整理方法数据资料的整理方法n二、数据筛选二、数据筛选n(一一)筛选的含义筛选的含义n 数据资料筛选就是将符合条件的总体单位数据资料筛选就是将符合条件的总体单位记录留下来,不符合条件的总体单位记录剔除记录留下来,不符合条件的总体单位记录剔除掉,以掌握有多少总体单位符合条件。掉,以掌握有多少总体单位符合条件。n(二二)用用ExcelExcel进行筛选的方法进行筛选的方法n(三三)用用ExcelExcel进行筛选要注意的问题进行筛选要注意的问题 南阳广播电视大学教务处20主要任务主要任务资料审核、分组、资料审核、分组、汇总、制表、制图等。汇总、制表、制图等。分组分组频数分布频数分布统计表统计表统计图统计图 南阳广播电视大学教务处知识二知识二 数据资料的整理方法数据资料的整理方法n三、数据分组三、数据分组n(一一)数据分组的含义数据分组的含义n 数据分组也称统计分组,它是根据统计研数据分组也称统计分组,它是根据统计研究的目的和任务,按照某一分组标志究的目的和任务,按照某一分组标志(字段名字段名),把总体分成若干个组成部分的工作过程。把总体分成若干个组成部分的工作过程。n(二二)分组标志类型分组标志类型n1.1.按数值型标志分组按数值型标志分组n2.2.按非数值型标志分组按非数值型标志分组 南阳广播电视大学教务处22分组标志的选择与分组形式分组标志的选择与分组形式关键:服从研究任务需要,反映总体本质特征关键:服从研究任务需要,反映总体本质特征形式形式按分组标志性质分按分组标志性质分品质标志分组品质标志分组数量标志分组数量标志分组按分组标志个数分按分组标志个数分简单分组简单分组复合分组复合分组分组体系分组体系 南阳广播电视大学教务处23分组作用分组作用2533421划分现象类型划分现象类型作用:作用:例:按所有制性质划分,我国现有例:按所有制性质划分,我国现有8种经济类型:种经济类型:国有经济;集体经济;私营经济;个体经济国有经济;集体经济;私营经济;个体经济联营经济;股份制经济;外商投资经济;港联营经济;股份制经济;外商投资经济;港澳台投资经济澳台投资经济 南阳广播电视大学教务处242研究总体结构研究总体结构例:上海市按例:上海市按GDP计算的三次产业结构(计算的三次产业结构(%)1980年年1990年年 1996年年 1997年年 GDP100 100 100 100 第一产业第一产业3.2 4.32.5 2.3 第二产业第二产业75.7 63.854.5 52.2 第三产业第三产业21.1 31.943.0 45.53研究现象之间的依存关系研究现象之间的依存关系例:中国农民家庭按收入分组的恩格尔系数(例:中国农民家庭按收入分组的恩格尔系数(1984年)年)按收入分组(元)按收入分组(元)200 300 400 500 600 800 1000恩格尔系数(恩格尔系数(%)64.9 60.2 56.7 54.4 50.5 49.9 43.6 南阳广播电视大学教务处25 分组体系分组体系 统计分组后所形成的一系列互相联系、互统计分组后所形成的一系列互相联系、互相补充的组的整体称分组体系。分组体系有平相补充的组的整体称分组体系。分组体系有平行分组体系和复合分组体系两种。行分组体系和复合分组体系两种。分组标志的选择分组标志的选择 分组标志的选择是统计分组的关键。分组标志的选择是统计分组的关键。正确选择分组标志,必须根据统计研究的正确选择分组标志,必须根据统计研究的任务目的,抓住反映现象本质区别和内在联系任务目的,抓住反映现象本质区别和内在联系的标志作为分组标志。的标志作为分组标志。南阳广播电视大学教务处26(1)品质标志分组方法)品质标志分组方法 品质标志分组一般较简单,分组标志一品质标志分组一般较简单,分组标志一旦确定,组数、组名、组与组之间的界限也旦确定,组数、组名、组与组之间的界限也就确定。有些复杂的品质标志分组可根据统就确定。有些复杂的品质标志分组可根据统一规定的划分标准和分类目录进行。一规定的划分标准和分类目录进行。(2)数量标质分组方法)数量标质分组方法 按数量标志分组的目的并不是单纯确定按数量标志分组的目的并不是单纯确定各组在数量上的差别,而是要通过数量上的各组在数量上的差别,而是要通过数量上的变化来区分各组的不同类型和性质。变化来区分各组的不同类型和性质。南阳广播电视大学教务处27 单项式分组和组距式分组单项式分组和组距式分组 离散变量如果变量值的变动幅度小,就可以离散变量如果变量值的变动幅度小,就可以一个变量值对应一组,称单项式分组。一个变量值对应一组,称单项式分组。如:人口按年龄分组1岁一组,学生按报考科目分组等。这种分组适用于离散性变量,且变量值的个数较少的情况。离散变量如果变量值的变动幅度很大,变量离散变量如果变量值的变动幅度很大,变量值的个数很多,则把整个变量值依次划分为几个值的个数很多,则把整个变量值依次划分为几个区间,各个变量值则按其大小确定所归并的区间,区间,各个变量值则按其大小确定所归并的区间,区间的距离称为组距,这样的分组称为组距式分区间的距离称为组距,这样的分组称为组距式分组。组。连续变量由于不能一一列举其变量值,只能连续变量由于不能一一列举其变量值,只能采用组距式的分组方式,且相邻的组限必须重叠。采用组距式的分组方式,且相邻的组限必须重叠。南阳广播电视大学教务处28 等距分组和不等距分组等距分组和不等距分组 等距分组是各组保持相等的组距,也就是说等距分组是各组保持相等的组距,也就是说各组标志值的变动都限于相同的范围。不等距分各组标志值的变动都限于相同的范围。不等距分组即各组组距不相等的分组。组即各组组距不相等的分组。统计分组时采用等距分组还是不等距分组,统计分组时采用等距分组还是不等距分组,取决于研究对象的性质特点。在标志值变动比较取决于研究对象的性质特点。在标志值变动比较均匀的情况下宜采用等距分组。等距分组便于各均匀的情况下宜采用等距分组。等距分组便于各组单位数和标志值直接比较,也便于计算各项综组单位数和标志值直接比较,也便于计算各项综合指标。在标志值变动很不均匀的情况下宜采用合指标。在标志值变动很不均匀的情况下宜采用不等距分组。不等距分组有时更能说明现象的本不等距分组。不等距分组有时更能说明现象的本质特征。质特征。南阳广播电视大学教务处29 等等 距距 分分 组组各组组距均相等。如:各组组距均相等。如:10201020 2030 2030 3040 3040以上各组组距均为以上各组组距均为1010。这种分组适用于均匀分布的总体这种分组适用于均匀分布的总体。不等距不等距 分分 组组各组组距不一定相等。如:各组组距不一定相等。如:10201020 2050 2050 5060 5060 6070 6070 以上分组中,其中第二组与其它各组的以上分组中,其中第二组与其它各组的组距不同。这种分组适用于资料分布离差较组距不同。这种分组适用于资料分布离差较大或者是为了满足特殊的研究目的的需要。大或者是为了满足特殊的研究目的的需要。南阳广播电视大学教务处30 组限和组中值组限和组中值 组距两端的数值称组限。其中,每组的起点数组距两端的数值称组限。其中,每组的起点数值称为下限,每组的终点数值称为上限。上限和下值称为下限,每组的终点数值称为上限。上限和下限的差称组距,表示各组标志值变动的范围。限的差称组距,表示各组标志值变动的范围。组中值是上下限之间的中点数值,以代表各组组中值是上下限之间的中点数值,以代表各组标志值的一般水平。标志值的一般水平。一般情况下,组中值一般情况下,组中值=(上限(上限+下限)下限)2 对于第一组是对于第一组是“多少以下多少以下”,最后一组,最后一组“多少多少以上以上”的开口组,组中值的计算可参照邻组的组距的开口组,组中值的计算可参照邻组的组距来决定。即:缺下限开口组组中值来决定。即:缺下限开口组组中值=上限上限1/2邻组邻组组距,缺上限开口组组中值组距,缺上限开口组组中值=下限下限+1/2邻组组距。邻组组距。南阳广播电视大学教务处31 组限组限组限就是每一组两端的数值。10 20 20 30 30 40下限上限 确定组限的方法有两种:间断式确定组限和重叠式确定组限。职工人数(人)99以下 100199 200299 300399固定资产额(万元)5060 6070 7080 8090间断式确定组限适用于离散变量重叠式确定组限适用于连续变量 南阳广播电视大学教务处32组中值组中值每组上限与下限之间的中点数值,是各组的假定平均数。组中值=(上限值+下限值)2开口组组中值的计算:缺下限:组中值=本组上限 相邻组组距/2缺上限:组中值=本组下限+相邻组组距/2例如产值(万元)50以下50 6060 7070以上第一组组中值:50(102)=45最后一组组中值:70+(102)=75 南阳广播电视大学教务处休息一下!休息一下!南阳广播电视大学教务处统计分组的原则统计分组的原则 n(1)科学性原则:统计分组一定要从统计研究的目的出发,使组与组之间在某一方面具有显著的差异,而组内各单位在该方面具有同质性。要实现这一原则,关键是正确选择分组标志和正确划定分组界限。n(2)完备性原则:它是指任何一个总体单位或任何一个原始数据都能归属于某一个组,而不会遗漏在外。n(3)互斥性原则:亦称不相容性原则,是指任何一个总体单位或任何一个原始数据,在一种统计分组中只能归属于某一个组,而不能归属于两个或两个以上的组。南阳广播电视大学教务处知识二知识二 数据资料的整理方法数据资料的整理方法n四、四、数据汇总数据汇总n(一一)数据汇总的含义数据汇总的含义n 数据分组是将现象分成若干个组成部分,接下来数据分组是将现象分成若干个组成部分,接下来就要将属于每一部分的总体单位和标志值归集到所属就要将属于每一部分的总体单位和标志值归集到所属的组中,并计算出每组的总体单位数和标志值之和,的组中,并计算出每组的总体单位数和标志值之和,这一工作过程称为数据汇总,也称统计汇总。这一工作过程称为数据汇总,也称统计汇总。n(二二)数据汇总的手段和方法数据汇总的手段和方法n 数据汇总的手段可分为手工汇总和计算机汇总两数据汇总的手段可分为手工汇总和计算机汇总两种。种。n1.1.手工汇总手工汇总n 手工汇总就是不凭借计算机的人工汇总。一般有手工汇总就是不凭借计算机的人工汇总。一般有划正登记法、过录法、折叠法和卡片法几种。划正登记法、过录法、折叠法和卡片法几种。n2.2.计算机汇总计算机汇总 南阳广播电视大学教务处知识二知识二 数据资料的整理方法数据资料的整理方法n五、五、次数分布次数分布n 根据数据分组要求对数据资料进行汇总后,根据数据分组要求对数据资料进行汇总后,便出现了一个反映总体单位和标志值分布状况便出现了一个反映总体单位和标志值分布状况的数列,统计上称之为统计分布,又称分配数的数列,统计上称之为统计分布,又称分配数列,也称次数分布表。列,也称次数分布表。南阳广播电视大学教务处知识二知识二 数据资料的整理方法数据资料的整理方法n(一一)次数分布表的构成次数分布表的构成n次数分布表一般由总体的各个组和各组相应的次数分布表一般由总体的各个组和各组相应的分配次数两部分构成。分配次数两部分构成。南阳广播电视大学教务处知识二知识二 数据资料的整理方法数据资料的整理方法n(二二)次数分布表的种类次数分布表的种类n 次数分布表都是统计分组后形成的,按分次数分布表都是统计分组后形成的,按分组标志属性的不同,次数分布表可分为数值型组标志属性的不同,次数分布表可分为数值型数列和非数值型数列两大类。数列和非数值型数列两大类。南阳广播电视大学教务处(三)频数和频率(三)频数和频率n统计分组后各组对应的单位数称频数,也叫次数;各组单位数占总体单位总数的比重称频率。各组的频率大于,所有组的频率总和等于。n在变量分配数列中,频数(频率)表明对应组标志值的作用程度。频数(频率)数值越大表明该组标志值对于总体水平所起的作用也越大,反之,频数(频率)数值越小,表明该组标志值对于总体水平所起的作用越小。南阳广播电视大学教务处(四)次数分布特征n钟型分布 特征是“两头大,中间小”,即靠近中间的变量值分布的次数多,靠近两边的变量分布次数少,形若古钟。n型分布 其特征与钟型分布正相反,靠近中间的变量值分布的次数少,靠近两端的变量值分布次数多,形成“两头大,中间小”的字型分布。nJ型分布 在社会经济现象中,一些统计总体分布曲线呈J型。n洛伦兹分布 洛伦兹曲线专门用以检定社会收入分配的平等程度。南阳广播电视大学教务处知识三知识三 在计算机上用在计算机上用Excel软件进行软件进行汇总汇总n一、一、数据简单汇总数据简单汇总n(一一)计数计数n(二二)求和与平均求和与平均n1.1.总分计算总分计算n2.2.平均分计算平均分计算n(三三)最大值、最小值最大值、最小值 南阳广播电视大学教务处知识三知识三 在计算机上用在计算机上用Excel软件进行软件进行汇总汇总n二、二、数据特殊汇总数据特殊汇总n(一一)分类汇总分类汇总n(二二)工作表汇总工作表汇总
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!