统计学第三章统计整理.ppt

上传人:tian****1990 文档编号:7758310 上传时间:2020-03-24 格式:PPT 页数:85 大小:1.20MB
返回 下载 相关 举报
统计学第三章统计整理.ppt_第1页
第1页 / 共85页
统计学第三章统计整理.ppt_第2页
第2页 / 共85页
统计学第三章统计整理.ppt_第3页
第3页 / 共85页
点击查看更多>>
资源描述
第三章统计整理 统计学 课件 制作人 胡宝臣 教学目的与要求通过本章学习 首先要明确统计整理的意义和步骤 重点掌握统计分组的理论和方法 学会编制变量数列和统计表 教学重点与难点重点 分组标志的选择 连续型变量的组距分组 次数分布数列的编制 权数意识的培养 正确理解权数 难点 组距分组中组数 组距和组限的确定 1 女 本科 讲师 月收入3500 2 男 本科 副教授 月收入3800 3 男 专科 讲师 月收入2600 4 女 本科 讲师 月收入2800 5 女 本科 副教授 月收入3900 6 女 研究生 讲师 月收入3100 7 男 本科 教授 月收入4200 8 女 研究生 副教授 月收入3200 9 女 研究生 教授 月收入4300 10 女 专科 讲师 月收入2900 11 女 本科 讲师 月收入3100 12 女 研究生 讲师 月收入3100 13 男 本科 教授 月收入4500 14 男 研究生 教授 月收入3600 15 女 本科 讲师 月收入3500 16 男 研究生 副教授 月收入3800 17 男 专科 讲师 月收入2600 18 女 本科 讲师 月收入2800 19 女 本科 副教授 月收入3900 20 女 本科 副教授 月收入3100 21 男 本科 教授 月收入4200 22 女 研究生 教授 月收入3500 23 女 研究生 讲师 月收入320024 女 研究生 讲师 月收入3900 25 女 研究生 教授 月收入4800 26 女 研究生 讲师 月收入3100 教学导例某高校教师有关资料 27 男 本科 教授 月收入4500 28 男 研究生 教授 月收入470029 男 研究生 教授 月收入4800 30 女 研究生 讲师 月收入380031 女 研究生 讲师 月收入3500 32 男 研究生 副教授 月收入360033 男 本科 副教授 月收入4200 34 女 本科 教授 月收入390035 男 研究生 讲师 月收入3200 36 女 本科 讲师 月收入320037 女 本科 助教 月收入2100 38 男 本科 副教授 月收入3600 39 男 专科 讲师 月收入2600 40 女 本科 教授 月收入4800 41 女 本科 副教授 月收入3900 42 女 研究生 讲师 月收入3100 43 男 本科 教授 月收入4500 44 女 研究生 副教授 月收入390045 女 研究生 教授 月收入4200 46 女 专科 助教 月收入2900 47 女 研究生 讲师 月收入2800 48 女 本科 教授 月收入4900 49 男 本科 助教 月收入1800 50 男 研究生 教授 月收入4600 51 女 本科 助教 月收入1900 52 男 本科 副教授 月收入3800 某高校教师有关资料 续1 53 男 专科 讲师 月收入2600 54 女 本科 助教 月收入1800 55 女 本科 助教 月收入1900 56 女 本科 副教授 月收入3100 57 男 本科 教授 月收入4200 58 女 研究生 副教授 月收入350059 女 本科 讲师 月收入2800 60 女 研究生 副教授 月收入390061 女 研究生 教授 月收入4100 62 女 研究生 助教 月收入180063 男 本科 助教 月收入1800 64 男 研究生 助教 月收入160065 女 本科 助教 月收入1900 66 男 本科 副教授 月收入370067 男 专科 讲师 月收入2600 68 女 本科 讲师 月收入2800 69 女 本科 助教 月收入1600 70 女 本科 副教授 月收入310071 男 本科 教授 月收入4200 72 女 研究生 教授 月收入450073 女 本科 讲师 月收入2800 74 女 研究生 副教授 月收入420075 女 研究生 助教 月收入2100 76 女 研究生 助教 月收入180077 女 本科 助教 月收入1800 78 女 本科 副教授 月收入390079 女 研究生 讲师 月收入330080 女 本科 助教 月收入1800 某高校教师有关资料 续2 面对如此繁杂的个体资料 大家感觉怎么样 那么整理为下面的图表又怎么样呢 乱乱乱 整理结果的表现形式 统计图该校教师职称及性别柱形图 该校教师职称 性别 学历结构图 整理结果的表现形式 统计表该校教师职称及性别分布数列单位 人 某高校教师月收入分布表 本章主要内容 统计整理的意义和步骤 统计分组 次数分布 分配 数列 统计表 第一节统计整理的意义和步骤 主要内容 统计整理的意义 统计整理的步骤 统计整理的地位统计调查统计整理统计分析 一 统计整理的意义 搜集原始资料对个体的感性认识 分类 汇总过渡阶段 取得研究结论对总体的理性认识 统计整理的概念根据目的对统计调查资料实施分类 汇总编制统计图表为统计分析奠定基础 二 统计整理的步骤 制订整理方案 审核调查资料 具体实施整理 复查整理结果 编制统计图表 1 3 4 4 2 5 统计整理的步骤 续 制订整理方案 主要内容有 统计分组体系和统计指标体系 编制整理表格和填表说明 整理的组织形式和汇总的技术方法 审核调查资料 审核内容包括 调查资料的完整性和正确性 审核方法 逻辑检查和计算检查 绘制统计图表 统计资料表现形式 2010年全国不同规模的家庭户类别 十五 时期我国进出口情况 第二节统计分组 主要内容 统计分组的意义 统计分组的两个关键问题 统计分组体系 统计分组的种类及方法 一 统计分组的意义 统计分组 根据统计研究的需要 将总体按一定的标志划分为若干性质不同的组成部分的统计方法 两个涵义 对总体而言是 分 对个体而言是 合 质量标准 组内同质性组间差异性 统计分组的主要作用 对社会经济现象进行类型划分统计分组过程就是类型划分的过程 划分类型 揭示差异是统计分组的根本作用 对社会经济现象进行结构分析反映总体内部结构 判定现象性质及变化 研究社会经济现象间的依存关系分析影响因素和结果之间的变动关系及规律 2000及2011年我国城乡居民消费结构对比表 资料来源 2001 2012年中国统计年鉴 注 表中 用 为家庭设备 用品及服务 教 为教育文化娱乐服务 通 为交通和通讯 2012年某地区职工受教育程度与月收入关系表 二 统计分组的两个关键问题 一 选择分组标志 首要问题 选择分组标志的原则 根据研究目的 具体问题具体分析 选择主要标志 二 划分各组界限 在选定分组标志后 就需要明确组与组之间的界限 如何正确选择分组标志 选择主要标志 有时存在若干个标志都能不同程度满足研究目的的需要 如研究某高校职工生活水平 可用的标志有 职工工资 收入 职工家庭月人均收入 职工家庭年人均收入 该选择哪个更为合适呢 三 统计分组体系 简单分组 对总体只按一个标志分组 平行分组体系 两个及以上标志分别分组 统计分组体系 运用多个分组标志对同一总体进行分组形成的一系列相互联系 相互补充的统计分组的整体 复合分组体系 两个及以上标志层叠分组 平行分组体系 人口分组为例 性别男女 年龄0 1415 6465以上 户籍城乡 平行分组体系适宜对研究对象进行多角度 多方面分析 复合分组体系 人口分组为例 城镇 农村 男 女 女 男 0 1415 6465以上 0 1415 6465以上 0 1415 6465以上 0 1415 6465以上 复合分组体系宜对研究对象进行多层次逐层深入分析 复合分组体系 注意 复合分组每增加一个层次就会使组数几何级增加 如上例 2 6 18组 因此复合分组层次也不可过多 有时候 为了排版和观感的需要复合分组的表现形式还可以采用上表式样 2010年第六次人口普查分性别和年龄的人口复合分组情况 对问题的研究往往需要多角度和多层次 平行分组体系可以满足多角度研究的需要 复合分组体系可以满足多层次研究的需要 四 统计分组的种类及方法 统计分组 变量分组 品质分组 单项分组 组距分组 等距分组 异距分组 一 品质分组 实例 二 变量分组 变量分组反映的是各组量的差别 通过量的差别来反映事物间的性质差别 1 单项分组每组只用一个具体的变量值来表示的分组 其组数由不重复的变量值个数决定 各组组值明确 适用于不重复的变量值个数不多的离散变量 单项分组 实例 现有50名育龄妇女 15 49 生育子女数情况 02113130011320003100202011011011213153212023210120 按育龄妇女生育子女数进行单项分组可分为 0 1 2 3 5五组 2 组距分组 各组用变量值的变动区间来表示 适用于连续变量和不重复的变量值个数很多的离散变量 1 几个基本概念 组限 下限 上限 闭口组 下限 上限都有 如200 300开口组 下开口组 以下上开口组 以上 为什么要设开口组 统计分组的原则 不漏不重 即 1 要使总体中的每个单位都有组可归 贯彻分组的 穷举 原则 即 不遗漏 原则 2 每个单位都只能归到某一组 不能重复归组 即 互斥 原则 在出现极端值情况下 为了遵循统计分组的原则 应设置开口组解决极端值归组问题 全距 最大值 最小值组距 上限 下限 注意 开口组组距以邻组组距代替 实例 组距分组 续2 学生成绩分组60以下60 7070 8080 9090以上 职工工资分组1000以下1000 20002000 30003000 40004000以上 年龄0 1415 6465以上 下开口组 以下 上开口组 以上 上限 下限 组距 组中值 注意组中值代表组内各单位的一般水平 其代表性受组内各单位分布是否均匀或是否在组中值两侧成对称分布 否则计算出来的数值与实际会有较大偏差 2 组距分组要解决的几个主要问题组距 等距分组或异距分组 组距多长 实际工作中 一般采用等距分组 组数 就是决定将总体分成多少组 组距和组数必须先确定一个 当研究对象有明显的几个组成部分 则可先确定组数 再根据情况确定各组的组距 组限 确定组限就是要找出何处是决定事物性质差别的数量界限 组限的表示方法 组距和组数的关系组数与组距的确定 要力求能够将总体分布的特点反映出来 由于全距是既定的 在等距分组情况下 组距和组数存在相互制约的关系 需要注意 根据上式计算的只能是一个参考数 若先确定组距组距要适中 若组距过小 易将同质单位划分在不同组 若组距过大 会使不同性质的单位同处一组 掩盖现象质的差异 若先确定组距 应先观察原始资料 大致判断总体的水平高低和分布 然后确定组距 如对某公司职工按月收入分组 据资料若大致判断其收入普遍在3000元左右 此时以500元或1000元做为组距比较合适 若大致为1000元左右 则组距为100元或200元比较合适 资料 现有某地区500个企业的计划完成程度资料 其中最低83 最高125 全距为42 据本资料可确定组数为6 则计算出的组距为7 分组结果为 1 观察以下三种分组结果 若先确定组数 实例讨论 先确定组数 实例讨论 分组结果 1 83 90 90 97 97 104 104 111 111 118 118 125 分组结果 3 80 90 90 100 100 110 110 120 120 130 分组结果 2 83 93 93 103 103 113 113 123 123 133 以上哪种分组效果最好 首先 分组 1 杂乱 难分析判断 一般等距分组时 组距尽可能取10或10的倍数 此例选10较合适 其次 分组 1 第三组和分组 2 第二组均出现严重问题 既包括超额完成计划的 还包括没有完成计划的 再次 组限问题 如确定组距为10 组数为5 而各组具体范围没搞清 分组 2 也不合适 最后 在算全距时要注意别机械 若有极端值 则以次大或次小值计算全距 再用开口组解决最大或最小值归组问题 若此例有20 和180 可以在计算全距时不考虑 组限的表示方法组限的表示方式取决于变量的类型 连续变量 须采用重叠组限 离散变量可采用间断组限或重叠组限 如 企业按职工人数分组 不重叠组限99以下100 9991000 49995000以上 重叠组限100以下100 10001000 50005000以上 连续变量组限的表现方法 重叠组限 职工月收入分组 元 1500以下1500 20002000 25002500 30003000 35003500 40004000以上 组距分组一般采用等距分组 各组组距以10或10的倍数为宜 组数不可过多 少 10组以内5 10组为宜 组限以10或10的倍数为宜 为保持一致 离散变量也采用重叠组限的方法 重叠组限解决了遗漏问题 但同时却出现了重复归组问题 为解决此问题 采用重叠组限时 应遵循 上组限不在内 原则 根据 穷举 原则要求 最小组的下限要不高于最小变量值 最大组的上限要不低于最大变量值 组距分组的一般处理方法 第三节次数分布 分配 数列 主要内容 次数分布 分配 数列概念及构成 次数分布 分配 数列的种类及编制 变量数列次数分布的主要类型 统计汇总技术 一 次数分布 分配 数列概念及构成 次数分布 分配 数列 是指在统计分组的基础上 将总体各单位进行归组整理编制而成的一种反映总体单位在各组之间分配状况的统计数列 权数 各组组别 单位数 频数 次数 比重 频率 构成要素 课堂讨论1 讨论目的 认识权数的作用 比较绝对数权数和相对数权数的作用差别资料 1 现有甲乙两个班的某学期考试的成绩 甲乙两班的英语学习成绩表 课堂讨论2 资料 2 现有A B两个不同股份公司的甲 乙两股东所持本公司股份如下表 若甲 乙都是所在公司第一大股东 甲掌握本公司2000万股份 而乙只掌握本公司120万股份 要求 判断甲 乙在本公司的决定权大小 二 次数分布 分配 数列的种类 次数分布 等距数列 变量数列 品质数列 单项数列 组距数列 异距数列 某校学生性别构成 某村农户按子女数分组 品质数列 次数 频率 变量数列 组别 组距数列的编制 实例 资料 现有2012年某地50户居民家庭人均月收入资料如下 8227947737378988277987767468118557407757968678248827297647887357717918198607267627868098521520722760784940930689659380803700753781801829712857781803832可以看出这些资料很凌乱 难以直接判断其分布特征 组距数列的编制实例 续1 第一步 按顺序排列变量值 第二步 计算全距 变量值在380 1520之间 全距为1140 由于380和1520为极端值 计算全距可不予考虑 可用开口组表示 则全距 940 659 281 第三步 确定组距或组数 若分6组 则组距 281 6 46 8 组距设为50 若分4组 则组距设为100 组距太小不能反映收入水平的差异 若先考虑组距 100更合适 组距数列的编制实例 续2 某地50户居民家庭人均月收入表 1 组距数列的编制实例 续3 某地50户居民家庭人均月收入表 2 对以上两种组距数列进行比较可以看出 表 1 反映情况比较详细 三 累计次数和累计频率 向下累计 将各组次数和频率由变量值大的组向变量值小的组逐项累计 各组累计数表明各组下限以上的累计次数和累计频率 向上累计 将各组次数和频率由变量值小的组向变量值大的组逐项累计 各组累计数表明各组上限以下的累计次数和累计频率 累计次数和累计频率 实例1 某班英语考试成绩表 累计频数和累计频率 实例2 累计频数和累计频率亦可用于品质数列 如 累计频数和累计频率 实例3 某县农民家庭户按年人均纯收入累计次数和累计频率表 四 次数分布的主要类型 各种不同性质的现象有着各自特殊的次数分布 概括起来主要有三种 钟形 正态与偏态 U形和J形 正J与反J 分布 如下图 五 统计汇总 统计汇总 是在统计分组基础上 根据整理方案所确定的指标体系的要求 计算各项指标分组数值和总计数值 以获得综合统计资料的工作过程 统计汇总组织形式 逐级汇总和集中汇总统计汇总技术方法 手工汇总计算机汇总 第四节统计资料的主要表现形式 统计表 主要内容 统计表的作用 统计表的分类 统计表的构成 统计表的设计 根据某机械制造厂职工资料分组汇总如下 初级工 240人 其中男80人 女160人 在男职工中 工龄在5年以下的30人 在5 10年的40人 10年以上的10人 在女职工中 工龄在5年以下的90人 在5 10年的40人 10年以上的30人 中级工 420人 其中男380人 女40人 在男职工中 工龄在5年以下的150人 在5 10年的200人 10年以上的30人 在女职工中 工龄在5年以下的10人 在5 10年的25人 10年以上的5人 高级工 360人 其中男250人 女110人 在男职工中 工龄在5年以下的50人 在5 10年的70人 10年以上的130人 在女职工中 工龄在5年以下的70人 在5 10年的30人 10年以上的10人 思考 该种表现形式好吗 某机械制造厂职工分布情况表 统计表表现整理结果单位 人 这种表现形式如何 一 统计表的作用 统计表 是用表格来系统显示统计资料的一种基本形式 统计表是重要和有效的统计资料表现形式 广义的统计表包括统计工作各个阶段的一切表格 包括调查表 整理表和分析表 统计整理表是表明前述资料整理的结果 又是后续资料分析工作的开始 统计表的作用 通过对统计资料有条理地组织与安排 统计表使枯燥杂乱的统计数字资料系统清晰 直观易懂 鲜明 形象和生动 一目了然 统计表内的数字组织科学 排列有序 便于阅读和对照比较 统计表还是分析研究各指标之间的数量关系 进行统计分析的有效工具 二 统计表的构成 从统计表的表式结构看 统计表包括 总标题 横行标题 纵栏标题和数字资料四个部分 从统计表的内容看 统计表由主词和宾词两部分组成 2012年我国三次产业产值构成表 总标题 纵栏标题 横行标题 数字资料 主词 宾词 三 统计表的分类 统计表 分析表 对主词的分组情况 按性质 整理表 调查表 按作用 空间数列表 时间数列表 复合分组表 简单分组表 平行分组表 简单表 分组表 时空数列结合表 2011年末我国三次产业就业构成表 简单分组表 资料来源 2011年度人力资源和社会保障事业发展统计公报 2012年我国人口数及其构成 平行分组表 2012年某地人口城乡及性别分布表 复合分组表 统计表 时空数列结合表 河南与全国人口老龄化进程表单位 资料来源 第六次人口普查统计公报 河南为常驻人口资料 四 统计表的设计 宾词的配置 在设计统计表时 除对主词是否分组外 对宾词也要根据分析问题的祥略要求 进行合理配置 宾词配置的三种形式 简单配置 平行配置 复合配置 2012年四通和百利公司职工性别分布表单位 人 统计表宾词的配置 简单配置 简单配置 在对宾词指标不再要求细分的情况下 将各项指标按主次顺序作简单排列 宾词平行配置是对宾词指标进行几种简单分组以后在表中平行编排 如 某地两企业工人的性别和工龄分布表单位 人 统计表宾词的配置 平行配置 宾词复合配置 对宾词指标复合分组以后在表中层叠配置 如下表 某地两企业工人的工龄和性别分布表单位 人 统计表宾词的配置 复合配置 统计表的设计规则 一般原则 科学 实用 简明 美观 注意事项 1 标题简明2 左右开口3 线条清晰4 基线加粗5 标明单位6 数字照齐7 排列有序8 编写序号9 布局合理10 表外注释 统计整理 知识结构图
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!