统计数据的整理与显示.ppt

上传人:zhu****ei 文档编号:3526044 上传时间:2019-12-17 格式:PPT 页数:94 大小:7.38MB
返回 下载 相关 举报
统计数据的整理与显示.ppt_第1页
第1页 / 共94页
统计数据的整理与显示.ppt_第2页
第2页 / 共94页
统计数据的整理与显示.ppt_第3页
第3页 / 共94页
点击查看更多>>
资源描述
统计数据的整理与显示,第三章,2,目录,第一节数据的预处理第二节统计数据的整理第三节统计数据的显示,3,第一节数据的预处理,一、数据的审核二、数据的筛选三、数据的排序四、建立数据透视表,4,一、数据的审核,审核资料的完整性和及时性审核资料的正确性历史资料的审核,数据的审核即对调查资料进行审核,5,二、数据的筛选,1)当数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选2)根据某种需要进行筛选,6,用Excel进行数据筛选,8名学生的考试成绩数据,数据筛选(datafilter),7,数据筛选(datafilter),8,自动筛选,9,高级筛选,10,高级筛选,11,三、数据的排序,按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索排序有助于对数据检查纠错,以及为重新归类或分组等提供依据在某些场合,排序本身就是分析的目的之一排序可借助于计算机完成,12,数据排序(方法),分类数据的排序字母型数据,排序有升序降序之分,但习惯上用升序汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分,13,2.数值型数据的排序递增排序:设一组数据为x1,x2,xn,递增排序后可表示为:x(1)x(2)x(n),数据排序(方法),14,在Excel中进行排序(以8名学生的考试成绩为例),数据排序(方法),15,按统计学成绩排序后的学生成绩排名,数据排序(方法),16,四、建立数据透视表,从复杂的数据中提取有用的信息可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图,形成交叉表数据源表中的首行必须有列标题,17,数据透视表,18,在Excel中建立数据透视表,19,形成的数据透视表,20,第二节统计数据的整理,一、分类型数据的整理二、顺序型数据的整理三、数值型数据的整理,21,一、分类数据整理频数分布表,【例1】一家市场调查公司为研究不同品牌饮料的市场占有率,对随机抽取的一家超市进行了调查。调查员在某天对50名顾客购买饮料的品牌和顾客性别进行了记录。下页表格就是记录的原始数据,用Excel制作频数分布表,22,23,列出各类别计算各类别的频数制作频数分布表,分类数据的整理,1.基本过程,1.频数:落在各类别中的数据个数2.比例:某一类别数据占全部数据的比值3.百分比:将对比的基数作为100而计算的比值4.比率:不同类别数值的比值,24,2.频数分布表(通过数据透视表在Excel中得到),分类数据的整理与显示,25,利用SPSS的频数分析得到,26,通过SPSS的交叉列联表获得,27,二、顺序型数据的整理,1累积频数(cumulativefrequencies):各类别频数的逐级累加2累积频率(cumulativepercentages):各类别频率(百分比)的逐级累加,方向:向上累积:自类别顺序的开始一方向最后一方累加向下累积:自类别顺序的最后一方向开始一方累加,28,顺序数据的频数分布表(例题分析),【例2】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?1非常不满意;2不满意;3一般;4满意;5非常满意。,24132225270300,8.044.075.090.0100.0,29,顺序数据的频数分布表(例题分析),30027918010238,100.093.060.034.012.7,30,【例】某生产车间50名工人日加工零件数如下(单位:个)。试对数据进行分组。,三、数值型数据的整理,31,分组方法,分组方法,32,单变量值分组(要点),将一个变量值作为一组1.适合于离散变量2.适合于变量值较少的情况,单变量值分组,33,单变量值分组表,34,组距分组(要点),将变量值的一个区间作为一组适合于连续变量适合于变量值较多的离散型变量情况需要遵循“不重不漏”的原则可采用等距分组,也可采用不等距分组,组距分组,35,等距分组(步骤),1.确定组数1)一般组数K:5K152)参考Sturges(斯特杰斯)公式来确定组数K,1.确定组数2.确定组距3.绘制频数分布表,36,1.组限:各组的上限、下限值2.下限:一个组的最小值3.上限:一个组的最大值4.闭口组:上限和下限都齐全的组5.开口组:上限或下限有一个没有的组,等距分组(概念),37,等距分组(步骤),2.确定组距组距=上限下限(分组已确定)组距(最大值-最小值)组数(原始数据),3.统计出各组的频数并整理成频数分布表,38,某生产车间50名工人日加工零件数如下(单位:个)。试对数据进行分组。,数值型数据的分组,39,频数分布表,上限不在组内,(1)上下组限重叠,40,(2)上下组限间断,频数分布表,41,常用的确定方法:1、按连续变量分组,由于相邻两组的上限和下限是同一数值,界限会重叠,为避免计算各组次数出现混乱,其原则是“上限不在内”2、按离散变量分组,则相邻的上、下限通常以两个确定的不同整数值来表示,故相邻两组的上、下限可以不重合。,组限的确定,42,(3)开口组,频数分布表,43,组中值:下限与上限之间的中点值。,组中值(classmidpoint),开口组,44,在Excel中通过FREQUENCY函数得到频数分布表,45,在SPSS中得到的频数分布表,46,第三节统计数据的显示,一、统计图二、统计表,47,一、统计图,分类型数据的统计图顺序型数据的统计图数值型数据的统计图,48,分类型数据的统计图,条形图饼图,49,分类数据的图示条形图,用宽度相同的条形高度或长短来表示各类别数据的图形;有单式条形图、复式条形图等形式;主要用于反映分类数据的频数分布;绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图。,50,在Excel中得到的条形图,51,在SPSS中得到的条形图(例题分析),52,在SPSS中得到的复式条形图,53,分类数据的图示饼图,也称圆形图,用扇形面积来表示数值大小的图形;表示总体或样本中各组成部分所占的比例,对于研究结构性问题十分有用;各部分所占的百分比用各个扇形面积表示,54,在Excel中得到的饼图,55,在SPSS中得到的饼图,56,顺序型数据的统计图,累积频数分布图环形图,57,顺序数据的频数分布表(例题分析),【例2】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?1非常不满意;2不满意;3一般;4满意;5非常满意。,24132225270300,8.044.075.090.0100.0,58,顺序数据的频数分布表(例题分析),30027918010238,100.093.060.034.012.7,59,顺序数据的图示累计频数分布图,图甲城市家庭对住房状况评价的累积频数分布图,(1)累积频数分布图,60,环形图(在Excel中获得),甲乙两城市家庭对住房状况的评价,61,饼图环形图,相同:都可用来研究结构性问题,即均表现部分与整体的关系,62,数值型数据的统计图,直方图茎叶图箱线图线图散点图,63,分组数据直方图,用矩形的面积来表示各组的频数分布;横轴数据分组纵轴频数或频率,各组与相应的频数就形成了一个矩形,即直方图;3.直方图的总面积等于1。,64,分组数据的图示,直方图的面积之和等于1,某电脑公司销售量分布的直方图,65,直方图条形图,66,由“茎”和“叶”两部分组成,反应原始数据分布的图形。对于一个数字,以其最后一位数字做树叶,其余高位数字做树茎。例:152茎15叶2,未分组数据茎叶图,67,未分组数据茎叶图(例题分析),68,未分组数据茎叶图(扩展的茎叶图),69,对于n(20n300)个数据,茎叶图最大行数不超过L=10lg(n),未分组数据茎叶图,70,未分组数据茎叶图,茎叶图类似于横置的直方图,但又有区别:,71,未分组数据箱线图,由一个箱子和两条线段组成。5个特征值:最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU)连接两个四分位数画出箱子,再将两个极值点与箱子相连接,72,未分组数据单批数据箱线图(箱线图的构成),73,未分组数据单批数据箱线图,74,未分组数据多批数据箱线图,【例】从某大学学生中随机抽取11人,对8门课程的考试成绩进行调查,结果如表。试绘制各科考试成绩的比较箱线图,并分析其分布特征,75,未分组数据多批数据箱线图(SPSS得到),8门课程成绩箱线图,76,11名学生8门课程考试成绩的箱线图,Min-Max,25%-75%,Medianvalue,45,55,65,75,85,95,105,学生1,学生2,学生3,学生4,学生5,学生6,学生7,学生8,学生9,学生10,学生11,未分组数据多批数据箱线图,77,时间序列数据线图(lineplot),绘制线图时应注意以下几点时间一般绘在横轴,指标数据绘在纵轴;图形的长宽比例要适当,其长宽比例大致为10:7一般情况下,纵轴数据下端应从“0”开始,以便于比较。数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断。,78,时间序列数据线图(例题分析),【例】已知19912000年我国城乡居民家庭的人均收入数据如右表。试绘制线图。,79,时间序列数据线图(Excel得到),80,SPSS中得到的线图,81,散点图,用二维坐标展示两个变量之间关系使用的数据是成对的数据,如(xi,yi)以变量x为横轴,变量y为纵轴,在坐标系中描出各数据点,82,【例】小麦的单位面积产量与降雨量和温度等有一定关系。收集到如下数据。试据此绘制散点图。,多变量数据散点图,83,多变量数据散点图(Excel获得),84,SPSS中获得散点图,85,二、统计表,统计表的概念和结构统计表的种类编制统计表应注意的问题,86,统计表的结构,横行标题,纵览标题,数字资料,总标题,附加,主词,宾词,87,简单表:表的主词未经任何分组的统计表。其主词一般按时间顺序,或按总体各单位名称排列,通常是对调查来的原始资料初步整理所采取的形式。2.分组表:表的主词按某一标志进行分组的统计表。用于揭示不同类型现象的特征,说明现象内部的结构,分析现象之间的相互关系等。3.复合表:表的主词按照两个或两个以上标志进行复合分组的统计表。能更深刻详细地反映客观,但并非分组越细越好。,统计表的种类,88,1998年某公司所属两企业合格品数量表,统计表类型简单表,89,1998年某地区工业净产值和职工人数,统计表类型分组表,90,统计表类型复合表,91,标题应简明地概括所要反映的内容。表中主词各行和宾词各栏,一般应按先局部后整体的原则排列。统计表的栏数如果过多,要加以编号,主词和计量单位各栏用(甲)、(乙)、(丙)等文字编写;宾词指标各栏则用(1)、(2)、(3)等数字编号。,编制统计表应注意的问题,92,编制统计表应注意的问题,4.表中数字要填写整齐,位数对准。当不存在某项数字时,用符号“”表示;当缺乏某项数字时,用符号“”表示。5.数字资料要注明计量单位。6.某些特殊资料需要说明的,应在表的下方加以注解;数字资料要在表下说明来源,以备查考。7.统计表编制完毕审核后,制表人和主管部门负责人要签字,并加盖公章以示负责。,93,第三章小结,1、预处理:审核、筛选、排序、数据透视表2、整理:分类数据频数分布表顺序数据累积频数分布表(向上/向下)数值型数据组距分组(3步),94,3、显示:分类数据条形图、饼图顺序数据累积频数分布图、环形图数值型数据直方图、茎叶图、箱线图、线图、散点图4、对比:饼图环形图;条形图直方图;直方图茎叶图,第三章小结,
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!