《SPSS统计描述》PPT课件.ppt

上传人:tia****nde 文档编号:11499277 上传时间:2020-04-26 格式:PPT 页数:69 大小:432KB
返回 下载 相关 举报
《SPSS统计描述》PPT课件.ppt_第1页
第1页 / 共69页
《SPSS统计描述》PPT课件.ppt_第2页
第2页 / 共69页
《SPSS统计描述》PPT课件.ppt_第3页
第3页 / 共69页
点击查看更多>>
资源描述
1,统计描述,引言,2,内容提要,统计概述与数据集中趋势指标介绍在EXCEL和SPSS中的应用变异程度指标介绍在EXCEL和SPSS中的应用分布形状,3,什么是统计学?,收集数据抽样设计;问卷调查演示数据图;表统计描述集中趋势;变异程度;分布形状统计推断统计估计:参数估计(点估计;区间估计);非参数估计假设检验:参数检验;非参数检验其他统计分析相关分析;方差分析;因子分析;聚类分析;回归分析,4,统计学的研究方法,统计学是从一组数据中抽象出有用信息以支持决策的原理和方法。统计学的研究领域或方法分为两部分:统计描述DescriptiveStatistics统计推断InferentialStatistics,5,统计描述和统计推断,统计描述:整理、概括并提供数据的方法以便看出数据间有用的关系例如:使用曲线图、饼图、条形图、表格等统计推断:利用从总体的一个样本中获得的信息来推断总体的特征时使用的方法例如:估计、检验、预测,6,统计描述,涉及Involves收集数据CollectingData演示数据PresentingData把握数据特征CharacterizingData目标Purpose描述数据DescribeData,7,统计推断,涉及Involves估计Estimation假设检验HypothesisTesting目标Purpose确定总体的特征MakeDecisionsAboutPopulationCharacteristics,8,数据来源,直接来源,间接来源,数值来源,试验,问卷调查,观察,出版物(或网上),9,数据类型,数值数据,属性数据,数据类型,离散数据,连续数据,10,数据类型举例,数值数据(定量的)离散的(数出来的)本月内买过几本书?_连续的(测出来的)从家到学校的距离?_(公里)属性数据(定性的)你喜欢参与式教学吗吗?_喜欢_不喜欢,11,数据度量尺度,定类尺度Nominal无等级次序排列例如:男-女;从事工作的行业定序尺度Ordinal可作等级次序排列例如:学校职位;班级排名定距尺度Interval没有真正的零点;例如,摄氏度C定比尺度Ratio存在真正的零点,倍数有意义例,身高、体重,12,数据度量与信息含量,度量尺度的信息含量由弱到强排列:定类尺度定序尺度定距尺度定比尺度定类尺度和定序尺度用于属性数据信息量低定距尺度和定比尺度用于数值数据信息量高,13,数据的统计描述,14,概括描述数值数据,一个变量的问题:解释数值数据的特征集中趋势变异程度分布形状两个以上变量的问题:相关系数和回归,15,数值数据的特征和度量,16,均值(平均数),用于度量数据的集中趋势是最常见的集中趋势的度量如同平衡点易受极端数值影响公式(样本均值),17,例:人均受教育年限(人力资本),18,几何平均数,常用于计算百分比、比率、指数、增长率等指标的平均数几何平均数算术平均数公式(要求xi0),19,几何平均数的实际算法,为了避免零增长率或负增长率,几何平均数的计算一般改为如下公式。中国的GDP增长率计算用的是实际GDP的几何平均数。,20,例:高等学校招生数量的增长,1978年为40.2万人,2004年为447万人,增长率为:exp(ln(447/40.2)/26)-10.097,21,复利计算公式的应用,在已知初值、终值及期数的情况下,下列复利计算公式也可以用于计算几何平均数,即平均变化率:A(1+r)n=F其中,A=初值,r=平均变化率n=期数,F=终值,22,算术平均数和几何平均数的差别,示例:假设$1投入普通股票的投资组合,在连续的两个年度中得到正50%和负50%的回报。第一年末投资组合价值$1.5。第二年末投资组合价值$0.75。年度变化的算术平均数为0,而年度变化的几何平均数(复利回报)为负13.4%。显然,几何平均数更适合度量资产在不同时期的变化。,23,加权平均数,24,例:,已知2000年三次产业从业人员的平均受教育年限分别为6.9年、7.8年和12.1年,问全体从业人员的平均受教育年限是多少?不能用简单算术平均!要先查找各个产业的从业人员数量,或比重。例如,知道2000年三次产业比重分别为50、22.5和27.5。全体从业人员的平均受教育年限是:0.5*6.9+0.225*7.8+0.275*12.18.5,25,调和平均数,调和平均数:倒数的算术平均数的倒数。主要用来计算学习速度等平均。公式:,26,调和平均数举例,一个学生阅读2页书,读第一页时的速度折合为每小时20页,读第二页时的速度折合为每小时40页,问该生平均每小时阅读速度是多少?算术平均为:调和平均为:实际用时为:60/20+60/40=3+3/2=9/2分钟按算术平均读,可以读30/60*9/2=9/4页按调和平均读,可以读(80/3)/60*9/2=2页,27,中位数,用于度量数据的集中趋势CentralTendency为排序序列的中间值如果n是奇数,即为排序序列居中位置的观测值如果n是偶数,则为排序序列两个居中位置的观测值的均值中位数在序列中的位置:不受数据极端值的影响,28,众数,用于度量数据的集中趋势为出现次数最多的数值可从排序数组中观察得到不受极值的影响一组数据可能没有众数或有多个众数对数值数据和类型数据均适用,29,值域中点,用于度量数据的集中趋势是最小和最大观测值的平均值对数据的极端值非常敏感常用于金融分析和气象预报,值域中点,X,X,最小值,最大值,2,30,四分位数,用于度量数据的非集中趋势把排序数据等分为四个区间第i个四分位数的位置,Q1Q2Q3,31,四分位数,Q1,firstquartile,第一四分位数是处于(n+1)/4位置上的观测值。25%的观测值比第一四分位数小。Q2,secondquartile,第二四分位数就是中位数。处于2(n+1)/4=(n+1)/2的位置上。50%的观测值比中位数小。Q3。thirdquartile,第三四分位数是处于3(n+1)/4位置上的观测值。75%的观测值比第三四分位数小。,32,中轴数,用于度量数据的集中趋势CentralTendency是第一和第三四分位数的平均值不受数据极端值的影响NotAffectedbyExtremeValues,33,应用示例,假如某班1小组期末考试数学成绩为:83,52,96,79,83,88,64,79,83,69试用上述方法描述数学成绩的集中趋势,34,题解:均值,35,题解:中位数(Median),36,题解:众数,37,题解:值域中点(Midrange),38,题解:Q1,39,题解:Q3,40,题解:中轴数(Midhinge),41,在EXCEL中计算集中趋势,直接利用函数:平均值:average(注意EXCEL中用的不是mean)中位数:median众数:mode,42,在SPSS中计算集中趋势,观测量概述:analyzereportscasessummarize频数分析:AnalyzeDescriptiveStatisticsFrequencies描述统计量:analyze-descriptivestatistics-descriptive,43,数值数据的特征和度量,44,全距(极差),度量数据的离散程度MeasureofDispersion最大和最小观测值之差不考虑数据如何分布取决于数据的极端值,全距,X,X,最小值,最大值,7,8,9,10,7,8,9,10,45,四分位间距,度量数据的离散程度MeasureofDispersion为第三和第一四分位数之差四分位间距=Q3-Q1包括排序数据处于中间位置50%的观测值不受极值影响,46,方差和标准差,度量数据的离散程度MeasuresofDispersion是最为常用的变异程度的度量涉及数据的分布状况表示全部观测值相对于均值的平均变异程度,X,=77.6,47,样本方差公式,分母是(n-1)。如果是总体方差就用N,48,样本标准差公式,标准差为方差的平方根,49,变异系数,度量相对离散程度(MeasureofRelativeDispersion)表现了标准差相对于均值的比率用来比较两组或多组计量单位不同的数据的变异程度公式,50,应用示例,假如某班1小组期末考试数学成绩为:83,52,96,79,83,88,64,79,83,69试用上述方法描述该数学成绩的波动程度(volatility).,51,题解:全距和四分位间距,全距X最大X最小965244四分位间距Q3Q1836914,52,题解:样本方差(SampleVariance),53,题解:样本标准差(SampleStandardDeviation),54,题解:变异系数(CoefficientofVariation),55,在EXCEL中计算变异趋势,直接利用函数:最大值:MAX最小值:MIN标准差:STDEV方差:VAR间接利用函数:变异系数:STDEV/AVERAGE,56,在SPSS中计算变异趋势,观测量概述:analyzereportscasessummarize频数分析:AnalyzeDescriptiveStatisticsFrequencies描述统计量:analyze-descriptivestatistics-descriptive,57,基尼系数,基尼系数是20世纪初意大利经济学家基尼根据洛伦茨曲线设计的判断收入分配平等程度的指标。收入分配越是趋向平等,基尼系数也越小,反之,收入分配越是趋向不平等,那么基尼系数也越大。联合国有关组织规定:若低于0.2表示收入绝对平均;0.2-0.3表示比较平均;0.3-0.4表示相对合理;0.4-0.5表示收入差距较大;0.6以上表示收入差距悬殊。,58,收入基尼系数的经验范围,59,基尼系数的图形表示,设实际收入分配曲线和收入分配绝对平等曲线之间的面积为A,实际收入分配曲线右下方的面积为B。并以A除以(A+B)的商表示不平等程度。这个数值被称为基尼系数或称洛伦茨系数。如果A为零,基尼系数为零,表示收入分配完全平等;如果B为零则系数为1,收入分配绝对不平等。该系数可在零和1之间取任何值。收入分配越是趋向平等,洛伦茨曲线的弧度越小,基尼系数也越小,反之,收入分配越是趋向不平等,洛伦茨曲线的弧度越大,那么基尼系数也越大。,60,基尼系数的计算公式,Gini系数的计算步骤:Step1:排序Step2:计算比重Step3:计算累积比重Step4:计算2倍的梯形面积Step5:计算基尼系数注意:此公式没有按照人口加权,61,基尼系数的例子,计算我国各省人均GDP的基尼系数(见课堂演示),62,泰尔(Theil)系数,泰尔(Theil)系数的优点可以将区域差异按产业结构或地区结构进行多层次(组内组间)分解。采用经济规模进行加权,63,泰尔(Theil)系数的计算公式,以省为单位的差异:,以地区为单位的差异:,以地区内的省份为单位的差异:,64,形状Shape,表明数据是如何分布的偏态Skew与对称Symmetry左偏:均值中位数对称(零偏度):均值=中位数,左偏的均值中位数众数,对称的均值中位数众数,右偏的众数中位数均值,65,盒须图Box-and-WhiskerPlot,用5个度量值概括表述数据特征:GraphicalDisplayofDataUsing5-NumberSummary最小值、第一四分位、中位数、第三四分位、最大值,66,数据分布状况与盒须图,右偏的Right-Skewed,左偏的Left-Skewed,对称的Symmetric,Q1中位数Q3,Q1中位数Q3,Q1中位数Q3,67,题解,68,题解,众数,中位数,平均数,69,阅读材料,贺灿飞、梁进社:“中国区域经济差异的时空变化:市场化、全球化与城市化”,管理世界,2004年第8期,第8-17页。王蓉:“我国义务教育经费的地区性差异研究”,收入闵维方教授等编为教育提供充足的资源教育经济学国际研讨会论文集,人民教育出版社2002年10月。岳昌君,“经济发展水平的地区差异对教育资源配置的影响”,教育与经济,2003年第1期,第35-41页。从人口大国迈向人力资源强国,高等教育出版社,2003年2月,第一章。盛世明,“浅谈不公平程度的度量方法”,统计与决策,2004年第2期。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!