统计学第4章数据的概括性度量课件

上传人:痛*** 文档编号:241705601 上传时间:2024-07-17 格式:PPTX 页数:51 大小:936.54KB
返回 下载 相关 举报
统计学第4章数据的概括性度量课件_第1页
第1页 / 共51页
统计学第4章数据的概括性度量课件_第2页
第2页 / 共51页
统计学第4章数据的概括性度量课件_第3页
第3页 / 共51页
点击查看更多>>
资源描述
17 七月七月 2024Statistical Research Office1第四章数据的概括性度量17 七月七月 2024Statistical Research Office24.1 4.1 数据分布集中趋势的测度数据分布集中趋势的测度4.2 4.2 数据分布离散程度的测度数据分布离散程度的测度4.3 4.3 数据分布偏态与峰度的测度数据分布偏态与峰度的测度17 七月七月 2024Statistical Research Office34.1 数据分布集中趋势的测度数据分布集中趋势的测度 数据的集中趋势数据的集中趋势是指一组数据向某是指一组数据向某 一中心值靠拢的倾向。一中心值靠拢的倾向。-集中趋势的测度集中趋势的测度就是寻找反映一组就是寻找反映一组 数据一般水平的数据一般水平的代表值代表值或或中心值中心值。-集中趋势的测度值集中趋势的测度值主要主要有:有:众数、众数、中位数、算术平均数(几何平均数)等中位数、算术平均数(几何平均数)等。17 七月七月 2024Statistical Research Office44.1.1 众数众数(mode)的概念的概念-一组定量数据中一组定量数据中出现次数最多出现次数最多的那个数值。的那个数值。-从数据次数分布的角度看,众数是具有从数据次数分布的角度看,众数是具有 明显集中趋势的数值,即一组数据分布明显集中趋势的数值,即一组数据分布(如正态分布、偏态分布)(如正态分布、偏态分布)的的最高峰点最高峰点所所 对应的数值就是众数。对应的数值就是众数。17 七月七月 2024Statistical Research Office5 若最高峰点有不止一个,则有不止一个若最高峰点有不止一个,则有不止一个众数;若没有最高峰点,则该组数据也没众数;若没有最高峰点,则该组数据也没有众数。有众数。众数不受极端数据的影响众数不受极端数据的影响众数的应用众数的应用 -如对零售市场上某种商品平均价格的如对零售市场上某种商品平均价格的估计;估计;-如某皮鞋生产厂商对所要生产皮鞋尺如某皮鞋生产厂商对所要生产皮鞋尺寸大小的确定等。寸大小的确定等。17 七月七月 2024Statistical Research Office6 众数的计算众数的计算 对未分组数据:对未分组数据:出现次数最多的出现次数最多的 变量值就是众数变量值就是众数。单变量值分组数据:单变量值分组数据:出现次数最出现次数最 多的变量值就是众数多的变量值就是众数。例例(见表(见表1)17 七月七月 2024Statistical Research Office7表表1 南京审计学院某班学生年龄南京审计学院某班学生年龄统计统计年龄(岁)人数(人)比重(%)向上累积人数(人)比重(%)18192021315302630604318485063696100合计50100-17 七月七月 2024Statistical Research Office8 对于组距分组数据(例对于组距分组数据(例 见表见表2)-确定众数组及其上下限的大小确定众数组及其上下限的大小 -确定众数组及相邻组的频数或确定众数组及相邻组的频数或频率频率 -确定众数组组距确定众数组组距 -将相关数据代入公式将相关数据代入公式 17 七月七月 2024Statistical Research Office9表表2某班学生课程考试成绩某班学生课程考试成绩统计统计分数分数(分)(分)人数人数(人)(人)比重比重(%)向上累积向上累积人数人数(人)(人)比重比重(%)90以上80-9070-8060-7055-6055以下6141040515.435.925.610.3012.839331995510085.648.723.112.812.8合计合计39100-17 七月七月 2024Statistical Research Office10某班学生考试成绩众数(某班学生考试成绩众数(Mode)17 七月七月 2024Statistical Research Office114.1.2 中位数中位数(median)的概念的概念-将一组定量数据按照从小到大或将一组定量数据按照从小到大或从大到小的顺序排列,处于中间位从大到小的顺序排列,处于中间位置上的数就是中位数。从而,把一置上的数就是中位数。从而,把一组数据平均分为两部分。组数据平均分为两部分。-一组数据的中位数一组数据的中位数有且只有有且只有一个。一个。-中位数中位数受极端数值受极端数值的影响的影响非常小非常小。17 七月七月 2024Statistical Research Office12 中位数的计算中位数的计算 对于未分组的数据:对于未分组的数据:排序直接找出排序直接找出处于中间位置的数即可。处于中间位置的数即可。-若数据是奇数个,则处于中间的若数据是奇数个,则处于中间的 那个数就是中位数;那个数就是中位数;若数据是偶数个,则处于中间的两若数据是偶数个,则处于中间的两个数的平均数就是中位数个数的平均数就是中位数。17 七月七月 2024Statistical Research Office13 对于单变量分组数据对于单变量分组数据 -确定中位数组确定中位数组 将组的次数(或频率)进行累积;将组的次数(或频率)进行累积;-中位数位置为(中位数位置为(N+1N+1)/2/2;-中位数组所在的变量值就是中位数。中位数组所在的变量值就是中位数。-例例(见见表表1 1)17 七月七月 2024Statistical Research Office14 对于组距分组数据对于组距分组数据 -确定中位数组及其组限;确定中位数组及其组限;-确定至中位数组前一组频数或频率累确定至中位数组前一组频数或频率累积数;积数;-确定中位数组的频数或频率;确定中位数组的频数或频率;-确定中位数组的组距;确定中位数组的组距;-代入公式代入公式注意:假定数据在每一组内服从均匀分布或注意:假定数据在每一组内服从均匀分布或关于组中值对称分布。关于组中值对称分布。17 七月七月 2024Statistical Research Office15某班学生考试成绩中位数17 七月七月 2024Statistical Research Office164.1.3 算术平均数(算术平均数(arithmetic mean)或称均值(或称均值(mean):总体中某一定量变总体中某一定量变量在各总体单位上的数值表现之和量在各总体单位上的数值表现之和与总体单位总数之比。与总体单位总数之比。-任意一组数据都任意一组数据都有且只有有且只有一个均一个均值;值;-均值广泛应用于数理统计中;均值广泛应用于数理统计中;-均值受极端数值的影响均值受极端数值的影响非常大非常大17 七月七月 2024Statistical Research Office17中国将中国将分岗位分岗位统计职工工资,防止工资统计职工工资,防止工资“被增长被增长”我国将分岗位统计职工工资,解决工资我国将分岗位统计职工工资,解决工资“被增长被增长”等等问题。问题。由于平均工资反映的是工资的总体情况而非个人的具由于平均工资反映的是工资的总体情况而非个人的具体水平,统计数据公布后,总有人感到自己工资体水平,统计数据公布后,总有人感到自己工资“被增长被增长”了。为此,国家统计局计划从了。为此,国家统计局计划从20132013年年起起分岗位分岗位统计平均统计平均工资,以更好地体现个体收入差异。工资,以更好地体现个体收入差异。资料来源资料来源:新华网:新华网,2012,2012年年0909月月2020日日 17:2817:2817 七月七月 2024Statistical Research Office18算术平均数的计算算术平均数的计算 对于未分组数据,用下列公式计算:对于未分组数据,用下列公式计算:17 七月七月 2024Statistical Research Office19 对于对于单变量单变量分组数据,用下列公式计算:分组数据,用下列公式计算:17 七月七月 2024Statistical Research Office20 对于组距分组数据,对于组距分组数据,计算公式与单变计算公式与单变 量分组数据计算公式相同,但其中量分组数据计算公式相同,但其中 分别表示每一组的分别表示每一组的组中值组中值;-利用组中值时利用组中值时假定假定数据在组中服数据在组中服从从均匀分布均匀分布或或关于关于组中值组中值对称分布对称分布17 七月七月 2024Statistical Research Office21 按按未分组数据未分组数据计算的均值,其大计算的均值,其大 小只受到变量值大小的影响;小只受到变量值大小的影响;按按单变量分组单变量分组数据与数据与组距组距分组分组 数据的均值,其大小数据的均值,其大小既既受到每组受到每组变变量值(或组中值)量值(或组中值)的影响,同时的影响,同时又又受到每一组受到每一组频数或频率频数或频率的影响。的影响。17 七月七月 2024Statistical Research Office22 对于对于众数与中位数众数与中位数而言,其大小而言,其大小仅仅受到受到分布形状及位置的影响,而分布形状及位置的影响,而不受不受其他变量值的影响;其他变量值的影响;当存在极端数值时,用众数或中位当存在极端数值时,用众数或中位数反映数据的集中趋势比算术平均数数反映数据的集中趋势比算术平均数更具有代表性。更具有代表性。-当数据差异较大时,应用当数据差异较大时,应用组平均数组平均数去说明、解释总平均数去说明、解释总平均数(例见表(例见表2 2)17 七月七月 2024Statistical Research Office23 2013年我国全年农村居民人均纯收入8896元,比上年增长12.4%,扣除价格因素,实际增长9.3%;农村居民人均纯收入中位数为7907元,增长12.7%。城镇居民人均可支配收入26955元,比上年增长9.7%,扣除价格因素,实际增长7.0%;城镇居民人均可支配收入中位数为24200元,增长10.1%。资料来源:2014年2月24日,中华人民共和国统计局:2013年中华人民共和国国民经济和社会发展统计公报17 七月七月 2024Statistical Research Office244.1.5 几何平均数几何平均数:主要用于计算比率或速主要用于计算比率或速度的平均数。度的平均数。-当数据本身是比率的形式,而 且各比率的乘积等于总的比率时,采用几何平均数计算该组数据的 平均数比较合适;-常用于计算经济的平均发展速 度、平均存款利率等。17 七月七月 2024Statistical Research Office25几何平均数的计算几何平均数的计算 对于对于未分组未分组数据,采用简单几何数据,采用简单几何 平均数公式计算:平均数公式计算:对于对于单变量值单变量值分组与分组与组距组距分组数分组数 据,采用加权几何平均数公式计算:据,采用加权几何平均数公式计算:17 七月七月 2024Statistical Research Office26例例1:“八五八五”和和“十一五十一五”时期我国经济的发展速度时期我国经济的发展速度 单位:单位:%年份年份 发展速度发展速度 年份年份 发展速度发展速度1991 109.1 2006 112.71992 114.1 2007 114.21993 113.1 2008 109.61994 112.6 2009 109.21995 109.0 2010 110.4因为因为所以,几何平均数可以看作算术平均数的变形。所以,几何平均数可以看作算术平均数的变形。17 七月七月 2024Statistical Research Office27 例2:2001-2010年小李在某家银行存款5万元。其中,有2年年存款利率为2.57%,有3年年存款利率为3.25%,有5年年存款利率为3.75%。问小李这10年享受的年平均存款利率是多少?17 七月七月 2024Statistical Research Office28中位数(中位数(median)、众数、众数(mode)、算术平、算术平 均数均数(mean)的关系的关系 在数据分布在数据分布偏度适当偏度适当的情况下,三者的情况下,三者之间的关系如下:之间的关系如下:-mode=median=mean (正态分布)正态分布)-mode median mean(右偏分布)(右偏分布)-mean median mode(左偏分布)(左偏分布)17 七月七月 2024Statistical Research Office29 -皮尔逊(皮尔逊(Pearson)经验经验公式公式 例如:例如:假定某年某市居民大多假定某年某市居民大多 数家庭的年收入为数家庭的年收入为4560045600元,但元,但 有一半的家庭年收入高于有一半的家庭年收入高于4750047500 元,问该年该市居民家庭年元,问该年该市居民家庭年 平均收入约为多少平均收入约为多少?17 七月七月 2024Statistical Research Office304.2 数据分布数据分布离散程度离散程度的测度的测度数据的离散(分散)程度:反映各变量值数据的离散(分散)程度:反映各变量值远离远离中心中心值值的程度。的程度。-一组数据的离散程度主要用来衡量数据集中趋势的一组数据的离散程度主要用来衡量数据集中趋势的测度值对该组数据测度值对该组数据代表性代表性的高低:的高低:数据的离散程度大,表明集中趋势的测度值对数数据的离散程度大,表明集中趋势的测度值对数据的代表性较差;据的代表性较差;数据的离散程度小,表明集中趋势的测度值对数数据的离散程度小,表明集中趋势的测度值对数据的代表性较高。据的代表性较高。17 七月七月 2024Statistical Research Office31数据离散程度测度指标有:数据离散程度测度指标有:-极差(极差(range)range)-内差内差(inter-quartile(inter-quartile range)range)-平均差(平均差(average deviation)average deviation)-标准差标准差(standard deviation)(standard deviation)-变异系数变异系数(coefficient of(coefficient of variance)variance)17 七月七月 2024Statistical Research Office32极差:一组数据的最大数值与最小数值之差。极差:一组数据的最大数值与最小数值之差。-极差极差 =最大数值最大数值 最小数值最小数值 -极差系数极差系数 =极差极差 /均值均值17 七月七月 2024Statistical Research Office3317 七月七月 2024Statistical Research Office34 内差内差=上四分位数上四分位数-下四分位数下四分位数 表明一组数据中,处于中间表明一组数据中,处于中间50%的数的数据的离散程度。据的离散程度。当需要比较不同数据组中间当需要比较不同数据组中间50%数据数据的离散程度时,要计算内差系数:的离散程度时,要计算内差系数:内差系数内差系数=内差内差/中间中间50%数据的平均数数据的平均数17 七月七月 2024Statistical Research Office35平均差(平均差(average deviation)17 七月七月 2024Statistical Research Office36 标准差(标准差(standard deviation):一组数一组数据据的的所有数值与其均值之差所有数值与其均值之差的的平方平方和和的的算术平均数算术平均数的的平方根。平方根。对未分组数据,计算公式为:对未分组数据,计算公式为:17 七月七月 2024Statistical Research Office37 对对单变量值单变量值分组数据或分组数据或组距组距分组数据:分组数据:思考:该公式的理论依据是什么?思考:该公式的理论依据是什么?17 七月七月 2024Statistical Research Office38标准差的平方称作方差(标准差的平方称作方差(variance)变异系数变异系数(标准差系数,风险系数)标准差系数,风险系数)(coefficient of standard deviation)例(见表例(见表3)17 七月七月 2024Statistical Research Office39表表3 某班学生考试绩统计某班学生考试绩统计分数分数频数频数频率频率组中植组中植90以上以上80-9070-8060-7055-6055以下以下6141040515.435.925.610.3012.89585756557.552.557011907502600262.5541501011505625016900013781.25合计合计39100-3032.542221.2517 七月七月 2024Statistical Research Office40判断或比较两组数据分散程度大小的判断或比较两组数据分散程度大小的步步骤骤:-计算每组数据的均值;计算每组数据的均值;-计算每组数据的标准差;计算每组数据的标准差;-计算每组数据的变异系数;计算每组数据的变异系数;-作出判断说明。作出判断说明。17 七月七月 2024Statistical Research Office414.3 数据分布偏态与峰度的测度数据分布偏态与峰度的测度 数据分布偏态及其测度数据分布偏态及其测度 偏态的判断偏态的判断:利用数据的均值、中位数:利用数据的均值、中位数 和众数三者之间的关系判断,即和众数三者之间的关系判断,即 若均值大于众数,则为若均值大于众数,则为右偏分布右偏分布;若均值小于众数,则为若均值小于众数,则为左偏分布左偏分布。偏态程度的测度偏态程度的测度:利用如下公式计算偏态系数:利用如下公式计算偏态系数:17 七月七月 2024Statistical Research Office42偏态系数偏态系数 17 七月七月 2024Statistical Research Office43-当偏态系数为零时,表明数据为对称分当偏态系数为零时,表明数据为对称分布;布;-当偏态系数大于零时,表明数据分布当偏态系数大于零时,表明数据分布为右偏分布;为右偏分布;-当偏态系数小于零时,表明数据分布当偏态系数小于零时,表明数据分布为左偏分布。为左偏分布。-偏态系数的绝对值越大,表明数据分布偏态系数的绝对值越大,表明数据分布的偏态程度越大。的偏态程度越大。17 七月七月 2024Statistical Research Office44 数据分布峰度的测度数据分布峰度的测度峰度系数:峰度系数:17 七月七月 2024Statistical Research Office45若峰度系数大于若峰度系数大于0 0,则数据分布为尖顶,则数据分布为尖顶分布,且系数越大,形态越陡峭;分布,且系数越大,形态越陡峭;若峰度系数小于若峰度系数小于0 0,则数据分布为平顶,则数据分布为平顶分布,且系数越小,形态越平缓;分布,且系数越小,形态越平缓;若峰度系数等于若峰度系数等于0 0,则数据分布为正态,则数据分布为正态分布。分布。17 七月七月 2024Statistical Research Office46例某班学生考试成绩的偏度与峰度计算例某班学生考试成绩的偏度与峰度计算。表4 某班学生考试成绩统计分数分数频数频数频率频率组中植组中植90以上以上80-9070-8060-7055-6055以下以下29119484.720.925.620.99.318.69585756557.552.572669130-28-186-10141906710301148141234417847合计合计43100-2194984817 七月七月 2024Statistical Research Office4717 七月七月 2024Statistical Research Office48(2)班)班概率论与数理统计概率论与数理统计成绩偏度与峰度计算成绩偏度与峰度计算分数分数频数频数频率频率组中植组中植90以上以上80-9070-8060-7055-6055以下以下6141040515.435.925.610.3012.89585756557.552.5784134-5-2160-207313478965152765052444合计合计39100-3032.56966717 七月七月 2024Statistical Research Office4950写在最后写在最后成功的基础在于好的学习习惯成功的基础在于好的学习习惯The foundation of success lies in good habits谢谢大家荣幸这一路,与你同行ItS An Honor To Walk With You All The Way讲师:XXXXXX XX年XX月XX日
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!