统计学第三章单变量描述统计课件

上传人:无*** 文档编号:241718984 上传时间:2024-07-18 格式:PPT 页数:62 大小:855.50KB
返回 下载 相关 举报
统计学第三章单变量描述统计课件_第1页
第1页 / 共62页
统计学第三章单变量描述统计课件_第2页
第2页 / 共62页
统计学第三章单变量描述统计课件_第3页
第3页 / 共62页
点击查看更多>>
资源描述
单变量描述统计学习提纲学习提纲v频数与累计频数频数与累计频数v集中趋势的度量集中趋势的度量 v离散程度的度量离散程度的度量v相对位置与异常值的检验相对位置与异常值的检验v偏态与峰度的测度偏态与峰度的测度频数与累计频数频数与累计频数v频数频数次数次数对总体经过分组后形成各组单位数在各组间的分布。对总体经过分组后形成各组单位数在各组间的分布。也就是各类别中的数据个数。也就是各类别中的数据个数。v频数分布频数分布次数分布,分布数列次数分布,分布数列总体中的各个类别及其相应的频数全部展示出来的总体中的各个类别及其相应的频数全部展示出来的数据集汇总表数据集汇总表定类数据定类数据 定序数据定序数据定距数据定距数据 定比数据定比数据v累计频数累计频数 向上累计向上累计将各组次数和比率,由变量值低的组向变量将各组次数和比率,由变量值低的组向变量值高的组逐组累计。值高的组逐组累计。向下累计向下累计将各组次数和比率,由变量值高的组向变量将各组次数和比率,由变量值高的组向变量值低的组逐组累计。值低的组逐组累计。参照参照P62表表3-3累计次数分布累计次数分布数据分布的特征数据分布的特征集中趋势集中趋势集中趋势集中趋势 (位置位置位置位置)离中趋势离中趋势离中趋势离中趋势 (分散程度分散程度分散程度分散程度)偏态和峰度偏态和峰度偏态和峰度偏态和峰度(形状)(形状)(形状)(形状)数据分布的特征和测度数据分布的特征和测度数据的特征和测度数据的特征和测度分布的形状分布的形状集中趋势集中趋势离散程度离散程度众众众众众众 数数数数数数中位数中位数中位数中位数中位数中位数均均均均均均 值值值值值值离散系数离散系数离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差峰峰峰峰峰峰 度度度度度度四分位差四分位差四分位差四分位差四分位差四分位差异众比率异众比率异众比率异众比率异众比率异众比率偏偏偏偏偏偏 态态态态态态 集中趋势及其测度集中趋势及其测度集中趋势集中趋势(Central tendency)v集中趋势集中趋势绝大多数总体各单位数据的次数分布都是正态分布绝大多数总体各单位数据的次数分布都是正态分布或近似正态分析或近似正态分析总体中各数据值的次数分布从两边向中间集中的趋总体中各数据值的次数分布从两边向中间集中的趋势势作为中心的变量值就是作为中心的变量值就是平均指标平均指标 同质总体中各单位某一数据所达到的一般水平同质总体中各单位某一数据所达到的一般水平集中趋势集中趋势(Central tendency)v集中趋势集中趋势不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值一组数据向其一组数据向其中心值中心值靠拢的靠拢的 倾向和程度倾向和程度低层次数据的集中趋势测度值适用于高层次低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据势测度值并不适用于低层次的测量数据集中趋势的测度集中趋势的测度定类数据:众数定类数据:众数定序数据:中位数和分位数定序数据:中位数和分位数定距和定比数据:均值定距和定比数据:均值众数众数v集中趋势测度值之一集中趋势测度值之一v出现次数最多的变量值出现次数最多的变量值v不受极端值的影响不受极端值的影响v可能没有众数或有几个众数可能没有众数或有几个众数v主要用于定类数据,也可用于定序数据和数主要用于定类数据,也可用于定序数据和数值型数据值型数据数值型分组数据的众数数值型分组数据的众数v出现次数最多的组作为众数所在组出现次数最多的组作为众数所在组v众数的区间范围:众数所在组的区间众数的区间范围:众数所在组的区间数值型分组数据的众数数值型分组数据的众数表表1 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)累积频数累积频数105110110115115120120125125130130135135140358141064381630404650合计合计50【例例例例 1 1】根根 据据 表表中中 的的 数数据据,计计算算 50名名工工 人人 日日加加 工工 零零件件 数数 的的众数众数中位数中位数v集中趋势的测度值之一集中趋势的测度值之一v排序后处于中间位置上的值排序后处于中间位置上的值MMe e50%50%v不受极端值的影响不受极端值的影响v主要用于定序数据,也可用数值型数据,但不能主要用于定序数据,也可用数值型数据,但不能用于定类数据用于定类数据v各变量值与中位数的离差绝对值之和最小各变量值与中位数的离差绝对值之和最小中位数中位数(位置的确定位置的确定)未分组数据:未分组数据:组距分组数据:组距分组数据:未分组数据的中位数未分组数据的中位数(计算公式计算公式)定序数据中位数定序数据中位数【例例例例2 2】根据表3-2中的数据,计算甲城市家庭对住房满意状况评价的中位数表表2 甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲甲城市城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意2410893453024132225270300合计合计300数值型分组数据的中位数数值型分组数据的中位数表表1 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)累积频数累积频数105110110115115120120125125130130135135140358141064381630404650合计合计50【例例例例 3 3】根根 据据 表表中中 的的 数数据据,计计算算 50名名工工 人人 日日加加 工工 零零件件 数数 的的中位数中位数四分位数四分位数v1.集中趋势的测度值之一v2.排序后处于25%和75%位置上的值v3.不受极端值的影响v4.主要用于定序数据,也可用于数值型数据,但不能用于定类数据QQL LQQMMQQU U25%25%25%25%四分位数四分位数(位置的确定)未分组数据:未分组数据:组距分组数据组距分组数据:下四分位数下四分位数(QQL L)位置位置 =N+N+1 14 4上四分位数上四分位数(QQU U)位置位置 =3(3(N+N+1)1)4 4下四分位数下四分位数(QQL L)位置位置 =N N4 4上四分位数上四分位数(QQL L)位置位置 =3N3N4 4百分位数百分位数vP百分位数百分位数p%的数据项的值小于等于的数据项的值小于等于P百分位数百分位数(100-p)%的数据项的值大于等于的数据项的值大于等于P百分位百分位数数均值均值v集中趋势的测度值之一集中趋势的测度值之一v最常用的测度值最常用的测度值v一组数据的均衡点所在一组数据的均衡点所在v易受极端值的影响易受极端值的影响v用于数值型数据,不能用于定类数据用于数值型数据,不能用于定类数据和定序数据和定序数据均值均值设设一组数据为:一组数据为:X X1 1,X X2 2,X XN N 简单均值简单均值简单均值简单均值的计算公式为的计算公式为设设分组后的数据为:分组后的数据为:X X1 1,X X2 2,X XK K 相应的频数为:相应的频数为:F F1 1,F F2 2,F FK K加权均值加权均值加权均值加权均值的计算公式为的计算公式为加权均值加权均值v甲甲乙乙两两组组各各有有10名名学学生生,他他们们的的考考试试成成绩绩及及其其分分布布数据如下:数据如下:甲组:甲组:考试成绩(考试成绩(X):0 20 100 人数分布(人数分布(F):):1 1 8 乙组:乙组:考试成绩(考试成绩(X):0 20 100 人数分布(人数分布(F):):8 1 1X X X甲甲甲01+201+100801+201+100801+201+1008n n n 101010iii=1=1=1 X X Xiii 828282828282(分)分)分)分)分)分)X X X乙乙乙08+201+100108+201+100108+201+1001n n n 101010iii=1=1=1 X X Xiii 121212121212(分)(分)(分)(分)(分)(分)计算举例计算举例v某投资者某日选中某投资者某日选中5只股票的价格分别为:只股票的价格分别为:3.5元、元、4.1元、元、5.6元、元、9.8元和元和15.6元。元。股票名称 价格数量购买总金额某高速3.51656某电子4.11249.2某科技5.618100.8某药业9.8329.4某环保15.6231.2合计51266.6均值均值v1.各变量值与均值的离差之和等于零各变量值与均值的离差之和等于零 2.各变量值与均值的离差平方和最小各变量值与均值的离差平方和最小调和平均数调和平均数v集中趋势的测度值之一集中趋势的测度值之一v均值的另一种表现形式均值的另一种表现形式v易受极端值的影响易受极端值的影响v用于定比数据用于定比数据v不能用于定类数据和定序数据不能用于定类数据和定序数据v 计算公式为计算公式为几何平均数几何平均数v集中趋势的测度值之一集中趋势的测度值之一vN 个变量值乘积的个变量值乘积的 N 次方根次方根v适用于特殊的数据适用于特殊的数据v主要用于计算平均发展速度主要用于计算平均发展速度v计算公式为计算公式为vv可看作是均值的一种变形可看作是均值的一种变形众数、中位数和均值的比较众数、中位数和均值的比较对称分布对称分布对称分布对称分布对称分布对称分布 均值均值均值均值均值均值=中位数中位数中位数中位数中位数中位数=众数众数众数众数众数众数左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数 均值均值均值均值均值均值数据类型与集中趋势测度值数据类型与集中趋势测度值数据类型和所适用的集中趋势测度值数据类型和所适用的集中趋势测度值数据类型数据类型定类数据定类数据 定序数据定序数据定距数据定距数据定比数据定比数据适适用用的的测测度度值值众数众数中位数中位数均值均值均值均值四分位数四分位数众数众数调和平均数调和平均数众数众数中位数中位数几何平均数几何平均数四分位数四分位数 中位数中位数四分位数四分位数众数众数 离散趋势及其测度离散趋势及其测度数据的特征和测度数据的特征和测度(本节位置)(本节位置)数据的特征和测度数据的特征和测度分布的形状分布的形状离散程度离散程度集中趋势集中趋势众众众众众众 数数数数数数中位数中位数中位数中位数中位数中位数均均均均均均 值值值值值值离散系数离散系数离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差峰峰峰峰峰峰 度度度度度度四分位差四分位差四分位差四分位差四分位差四分位差异众比率异众比率异众比率异众比率异众比率异众比率偏偏偏偏偏偏 态态态态态态离中趋势离中趋势v数据分布的另一个重要特征数据分布的另一个重要特征v离中趋势的各测度值是对数据离散程度所作的描离中趋势的各测度值是对数据离散程度所作的描述述v反映各变量值远离其中心值的程度,因此也称为反映各变量值远离其中心值的程度,因此也称为离中趋势离中趋势v从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度v不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值离散程度的测度离散程度的测度v定类数据:异众比率定类数据:异众比率v定序数据:四分位差定序数据:四分位差v定距和定比数据:方差及标准差定距和定比数据:方差及标准差v相对离散程度:离散系数相对离散程度:离散系数异众比率异众比率(定类数据定类数据)v离散程度的测度值之一离散程度的测度值之一v非众数组的频数占总频数的比率非众数组的频数占总频数的比率v计算公式为计算公式为vv 用于衡量众数的代表性用于衡量众数的代表性异众比率异众比率(算例)表表3 某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布 广告类型广告类型人数人数(人人)频率频率(%)商品广告商品广告 服务广告服务广告 金融广告金融广告 房地产广告房地产广告 招生招聘广告招生招聘广告 其他广告其他广告1125191610256.025.54.58.05.01.0合计合计200100【例例例例4 4】根据下表数据,计算异众比率根据下表数据,计算异众比率在在在在所所所所调调调调查查查查的的的的200200人人人人当当当当中中中中,关关关关注注注注非非非非商商商商品品品品广广广广告告告告的的的的人人人人数数数数占占占占44%44%,异异异异众众众众比比比比率率率率还还还还是是是是比比比比较较较较大大大大。因因因因此此此此,用用用用“商商商商品品品品广广广广告告告告”来来来来反反反反映映映映城城城城市市市市居居居居民民民民对对对对广广广广告告告告关关关关注注注注的的的的一一一一般般般般趋趋趋趋势势势势,其其其其代代代代表表表表性不是很好性不是很好性不是很好性不是很好四分位差(定序数据)四分位差(定序数据)v离散程度的测度值之一离散程度的测度值之一v也称为内距或四分间距也称为内距或四分间距v上四分位数与下四分位数之差上四分位数与下四分位数之差v QD=QU-QLv反映了中间反映了中间50%数据的离散程度数据的离散程度v不受极端值的影响不受极端值的影响v用于衡量中位数的代表性用于衡量中位数的代表性四分位差四分位差(定序数据的算例定序数据的算例)【例例例例5 5】根根根根据据据据表表表表3-23-2中中中中的的的的数数数数据据据据,计计计计算算算算甲甲甲甲城城城城市市市市家家家家庭庭庭庭对对对对住住住住房房房房满意状况评价的四分位差满意状况评价的四分位差满意状况评价的四分位差满意状况评价的四分位差解解:设设非非常常不不满满意意为为1,不不满满意意为为2,一一般般为为3,满满意意为为 4,非非常常满满意意为为5 已已知知 QL=不满意不满意=2,QU =一般一般=3四分位差:四分位差:QD=QU =QL =3 2 =1表表3-2 甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲甲城市城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意2410893453024132225270300合计合计300极差极差v一组数据的最大值与最小值之差一组数据的最大值与最小值之差v离散程度的最简单测度值离散程度的最简单测度值v易受极端值影响易受极端值影响v未考虑数据的分布未考虑数据的分布7 7 8 8 9 910107 7 8 8 9 9 1010未分组数据未分组数据未分组数据未分组数据 R R =max(max(X Xi i)-)-min(min(X Xi i).=组距分组数据组距分组数据组距分组数据组距分组数据 R R 最高组上限最高组上限 -最低组下最低组下限限v 计算公式为计算公式为平均差平均差v离散程度的测度值之一离散程度的测度值之一v各变量值与其均值离差绝对值的平均数各变量值与其均值离差绝对值的平均数v能全面反映一组数据的离散程度能全面反映一组数据的离散程度v数学性质较差,实际中应用较少数学性质较差,实际中应用较少v计算公式为计算公式为未分组数据未分组数据未分组数据未分组数据组距分组数据组距分组数据组距分组数据组距分组数据平均差平均差(计算过程及结果)(计算过程及结果)表表 某车间某车间50名工人日加工零件标准差计算表名工人日加工零件标准差计算表按零件数分组按零件数分组组中值组中值(Xi)频数频数(Fi)|Xi-X|Xi-X|Fi105110110115115120120125125130130135135140107.5112.5117.5122.5127.5132.5137.535814106415.710.75.70.74.39.314.347.153.545.69.843.055.857.2合计合计50312【例例例例6 6】根根据据第第三三章章表表3-5中中的的数数据据,计计算算工工人人日日加加工工零零件件数数的平均差的平均差方差和标准差方差和标准差v离散程度的测度值之一离散程度的测度值之一v最常用的测度值最常用的测度值v反映了数据的分布反映了数据的分布v反映了各变量值与均值的平均差异反映了各变量值与均值的平均差异v各变量值对均值的方差小于对任意值的各变量值对均值的方差小于对任意值的方差方差v根据总体数据计算的,称为总体方差或标准差;根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差根据样本数据计算的,称为样本方差或标准差4 6 8 10 124 6 8 10 12X=X=8.38.3总体方差和标准差总体方差和标准差未分组数据未分组数据:组距分组数据:组距分组数据:未分组数据:未分组数据:组距分组数据:组距分组数据:方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式总体方差和标准差总体方差和标准差表表3 某车间某车间50名工人日加工零件标准差计算表名工人日加工零件标准差计算表按零件数分组按零件数分组组中值组中值(Xi)频数频数(Fi)(Xi-X)2(Xi-X)2Fi105110110115115120120125125130130135135140107.5112.5117.5122.5127.5132.5137.5358141064246.49114.4932.490.4918.4986.49204.49739.47572.45259.926.86184.90518.94817.96合计合计503100.5【例例7】根根据据表表3-5中中的的数数据据,计计算算工工人人日日加加工工零零件件数的标准差数的标准差样本方差和标准差样本方差和标准差未分组数据:未分组数据:组距分组数据:组距分组数据:未分组数据:未分组数据:组距分组数据:组距分组数据:方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式方差的数学性质方差的数学性质v各变量值对均值的方差小于对任意值各变量值对均值的方差小于对任意值的方差的方差v设设X0为不等于为不等于 X 的任意数,的任意数,D2为对为对X0的方的方差,则差,则离散系数离散系数v消除了数据水平高低和计量单位的影响消除了数据水平高低和计量单位的影响v测度了数据的相对离散程度测度了数据的相对离散程度v用于对不同组别数据离散程度的比较用于对不同组别数据离散程度的比较v标准差系数:标准差系数:v平均差系数:平均差系数:离散系数离散系数表表4 某管理局所属某管理局所属8家企业的产品销售数据家企业的产品销售数据企业编号企业编号产品销售额(万元)产品销售额(万元)X1销售利润(万元)销售利润(万元)X21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例例例例8 8】某某管管理理局局抽抽查查了了所所属属的的8家家企企业业,其其产产品品销销售售数数据据如如表表4。试比较产品销售额与销售利润的离散程度。试比较产品销售额与销售利润的离散程度离散系数离散系数(计算结果计算结果)X X1 1=536.25536.25(万元)万元)S S1 1=309.19309.19(万元)万元)V V1 1=536.25536.25309.19309.19=0.5770.577S S2 2=23.0923.09(万元)万元)V V2 2=32.521532.521523.0923.09=0.7100.710X X2 2=32.521532.5215(万元)万元)结结结结论论论论:计算结果表明,V1 0为右偏分布为右偏分布v偏态系数偏态系数 0为左偏分布为左偏分布v计算公式为计算公式为偏态偏态(实例实例)【例例例例9 9】已已知知某某年年我我国国农农村村居居民民家家庭庭按按纯纯收收入入分分组组的的有有关关数数据据如如右右表表。试试计算偏态系数计算偏态系数农村居民家庭纯收入数据农村居民家庭纯收入数据按纯收入分组(元)按纯收入分组(元)户数比重(户数比重(%)500以下以下500100010001500150020002000250025003000300035003500400040004500450050005000以上以上2.2812.4520.3519.5214.9310.356.564.132.681.814.94户户户户户户数数数数数数比比比比比比重重重重重重(%)(%)(%)25252020151510105 5农村居民家庭村收入数据的直方图农村居民家庭村收入数据的直方图农村居民家庭村收入数据的直方图农村居民家庭村收入数据的直方图偏态与峰度偏态与峰度(从直方图上观察从直方图上观察)按纯收入分组按纯收入分组按纯收入分组按纯收入分组按纯收入分组按纯收入分组(元元元元元元)10001000500500150015002000200025002500300030003500350040004000 4500450050005000结论:结论:结论:结论:1.1.为右偏分布为右偏分布 2.2.峰度适中峰度适中偏态系数偏态系数(计算过程)(计算过程)农村居民家庭纯收入数据偏态及峰度计算表农村居民家庭纯收入数据偏态及峰度计算表按纯收入分组按纯收入分组(百元)(百元)组中值组中值Xi户数比重户数比重(%)Fi(Xi-X)Fi3(Xi-X)Fi45以下以下5101015152020252530303535404045455050以上以上2.57.512.517.522.527.532.537.542.547.552.52.2812.4520.3519.5214.9310.356.564.132.681.814.94-154.64-336.46-144.87-11.840.1823.1689.02171.43250.72320.741481.812927.154686.511293.5346.520.20140.60985.492755.005282.948361.9846041.33合计合计1001689.2572521.25偏态系数偏态系数(计算结果计算结果)根据上表数据计算得根据上表数据计算得将计算结果代入公式得将计算结果代入公式得将计算结果代入公式得将计算结果代入公式得结论:结论:偏态系数为正值,而且数值较大,说明农村居民家庭纯偏态系数为正值,而且数值较大,说明农村居民家庭纯收入的分布为右偏分布,即收入较少的家庭占据多数,而收入收入的分布为右偏分布,即收入较少的家庭占据多数,而收入较高的家庭则占少数,而且偏斜的程度较大较高的家庭则占少数,而且偏斜的程度较大 峰度峰度v次数分布曲线顶峰尖削程度次数分布曲线顶峰尖削程度v峰度系数峰度系数=3,扁平程度适中,正态分布,扁平程度适中,正态分布v扁平分布扁平分布 偏态系数偏态系数3,变量值的次数在众数周围分布集中,变量值的次数在众数周围分布集中v计算公式为计算公式为峰度系数峰度系数(计算结果计算结果)代入公式得代入公式得 【例例例例1010】根根据据表表中中的的计计算算结结果果,计计算算农农村村居居民民家家庭纯收入分布的峰度系数庭纯收入分布的峰度系数 结结论论:由由于于=3.43,说说明明我我国国农农村村居居民民家家庭庭纯纯收收入入的的分分布布为为尖尖峰峰分分布布,说说明明低低收收入入家家庭庭占占有有较较大大的的比比重重
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!