第二章统计数据的描述教学课件

上传人:痛*** 文档编号:241661294 上传时间:2024-07-14 格式:PPT 页数:97 大小:1.51MB
返回 下载 相关 举报
第二章统计数据的描述教学课件_第1页
第1页 / 共97页
第二章统计数据的描述教学课件_第2页
第2页 / 共97页
第二章统计数据的描述教学课件_第3页
第3页 / 共97页
点击查看更多>>
资源描述
数据分布的特征和测度峰峰峰峰峰峰 度度度度度度偏偏偏偏偏偏 态态态态态态数据的特征和测度数据的特征和测度分布的形状分布的形状集中趋势集中趋势离散程度离散程度众众众众众众 数数数数数数中位数中位数中位数中位数中位数中位数离散系数离散系数离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差四分位差四分位差四分位差四分位差四分位差四分位差异众比率异众比率异众比率异众比率异众比率异众比率位置位置位置位置位置位置平均数平均数平均数平均数平均数平均数数值数值数值数值数值数值平均数平均数平均数平均数平均数平均数算术平均数算术平均数算术平均数算术平均数算术平均数算术平均数调和平均数调和平均数调和平均数调和平均数调和平均数调和平均数几何平均数几何平均数几何平均数几何平均数几何平均数几何平均数2.5 集中趋势的测度一一.众数众数二二.中位数中位数三三.分位数分位数四四.均值均值五五.调和平均数调和平均数六六.几何平均数几何平均数七七.众数、中位数和算术平均数的比较众数、中位数和算术平均数的比较数据分布的特征和测度(本节位置)(本节位置)数据的特征和测度数据的特征和测度分布的形状分布的形状集中趋势集中趋势离散程度离散程度众众众众众众 数数数数数数中位数中位数中位数中位数中位数中位数离散系数离散系数离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差四分位差四分位差四分位差四分位差四分位差四分位差异众比率异众比率异众比率异众比率异众比率异众比率位置位置位置位置位置位置平均数平均数平均数平均数平均数平均数数值数值数值数值数值数值平均数平均数平均数平均数平均数平均数算术平均数算术平均数算术平均数算术平均数算术平均数算术平均数调和平均数调和平均数调和平均数调和平均数调和平均数调和平均数几何平均数几何平均数几何平均数几何平均数几何平均数几何平均数峰峰峰峰峰峰 度度度度度度偏偏偏偏偏偏 态态态态态态集中趋势集中趋势(Central tendency)1.1.一组数据向其中心值靠拢的倾向和程度一组数据向其中心值靠拢的倾向和程度一组数据向其中心值靠拢的倾向和程度一组数据向其中心值靠拢的倾向和程度2.2.测度集中趋势就是寻找数据一般水平的代表值或中心值测度集中趋势就是寻找数据一般水平的代表值或中心值测度集中趋势就是寻找数据一般水平的代表值或中心值测度集中趋势就是寻找数据一般水平的代表值或中心值3.3.不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值4.4.低层次数据的集中趋势测度值适用于高层次的测量数据,低层次数据的集中趋势测度值适用于高层次的测量数据,低层次数据的集中趋势测度值适用于高层次的测量数据,低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次反过来,高层次数据的集中趋势测度值并不适用于低层次反过来,高层次数据的集中趋势测度值并不适用于低层次反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据的测量数据的测量数据的测量数据5.5.选用哪一个测度值来反映数据的集中趋势,要根据所掌握选用哪一个测度值来反映数据的集中趋势,要根据所掌握选用哪一个测度值来反映数据的集中趋势,要根据所掌握选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定的数据的类型来确定的数据的类型来确定的数据的类型来确定一、众数(概念要点概念要点)1.1.集中趋势的测度值之一集中趋势的测度值之一2.2.出现次数最多的变量值出现次数最多的变量值3.3.不受极端值的影响不受极端值的影响4.4.可能没有众数或有几个众数可能没有众数或有几个众数5.5.主要用于定类数据,也可用于定序数据主要用于定类数据,也可用于定序数据和数值型数据和数值型数据众数(众数的不唯一性众数的不唯一性)n n无众数无众数原始数据:10 5 9 12 6 8一个众数一个众数原始数据:6 5 9 8 5 5多于一个众数多于一个众数原始数据:25 28 28 36 42 42定类数据的众数(算例算例)【例例例例2.82.8】根根根根据据据据表表表表中中中中的的的的数数数数据据据据,计算众数计算众数计算众数计算众数解解解解:这这这这里里里里的的的的变变变变量量量量为为为为“广广广广告告告告类类类类型型型型”,这这这这是是是是个个个个定定定定类类类类变变变变量量量量,不不不不同同同同类类类类型型型型的的的的广广广广告告告告就就就就是是是是变变变变量量量量值值值值。我我我我们们们们看看看看到到到到,在在在在所所所所调调调调查查查查的的的的200200人人人人当当当当中中中中,关关关关注注注注商商商商品品品品广广广广告告告告的的的的人人人人数数数数最最最最多多多多,为为为为112112人人人人,占占占占总总总总被被被被调调调调查查查查人人人人数数数数的的的的56%56%,因因因因此此此此众众众众数数数数为为为为“商商商商品品品品广广广广告告告告”这这这这一类别,即一类别,即一类别,即一类别,即 MMo o商品广告商品广告商品广告商品广告定序数据的众数(算例算例)【例例2.9】根根据据表表中中的的数数据据,计算众数计算众数解解解解:这这这这里里里里的的的的数数数数据据据据为为为为定定定定序序序序数数数数据据据据。变变变变量量量量为为为为“回回回回答答答答类类类类别别别别”。甲甲甲甲城城城城市市市市中中中中对对对对住住住住房房房房表表表表示示示示不不不不满满满满意意意意的的的的户户户户数数数数最最最最多多多多,为为为为108108户户户户,因因因因此此此此众众众众数数数数为为为为“不不不不满满满满意意意意”这这这这一类别,即一类别,即一类别,即一类别,即 MMo o不满意不满意不满意不满意数值型分组数据的众数(要点及计算公式要点及计算公式)1.1.众数的值与相邻两组频数的分布有关众数的值与相邻两组频数的分布有关众数的值与相邻两组频数的分布有关众数的值与相邻两组频数的分布有关4.4.该公式假定众数组的频数在众数组内均匀分布该公式假定众数组的频数在众数组内均匀分布该公式假定众数组的频数在众数组内均匀分布该公式假定众数组的频数在众数组内均匀分布2.2.2.相邻两组的频数相等时,众数组的组中值相邻两组的频数相等时,众数组的组中值相邻两组的频数相等时,众数组的组中值相邻两组的频数相等时,众数组的组中值相邻两组的频数相等时,众数组的组中值相邻两组的频数相等时,众数组的组中值即为众数即为众数即为众数即为众数即为众数即为众数M MMooo3.3.相邻两组的频数不相等时,众数采用下相邻两组的频数不相等时,众数采用下相邻两组的频数不相等时,众数采用下相邻两组的频数不相等时,众数采用下列近似公式计算列近似公式计算列近似公式计算列近似公式计算M MMoooM MMooo数值型分组数据的众数(算例算例)【例例例例2.102.10】根根根根据据据据表表表表中中中中的的的的数数数数据据据据,计计计计算算算算5050名名名名工工工工人人人人日日日日加加加加工工工工零零零零件件件件数数数数的众数的众数的众数的众数二、中位数(概念要点概念要点)1.1.集中趋势的测度值之一集中趋势的测度值之一集中趋势的测度值之一集中趋势的测度值之一2.2.排序后处于中间位置上的值排序后处于中间位置上的值排序后处于中间位置上的值排序后处于中间位置上的值MMe e50%50%3.不受极端值的影响不受极端值的影响不受极端值的影响不受极端值的影响4.主要用于定序数据,也可用数值型数据,但不主要用于定序数据,也可用数值型数据,但不主要用于定序数据,也可用数值型数据,但不主要用于定序数据,也可用数值型数据,但不能用于定类数据能用于定类数据能用于定类数据能用于定类数据5.各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即中位数(位置的确定位置的确定)未分组数据:未分组数据:组距分组数据:组距分组数据:2f中位数位置中位数位置N N为奇数为奇数N N为偶数为偶数未分组数据的中位数(计算公式计算公式)定序数据的中位数(算例算例)【例例例例2.112.11】根根根根据据据据表表表表中中中中的的的的数数数数据据据据,计计计计算算算算甲甲甲甲城城城城市市市市家家家家庭庭庭庭对对对对住住住住房房房房满满满满意意意意状况评价的中位数状况评价的中位数状况评价的中位数状况评价的中位数解解:中中中中位位位位数数数数的的的的位位位位置置置置为:为:为:为:300/2 300/2150150从从从从累累累累计计计计频频频频数数数数看看看看,中中中中位位位位数数数数的的的的在在在在“一一一一般般般般”这一组别中。因此这一组别中。因此这一组别中。因此这一组别中。因此 MMe e一般一般一般一般数值型未分组数据的中位数(5(5个数据的算例个数据的算例)n n原始数据原始数据:24 22 21 26 20n n排排 序序:20 21 22 24 26n n位位 置置:1 2 3 4 5中位数中位数 22数值型未分组数据的中位数(6(6个数据的算例个数据的算例)n n原始数据原始数据:10 5 9 12 6 8n n排排 序序:5 6 8 9 10 12n n位位 置置:1 2 3 4 5 6位置位置N+126+123.5中位数中位数 8+928.51.根据位置公式确定中位数所在的组根据位置公式确定中位数所在的组2.采用下列近似公式计算采用下列近似公式计算:该公式假定中位数组的频数在该组内均匀分布该公式假定中位数组的频数在该组内均匀分布数值型分组数据的中位数(要点及计算公式要点及计算公式)ifSfLMmme-+-12&数值型分组数据的中位数(算例算例)【例例2.122.12】根根据据第第三三章章表表中中的的数数据据,计计算算50 50 名名工工人人日日加加工工零零件件数数的的中中位数位数三、四分位数(概念要点概念要点)n n1.集中趋势的测度值之一集中趋势的测度值之一n n2.排序后处于排序后处于25%和和75%位置上的值位置上的值n n3.3.不受极端值的影响不受极端值的影响n n4.4.主主要要用用于于定定序序数数据据,也也可可用用于于数数值值型型数数据,但不能用于定类数据据,但不能用于定类数据QQL LQQMMQQU U25%25%25%25%四分位数(位置的确定位置的确定)未分组数据:未分组数据:组距分组数据:组距分组数据:下四分位数下四分位数下四分位数下四分位数(QQL L)位置位置位置位置=N+N+1 14 4上四分位数上四分位数上四分位数上四分位数(QQU U)位置位置位置位置=3(3(N+N+1)1)4 4下四分位数下四分位数下四分位数下四分位数(QQL L)位置位置位置位置=f f4 4上四分位数上四分位数上四分位数上四分位数(QQL L)位置位置位置位置=33f f4 4定序数据的四分位数(算例算例)【例例2.13】根根据据表表中中的的数数据据,计计算算甲甲城城市市家家庭庭对住房满意状况评价的四分位数对住房满意状况评价的四分位数解:解:解:解:下四分位数下四分位数下四分位数下四分位数(Q QL L)的位置为的位置为的位置为的位置为 Q QL L位置位置位置位置(300)/4(300)/47575 上四分位数上四分位数上四分位数上四分位数(Q QL L)的位置为:的位置为:的位置为:的位置为:Q QU U位位位位 置置置置 (3300)/4(3300)/4225225从从从从累累累累计计计计频频频频数数数数看看看看,Q QL L在在在在“不不不不满满满满意意意意”这这这这一一一一组组组组别别别别中中中中;Q QU U在在在在“一一一一般般般般”这一组别中。因此这一组别中。因此这一组别中。因此这一组别中。因此 Q QL L 不满意不满意不满意不满意 Q QUU 一般一般一般一般数值型未分组数据的四分位数(7(7个数据的算例个数据的算例)n n原始数据原始数据原始数据原始数据:23 2123 21 30 32 30 32 28 25 2628 25 26n n排排排排 序序序序:21 21 23 23 25 26 28 25 26 28 3030 32 32n n位位位位 置置置置:1 2 3 4 5 6 7 1 2 3 4 5 6 7 N+N+1 1QL=237+7+1 1QQL L位置位置=4 4=4 4=2=2QQU U位置位置=3(3(N+N+1)1)4 43(73(7+1)1)4 4=6=6QU=30数值型未分组数据的四分位数(6个数据的算例)n n原始数据原始数据原始数据原始数据:23 21 30 23 21 30 28 25 2628 25 26n n排排排排 序序序序:21 23 25 26 28 30 21 23 25 26 28 30n n位位位位 置置置置:1 2 3 1 2 3 4 4 5 6 5 6QQL L=21+0.75(23-21)=21+0.75(23-21)=22.522.5QQL L位置位置=N+N+1 14 4=6+6+1 14 4=1.75=1.75QQU U位置位置=3(3(N+N+1)1)4 43(63(6+1)1)4 4=5.25=5.25QQU U=28+0.25(30-28)=28+0.25(30-28)=28.528.5数值型分组数据的四分位数(计算公式计算公式)n nn上四分位上四分位上四分位上四分位数数数数:n nn下四分位下四分位下四分位下四分位数数数数:数值型分组数据的四分位数(计算示例)Q QL L位置位置位置位置50/450/412.512.5Q QU U位置位置位置位置350/4350/437.537.5【例例例例2.142.14】根根根根据据据据表表表表中中中中的的的的数数数数据据据据,计计计计算算算算50 50 名工人日加工零件数的四分位数名工人日加工零件数的四分位数名工人日加工零件数的四分位数名工人日加工零件数的四分位数四、均值(算术平均数)(概念要点概念要点)n n1.集中趋势的测度值之一集中趋势的测度值之一n n2.最常用的测度值最常用的测度值n n3.一组数据的均衡点所在一组数据的均衡点所在n n4.易受极端值的影响易受极端值的影响n n5.用于数值型数据,不能用于定类用于数值型数据,不能用于定类数据和定序数据数据和定序数据算术平均数(计算公式计算公式)设一组数据为:设一组数据为:设一组数据为:设一组数据为:X X1 1,X X2 2,X XN N 简单均值简单均值简单均值简单均值的计算公式为的计算公式为的计算公式为的计算公式为设分组后的数据为:设分组后的数据为:设分组后的数据为:设分组后的数据为:X X1 1,X X2 2,X XKK 相应的频数为:相应的频数为:相应的频数为:相应的频数为:F F1 1,F F2 2,F FKK加权均值加权均值加权均值加权均值的计算公式为的计算公式为的计算公式为的计算公式为简单算术平均数(算例算例)n n原始数据原始数据:10591368加权算术平均数(算例)(算例)【例例例例2.152.15】根根据据表表中中的的数数据据,计计算算50 50 名名工工人人日日加加工工零零件数的均值件数的均值权数对算术平均数的影响n n甲甲甲甲乙乙乙乙两两两两组组组组各各各各有有有有1010名名名名学学学学生生生生,他他他他们们们们的的的的考考考考试试试试成成成成绩绩绩绩及及及及其其其其分分分分布布布布数数数数据据据据如下:如下:如下:如下:n n甲组:甲组:甲组:甲组:考试成绩(考试成绩(考试成绩(考试成绩(X X):0 20 100 0 20 100n n 人数分布(人数分布(人数分布(人数分布(F F):):):):1 1 81 1 8n n乙组:乙组:乙组:乙组:考试成绩(考试成绩(考试成绩(考试成绩(X X):0 20 100 0 20 100n n 人数分布(人数分布(人数分布(人数分布(F F):):):):8 1 18 1 1X X X甲甲甲01+201+100801+201+100801+201+1008n n n 101010iii=1=1=1 X X Xiii 828282828282(分)(分)(分)(分)(分)(分)X X X乙乙乙08+201+100108+201+100108+201+1001n n n 101010iii=1=1=1 X X Xiii 121212121212(分)(分)(分)(分)(分)(分)算术平均数的数学性质n n1.各变量值与均值的离差之和等于零各变量值与均值的离差之和等于零n n 2.各变量值与均值的离差平方和最小各变量值与均值的离差平方和最小五、调和平均数(概念要点概念要点)n n1.集中趋势的测度值之一集中趋势的测度值之一n n2.均值的另一种表现形式均值的另一种表现形式n n3.易受极端值的影响易受极端值的影响n n4.用于定比数据用于定比数据n n5.不能用于定类数据和定序数据不能用于定类数据和定序数据n n6.计算公式为计算公式为调和平均数(算例算例)【例例例例2.152.15】某某某某钢钢钢钢材材材材批批批批发发发发市市市市场场场场三三三三种种种种不不不不同同同同规规规规格格格格钢钢钢钢材材材材的的的的日日日日成成成成交数据如表,计算这三种钢材该日的平均批发价格交数据如表,计算这三种钢材该日的平均批发价格交数据如表,计算这三种钢材该日的平均批发价格交数据如表,计算这三种钢材该日的平均批发价格(万元(万元(万元(万元/吨)吨)吨)吨)六、几何平均数(概念要点概念要点)n n1.1.集中趋势的测度值之一集中趋势的测度值之一集中趋势的测度值之一集中趋势的测度值之一n n2.2.N N 个变量值乘积的个变量值乘积的个变量值乘积的个变量值乘积的 N N 次方根次方根次方根次方根n n3.3.适用于特殊的数据适用于特殊的数据适用于特殊的数据适用于特殊的数据n n4.4.主要用于计算平均发展速度主要用于计算平均发展速度主要用于计算平均发展速度主要用于计算平均发展速度n n5.5.计算公式为计算公式为计算公式为计算公式为n n 6 6.可看作是均值的一种变形可看作是均值的一种变形几何平均数(算例算例)n n【例例2.16】一一位位投投资资者者持持有有一一种种股股票票,2019年年、2019年年、2019年年和和2009年年收收益益率率分分别别为为4.5%、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均收益率。计算该投资者在这四年内的平均收益率。平均收益率103.84%-1=3.84%切尾均值切尾均值1.1.去掉大小两端的若干数值后计算中间数据的均值2.2.在电视大奖赛、体育比赛及需要人们进行综合评价的比赛项目中已得到广泛应用3.3.计算公式为n n 表示观察值的个数;表示观察值的个数;表示切尾系数,表示切尾系数,切尾均值切尾均值(算例算例)【例】【例】【例】【例】某次比赛共有某次比赛共有某次比赛共有某次比赛共有1111名评委,对某位歌手的给分分别是名评委,对某位歌手的给分分别是名评委,对某位歌手的给分分别是名评委,对某位歌手的给分分别是:经整理得到顺序统计量值为经整理得到顺序统计量值为经整理得到顺序统计量值为经整理得到顺序统计量值为去掉一个最高分和一个最低分,取去掉一个最高分和一个最低分,取去掉一个最高分和一个最低分,取去掉一个最高分和一个最低分,取1/111/11 七、众数、中位数和算术平均数的关系左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布算术平均数算术平均数算术平均数算术平均数算术平均数算术平均数 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数 算术平均数算术平均数算术平均数算术平均数算术平均数算术平均数对称分布对称分布对称分布对称分布对称分布对称分布 算术平均数算术平均数算术平均数算术平均数=中位数中位数中位数中位数=众数众数众数众数吉斯莫先生有一个小工厂,生产超级小玩意儿。吉斯莫先生有一个小工厂,生产超级小玩意儿。管理人员由吉斯莫先生、他的弟弟、六个亲戚组成。工作人管理人员由吉斯莫先生、他的弟弟、六个亲戚组成。工作人员由员由5 5个领工和个领工和1010个工人组成。工厂经营得很顺利,现在需要个工人组成。工厂经营得很顺利,现在需要一个新工人。现在吉斯莫先生正在接见萨姆,谈工作问题。一个新工人。现在吉斯莫先生正在接见萨姆,谈工作问题。吉斯莫:我们这里报酬不错。平均薪金是每周吉斯莫:我们这里报酬不错。平均薪金是每周300300镑。你在学镑。你在学徒期间每周得徒期间每周得7575镑镑,不过很快就可以加工资。,不过很快就可以加工资。萨姆工作了几天之后,要求见厂长。萨姆工作了几天之后,要求见厂长。萨姆;你欺骗我!我已经找其他工人核对过了,没有一个人萨姆;你欺骗我!我已经找其他工人核对过了,没有一个人的工资超过每周的工资超过每周100100镑镑。平均工资怎么可能是一周。平均工资怎么可能是一周300300镑镑呢?呢?吉斯莫:啊,萨姆,不要激动。平均工资是吉斯莫:啊,萨姆,不要激动。平均工资是300300镑镑。我要向你。我要向你证明这一点。证明这一点。骗人的骗人的“平均数平均数”吉斯莫:这是我每周付出的酬金。我得吉斯莫:这是我每周付出的酬金。我得24002400镑镑,我弟弟得,我弟弟得10001000镑镑,我的六个亲戚每人得,我的六个亲戚每人得250250镑镑,五个领工每人得,五个领工每人得200200镑镑,1010个个工人每人工人每人100100镑镑。总共是每周。总共是每周69006900镑镑,付给,付给2323个人,对吧?个人,对吧?萨姆:对,对,对!你是对的,平均工资是每周萨姆:对,对,对!你是对的,平均工资是每周300300镑镑。可你。可你还是蒙骗了我。还是蒙骗了我。吉斯莫;我不同意!你实在是不明白。我已经把工资列了个表,吉斯莫;我不同意!你实在是不明白。我已经把工资列了个表,并告诉了你,工资的中位数是并告诉了你,工资的中位数是200200镑镑,可这不是平均工资,而,可这不是平均工资,而是中等工资。是中等工资。萨姆:每周萨姆:每周100100镑镑又是怎么回事呢?又是怎么回事呢?吉斯莫:那称为众数,是大多数人挣的工资。吉斯莫:那称为众数,是大多数人挣的工资。吉斯莫:老弟,你的问题是出在你不懂平均数、中位数和众数吉斯莫:老弟,你的问题是出在你不懂平均数、中位数和众数之间的区别。之间的区别。萨姆:好,现在我可懂了。我萨姆:好,现在我可懂了。我我辞职!我辞职!统计学的解说可能是极富逆论性的,常被完全误解统计学的解说可能是极富逆论性的,常被完全误解关于吉斯莫工厂的故事揭示出,误解产生的一个共同根源是关于吉斯莫工厂的故事揭示出,误解产生的一个共同根源是不了解平均数、中位数(中值)和众数之间的差别。不了解平均数、中位数(中值)和众数之间的差别。统计学统计学的报告有时甚至更加使人糊涂,这因为有时的报告有时甚至更加使人糊涂,这因为有时“平均平均”这个词这个词不是指算术平均值,而是指中值或众数。不是指算术平均值,而是指中值或众数。中值(中位数)是按大小顺序排列的数值表中中心位置对应中值(中位数)是按大小顺序排列的数值表中中心位置对应的数值。如果表中数值有奇数项,则中值就单地是中间项的的数值。如果表中数值有奇数项,则中值就单地是中间项的值。如果有偶数项,中值往往取中间两项的算术平均值。值。如果有偶数项,中值往往取中间两项的算术平均值。中值对萨姆来说比算术平均值重要,但就是中值也使人对这中值对萨姆来说比算术平均值重要,但就是中值也使人对这个工厂的工资情况得出歪曲了的印象。萨姆反正要知道的是个工厂的工资情况得出歪曲了的印象。萨姆反正要知道的是“众数众数”表中段常出现的数。在这里,众数是发给工厂表中段常出现的数。在这里,众数是发给工厂中数目最多的人的工资数。有时候这叫做典型情况,因为它中数目最多的人的工资数。有时候这叫做典型情况,因为它比其他任何情况出现次数都多。比其他任何情况出现次数都多。数据类型与集中趋势测度值红色为该数据类型最适合用的测度值2.6 分布离散程度的测定一一.异众比率异众比率二二.极差极差三三.内距内距四四.方差及标准差方差及标准差五五.标准化值标准化值六六.离散系数离散系数离中趋势1.1.数据分布的另一个重要特征数据分布的另一个重要特征数据分布的另一个重要特征数据分布的另一个重要特征2.2.离中趋势的各测度值是对数据离散程度所作的描述离中趋势的各测度值是对数据离散程度所作的描述离中趋势的各测度值是对数据离散程度所作的描述离中趋势的各测度值是对数据离散程度所作的描述3.3.反映各变量值远离其中心值的程度,因此也称为离中趋势反映各变量值远离其中心值的程度,因此也称为离中趋势反映各变量值远离其中心值的程度,因此也称为离中趋势反映各变量值远离其中心值的程度,因此也称为离中趋势4.4.从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度5.5.不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值数据的特征和测度(本节位置)(本节位置)数据的特征和测度数据的特征和测度分布的形状分布的形状离散程度离散程度众众众众众众 数数数数数数中位数中位数中位数中位数中位数中位数离散系数离散系数离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差四分位差四分位差四分位差四分位差四分位差四分位差异众比率异众比率异众比率异众比率异众比率异众比率位置位置位置位置位置位置平均数平均数平均数平均数平均数平均数数值数值数值数值数值数值平均数平均数平均数平均数平均数平均数算术平均数算术平均数算术平均数算术平均数算术平均数算术平均数调和平均数调和平均数调和平均数调和平均数调和平均数调和平均数几何平均数几何平均数几何平均数几何平均数几何平均数几何平均数偏偏偏偏偏偏 态态态态态态峰峰峰峰峰峰 度度度度度度集中趋势集中趋势一、异众比率(概念要点概念要点)n n1.离散程度的测度值之一离散程度的测度值之一n n2.非众数组的频数占总频数的比率非众数组的频数占总频数的比率n n3.计算公式为计算公式为n n 4.用于衡量众数的代表性用于衡量众数的代表性异众比率(算例算例)【例例例例2.172.17】根根根根据据据据表表表表中中中中的的的的数数数数据,计算异众比率据,计算异众比率据,计算异众比率据,计算异众比率解:解:解:解:在在在在所所所所调调调调查查查查的的的的200200人人人人当当当当中中中中,关关关关注注注注非非非非商商商商品品品品广广广广告告告告的的的的人人人人数数数数占占占占44%44%,异异异异众众众众比比比比率率率率还还还还是是是是比比比比较较较较大大大大。因因因因此此此此,用用用用“商商商商品品品品广广广广告告告告”来来来来反反反反映映映映城城城城市市市市居居居居民民民民对对对对广广广广告告告告关关关关注注注注的的的的一一一一般般般般趋趋趋趋势势势势,其其其其代表性不是很好代表性不是很好代表性不是很好代表性不是很好 V Vr r=200-112200-112200200 =1-=1-112 112 200 200 =0.44=44%=0.44=44%二、极 差(概念要点及计算公式概念要点及计算公式)n n1.1.一组数据的最大值与最小值之差一组数据的最大值与最小值之差一组数据的最大值与最小值之差一组数据的最大值与最小值之差n n2.2.离散程度的最简单测度值离散程度的最简单测度值离散程度的最简单测度值离散程度的最简单测度值n n3.3.易受极端值影响易受极端值影响易受极端值影响易受极端值影响n n4.4.未考虑数据的分布未考虑数据的分布未考虑数据的分布未考虑数据的分布7 7 8 8 9 910107 7 8 8 9 9 1010未分组数据未分组数据未分组数据未分组数据 R R =max(=max(X Xi i)-min()-min(X Xi i).=组距分组数据组距分组数据组距分组数据组距分组数据 R R 最高组上限最高组上限-最低组下最低组下限限n n 计算公式为计算公式为计算公式为计算公式为三、内距(四分位差)(概念要点概念要点)n n1.离散程度的测度值之一离散程度的测度值之一n n2.也称为内距或四分间距也称为内距或四分间距n n3.上四分位数与下四分位数之差上四分位数与下四分位数之差 QD=QU-QLn n4.反映了中间反映了中间50%数据的离散程度数据的离散程度 不受极端值的影响不受极端值的影响 用于衡量中位数的代表性用于衡量中位数的代表性四分位差(定序数据的算例定序数据的算例)【例例例例2.182.18】根根根根据据据据表表表表中中中中的的的的数数数数据据据据,计计计计算算算算甲甲甲甲城城城城市市市市家家家家庭庭庭庭对对对对住住住住房房房房满意状况评价的四分位差满意状况评价的四分位差满意状况评价的四分位差满意状况评价的四分位差解解解解:设设设设非非非非常常常常不不不不满满满满意意意意为为为为1,1,不不不不满满满满意意意意为为为为2,2,一一一一般般般般为为为为3,3,满满满满意为意为意为意为 4,4,非常满意为非常满意为非常满意为非常满意为5 5 已知已知 Q QL L=不满意不满意 =2 2 Q QU U =一般一般 =3 3四分位差:四分位差:Q QD D =Q QU U =Q QL L =3 2 3 2 =1 1四、平均差(概念要点及计算公式概念要点及计算公式)n n1.1.离散程度的测度值之一离散程度的测度值之一离散程度的测度值之一离散程度的测度值之一n n2.2.各变量值与其均值离差绝对值的平均数各变量值与其均值离差绝对值的平均数各变量值与其均值离差绝对值的平均数各变量值与其均值离差绝对值的平均数n n3.3.能全面反映一组数据的离散程度能全面反映一组数据的离散程度能全面反映一组数据的离散程度能全面反映一组数据的离散程度n n4.4.数学性质较差,实际中应用较少数学性质较差,实际中应用较少数学性质较差,实际中应用较少数学性质较差,实际中应用较少n n 计算公式为计算公式为计算公式为计算公式为未分组数据未分组数据未分组数据未分组数据组距分组数据组距分组数据组距分组数据组距分组数据平均差(计算过程及结果)(计算过程及结果)【例例例例2.192.19】根根据据表表中中的的数数据据,计计算算工工人人日日加加工工零零件件数数的平均差的平均差方差和标准差(概念要点概念要点)n n1.离散程度的测度值之一离散程度的测度值之一n n2.最常用的测度值最常用的测度值n n3.反映了数据的分布反映了数据的分布4.4.反映了各变量值与均值的平均差异反映了各变量值与均值的平均差异5.5.根据总体数据计算的,称为总体方差或标根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方准差;根据样本数据计算的,称为样本方差或标准差差或标准差4 6 8 10 124 6 8 10 12X=X=8.38.3总体方差和标准差(计算公式计算公式)未分组数据:未分组数据:组距分组数据:组距分组数据:未分组数据:未分组数据:组距分组数据:组距分组数据:方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式总体标准差(计算过程及结果)(计算过程及结果)3100.53100.5739.47739.47572.45572.45259.92259.926.866.86184.90184.90518.94518.94817.96817.96(X Xi i-X X)2 2F Fi i246.49246.49114.49114.4932.4932.490.490.4918.4918.4986.4986.49204.49204.49(X Xi i-X X)2 25050合计合计合计合计3 35 58 8141410106 64 4107.5107.5112.5112.5117.5117.5122.5122.5127.5127.5132.5132.5137.5137.5105105 110110110110 115115115115 120120120120125125125125 130130130130 135135135135 140140频数频数频数频数(F Fi i)组中值组中值组中值组中值(X Xi i)按零件数分组按零件数分组按零件数分组按零件数分组某车间某车间某车间某车间5050名工人日加工零件标准差计算表名工人日加工零件标准差计算表名工人日加工零件标准差计算表名工人日加工零件标准差计算表【例例例例2.202.20】根根根根据据据据表表表表中中中中的的的的数数数数据据据据,计计计计算算算算工工工工人人人人日日日日加加加加工工工工零零零零件件件件数的标准差数的标准差数的标准差数的标准差样本方差和标准差(计算公式计算公式)未分组数据:未分组数据:组距分组数据:组距分组数据:未分组数据:未分组数据:组距分组数据:组距分组数据:方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式注意:注意:注意:样本方差用自样本方差用自样本方差用自由度由度由度n-1n-1n-1去除去除去除!样本方差自由度(degree of freedom)1.1.一组数据中可以自由取值的数据的个数。一组数据中可以自由取值的数据的个数。一组数据中可以自由取值的数据的个数。一组数据中可以自由取值的数据的个数。2.2.当当当当样样样样本本本本数数数数据据据据的的的的个个个个数数数数为为为为 n n 时时时时,若若若若样样样样本本本本均均均均值值值值 x x 确确确确定定定定后后后后,只只只只有有有有n n-1-1个个个个数数数数据据据据可可可可以以以以自自自自由由由由取取取取值值值值,其其其其中中中中必必必必有有有有一一一一个个个个数数数数据据据据则则则则不能自由取值。不能自由取值。不能自由取值。不能自由取值。3.3.例例例例如如如如,样样样样本本本本有有有有3 3个个个个数数数数值值值值,即即即即x x1 1=2=2,x x2 2=4=4,x x3 3=9=9,则则则则 x x =5 5。当当当当 x x =5 5 确确确确定定定定后后后后,x x1 1,x x2 2和和和和x x3 3有有有有两两两两个个个个数数数数据据据据可可可可以以以以自自自自由由由由取取取取值值值值,另另另另一一一一个个个个则则则则不不不不能能能能自自自自由由由由取取取取值值值值,比比比比如如如如x x1 1=6=6,x x2 2=7=7,那么那么那么那么x x3 3则必然取则必然取则必然取则必然取2 2,而不能取其他值。,而不能取其他值。,而不能取其他值。,而不能取其他值。4.4.样样样样本本本本方方方方差差差差用用用用自自自自由由由由度度度度去去去去除除除除,其其其其原原原原因因因因可可可可从从从从多多多多方方方方面面面面来来来来解解解解释释释释,从从从从实实实实际际际际应应应应用用用用角角角角度度度度看看看看,在在在在抽抽抽抽样样样样估估估估计计计计中中中中,当当当当用用用用样样样样本本本本方方方方差差差差去估计总体方差去估计总体方差去估计总体方差去估计总体方差 2 2时,它是时,它是时,它是时,它是 2 2的无偏估计量。的无偏估计量。的无偏估计量。的无偏估计量。样本方差(算例算例)原始数据原始数据原始数据原始数据:10 10 5 9 13 6 8 5 9 13 6 8n n样本方差与标准差样本方差与标准差方差(简化计算公式简化计算公式)样本方差样本方差总体方差总体方差方差(数学性质数学性质)n n各变量值对均值的方差小于对任意值的方差各变量值对均值的方差小于对任意值的方差各变量值对均值的方差小于对任意值的方差各变量值对均值的方差小于对任意值的方差证明提示:设证明提示:设证明提示:设证明提示:设X X0 0为不等于为不等于为不等于为不等于 X X 的任意数,的任意数,的任意数,的任意数,D D2 2为对为对为对为对X X0 0的的的的方差,则:方差,则:方差,则:方差,则:标准化值标准化值(概念要点和计算公式概念要点和计算公式)n n1.1.离差与其相应的标准差之比离差与其相应的标准差之比离差与其相应的标准差之比离差与其相应的标准差之比n n2.2.即常用的统计标准化公式即常用的统计标准化公式即常用的统计标准化公式即常用的统计标准化公式n n3.3.给出了一组数据中各数值的相对位置给出了一组数据中各数值的相对位置给出了一组数据中各数值的相对位置给出了一组数据中各数值的相对位置n n4.4.用于对不同量纲的指标进行标准化处理用于对不同量纲的指标进行标准化处理用于对不同量纲的指标进行标准化处理用于对不同量纲的指标进行标准化处理n n计算公式为计算公式为计算公式为计算公式为五、变异系数n n1.各种变异指标与其相应的均值之比各种变异指标与其相应的均值之比n n2.消除了数据水平高低和计量单位的影响消除了数据水平高低和计量单位的影响n n3.测度了数据的相对离散程度测度了数据的相对离散程度n n4.用于对不同总体数据离散程度的比较用于对不同总体数据离散程度的比较标准差系数(概念要点和计算公式概念要点和计算公式)n n1.标准差与其相应的均值之比标准差与其相应的均值之比n n2.消除了数据水平高低和计量单位的影响消除了数据水平高低和计量单位的影响n n3.测度了数据的相对离散程度测度了数据的相对离散程度n n4.用于对不同组别数据离散程度的比较用于对不同组别数据离散程度的比较n n计算公式为计算公式为标准差系数(实例和计算过程)(实例和计算过程)【例例例例2.212.21】某某某某管管管管理理理理局局局局抽抽抽抽查查查查了了了了所所所所属属属属的的的的8 8家家家家企企企企业业业业,其其其其产产产产品品品品销销销销售数据如表。试比较产品销售额与销售利润的离散程度售数据如表。试比较产品销售额与销售利润的离散程度售数据如表。试比较产品销售额与销售利润的离散程度售数据如表。试比较产品销售额与销售利润的离散程度标准差系数(计算结果计算结果)X X1 1=536.25536.25(万元)(万元)(万元)(万元)S S1 1=309.19309.19(万元)(万元)(万元)(万元)V V1 1=536.25536.25309.19309.19=0.5770.577S S2 2=23.0923.09(万元)(万元)(万元)(万元)V V2 2=32.521532.521523.0923.09=0.7100.710X X2 2=32.521532.5215(万元)(万元)(万元)(万元)结结结结论论论论:计计计计算算算算结结结结果果果果表表表表明明明明,V V1 1 0为为右偏分布右偏分布n n4.偏态系数偏态系数 0为为左偏分布左偏分布n n5.计算公式为计算公式为()3133sa FiFXXKiii-偏态(实例实例)【例例例例2.222.22】已已已已知知知知20192019年年年年我我我我国国国国农农农农村村村村居居居居民民民民家家家家庭庭庭庭按按按按纯纯纯纯收收收收入入入入分分分分组组组组的的的的有有有有关关关关数数数数据据据据如如如如表表表表。试试试试计计计计算算算算偏态系数偏态系数偏态系数偏态系数户户户户户户数数数数数数比比比比比比重重重重重重(%)(%)(%)25252020151510105 5农村居民家庭村收入数据的直方图农村居民家庭村收入数据的直方图农村居民家庭村收入数据的直方图农村居民家庭村收入数据的直方图偏态与峰度(从直方图上观察从直方图上观察)按纯收入分组按纯收入分组按纯收入分组按纯收入分组按纯收入分组按纯收入分组(元元元元元元)10001000500500150015002000200025002500300030003500350040004000 4500450050005000结论结论结论结论:1.1.为右偏分布为右偏分布为右偏分布为右偏分布 2.2.峰度适中峰度适中峰度适中峰度适中偏态系数(计算过程)偏态系数(计算结果计算结果)根据上表数据计算得根据上表数据计算得根据上表数据计算得根据上表数据计算得将计算结果代入公式得将计算结果代入公式得将计算结果代入公式得将计算结果代入公式得结论:结论:结论:结论:偏态系数为正值,而且数值较大,说明农村居民家庭纯偏态系数为正值,而且数值较大,说明农村居民家庭纯偏态系数为正值,而且数值较大,说明农村居民家庭纯偏态系数为正值,而且数值较大,说明农村居民家庭纯收入的分布为右偏分布,即收入较少的家庭占据多数,而收入收入的分布为右偏分布,即收入较少的家庭占据多数,而收入收入的分布为右偏分布,即收入较少的家庭占据多数,而收入收入的分布为右偏分布,即收入较少的家庭占据多数,而收入较高的家庭则占少数,而且偏斜的程度较大较高的家庭则占少数,而且偏斜的程度较大较高的家庭则占少数,而且偏斜的程度较大较高的家庭则占少数,而且偏斜的程度较大 ()()()956.07339.176625.1689089.121429.21311133133-iiiKiiiFXFFXXsa二、峰度(概念要点概念要点)n n1.数据分布扁平程度的测度数据分布扁平程度的测度n n2.峰度系数峰度系数=3扁平程度适中扁平程度适中n n3.峰度系数峰度系数3为为尖峰分布尖峰分布n n5.计算公式为计算公式为()K4144saFiFXXiii-峰度系数(实例计算结果实例计算结果)代入公式得代入公式得代入公式得代入公式得 【例例例例2.232.23】根根根根据据据据前前前前表表表表中中中中的的的的计计计计算算算算结结结结果果果果,计计计计算算算算农农农农村村村村居居居居民家庭纯收入分布的峰度系数民家庭纯收入分布的峰度系数民家庭纯收入分布的峰度系数民家庭纯收入分布的峰度系数 由由由由于于于于峰峰峰峰度度度度系系系系数数数数=3.43=3.43,说说说说明明明明我我我我国国国国农农农农村村村村居居居居民民民民家家家家庭庭庭庭纯纯纯纯收收收收入入入入的的的的分分分分布布布布为为为为尖尖尖尖峰峰峰峰分分分分布布布布,说说说说明明明明低低低低收收收收入入入入家家家家庭庭庭庭占占占占有有有有较较较较大的比重大的比重大的比重大的比重 ()()4.3089.12125.7252124144-saFFXXKiii.统计表与统计图统计表与统计图n n统计数据可以通过统计表和统计图来直观的显示n n一、统计表n n将调查得来的原始资料,经过整理后按一定的顺序排列在表格上就形成了统计表。n n从表式上看,由表头、行标题、列标题和数字资料组成。n n从内容上看,由主词和宾词组成。n n设计统计表时要注意的问题二、统计图定类数据的图示条形图条形图(条形图的制作)(条形图的制作)1.1.条条形形图图是是用用宽宽度度相相同同的的条条形形的的高高度度或或长长短短来表示数据变动的图形。来表示数据变动的图形。2.2.条形图有单式、复式等形式。条形图有单式、复式等形式。3.3.在在表表示示定定类类数数据据的的分分布布时时,是是用用条条形形图图的的高度来表示各类别数据的频数或频率。高度来表示各类别数据的频数或频率。4.4.绘绘制制时时,各各类类别别可可以以放放在在纵纵轴轴,称称为为条条形形图,也可以放在横轴,称为柱形图。图,也可以放在横轴,称为柱形图。定类数据的图示条形图(由(由 Excel 绘制的条形图)绘制的条形图)人数(人)人数(人)5191610211204080120 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告广广告告类类型型 图图2-1 2-1 某城市居民关注不同类型广告的人数分布某城市居民关注不同类型广告的人数分布定类数据的图示圆形图(圆形图的制作)(圆形图的制作)1.1.也也也也称称称称饼饼饼饼图图图图,是是是是用用用用圆圆圆圆形形形形及及及及园园园园内内内内扇扇扇扇形形形形的的的的面面面面积积积积来来来来表表表表示示示示数数数数值大小的图形。值大小的图形。值大小的图形。值大小的图形。2.2.主主主主要要要要用用用用于于于于表表表表示示示示总总总总体体体体中中中中各各各各组组组组成成成成部部部部分分分分所所所所占占占占的的的的比比比比例例例例,对对对对于研究结构性问题十分有用。于研究结构性问题十分有用。于研究结构性问题十分有用。于研究结构性问题十分有用。3.3.在在在在绘绘绘绘制制制制圆圆圆圆形形形形图图图图时时时时,总总总总体体体体中中中中各各各各部部部部分分分分所所所所占占占占的的的的百百百百分分分分比比比比用用用用圆圆圆圆内内内内的的的的各各各各个个个个扇扇扇扇形形形形面面面面积积积积表表表表示示示示,这这这这些些些些扇扇扇扇形形形形的的的的中中中中心心心心角角角角度度度度,是按各部分百分比占是按各部分百分比占是按各部分百分比占是按各部分百分比占3603600 0的相应比例确定的。的相应比例确定的。的相应比例确定的。的相应比例确定的。4.4.例例例例如如如如,关关关关注注注注服服服服务务务务广广广广告告告告的的的的人人人人数数数数占占占占总总总总人人人人数数数数的的的的百百百百分分分分比比比比为为为为25.5%25.5%,那那那那 么么么么 其其其其 扇扇扇扇 形形形形 的的的的 中中中中 心心心心 角角角角 度度度度 就就就就 应应应应 为为为为3603600 025.5%25.5%91.891.80 0,其余类推。,其余类推。,其余类推。,其余类推。定类数据的图示圆形图(由(由 Excel Excel 绘制的圆形图)绘制的圆形图)其他广告1.0%房地产广告8.0%商品广告56.0%金融广告4.5%服务广告25.5%招生招聘广告5.8%图图2-2 2-2 某城市居民关注不同类型广告的人数构成某城市居民关注不同类型广告的人数构成定序数据的图示环形图(环形图的制作)1.1.环环形形图图中中间间有有一一个个“空空洞洞”,总总体体中中的的每每一一部分数据用环中的一段表示部分数据用环中的一段表示2.2.环形图与圆形图类似,但又有区别环形图与圆形图类似,但又有区别圆形图只能显示一个总体各部分所占的比例圆形图只能显示一个总体各部分所占的比例圆形图只能显示一个总体各部分所占的比例圆形图只能显示一个总体各部分所占的比例环环环环形形形形图图图图则则则则可可可可以以以以同同同同时时时时绘绘绘绘制制制制多多多多个个个个总总总总体体体体的的的的数数数数据据据据系系系系列列列列,每一个总体的数据系列为一个环每一个总体的数据系列为一个环每一个总体的数据系列为一个环每一个总体的数据系列为一个环3.3.环形图可用于进行比较研究环形图可用于进行比较研究 4.4.环形图可用于展示定类和定序的数据环形图可用于展示定类和定序的数据品质数据的图示环形图(由 Excel 绘制的环形图)8%36%31%15%7%33%26%21%13%10%非常不满意 不满意 一般 满意 非常满意 图图2-4 2-4 甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价分组数据折线图(折线图的制作)(折线图的制作)1.1.折线图也称频数多边形图折线图也称频数多边形图折线图也称频数多边形图折线图也称频数多边形图(Frequency polygon)Frequency polygon)2.2.是是是是在在在在直直直直方方方方图图图图的的的的基基基基础础础础上上上上,把把把把直直直直方方方方图图图图顶顶顶顶部部部部的的的的中中中中点点点点(组组组组中值中
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!