数据分布特征的统计描述ppt课件

上传人:文**** 文档编号:240782326 上传时间:2024-05-08 格式:PPT 页数:183 大小:1.45MB
返回 下载 相关 举报
数据分布特征的统计描述ppt课件_第1页
第1页 / 共183页
数据分布特征的统计描述ppt课件_第2页
第2页 / 共183页
数据分布特征的统计描述ppt课件_第3页
第3页 / 共183页
点击查看更多>>
资源描述
1 除了统计图和统计表之外,还可以用少量除了统计图和统计表之外,还可以用少量的的特征值(代表值)特征值(代表值)对数据分布的数量规对数据分布的数量规律进行精确、简洁的描述。律进行精确、简洁的描述。第三章第三章 数据分布特征的统计描述数据分布特征的统计描述1 除了统计图和统计表之外,还可以用少量的特征值(代表12 大量的数据经过整理后,已经能初步反映总大量的数据经过整理后,已经能初步反映总体分布的特征。体分布的特征。为了更加准确的了解数据分布的特征和规律,为了更加准确的了解数据分布的特征和规律,需要找到反映数据分布特征的需要找到反映数据分布特征的代表值代表值 三类:集中趋势、离中趋势、分布形态三类:集中趋势、离中趋势、分布形态说明:说明:2 大量的数据经过整理后,已经能初步反映总体分布的特征23集中趋势集中趋势:即反映各数据向中心值靠拢的程度:即反映各数据向中心值靠拢的程度返回本节首页集中趋势集中趋势集中趋势集中趋势 (位置位置位置位置)3集中趋势:即反映各数据向中心值靠拢的程度返回本节首页集中趋34离中趋势离中趋势:即反映各数据远离中心值的程度:即反映各数据远离中心值的程度离中趋势离中趋势离中趋势离中趋势 (分散程度分散程度分散程度分散程度)两个不同的曲线表示两个不同的总体,它们的两个不同的曲线表示两个不同的总体,它们的两个不同的曲线表示两个不同的总体,它们的两个不同的曲线表示两个不同的总体,它们的集中趋势相同但离中趋势不同。集中趋势相同但离中趋势不同。集中趋势相同但离中趋势不同。集中趋势相同但离中趋势不同。因为即使现象的集中趋势相同,其离中趋势因为即使现象的集中趋势相同,其离中趋势也可能不同。也可能不同。4离中趋势:即反映各数据远离中心值的程度离中趋势两个不同的曲45实际中还会遇到:集中趋势和离中趋势均相同实际中还会遇到:集中趋势和离中趋势均相同实际中还会遇到:集中趋势和离中趋势均相同实际中还会遇到:集中趋势和离中趋势均相同的现象,其分布的形态也可能不同。的现象,其分布的形态也可能不同。的现象,其分布的形态也可能不同。的现象,其分布的形态也可能不同。这表明:除了集中和离中趋势外,分布还这表明:除了集中和离中趋势外,分布还这表明:除了集中和离中趋势外,分布还这表明:除了集中和离中趋势外,分布还有其他方面的特征:有其他方面的特征:有其他方面的特征:有其他方面的特征:分布的形态分布的形态分布的形态分布的形态。指:数据分布的对称程度和扁平(高低)程度指:数据分布的对称程度和扁平(高低)程度指:数据分布的对称程度和扁平(高低)程度指:数据分布的对称程度和扁平(高低)程度测度指标是偏度测度指标是偏度测度指标是偏度测度指标是偏度测度指标是峰度测度指标是峰度测度指标是峰度测度指标是峰度是相对于是相对于是相对于是相对于对称分布对称分布对称分布对称分布而言而言而言而言相对于相对于相对于相对于正态分布正态分布正态分布正态分布而言而言而言而言5实际中还会遇到:集中趋势和离中趋势均相同的现象,其分布的形56偏度:测定分布的偏斜程度的指标偏度:测定分布的偏斜程度的指标偏度:测定分布的偏斜程度的指标偏度:测定分布的偏斜程度的指标偏斜是相对于偏斜是相对于偏斜是相对于偏斜是相对于对称分布对称分布对称分布对称分布而言而言而言而言峰度:测定分布的高低(尖峭)程度的指标峰度:测定分布的高低(尖峭)程度的指标峰度:测定分布的高低(尖峭)程度的指标峰度:测定分布的高低(尖峭)程度的指标尖峭是相对于尖峭是相对于尖峭是相对于尖峭是相对于正态分布正态分布正态分布正态分布而言而言而言而言6偏度:测定分布的偏斜程度的指标偏斜是相对于对称分布而言峰度67偏态偏态偏态偏态(形状)(形状)(形状)(形状)峰态峰态峰态峰态 (形状形状形状形状)正态分布正态分布正态分布正态分布对称分布对称分布对称分布对称分布7偏态峰态正态分布对称分布78扁平分布扁平分布扁平分布扁平分布尖峰分布尖峰分布尖峰分布尖峰分布峰态峰态峰态峰态左偏分布左偏分布左偏分布左偏分布右偏分布右偏分布右偏分布右偏分布与正态分布与正态分布与正态分布与正态分布比较!比较!比较!比较!偏态偏态偏态偏态与对称分与对称分与对称分与对称分布比较布比较布比较布比较8扁平分布尖峰分布峰态左偏分布右偏分布与正态分布比较!偏态与89正态分布中有两个参数:正态分布中有两个参数:一般记为:一般记为:、2 是正态分布的参数,不确定常数。是正态分布的参数,不确定常数。不同的不同的、不同的、不同的2对应不同的正态分布对应不同的正态分布9正态分布中有两个参数:一般记为:、2 是正态分布的参数910标准正态分布是正态分布中的一种标准正态分布是正态分布中的一种记为:记为:10标准正态分布是正态分布中的一种记为:1011本章内容本章内容v第一节第一节 集中趋势的测度集中趋势的测度 v第二节第二节 离散程度的测度离散程度的测度 v第三节第三节 偏度与峰度偏度与峰度 11本章内容第一节 集中趋势的测度 1112 第一节第一节 集中趋势的测度集中趋势的测度v集中趋势集中趋势是指一组数据向其中心值靠拢的倾向是指一组数据向其中心值靠拢的倾向v测度集中趋势测度集中趋势就是寻找一组数据的代表值或中就是寻找一组数据的代表值或中心值,在统计中是使用心值,在统计中是使用平均指标平均指标来测度的。来测度的。12 第一节 集中趋势的测度集中趋势是指一组数据向其中心1213本节内容本节内容v一、平均指标含义一、平均指标含义v二、平均指标的计算二、平均指标的计算 (一)算术平均数(一)算术平均数 (二)调和平均数(二)调和平均数 (三)几何平均数(三)几何平均数 (四)众数(四)众数 (五)中位数(五)中位数v三、各种平均数之间的相互关系三、各种平均数之间的相互关系数值平均数值平均数值平均数值平均位置平均位置平均位置平均位置平均13本节内容一、平均指标含义数值平均位置平均1314一、平均指标含义一、平均指标含义1、定义:又称平均数。、定义:又称平均数。是将同质总体内各单位的数量差异抽是将同质总体内各单位的数量差异抽象化,以反映总体的一般水平。象化,以反映总体的一般水平。被平均的对象必须具有同质性被平均的对象必须具有同质性14一、平均指标含义1、定义:又称平均数。被平均的对象必须具14152、平均指标有两大类、平均指标有两大类数值平均数值平均:位置平均位置平均:根据总体内全部数据计算:算根据总体内全部数据计算:算根据总体内全部数据计算:算根据总体内全部数据计算:算术平均、调和平均、几术平均、调和平均、几术平均、调和平均、几术平均、调和平均、几 何平均。何平均。何平均。何平均。根据数据在分配数列中的位置根据数据在分配数列中的位置根据数据在分配数列中的位置根据数据在分配数列中的位置确定:众数、中位数。确定:众数、中位数。确定:众数、中位数。确定:众数、中位数。152、平均指标有两大类数值平均:位置平均:根据总体内全部数15163、平均指标作用、平均指标作用 a、反映总体各单位变量值分布的集中趋势、反映总体各单位变量值分布的集中趋势 b、比较同一现象在不同空间或不同时间的发展、比较同一现象在不同空间或不同时间的发展 水平水平 c、分析现象间的依存关系、分析现象间的依存关系163、平均指标作用 a、反映总体各单位变量值分布的集中趋1617集中趋势集中趋势:v总体中各单位某一标志值的具体表现是各不相总体中各单位某一标志值的具体表现是各不相v同的,但一般呈正态分布,即很小或很大的标同的,但一般呈正态分布,即很小或很大的标v志值出现的次数较少,接近平均数的标志值出志值出现的次数较少,接近平均数的标志值出v现的次数较多,大多数的标志值都围绕着平均现的次数较多,大多数的标志值都围绕着平均v数左右波动。数左右波动。返回本节首页17集中趋势:总体中各单位某一标志值的具体表现是各不相返回本1718商场按销售商场按销售额分(万元)额分(万元)商场数商场数 (家)(家)各组商品流通各组商品流通 费用率(费用率(%)50以下以下 50200 200400 400600 600800 8001000 1000以上以上 25 70 130 75 40 18 10 11.2 10.4 9.9 6.7 5.9 5.5 5.0 注:流通费用率注:流通费用率=费用额费用额/销售额销售额现象间的依存关系:现象间的依存关系:18商场按销售 商场数 各组商品流通 50以下 1819二、平均指标计算二、平均指标计算(一)算术平均数(一)算术平均数又称均值。根据掌握的资料不同又称均值。根据掌握的资料不同:简单法和加权法。简单法和加权法。19二、平均指标计算(一)算术平均数又称均值。根据掌握的资料19201、简单法:适用于没有分组的原始数据、简单法:适用于没有分组的原始数据均值,即算术平均数均值,即算术平均数均值,即算术平均数均值,即算术平均数x 标志值或变量值标志值或变量值见见49页例题页例题201、简单法:适用于没有分组的原始数据均值,即算术平均数x20212、加权法、加权法:分组且各组标志值出现的次数分组且各组标志值出现的次数 (权数(权数 f)不相等时,公式:)不相等时,公式:返回本节首页x x 为标志值,又称变量值;为标志值,又称变量值;为标志值,又称变量值;为标志值,又称变量值;f f 为各组标志值出现的次数为各组标志值出现的次数为各组标志值出现的次数为各组标志值出现的次数212、加权法:分组且各组标志值出现的次数返回本节首页x 为2122计算平均日产量计算平均日产量22计算平均日产量2223产量产量(件)(件)x 人数人数 f xf192121232325252727292931202224262830146812102088144208336300合计合计-41109623产量 x 人数 xf192120120合计-4112324用统计功能的计算器计算:用统计功能的计算器计算:2ndF,ON,20 1M+22 4M+24 6M+26 8M+28 12M+30 10M+,xM结果为结果为26.7324用统计功能的计算器计算:2425例例1:用计算器对下列数据求平均:用计算器对下列数据求平均 x f 25 25 35 35 45 45 55 55 合计合计合计合计 10 10 70 70 90 90 30 30 200 20025例1:用计算器对下列数据求平均 x f 2526vmode2vShift scl=v 25 Shift;10 DT 35 Shift;70 DT 45 Shift;90DT 55 Shift;30 DTvShift 注意:注意:注意:注意:DTDT是储存功能的加号是储存功能的加号是储存功能的加号是储存功能的加号26mode2注意:2627 注意:注意:当各组权数均相等时,加权算术平均数当各组权数均相等时,加权算术平均数等于简单算术平均数等于简单算术平均数:返回本节首页27 注意:当各组权数均相等时,加权算术平均数返回本节首页2728产量产量(x)人数人数(f)1213141510101010合计合计40可用简单式计算均值可用简单式计算均值可用简单式计算均值可用简单式计算均值各组权数都相等的数列各组权数都相等的数列28产量(x)人数(f)1210合计40可用简单式计2829对称数列:对称数列:产量产量(x)人数人数(f)121314151531030103合计合计56可用简单式计算均值可用简单式计算均值可用简单式计算均值可用简单式计算均值29对称数列:产量(x)人数(f)123合计56可用29303、权数、权数 加权均值的大小受两个因素的影响:加权均值的大小受两个因素的影响:各组变量值(各组变量值(x)各组次数,即权数(各组次数,即权数(f)303、权数 加权均值的大小受两个因素的影响:3031(1)权数的定义)权数的定义权数:权数:即次数,分布在各组间的总体单位数,即次数,分布在各组间的总体单位数,因为它对均值的大小起权衡轻重的作因为它对均值的大小起权衡轻重的作 用,故又称权数。用,故又称权数。出现次数多的标志值出现次数多的标志值对平均数的影响大对平均数的影响大31(1)权数的定义权数:即次数,分布在各组间的总体单位数,3132(2)权数的表现及应用)权数的表现及应用 绝对数权数绝对数权数 f 相对数权数相对数权数 第一、权数表现:有两种形式:第一、权数表现:有两种形式:32(2)权数的表现及应用 绝对数权数 f3233绝对权数:绝对权数:相对权数:相对权数:计算公式:计算公式:例题见教科书例题见教科书51页表页表3333绝对权数:相对权数:计算公式:例题见教科书51页表333334第二、权数的实质第二、权数的实质 是相对数权数。是相对数权数。即权数对均值的影响作用,取决于相对权数即权数对均值的影响作用,取决于相对权数而非绝对权数。而非绝对权数。举例:举例:34第二、权数的实质 是相对数权数。举例:3435计算平均奖金额计算平均奖金额等级等级奖金额奖金额(X X)人数(人数(F F1 1)人数(人数(F F2 2)一等一等1201208 81212二等二等10010042426363三等三等909030304545合计合计8080120120虽然各组绝对人数变化了,但各组人数的比重未变虽然各组绝对人数变化了,但各组人数的比重未变比重比重%1037.552.510035计算平均奖金额奖金额(X)人数(F1)人数(F2)一等135364、平均数应用举例:、平均数应用举例:统计中有三大综合指标:统计中有三大综合指标:总量指标、相对指标和平均指标总量指标、相对指标和平均指标反映现象总规模、总水平,用绝对数表示反映现象总规模、总水平,用绝对数表示如:如:2019年中国年中国GDP 39.8万亿元人民币万亿元人民币相对指标相对指标是两个有联系的指标值对比的比率,是两个有联系的指标值对比的比率,如:三次产业比重、企业劳动生产率、产出的如:三次产业比重、企业劳动生产率、产出的计划完成百分数计划完成百分数、经济发展速度和增长速度、经济发展速度和增长速度364、平均数应用举例:统计中有三大综合指标:反映现象总3637例例1、10个企业资金利润率资料:个企业资金利润率资料:资金利资金利润率润率 企业企业数数n 企业资金企业资金(万元)(万元)f 0-1010-2020-30532100500800合计合计101400求:求:10个企业的平均利润率个企业的平均利润率37例1、10个企业资金利润率资料:资金利企业企业资金 037资金利资金利润率润率 企业企业数数n 企业资金企业资金(万元)(万元)fx xf利润额利润额 0-1010-2020-3053210050080051525575200合计合计101400-280“企业的平均利润率企业的平均利润率”等同于等同于“企业的总利润率企业的总利润率”企业的总利润率企业的总利润率=利润总额利润总额/资金总额资金总额资金利企业企业资金xxf 0-10510055合计101403839利润总额利润总额利润总额利润总额资金总额资金总额资金总额资金总额39利润总额资金总额3940计划完成计划完成百分数百分数 企业企业数数 n 计划产值计划产值fx xf实际值实际值105110110120120130307050570020500225001.0751.151.256127.52357528125合计合计15048700-57827.5 计算计算150个企业的平均计划完成百分数个企业的平均计划完成百分数例例2、150个企业的资料:个企业的资料:40计划完成企业计划产值xxf1051103057001.40计划完成计划完成百分数百分数 企业企业数数 n 计划产值计划产值fx xf实际值实际值105110110120120130307050570020500225001.0751.151.256127.52357528125合计合计15048700-57827.5“150个企业的平均计划完成百分数个企业的平均计划完成百分数”就是就是“150个企个企业总的计划完成百分数业总的计划完成百分数”。企业总计划完成百分数企业总计划完成百分数=总实际数总实际数/总计划数总计划数计划完成企业计划产值xxf1051103057001.074142实际产值实际产值实际产值实际产值计划产值计划产值计划产值计划产值42实际产值计划产值42435、算术平均数的数学性质、算术平均数的数学性质v见见52页页435、算术平均数的数学性质见52页4344(二)调和平均数(二)调和平均数 1、含义:、含义:总体内各个变量值倒数的算术平均总体内各个变量值倒数的算术平均 数的倒数,又称倒数平均数。数的倒数,又称倒数平均数。如有三个变量值:如有三个变量值:8、10、12,求调和平均数。步骤如下:,求调和平均数。步骤如下:44(二)调和平均数 1、含义:总体内各个变量值倒数的算术4445、即为调和平均数即为调和平均数公式:公式:45、即为调和平均数公式:4546(1)简单式:)简单式:(2)加权式:)加权式:各变量值出现次数相等各变量值出现次数相等各变量值出现次数不等各变量值出现次数不等 设设设设 mm为次数为次数为次数为次数2、调和平均数的计算调和平均数的计算46(1)简单式:(2)加权式:各变量值出现次数相等各变量值4647举例举例:某蔬菜单价早中晚分别为某蔬菜单价早中晚分别为0.5、0.4、0.25(元(元/斤)斤)(1)早中晚各买)早中晚各买1元,求平均价格元,求平均价格 (2)早中晚各买)早中晚各买1斤,求平均价格斤,求平均价格 (3)早中晚各买)早中晚各买2元、元、3元、元、4元,求平均价格元,求平均价格 (4)早中晚各买)早中晚各买2斤、斤、3斤、斤、4斤,求平均价格斤,求平均价格47举例:某蔬菜单价早中晚分别为0.5、0.4、0.24748(1)问:用调和平均。)问:用调和平均。先求早、中、晚购买的斤先求早、中、晚购买的斤数。早数。早 1/0.5=2(斤斤)、中、中 1/0.4=2.5(斤斤)、晚、晚 1/0.25=4(斤斤)(2)问:用算术平均)问:用算术平均48(1)问:用调和平均。先求早、中、晚购买的斤(2)问:用4849(3)问:用加权调和平均)问:用加权调和平均(4)问:用加权算术平均)问:用加权算术平均49(3)问:用加权调和平均(4)问:用加权算术平均49503、调和平均数和算术平均数间的关系、调和平均数和算术平均数间的关系调和平均数是一种特殊的均值调和平均数是一种特殊的均值(1)两者存)两者存在着变形关系:在着变形关系:503、调和平均数和算术平均数间的关系调和平均数是一种特殊的5051(2 2)当掌握的资料无法直接计算算术)当掌握的资料无法直接计算算术平均数时,可用调和法计算。平均数时,可用调和法计算。这时两者计算结果相同,只是根据已知这时两者计算结果相同,只是根据已知条件不同,需选择不同的公式。条件不同,需选择不同的公式。51(2)当掌握的资料无法直接计算算术平均数时,可用调和法计5152 已知对比分母,将分母定为已知对比分母,将分母定为f,求分子,求分子xf,然,然后用加权算术公式,即:后用加权算术公式,即:已知对比分子,将分子定为已知对比分子,将分子定为m,求分母,求分母mx用加权调和公式,即用加权调和公式,即:52 已知对比分母,将分母定为f,求分子xf,然后用加权5253某公司下属三个部门销售利润资料某公司下属三个部门销售利润资料部门部门销售利润销售利润率()率()x x利润额利润额(万元)(万元)m m销售额销售额m mx xA A121212012010001000B B101020020020002000C C7 710510515001500合计合计-42542545004500求三个部门的平均利润率。求三个部门的平均利润率。53某公司下属三个部门销售利润资料销售利润率()x利润额(5354思考:思考:如果已知销售利润率和销售额资料,如果已知销售利润率和销售额资料,该如何计算?该如何计算?54思考:5455部门部门销售利润率销售利润率()()x x销售额(万销售额(万元)元)利润额利润额A A121210001000B B101020002000C C7 715001500合计合计-4500450055销售利润率()x销售额(万元)利润额A121000B15556计算:计算:计算:计算:2020个商店平均销售计划完成程度及个商店平均销售计划完成程度及个商店平均销售计划完成程度及个商店平均销售计划完成程度及总的流通费用率。总的流通费用率。总的流通费用率。总的流通费用率。56计算:20个商店平均销售计划完成程度及总的流通费用率。5657计划完计划完成百分成百分数数%计划百计划百分数的分数的组中值组中值%(x1)实际销实际销售额售额(万元万元)(M或或f)计划销计划销售额售额(M/x)流通费流通费用率用率%(x2)流通费流通费用额用额(万元)(万元)(xf)809090100100110110120859510511545.968.434.494.354.072.032.882.014.813.212.011.06.799.034.1310.37合计合计-243.024.08-30.3257计划完成百分数%计划百分数的组中值%(x1)实际销售额计5758(1)20个商店的平均销售计划完成程度个商店的平均销售计划完成程度(2)20个商店总的流通费用率个商店总的流通费用率58(1)20个商店的平均销售计划完成程度(2)20个商店总5859(三)几何平均数(三)几何平均数1.定义:定义:n 个变量值乘积的个变量值乘积的 n 次方根次方根59(三)几何平均数1.定义:n 个变量值乘积的 n 次方59603、计算方法、计算方法简单法:简单法:加权法:加权法:603、计算方法简单法:加权法:6061 例例1:2019-2019年我国某工业品产量环比发年我国某工业品产量环比发展速度分别为展速度分别为107.6%、102.5%、100.6%、102.7%、102.2%。计算平均每年的发展速度。计算平均每年的发展速度61 例1:2019-2019年我国某工业品产量环比发6162按计算器:按计算器:按计算器:按计算器:1.076,1.076,1.025,1.025,1.006,1.006,1.027,1.027,1.022,=,2ndF,1.022,=,2ndF,5,=,5,=出现结果:出现结果:出现结果:出现结果:1.03091.0309即即即即103.1%103.1%62按计算器:1.076,1.025,1.006,6263 例例2:某厂有四个流水连续作业车间,某月:某厂有四个流水连续作业车间,某月的合格率分别为:的合格率分别为:0.95,0.92,0.90,0.80,求四个车间的平均合格率。求四个车间的平均合格率。63 例2:某厂有四个流水连续作业车间,某月的合格率6364例例3:某地区:某地区25年的年经济发展速度分别是:年的年经济发展速度分别是:1年年103%,4年年105%,8年年108%,10年年 110%,2年年115%,求该地区经济的平均年发展速度。求该地区经济的平均年发展速度。64例3:某地区25年的年经济发展速度分别是:64651.03,1.03,(,1.05,y,(,1.05,yx,4,),(,1.08,y,(,1.08,yx,8,),(,1.1,y,(,1.1,yx,10,),(,1.15,y,(,1.15,yx,2,),=,2ndF,=,2ndF,25,=,25,=出现结果:出现结果:出现结果:出现结果:1.0861.086即即即即108.6%108.6%651.03,(,1.05,yx,4,),(,1.065664、使用几何平均法注意问题使用几何平均法注意问题第一、变量值要是相对数,且不能为第一、变量值要是相对数,且不能为负值或零负值或零第二、这些相对数的连乘积要等于总速度或第二、这些相对数的连乘积要等于总速度或总比率总比率几何平均法适用于对比率数据(相对数)的几何平均法适用于对比率数据(相对数)的平均,平均,主要用于计算主要用于计算平均比率和平均速度平均比率和平均速度664、使用几何平均法注意问题第一、变量值要是相对数,且不能6667几何平均数是一种特殊的均值:几何平均数是一种特殊的均值:可写成:可写成:可写成:可写成:67几何平均数是一种特殊的均值:可写成:6768(四)众数(四)众数 1、定义:、定义:一组数据中出现次数最多的变量值一组数据中出现次数最多的变量值2、计算:分、计算:分两种情况:两种情况:品质数列和单项式数列品质数列和单项式数列组距式数列组距式数列68(四)众数 1、定义:2、计算:分两种情况:6869不同品牌饮料的频数分布不同品牌饮料的频数分布 饮料品牌饮料品牌频数频数比例比例百分百分比比(%)可口可乐可口可乐 旭日升冰茶旭日升冰茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露1511 9 6 90.300.220.180.120.183022181218合计合计501100MMo o可口可乐可口可乐可口可乐可口可乐(1)品质数列计算众数)品质数列计算众数定性变量定性变量定性变量定性变量69不同品牌饮料的频数分布 饮料品牌频数比例百分比(%)6970MMo o不满意不满意不满意不满意回答类别回答类别甲城市甲城市户数户数 (户户)百分比百分比 (%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 836311510合计合计300100.0甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布70Mo不满意回答类别甲城市户数 (户)百分比 (%)7071价格(元)价格(元)销量(公斤)销量(公斤)2.00 2.40 3.00 4.00206014080众数众数是数列中出现次数最多的变量值是数列中出现次数最多的变量值众数众数(2)单项数列计算众数)单项数列计算众数定性变量定性变量定性变量定性变量71价格(元)销量(公斤)2.00 20众数是数列中出现次数7172(3)组距式数列计算众数)组距式数列计算众数先确定众数所在的组,然后用公式计算先确定众数所在的组,然后用公式计算分:上限公式和下限公式分:上限公式和下限公式返回本节首页定性变量定性变量定性变量定性变量72(3)组距式数列计算众数先确定众数所在的组,然后用公式计7273分数分数x 人数人数 f60以下以下 26070 77080 15 8090 10 90以上以上 6 合计合计 40 fm-1fm+1fmL:众数所在组的下限:众数所在组的下限U:众数所在组的上限:众数所在组的上限73分数x 人数 ffm-1fm+1fmL:众数7374上限公式:上限公式:下限公式:下限公式:74上限公式:下限公式:7475757576 3、众数说明、众数说明(1)不受极端值的影响)不受极端值的影响(2)既适用于品质数列,也适用于变量数列)既适用于品质数列,也适用于变量数列(3)一组数据可能没有众数或有几个众数)一组数据可能没有众数或有几个众数返回本节首页76 3、众数说明(1)不受极端值的影响返回本节首页7677无众数无众数原始数据原始数据:10 5 9 12 6 8多于一个众数多于一个众数多于一个众数多于一个众数原始数据原始数据原始数据原始数据:25 25 28 2828 28 36 36 42 4242 42一个众数一个众数一个众数一个众数原始数据原始数据原始数据原始数据:6 :6 5 5 9 8 9 8 5 55 577无众数原始数据:10 5 9 12 7778(五)中位数(五)中位数 1、中位数的含义:、中位数的含义:将各单位标志值按大小排列,居于中间位将各单位标志值按大小排列,居于中间位 置的那个标志值。置的那个标志值。返回本节首页MMe e50%50%78(五)中位数 1、中位数的含义:返回本节首页Me50%78792、中位数的计算、中位数的计算分两种情况:分两种情况:(1)未分组原始资料)未分组原始资料(2)组距式数据)组距式数据返回本节首页792、中位数的计算分两种情况:返回本节首页7980(1)未分组原始资料)未分组原始资料 先将数据从小到大排序先将数据从小到大排序 项数为奇数时,中间位置项数为奇数时,中间位置上的标志值即为中位数上的标志值即为中位数项数为偶数时,中间位置项数为偶数时,中间位置上上2个标志值的平均为中位数个标志值的平均为中位数80(1)未分组原始资料 先将数据从小到大排序 项数为奇数8081 有有9个数值:个数值:2、3、5、6、9、10、11、13、14 中位数为第中位数为第5个,即个,即9 有有10个数值个数值:2、3、5、6、9、10、11、13、14、15 中位数为第中位数为第5、第、第6个数据的平均值,即个数据的平均值,即9.581 有9个数值:8182分数分数人数人数向上累计向上累计向下累计向下累计60以下以下60707080809090以上以上271510629243440403831166合计合计 40-(2)组距数列)组距数列fmS SMe+1Me+1S SMe-1Me-182分数人数向上累计向下累计60以下2240合计 40-8283B、确定中位数所在的组:确定中位数所在的组:本例为:本例为:40/2=20,即中位数应在将分数从,即中位数应在将分数从 高到低排列后的第高到低排列后的第20个学生的分数上个学生的分数上A、先将次数进行累计先将次数进行累计 C、利用公式计算中位数利用公式计算中位数(公式公式 见见56页页)83B、确定中位数所在的组:A、先将次数进行累计 C、利用公8384公式:公式:下限公式下限公式=上限公式上限公式=84公式:8485带入资料得:带入资料得:v v (分)v v (分)85带入资料得:8586附:四分位数附:四分位数四分位数:四分位数:是指位于全部数据是指位于全部数据 位置和位置和 位位置上的数据,分别称为下四分位数和上四分位置上的数据,分别称为下四分位数和上四分位数。也称为第一个四分位数数。也称为第一个四分位数 和和 第三个四分位数。第三个四分位数。即:排序后处于即:排序后处于25%和和75%位置上的值。位置上的值。实际上,中位数就是第二个四分位数实际上,中位数就是第二个四分位数QQ1 1QQMeMeQQ3 325%25%25%25%86附:四分位数四分位数:是指位于全部数据 位置和 8687四分位的位置:四分位的位置:87四分位的位置:8788箱线图:可以观察数据分布的特征箱线图:可以观察数据分布的特征4 46 68 810101212QQ3 33QQ1 11X X最大值最大值最大值X X最小值最小值最小值Median/Quart./RangeMedian/Quart./Range箱线图箱线图箱线图箱线图Me88箱线图:可以观察数据分布的特征4681012Q3Q1X最8889某某某某电电电电脑脑脑脑公公公公司司司司20192019年年年年前前前前四四四四个个个个月月月月120120天天天天的的的的销销销销售售售售量量量量数数数数据据据据,试利用箱线图对数据分布特征进行分析。试利用箱线图对数据分布特征进行分析。试利用箱线图对数据分布特征进行分析。试利用箱线图对数据分布特征进行分析。89某电脑公司2019年前四个月120天的销售量数据,试利用8990未分组数据未分组数据单批数据箱线图单批数据箱线图最小值最小值最小值最小值最小值最小值141141141最大值最大值最大值最大值最大值最大值237237237中位数中位数中位数中位数中位数中位数182182182下四分位数下四分位数下四分位数下四分位数下四分位数下四分位数170.25170.25170.25上四分位数上四分位数上四分位数上四分位数上四分位数上四分位数197197197140 150 160 170 180 190 200 210 220 230 240140 150 160 170 180 190 200 210 220 230 240140 150 160 170 180 190 200 210 220 230 240某电脑公司销售量数据的某电脑公司销售量数据的Median/Quart./Rang箱线图箱线图90未分组数据单批数据箱线图最小值最大值中位数下四分位数上9091某电脑公司销量分组表某电脑公司销量分组表91某电脑公司销量分组表91未分组数据未分组数据多批数据箱线图多批数据箱线图从从从从某某某某大大大大学学学学经经经经济济济济管管管管理理理理专专专专业业业业二二二二年年年年级级级级学学学学生生生生中中中中随随随随机机机机抽抽抽抽取取取取1111人人人人,对对对对 8 8门门门门主主主主要要要要课课课课程程程程的的的的考考考考试试试试成成成成绩绩绩绩进进进进行行行行调调调调查查查查,所所所所得得得得结结结结果果果果如如如如表表表表。试试试试通通通通过过过过多多多多批批批批箱箱箱箱线线线线图图图图分分分分析析析析各各各各科科科科考考考考试试试试成成成成绩绩绩绩的的的的分分分分布特征。布特征。布特征。布特征。11名学生各科的考试成绩数据名学生各科的考试成绩数据课程名称课程名称学生编号学生编号1234567891011英语英语经济数学经济数学西方经济西方经济市场营销市场营销财务管理财务管理基础会计基础会计统计学统计学计算机应计算机应用用76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177未分组数据多批数据箱线图从某大学经济管理专业二年级学生中随9293未分组数据未分组数据未分组数据未分组数据多批数据箱线图多批数据箱线图多批数据箱线图多批数据箱线图8门课程考试成绩的门课程考试成绩的Median/Quart./Range箱线图箱线图93未分组数据多批数据箱线图8门课程考试成绩的Median93941111名学生名学生名学生名学生8 8门课程考试成绩的门课程考试成绩的门课程考试成绩的门课程考试成绩的Median/Quart./RangeMedian/Quart./Range箱线图箱线图箱线图箱线图min-max25%-75%median value455565758595105学生1学生2学生3学生4学生5学生6学生7学生8学生9学生10学生11未分组数据未分组数据未分组数据未分组数据多批数据箱线图多批数据箱线图多批数据箱线图多批数据箱线图9411名学生8门课程考试成绩的Median/Quart./9495959596三、各种平均数之间的关系三、各种平均数之间的关系两者都属于抽象化的代表值,但有区别,两者都属于抽象化的代表值,但有区别,前者容易受极端值的影响,后者不会。前者容易受极端值的影响,后者不会。1、数值平均数和位置平均数的比较:、数值平均数和位置平均数的比较:96三、各种平均数之间的关系两者都属于抽象化的代表值,但有区9697某公司中层干部某公司中层干部2019年的收入,求平均收入年的收入,求平均收入 职位职位 收入收入(元元)财务部经理财务部经理 10 000市场部经理市场部经理 450000人事部经理人事部经理 90 000研发部经理研发部经理 100 000生产部经理生产部经理 10 000 实际中可利用实际中可利用切尾平均法切尾平均法:去掉极端值,:去掉极端值,将剩余的数据求平均。将剩余的数据求平均。97某公司中层干部2019年的收入,求平均收入 职位9798收入收入(元元)人数人数1000 53000 255000 5610000 1050000 330000000 1计算其平均收入时,计算其平均收入时,位置平均和数值平均哪一种方法更合适?位置平均和数值平均哪一种方法更合适?98收入(元)人数计算其平均收入时,98992、三种平均数之间的关系、三种平均数之间的关系左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数对称分布对称分布对称分布对称分布对称分布对称分布 均值均值均值均值均值均值=中位数中位数中位数中位数中位数中位数=众数众数众数众数众数众数右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数均值均值均值均值均值均值有极小值,拉动均有极小值,拉动均有极小值,拉动均有极小值,拉动均值向极小值靠近值向极小值靠近值向极小值靠近值向极小值靠近有极大值,拉动均有极大值,拉动均有极大值,拉动均有极大值,拉动均值向极大值靠近值向极大值靠近值向极大值靠近值向极大值靠近992、三种平均数之间的关系左偏分布均值 中位数 众数对99100众数、中位数、平均数的众数、中位数、平均数的特点和应用特点和应用 众数:众数:不受极端值影响不受极端值影响 具有不惟一性具有不惟一性 数据分布偏斜程度较大且有明显峰值时应用数据分布偏斜程度较大且有明显峰值时应用 中位数:中位数:不受极端值影响不受极端值影响 数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用 平均数:平均数:易受极端值影响易受极端值影响 数据对称分布或接近对称分布时应用数据对称分布或接近对称分布时应用100众数、中位数、平均数的特点和应用 众数:不受极端值影100101离散程度离散程度是测定数据分布特征的另一重要指标是测定数据分布特征的另一重要指标 第二节第二节 离散程度测度离散程度测度统计是使用统计是使用变异指标变异指标来测度分布的离散程度来测度分布的离散程度用于测定一组数据中各数值之间的差异程度,用于测定一组数据中各数值之间的差异程度,即:在一个分布中各数值与均值的离差程度即:在一个分布中各数值与均值的离差程度101离散程度是测定数据分布特征的另一重要指标 第二节 离101102三个集中趋势相同但离中趋势不同的总体三个集中趋势相同但离中趋势不同的总体离散程度指标可从另一个角度说明集中趋离散程度指标可从另一个角度说明集中趋离散程度指标可从另一个角度说明集中趋离散程度指标可从另一个角度说明集中趋势测度值的代表程度。势测度值的代表程度。势测度值的代表程度。势测度值的代表程度。102三个集中趋势相同但离中趋势不同的总体离散程度指标可从另102103一、变异指标的意义和作用一、变异指标的意义和作用二、变异指标的种类二、变异指标的种类(一)全距(极差)(一)全距(极差)(二)平均差(二)平均差(三)标准差(三)标准差(四)离散系数(四)离散系数返回本章首页本节内容本节内容103一、变异指标的意义和作用返回本章首页本节内容103104一、变异指标的意义和作用一、变异指标的意义和作用变异指标的含义变异指标的含义 又称标志变动度、离散程度或离中程度。又称标志变动度、离散程度或离中程度。是描述总体内各数据之间差别大小程度的指标是描述总体内各数据之间差别大小程度的指标返回本节首页甲:甲:20,40,60,70,80,100,120乙:乙:67,68,69,70,71,72,73如两组数据,请直观判断哪一组的离散程度大如两组数据,请直观判断哪一组的离散程度大104一、变异指标的意义和作用变异指标的含义返回本节首页甲10410570707070返回本节首页1057070返回本节首页105106 标志变动度的作用标志变动度的作用2、能衡量现象变动的均衡性或稳定性、能衡量现象变动的均衡性或稳定性3、能反映各变量值分布的离散程度(离中趋势)、能反映各变量值分布的离散程度(离中趋势)1、是评价平均数代表性的依据、是评价平均数代表性的依据甲企业甲企业 25 25 25 25 均匀、协调均匀、协调乙企业乙企业 10 15 20 55丙企业丙企业 5 10 15 70 不均匀。不均匀。企业产值各季度计划完成情况企业产值各季度计划完成情况企业产值各季度计划完成情况企业产值各季度计划完成情况106 标志变动度的作用2、能衡量现象变动的均衡性或稳定性106107平均数的代表性和标志变动度的关系平均数的代表性和标志变动度的关系标志变动度大,平均数的代表性就小;标志变动度大,平均数的代表性就小;反之反之,平均数的代表性就大平均数的代表性就大例如:三组学生的年龄例如:三组学生的年龄(岁)(岁)20 20 20 20 20-差距最小,差距最小,20岁的代表性最好岁的代表性最好 18 19 20 21 22 15 16 20 24 25-差距最大,差距最大,20 岁的代表性最差岁的代表性最差107平均数的代表性和标志变动度的关系标志变动度大,平均数的107108二、标志变异指标的种类二、标志变异指标的种类全距全距 1、含义:总体各单位标志的最大值和最小值、含义:总体各单位标志的最大值和最小值之差。之差。R=Xmax-Xmin108二、标志变异指标的种类全距1081092、全距的优点和缺点、全距的优点和缺点 优点:计算简单、涵义直观优点:计算简单、涵义直观缺点:易受极端数值的影响缺点:易受极端数值的影响 不能反映中间标志值的变动不能反映中间标志值的变动1092、全距的优点和缺点 优点:计算简单、涵义直观缺109110附:四分位差(见附:四分位差(见 60 页)页)四分位差四分位差Qd=Q3-Q1110附:四分位差(见 60 页)四分位差Qd=110111(二)平均差(二)平均差 1、含义、含义 是各变量值与其算术平均数离差绝对值是各变量值与其算术平均数离差绝对值 的算术平均数,即:的算术平均数,即:平均差能全面反映一组数据的离散状况平均差能全面反映一组数据的离散状况平均差能全面反映一组数据的离散状况平均差能全面反映一组数据的离散状况111(二)平均差 1、含义平均差能全面反映一组数据的1111122、平均差计算:、平均差计算:返回本节首页简单式:简单式:加权式:加权式:1122、平均差计算:返回本节首页简单式:加权式:11211318181919202021212222-2-2-1-1 0 0 1 1 2 2 2 2 1 1 0 0 1 1 2 2x x合计合计 -6 6一组学生年龄:组学生年龄:18 19 20 21 22求平均差。求平均差。11318-2 2x合计 -113114某厂某厂某厂某厂200200个工人产量资料(单位:公斤)个工人产量资料(单位:公斤)个工人产量资料(单位:公斤)个工人产量资料(单位:公斤)日产量日产量日产量日产量3030以下以下以下以下30403040405040505050以上以上以上以上合计合计合计合计求求求求A.DA.D工人数工人数工人数工人数 1010 70 70 90 90 30 30 200 200114某厂200个工人产量资料(单位:公斤)日产量工人数114115X X2525353545455555合计合计合计合计-17-17-7-7 3 3 13 13-f f10107070909030302002001717 7 7 3 3 13 13-170 170 490 490 270 270 390 390 1320 1320 250 250 2450 2450 4050 4050 1650 1650 8400 8400115X-17 f17 170 250115116结论:结论:结论:结论:该厂工人平均日产量为该厂工人平均日产量为该厂工人平均日产量为该厂工人平均日产量为4242公斤,但各工人公斤,但各工人公斤,但各工人公斤,但各工人生产水平有差异,其差异平均为生产水平有差异,其差异平均为生产水平有差异,其差异平均为生产水平有差异,其差异平均为6.66.6公斤。公斤。公斤。公斤。116结论:1161173、平均差的优缺点、平均差的优缺点v优点:优点:和全距相比,弥补了全距不足,能反和全距相比,弥补了全距不足,能反 映中间标志值的变动。映中间标志值的变动。v缺点:缺点:加绝对值号为计算带来了不便。加绝对值号为计算带来了不便。1173、平均差的优缺点优点:和全距相比,弥补了全距不足,能117118(三)标准差(均方差)(三)标准差(均方差)1、概念、概念 是各变量值与其算术平均数离差平方的算术是各变量值与其算术平均数离差平方的算术 平均数的平方根,又称均方差。平均数的平方根,又称均方差。118(三)标准差(均方差)1、概念118119 2、计算:、计算:已知资料不同采用不同方法:已知资料不同采用不同方法:加权式:加权式:简单式:简单式:119 2、计算:加权式:简单式:119120标准差的平方即为方差标准差的平方即为方差120标准差的平方即为方差120121一组学生年龄一组学生年龄:18 19 20 21 2218 -2 419 -1 120 0 021 1 122 2 4 合计 -10简单式举例简单式举例:121简单式举例:121122某厂某厂某厂某厂200200个工个工个工个工人产量资料人产量资料人产量资料人产量资料:(单位:公斤)(单位:公斤)(单位:公斤)(单位:公斤)日产量日产量日产量日产量3030以下以下以下以下30403040405040505050以上以上以上以上合计合计合计合计工人数工人数工人数工人数 1010 70 70 90 90 30 30 200 200求标准差求标准差加权式举例:加权式举例:122某厂200个工日产量工人数求标准差加权式举例:122123x x2525353545455555合计合计合计合计-17-17-7-7 3 3 13 13-f f1010707090903030200200289289 49 49 9 9169169-2890 2890 3430 3430 810 810 5070 50701220012200 250 250 2450 2450 4050 4050 1650 1650 8400 8400123x-17 f289 2890 250123124标准差的计算可以用统计功能的计算器。标准差的计算可以用统计功能的计算器。标准差的计算可以用统计功能的计算器。标准差的计算可以用统计功能的计算器。结论:结论:结论:结论:各工人生产产量与平均产量相比,平均相各工人生产产量与平均产量相比,平均相各工人生产产量与平均产量相比,平均相各工人生产产量与平均产量相比,平均相差差差差7.87.8公斤。公斤。公斤。公斤。124标准差的计算可以用统计功能的计算器。结论:124125计算器的使用计算器的使用v开机:开机:ON,2ndF,ONv进入到统计功能后,用计算平均数的方进入到统计功能后,用计算平均数的方法输数据法输数据v所有的数据输完后,按所有的数据输完后,按 2ndF 键,键,v再按再按xM 健,即为标准差健,即为标准差注意:注意:所有的数据输完后,如果直接所有的数据输完后,如果直接按按xM 健,即为平均数。健,即为平均数。125计算器的使用开机:ON,2ndF,ON注意:所有的数据125126统计功能的计算器的使用统计功能的计算器的使用Mode2Shift scl=25 Shift;10 DT 35 Shift;70 DT45 Shift;90 DT 55 Shift;30 DTShift 126统计功能的计算器的使用1261273、标准差的优缺点、标准差的优缺点v优点优点:弥补了平均差和全距的不足。:弥补了平均差和全距的不足。v缺点缺点:利用标准差不能比较性质不同的数列:利用标准差不能比较性质不同的数列(即水平高低不等和计量单位不同)离散程度(即水平高低不等和计量单位不同)离散程度的大小。的大小。1273、标准差的优缺点优点:弥补了平均差和全距的不足。127128 如:两组动物体重(单位:公斤)如:两组动物体重(单位:公斤)甲:甲:,乙:,乙:,试比较平均数的代表性。试比较平均数的代表性。128 如:两组动物体重(单位:公斤)甲:,128129129129130上述结论不一定正确上述结论不一定正确
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!