第四章数据分布特征的描述PPT课件

上传人:无*** 文档编号:181334968 上传时间:2023-01-12 格式:PPT 页数:68 大小:401.50KB
返回 下载 相关 举报
第四章数据分布特征的描述PPT课件_第1页
第1页 / 共68页
第四章数据分布特征的描述PPT课件_第2页
第2页 / 共68页
第四章数据分布特征的描述PPT课件_第3页
第3页 / 共68页
点击查看更多>>
资源描述
1第四章第四章 数据分布特征的描述数据分布特征的描述21、2、3平均是平均是21、1、1.1、100000,1亿个数平均亿个数平均和除以项数和除以项数1亿亿和除以项数和除以项数1亿亿13第一节第一节 集中趋势集中趋势-数值平均数数值平均数4集中趋势亦称为趋中性、集中性,是指变量分布以某一集中趋势亦称为趋中性、集中性,是指变量分布以某一数值为中心的倾向数值为中心的倾向变量分布的集中趋势要用平均指标反映变量分布的集中趋势要用平均指标反映平均指标是将随机变量的各变量值差异抽象化、以反映变量平均指标是将随机变量的各变量值差异抽象化、以反映变量值的一般水平或平均水平的指标,也就是反映变量分布中心值的一般水平或平均水平的指标,也就是反映变量分布中心值或代表值的指标。值或代表值的指标。平均数因计算方法不同可分为数值平均数和位置平均数两类。平均数因计算方法不同可分为数值平均数和位置平均数两类。数值平均数主要有算术平均数、调和平均数和几何平均数等三种数值平均数主要有算术平均数、调和平均数和几何平均数等三种位置平均数主要有中位数和众数位置平均数主要有中位数和众数置查找平均部数据,只需要根据位位置平均不一定用到全数据进行计算数值平均就是用到全部5一、算术平均数一、算术平均数算术平均数也称为均值,是总体标志总算术平均数也称为均值,是总体标志总量与总体单位总量对比的结果。量与总体单位总量对比的结果。算术平均数是最为常用的用以描述集中趋势算术平均数是最为常用的用以描述集中趋势的指标,因为它的计算方法客观上符合许多的指标,因为它的计算方法客观上符合许多现象个体与总体之间存在的数量关系,即总现象个体与总体之间存在的数量关系,即总体中每个个体标志值的算术和等于总体标志体中每个个体标志值的算术和等于总体标志总量,用总体标志总量除以总体单位总量,总量,用总体标志总量除以总体单位总量,就可以消除个体标志值之间的差异而体现出就可以消除个体标志值之间的差异而体现出总体的一般水平。总体的一般水平。)()(变量值个数总体单位总量变量值总量总体标志总量算术平均数6在实际工作中,由于所掌握的统计资料在实际工作中,由于所掌握的统计资料的不同,利用上述公式进行计算时,可的不同,利用上述公式进行计算时,可分为简单算术平均数和加权算术平均数分为简单算术平均数和加权算术平均数两种。两种。7(一)简单算术平均数(一)简单算术平均数简单算术平均数是根据未分组数据计算简单算术平均数是根据未分组数据计算的,即直接将变量的每个变量值相加,的,即直接将变量的每个变量值相加,除以变量值的个数。除以变量值的个数。设某随机变量的各变量值为设某随机变量的各变量值为x1,x1,xn,则简单算术平均数的计算公式如下:则简单算术平均数的计算公式如下:nxnxxxxnin1i21nxx简写为8例例4-1某某IT企业人员年薪样本资料如表计算该企业企业人员年薪样本资料如表计算该企业的平均年薪。的平均年薪。491004910049300493004870048700486004860051200512005030050300499504995051000510004900049000488004880049400494004980049800472004720051400514004890048900499004990051800518004865048650513505135049600496005130051300546005460053400534005190051900)(58.502142451900534004930049100元nxx9(二)加权算术平均数(二)加权算术平均数加权算术平均数是根据单项数列或组距加权算术平均数是根据单项数列或组距数列计算的,即以各组变量值乘以相应数列计算的,即以各组变量值乘以相应的频数求出各组标志总量,除以总频数的频数求出各组标志总量,除以总频数得到的。其计算公式为得到的。其计算公式为fxfffffxfxfxxnnn21221110【例【例4-2】某企业】某企业50名工人加工零件样名工人加工零件样本资料,分组后如表本资料,分组后如表4-2。计算该企业。计算该企业50名工人的平均日产量。名工人的平均日产量。按零件数按零件数分组分组频数频数1051051101101101101151151151151201201201201251251251251301301301301351351351351401403 35 58 8141410106 64 4合合 计计5050(件)2.123506160fxfx11算术平均数的数学性质算术平均数的数学性质1、算术平均数与其总体单位总数的乘积等于总、算术平均数与其总体单位总数的乘积等于总体标志总量体标志总量2、如果每个变量值都加(或减)一个任意数值、如果每个变量值都加(或减)一个任意数值A,则其算术平均数也要增多(或减少)这个常数则其算术平均数也要增多(或减少)这个常数A3、如果每个变量值都乘以(或除以)一个任意、如果每个变量值都乘以(或除以)一个任意数值数值A,则其算术平均数也乘以(或除以)这个常则其算术平均数也乘以(或除以)这个常数数A4、各个变量值与其算术平均数离差之和为零、各个变量值与其算术平均数离差之和为零5、各个变量值与算术平均数离差平方之和最小、各个变量值与算术平均数离差平方之和最小12调和平均数调和平均数13(一)简单调和平均数(一)简单调和平均数我们以我们以H表示调和平均数。与算术平均表示调和平均数。与算术平均数类似,调和平均数也有简单的和加权数类似,调和平均数也有简单的和加权的两种形式。简单调和平均数的计算公的两种形式。简单调和平均数的计算公式为:式为:xnxxxnHn11112114【例【例4-4】某市场上白菜早中晚的价格各不相同,】某市场上白菜早中晚的价格各不相同,其中,早上其中,早上2.5元元/斤、中午斤、中午2元元/斤、晚上斤、晚上1.5元元/斤。如果早中晚各买斤。如果早中晚各买1斤,求平均价格;如果早中斤,求平均价格;如果早中晚各买晚各买1元,求平均价格元,求平均价格斤)(元总的菜量总的金额平均价格/58.19.1311215.21111斤)(元总的菜量总的金额平均价格/2361115.11215.21公式(加权)这是调和平均数的简单将上式推广得到xnxxxnHn11112115(二)加权调和平均数(二)加权调和平均数简单调和平均数是在各标志总量对平均简单调和平均数是在各标志总量对平均数起同等作用的条件下应用的,但在更数起同等作用的条件下应用的,但在更多的场合,各标志总量对平均数的作用多的场合,各标志总量对平均数的作用是不同的。这时就应以各标志总量作权是不同的。这时就应以各标志总量作权数,计算加权调和平均数。加权调和平数,计算加权调和平均数。加权调和平均数的公式为均数的公式为xmmxmxmxmmmmHnnn22112116【例【例4-5】某企业分别购进原材料三批,价格及采购】某企业分别购进原材料三批,价格及采购金额资料见表,试计算购入材料的平均价格金额资料见表,试计算购入材料的平均价格批批 次次单位价格单位价格x(元元/千克)千克)采购金额采购金额m(元)元)第一批第一批203600第二批第二批226600第三批第三批255000合合 计计15200)/(35.2268015200255000226600203600500066003600千克元xmmH)/(35.2268015200千克元材料量材料金额x17算术平均和调和平均根本就是一回事算术平均和调和平均根本就是一回事最主要的区别在权数的不同最主要的区别在权数的不同区别权数就看单位就可以了。区别权数就看单位就可以了。12乘就算术乘就算术13除就调和除就调和批批 次次1单位价格单位价格(元(元/千克)千克)2各批采购材料各批采购材料数量(千克)数量(千克)3采购金额采购金额m(元)(元)第一批第一批201803600第二批第二批223006600第三批第三批252005000合合 计计6801520018三、几何平均数三、几何平均数19几何平均数是几何平均数是n个变量值连乘积的个变量值连乘积的n次方次方根根几何平均数用来计算几何平均数用来计算平均比率、平均速度、平均比率、平均速度、产品平均合格率、复利法的平均利率产品平均合格率、复利法的平均利率几何平均数分为简单几何平均数、加权几几何平均数分为简单几何平均数、加权几何平均数何平均数20(一)简单几何平均数(一)简单几何平均数直接将直接将n个变量值连乘,然后对其连乘积开个变量值连乘,然后对其连乘积开n次方根所得的平均数即为简单几何平均数。次方根所得的平均数即为简单几何平均数。它是几何平均数的基本形式。计算公式为它是几何平均数的基本形式。计算公式为xxxxxGnn321GGnXnxxxGn,需要转成注意最终的答案为同取习惯加减,将上式两边lglglg.lglglglg2121【例【例4-6】某厂有三个车间,进入第一车间的原】某厂有三个车间,进入第一车间的原件有件有100000件,第一车间的合格率为件,第一车间的合格率为50,出车间的为出车间的为50000件,进入到第二车间;第二件,进入到第二车间;第二车间的合格率为车间的合格率为10,出车间的为,出车间的为5000件,进件,进入到第三车间;第三车间的合格率为入到第三车间;第三车间的合格率为2,出车,出车间的为间的为100件。求其平均合格率。件。求其平均合格率。1.0001.002.01.05.033G22【例【例47】生产某种产品要经过铸造、】生产某种产品要经过铸造、机加工和电镀机加工和电镀3个车间进行连续加工,各个车间进行连续加工,各车间产品合格率分别为车间产品合格率分别为95,92,90,求各车间产品平均合格率。,求各车间产品平均合格率。%2996.929.092.095.03法一:nxG率为所以各车间的平均合格所以次方的再求法二:2996.922996.92)9653.110(9652.1390lg92lg95lglglgGnxG23(二)加权几何平均数(二)加权几何平均数资料中的变量值重复出现时,简单几何平均数资料中的变量值重复出现时,简单几何平均数就变成了加权几何平均数就变成了加权几何平均数ffffnfffxxxxxGn321321GGfXffxfxfxffxxxGnnfnffn,需要转成注意最终的答案为同取习惯加减,将上式两边lglglg.lglglg.lglglglg2211212124【例【例4-8】投资银行某笔投资的年利率是】投资银行某笔投资的年利率是按复利计算的,按复利计算的,25年的年利率分配是:年的年利率分配是:有有1年为年为3,有,有4年为年为5,有,有8年为年为8,有,有10年为年为10,有,有2年为年为15,求,求平均年利率。平均年利率。0360.225115lg2110lg10108lg8105lg4103lg1lglgfXfG6.108G25几何平均用连乘而不用连加几何平均用连乘而不用连加某投资者持有股票,初始投资某投资者持有股票,初始投资10000,2001-2004四年的四年的收益率为收益率为4.52.125.51.9,求平均收益率,求平均收益率收益率 0787.80787.1089.1015.1251.1025.1044G收益率 5.85.10849.1015.1251.1025.104G59.138585.1081000057.136449.1015.1251.1025.104100005.1251.1025.104100001.1025.104100005.1041000010000,4)(算术法本利和第四年末第三年末第二年末第一年末初始模拟真实投资26第二节第二节 集中趋势集中趋势-位置平均数位置平均数27位置平均数是根据标志值在分配数列中位置平均数是根据标志值在分配数列中所处的位置来确定的代表值所处的位置来确定的代表值与数值平均数相比具有不受极端数值影响的与数值平均数相比具有不受极端数值影响的特点特点对于整个总体来说,具有非常直观的代表性,对于整个总体来说,具有非常直观的代表性,所以常被用来反映分布的集中趋势所以常被用来反映分布的集中趋势常用的位置平均数有众数、中位数常用的位置平均数有众数、中位数28一、众数一、众数29(一)众数的含义(一)众数的含义统计上把这种在一组数据中出现次数最多统计上把这种在一组数据中出现次数最多的变量值叫做众数,用的变量值叫做众数,用M0表示(表示(Mode)主要用于品质标志数据的集中趋势测量,也主要用于品质标志数据的集中趋势测量,也适用于作为数量标志数据集中趋势的测量适用于作为数量标志数据集中趋势的测量30(二)众数计算(二)众数计算1、根据单项数列确定众数、根据单项数列确定众数根据单项数列确定众数比较容易,出现次数根据单项数列确定众数比较容易,出现次数最多的变量值即为众数。最多的变量值即为众数。【例【例4-9】某院入校新生资料如表,求众数。】某院入校新生资料如表,求众数。按年龄分组按年龄分组人数(人)人数(人)1710818693199852017621432217合合 计计2022190M312、由组距数列计算众数、由组距数列计算众数组距式数列,只能按一定的方法来推算众数近似值组距式数列,只能按一定的方法来推算众数近似值首先要根据各组次数确定众数组,即众数所在的组首先要根据各组次数确定众数组,即众数所在的组其次,利用公式计算众数其次,利用公式计算众数dLM2110dUM212032【例【例4-10】某企业】某企业50名工人加工零件本资料。计算众数名工人加工零件本资料。计算众数按零件数分组按零件数分组频数频数f f1051051101101101101151151151151201201201201251251251251301301301301351351351351401403 35 58 8141410106 64 4)(1235)1014()814(8141202110件dLM)(1235)1014()814(10141252120件dUM33二、中位数二、中位数34(一)中位数的含义(一)中位数的含义中位数是指按数据大小顺序排列起来所中位数是指按数据大小顺序排列起来所形成的分配数列中,居于中间位置的变形成的分配数列中,居于中间位置的变量值量值中位数的作用与众数相近,也是研究数中位数的作用与众数相近,也是研究数据的代表值据的代表值中位数用中位数用Me表示表示(Middle)从定义知,所研究的数据中有一半小于中位从定义知,所研究的数据中有一半小于中位数,一半大于中位数数,一半大于中位数35(二)中位数的计算(二)中位数的计算确定中位数,必须将总体各单位的标志值确定中位数,必须将总体各单位的标志值按大小顺序排列。按大小顺序排列。1.根据未分组资料计算根据未分组资料计算121222ennnxnxxnM当 为奇数时当 为偶数时362.由单项数列计算由单项数列计算单项式数列,首先,要求计算权数和的单项式数列,首先,要求计算权数和的一半;然后对各组次数顺序做累计,确一半;然后对各组次数顺序做累计,确定中为数所在的组,与此对应的变量值定中为数所在的组,与此对应的变量值即为中位数即为中位数37【例【例4-13】某村人均亩产量情况如表】某村人均亩产量情况如表4-7,计算中位数。,计算中位数。人均亩产人均亩产(千克千克)户数户数(户户)1000 1000以下以下 30 30100010001501503000300025025050005000 50 5070007000 10 10 10000 10000以上以上 10 10合合 计计50050025025002f所以,Me3000 383、由组距数列计算、由组距数列计算组距数列确定中位数,应先按权数和的组距数列确定中位数,应先按权数和的一半求出中位数组,然后再按下限公式一半求出中位数组,然后再按下限公式或上限公式确定中位数或上限公式确定中位数dfsfUMdfsfLMmmemme1122:上限公式下限公式39【例【例4-14】某农村信用社按定期存款账号】某农村信用社按定期存款账号进行每隔进行每隔10户的系统抽样,得到如下资料,户的系统抽样,得到如下资料,计算其中位数计算其中位数存款金额存款金额(元元)户数户数(户户)1000 1000以下以下 30 30100030001000300015015030005000300050002502505000700050007000 50 50700010000700010000 10 10 10000 10000以上以上 10 10合合 计计500500356020002501802300021fdfSfLMmme40众数、中位数和算术平均数的比较众数、中位数和算术平均数的比较算术平均数、众数和中位数之间的关系与次数算术平均数、众数和中位数之间的关系与次数分布数列有关分布数列有关次数分布对称时,算术平均数、众数和中位数都是次数分布对称时,算术平均数、众数和中位数都是同一数值同一数值在尾巴拖在右边的正偏态(或右偏态)分布中,众在尾巴拖在右边的正偏态(或右偏态)分布中,众数最小,中位数适中,算术平均数最大数最小,中位数适中,算术平均数最大在尾巴拖在左边的负偏态(或左偏态)分布中,众在尾巴拖在左边的负偏态(或左偏态)分布中,众数最大,中位数适中,算术平均数最小数最大,中位数适中,算术平均数最小41课堂练习课堂练习421、某乡甲乙两村的粮食生产情况如下,求哪个、某乡甲乙两村的粮食生产情况如下,求哪个村的总平均亩产高村的总平均亩产高按耕地自按耕地自然条件然条件分组分组甲村甲村乙村乙村平均亩产平均亩产(千克(千克/亩)亩)粮食产量粮食产量(千克)(千克)平均亩产平均亩产(千克(千克/亩)亩)播种面积播种面积(亩)(亩)山地山地丘陵丘陵平原地平原地100100150150400400250002500015000015000050000050000015015020020045045012501250500500750750产高于乙村,所以,甲村的平均亩亩千克亩千克乙甲乙甲XXfxfXxmmH)/(25075050012507504505002001250150)/(2704005000001501500001002500050000015000025000432、某超市周调查销售数据如表,求众数、某超市周调查销售数据如表,求众数不同品牌饮料的频数分布不同品牌饮料的频数分布 饮料品牌饮料品牌频数频数比例比例百分百分比比(%)可口可乐可口可乐 旭日升冰茶旭日升冰茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露15119690.300.220.180.120.183022181218合计合计501100解:这里的变量为解:这里的变量为“饮料饮料品牌品牌”,这是个分类变量,这是个分类变量,不同类型的饮料就是变,不同类型的饮料就是变量值量值 在所调查的在所调查的50人中,人中,购买可口可乐的人数最多购买可口可乐的人数最多,为,为15人,占总被调查人,占总被调查人数的人数的30%,因此众数为,因此众数为“可口可乐可口可乐”这一品牌,这一品牌,即即 Mo可口可乐可口可乐443、某零件车间工人月产量数据如表,求、某零件车间工人月产量数据如表,求Me月产量月产量(公斤(公斤/月)月)工人数(人)工人数(人)200200以下以下200-400200-400400-600400-600600-800600-8003 37 732328 8第三组,252502f75.493200321025040021dfsfLMmme45第三节第三节 离中趋势离中趋势46变量分布既有集中趋势的一面,又有离中趋势的变量分布既有集中趋势的一面,又有离中趋势的一面一面离中趋势,就是变量分布中各变量值背离中心值的倾向离中趋势,就是变量分布中各变量值背离中心值的倾向对离中趋势的描述,就是要反映变量分布中各变量值远离中心对离中趋势的描述,就是要反映变量分布中各变量值远离中心值或代表值的状况,以更客观地反映变量分布的特征值或代表值的状况,以更客观地反映变量分布的特征变量分布的离中趋势用离散指标来反映变量分布的离中趋势用离散指标来反映离散指标,也称为标志变动度,是指反映变量值变动范离散指标,也称为标志变动度,是指反映变量值变动范围和差异程度的指标,即反映变量分布中各变量值远离围和差异程度的指标,即反映变量分布中各变量值远离中心值或代表值程度的指标,亦称为变异指标或标志变中心值或代表值程度的指标,亦称为变异指标或标志变动度指标动度指标常用的离散指标主要有:全距(亦称极差)、四分位差、异众常用的离散指标主要有:全距(亦称极差)、四分位差、异众比率、平均差、标准差、离散系数等比率、平均差、标准差、离散系数等47全距全距全距也称为极差,是指一组数据中最大全距也称为极差,是指一组数据中最大值与最小值之差,其计算公式为值与最小值之差,其计算公式为minmaxXXR48【例【例4-15】有两个学习小组的统计学开始成绩分别】有两个学习小组的统计学开始成绩分别为:第一组:为:第一组:60,70,80,90,100第二组:第二组:78,79,80,81,82两个小组的考试成绩平均分都是两个小组的考试成绩平均分都是80分,但是哪一组分,但是哪一组的分数比较集中呢?的分数比较集中呢?R R1 110010060604040(分)分)R R2 2828278784 4(分)分)这说明第一学习小组的离中趋势远大于第二组资料的标志这说明第一学习小组的离中趋势远大于第二组资料的标志变动度,即第二组的分数比较集中。变动度,即第二组的分数比较集中。49二、平均差二、平均差平均差是各变量值与其算术平均数离差平均差是各变量值与其算术平均数离差绝对值的算术平均数,用绝对值的算术平均数,用A.D表示表示它能够综合反映各单位标志值变动的影响它能够综合反映各单位标志值变动的影响平均差大,表示标志变动度大,算术平均数平均差大,表示标志变动度大,算术平均数代表性小代表性小计算平均差之所以采用离差的绝对值,是由于各计算平均差之所以采用离差的绝对值,是由于各标志值对算术平均数的离差之和等于零。标志值对算术平均数的离差之和等于零。nxxDA.ffxxDA.50【例【例417】某厂按月收入水平分组的组】某厂按月收入水平分组的组距数列如表,计算平均差。距数列如表,计算平均差。职工工资(元)职工工资(元)职工数(人)职工数(人)250-270250-270270-290270-290290-310290-310310-330310-330330-350330-35015152525353565654040)(31018055800元ffxx370020.6180 xx ff(元)51三、方差与标准差三、方差与标准差方差和标准差是测度数据变异程度的最方差和标准差是测度数据变异程度的最重要、最常用的指标重要、最常用的指标方差是各变量值与其算术平均数离差平方的方差是各变量值与其算术平均数离差平方的平均数平均数根据总体数据计算的称总体方差根据总体数据计算的称总体方差根据样本数据计算的称样本方差根据样本数据计算的称样本方差NXX22()ffXX22()NXX2()ffXX2()1)(22nxxs1)(22ffxxs1)(2nxxs1)(2ffxxs方差方差 标准差标准差 总体总体 样本样本 未分组未分组分组分组未分组未分组分组分组53【例【例4-18】考察一台机器的生产能力,利用抽】考察一台机器的生产能力,利用抽样程序来检验生产出来的产品质量,数据如表,样程序来检验生产出来的产品质量,数据如表,根据法则,如果方差大于根据法则,如果方差大于0.005,则该机器必,则该机器必须关闭待修。问该机器是否必须关闭?须关闭待修。问该机器是否必须关闭?3.433.433.453.453.433.433.483.483.523.523.503.503.393.393.483.483.413.413.383.383.493.493.453.453.513.513.503.50459.3nxx005.0002.0114)459.35.3(.)459.343.3(1)(2222nxxs54离散系数离散系数对于平均水平不同或计量单位不同的不对于平均水平不同或计量单位不同的不同组别的变量值,不能直接用上述离散同组别的变量值,不能直接用上述离散程度比较程度比较为消除变量值水平高低和计量单位不同为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离对离散程度测度值的影响,需要计算离散系数散系数离散系数消除了数据水平高低和计量单位的离散系数消除了数据水平高低和计量单位的影响,因而可以用于对不同组别数据离散程影响,因而可以用于对不同组别数据离散程度的比较度的比较xSVXVS或55【例【例4-20】某管理局抽查了所属的】某管理局抽查了所属的8家企业,家企业,其产品销售数据如表其产品销售数据如表试比较产品销售额与销售利润的离散程度试比较产品销售额与销售利润的离散程度企业企业编号编号产品销售额产品销售额(万元)(万元)X1X1销售利润(销售利润(万元)万元)X2X21 12 23 34 45 56 67 78 8170170220220390390430430480480650650950950100010008.18.112.512.518.018.022.022.026.526.540.040.064.064.069.069.0710.05125.3209.23)(09.23)(5215.322577.025.53619.309)(19.309)(25.53612211VsxVsx万元万元万元万元56第四节第四节 分布形状的描述分布形状的描述57一、分布形状概述一、分布形状概述变量分布的形状是各种各样的,有变量分布的形状是各种各样的,有J型的、型的、U型的和型的和钟型等钟型等钟型分布,有的两侧完全对称,有的左偏,有的右偏,钟型分布,有的两侧完全对称,有的左偏,有的右偏,有的比较扁平,有的比较适中,有的则比较陡峭有的比较扁平,有的比较适中,有的则比较陡峭分布形状不同,表明变量分布的内在结构也不同分布形状不同,表明变量分布的内在结构也不同形状指标就是反映变量分布具体形状,即左右是否对称、形状指标就是反映变量分布具体形状,即左右是否对称、偏斜程度与陡峭程度如何的指标偏斜程度与陡峭程度如何的指标反映变量分布偏斜程度的指标,称偏态系数反映变量分布偏斜程度的指标,称偏态系数反映变量分布陡峭程度的指标,称峰态系数反映变量分布陡峭程度的指标,称峰态系数偏态系数可以告诉我们变量分布是左偏还是右偏偏态系数可以告诉我们变量分布是左偏还是右偏峰态系数则可以告诉我们分布是陡峭还是扁平峰态系数则可以告诉我们分布是陡峭还是扁平58二、偏态系数二、偏态系数偏态的测定是通过计算偏态系数来实现偏态的测定是通过计算偏态系数来实现的,通常用的,通常用SK来表示。偏态系数的常用来表示。偏态系数的常用计算公式为:计算公式为:33)2)(1(snnxxnSKi33)(nsfxxSK59第一个式子是根据未分组资料计算的,第一个式子是根据未分组资料计算的,第二个式子是根据分组资料计算的。其第二个式子是根据分组资料计算的。其中中SK为偏态系数,为偏态系数,n为数量个数或权数为数量个数或权数和,和,f为频数,为频数,s为样本标准差。为样本标准差。一般情况下,有如下判定标准:一般情况下,有如下判定标准:偏态系数偏态系数=0为对称分布为对称分布偏态系数偏态系数0为右偏分布为右偏分布偏态系数偏态系数0为尖峰为尖峰峰态系数峰态系数0为平峰为平峰64【例【例4-22】某车间工人日加工零件数据见】某车间工人日加工零件数据见表,试计算峰态系数表,试计算峰态系数按日加工按日加工零件分组零件分组组中组中值值x x人人数数f f80-9080-9085853 390-10090-10095957 7100-110100-1101051051313110-120110-1201151155 5120-130120-1301251252 2合计合计-303045.0342.103034.9004803)(444nsfxxK显然,显然,K=2.553,表明该分组数据分布为表明该分组数据分布为平顶分布,较正态分布的高峰要平坦一些。平顶分布,较正态分布的高峰要平坦一些。65课堂练习课堂练习661、某彩电公司彩电销售量数据如表,计算销售、某彩电公司彩电销售量数据如表,计算销售量的平均差量的平均差按销售量分按销售量分组(台)组(台)频数频数140-150140-150150-160150-160160-170160-170170-180170-180180-190180-190190-200190-200200-210200-210210-220210-220220-230220-230230-240230-2404 49 9161627272020171710108 84 45 5合计合计12012017.185.计算过程计算过程ffxxDAfxfx672、某地区全部水稻收获量分组资料如下,求平、某地区全部水稻收获量分组资料如下,求平均亩产量和标准差均亩产量和标准差水稻收获量水稻收获量(千克(千克/亩)亩)耕地面耕地面积(亩)积(亩)125-175125-175175-225175-225225-275225-275275-325275-325325-375325-375375-425375-4251818323253536969848413313306.751338469533218133)01.323400(.32)01.323200(18)01.323150()()/(01.323133846953321813340084350693005325032200181502222ffxxfxfX亩千克乙68
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 压缩资料 > 基础医学


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!