资源描述
*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第四章 集中趋势测量法,主,要,内,容,算术平均数,中位数,众数,几何平均数和调和平均数,1,统计分析首先要解决的问题,就是寻求一个简单数值以代表搜集所得的资料。,平均指标就是说明同质总体在一定条件下某一数量标志所到达的一般水平。,平均指标把总体各单位之间的差异加以抽象概括,其中个别标志值的偶然性被相互抵消,从而反映出总体分布的集中趋势。,2,下面是一个小故事:,一个人到某公司求职,经过调查,得出关于该公司工资的一些数据,如果是你,应该如何选择?,3,挠头的数值,公司员工的月薪如下:,员工,经理,副经理,职员A,职员B,职员C,职员D,职员E,职员F,职员G,月薪(元),6000,4000,1700,1300,1200,1100,1100,1100,500,4,我们有三种方法选择集中趋势:,1根据频数:哪个变量值出现次数越,多,就选择哪个变量值,比方民主决策的表决,机制。,2根据居中:比方一个城镇居民的生活,水平,居中的是小康家庭,那么就用小康家庭,来代表该城镇的生活水平。,3根据平均:用平均数来代表变量的,平均水平。,5,关于集中趋势的一个故事,吉斯莫先生有一个小工厂,生产超级小玩意儿。,管理人员由吉斯莫先生、他的弟弟、六个亲戚组成。工作人员由5个领工和10个工人组成。工厂经营得很顺利,现在需要一个新工人。,现在吉斯莫先生正在接见萨姆,谈工作问题。,6,吉斯莫:我们这里报酬不错。平均薪金是每周300美元。你在学徒期间每周得75美元,不过很快就可以加工资。,萨姆工作了几天之后,要求见厂长。,萨姆;你欺骗我!我已经找其他工人核对过了,没有一个人的工资超过每周100元。平均工资怎么可能是一周300元呢?,吉斯莫:啊,萨姆,不要冲动。平均工资是300元。我要向你证明这一点。,7,吉斯莫:这是我每周付出的酬金。我得2400元,我弟弟得1000元,我的六个亲戚每人得250元,五个领工每人得200元,10个工人每人100元。总共是每周6900元,付给23个人,对吧?,萨姆:对,对,对!你是对的,平均工资是每周300元。可你还是蒙骗了我。,吉斯莫;我不同意!你实在是不明白。我已经把工资列了个表,并告诉了你,工资的中位数是200元,可这不是平均工资,而是中等工资。,8,萨姆:每周100元又是怎么回事呢?,吉斯莫:那称为众数,是大多数人挣的工资。,吉斯莫:老弟,你的问题是出在你不懂平均数、中位数和众数之间的区别。,萨姆:好,现在我可懂了。我,我辞职!,9,第一节 算术平均数,(MEAN),用总体标志总量除以总体单位数即得,算术平均数Arithematic mean。,算术平均数是反映集中趋,势最常用、最根本的平均指标,,也被称为均值。它只适用于定,距以上的变量。,10,例:某小区350户家庭共有居民1190人。在,这个例子中,家庭总数350户是总体单位数,居,民总数1190人是该总体的标志总量。根据算术,平均数的定义,户均人口 3.4人,11,1.对于未分组资料,注意:对求和符号,此时流动脚标的变动范围是1,2,3,N,,,N,是总体单位数。,例 求74、85、69、9l、87、74、69这些数字的,算术平均数。,解,78.4,12,2.对于分组资料,注意:对求和符号,此时流动脚标的变动范围是1,2,3 ,n,,n是组数,而不是总体单位数。,很显然,算术平均数不仅受各变量值(X)大小的影,响,而且受各组单位数(频数)的影响。由于对于总体的影,响要由频数(f)大小所决定,所以 f 也被称为权数。值得,注意的是,在统计计算中,权数不仅用来衡量总体中各标,志值在总体中作用,同时反映了指标的结构,所以它有两,种表现形式:绝对数频数和相对数频率。这样一,来,在统计学中,凡对应于分组资料的计算式,都被称为,加权式。,13,例 求下表(,单项数列,)所示数据的算术平均数,。,人口数(X),户数(f),频率(P),2,3,4,5,6,7,8,5,8,16,10,6,4,1,0.10,0.16,0.32,0.20,0.12,0.08,0.02,合计,50,1.00,14,对于,组距数列,,要用每一组的组中值权充该,组统一的变量值。,例 求下表所示数据的的算术平均数,间距,频数(f),组中值(X),148152,152156,156160,160164,164168,168172,172176,176180,180184,184188,188192,192196,1,2,5,10,19,25,17,12,5,3,0,1,150,154,158,162,166,170,174,178,182,186,190,194,合计,100,15,3.算术平均数的性质,各变量值与算术平均数的离差之和等于0。,各变量值对算术平均数的平方和,小于它们对任,何他数偏差的平方和,算术平均数受抽样变动影响较小。,分组资料如遇有开放组距时,不经特殊处理,不能进行算术平均数的计算。,受极端值影响较大。,16,第二节 中位数Median),把总体单位某一数量标志的各个数值按大小顺序排列,位于正中处的变量值,即为中位数,用M,d,表示。M,d,可用于定序、定距、定比资料。,17,1.对未分组资料,(1)、先把所有数据按大小顺序排列,如果总体单位数为奇数,那么取第N+1/2 位上的变量值为中位数;,2、如果总体单位数为偶数。因为居中的数值不存在,按惯例,取第 N/2位和第N+1/2 位上的两个变量值的平均作为中位数。,18,例 求54,65,78,66,43这些数字的中位数。,例、求54,65,78,66,43,38 这些数字的中位数。,你会吗?,19,2.对于分组资料,1单项数列,根据N/2在累计频数分布中找到中位数所在组,,该组变量值就是,M,d,。,中,位,数,20,2组距数列按中位数所在组的下限:按中位数所在组的上限:,当根据组距数列求中位数时,要采用所谓的比例插值法:先根据,N,2在累计频数分布中找到中位数所在组,然后假定该组中各变量值是均匀分布的,再用以下任何一种方法求出中位数(注意:此处用的是向上累计)。,21,例某年级学生身高如下,求中位数,22,解 第一种方法,168,6,17112(厘米),请你用第二种方法来做一下,23,3.中位数的性质,(1)各变量值对中位数之差的绝对值总和,,小于它们对任何其他数的绝对值总和。,(2)中位数不受极端值的影响。,(3)分组资料有不确定组距时,仍可求得,中位数。,(4)中位数受抽样变动的影响较算术平均,数略大。,24,4.四分位数,中位数所有单位被等分为两局部,因而被称为二分,位数。类似于求中位数,我们还可求出四分位数、十分,位数、百分位数。,将总体中的各单位分割成相等的四局部,那么这三个,分割的变量值就是四分位数。假设以Q1、Q2、Q3分别代表,第一、第二、第三四分位数。Q2 即中位数,Q1、Q3的算,法分别是,25,请从下表中指出第一四分位数和第三四分位数,26,求出下表中的第一四分位数和第三四分数,27,第三节 众数(Mode),众数是在一组资料中,出现次数(或频,数)呈现出“峰值的那些变量值,用Mo表示。,众数只与次数有关,可以用于定类、定序、定距、定比资料。,28,1.对于未分组资料,直接观察,首先,将所有数据顺序排列;然后,只要,观察到某些变量值(与相邻变量值相比较)出现,的次数(或频数)呈现“峰值,这些变量值就是,众数。,29,2.对于分组资料,单项式:,观察频数分布(或频率分布),组距式:,L,o,为众数组下限;,为众数组频数与前一组频数之差;,为众数组频数与后一组频数之差;,h,o,为众数组组距。,30,人口数(X),户数(f),频率(P),2,3,4,5,6,7,8,5,8,16,10,6,4,1,0.10,0.16,0.32,0.20,0.12,0.08,0.02,合计,50,1.00,求下表中的众数,众数,31,求下表中的众数,32,(1)众数仅受上下相邻两组频数大小的影响,不受极,端值影响,对开口组仍可计算众数;,(2)受抽样变动影响大;,(3)众数不唯一确定。,(4)众数标示为其峰值所对应的变量值,能很容易区,分出单峰、多峰。因而具有明显偏态集中趋势的频数分,布,用众数最适宜。,3.众数的性质,33,第四节 几何平均数、调和平均数了解,1.几何平均数Mg(geometric mean,N个变量值连乘积的N次方根。(不能有变量值为,0。适用于:(1)计算某种比率的平均数;(2)计算大,致具有几何级数关系的一组数字的平均数,如经济指标,的平均开展速度。,1简单几何平均数,对数式:,34,(2)加权几何平均数,对数式:,应该指出,用以计算几何平均数的各项数值必须,大于0,否那么就不能计算几何平均数或计算结果无实,际意义。,35,例 求3,9,27,81,243这些数字的几何平均,数。,解,1,2,36,2.调和平均数M,h,(harmonic mean),N个变量值倒数算术平均数的倒数,也称倒数平均,数。,适用于,:掌握的情况是总体标志总量而缺少总体,单位数的资料时。,简单调和平均数,加权调和平均数,37,3.各种平均数的关系,(1)当总体呈正态分布时:,(2)当总体呈偏态分布时:中位数总在均数和众数之间,正偏:负偏:,注:和 合称位置平均数,(3)皮尔逊发现,在钟形分布的偏态不大显著时,、,三者大致构成一个比较固定的关系:,(4)、和 合称数值平均数,38,39,
展开阅读全文