统计第三章课件

上传人:沈*** 文档编号:241735822 上传时间:2024-07-19 格式:PPT 页数:57 大小:846KB
返回 下载 相关 举报
统计第三章课件_第1页
第1页 / 共57页
统计第三章课件_第2页
第2页 / 共57页
统计第三章课件_第3页
第3页 / 共57页
点击查看更多>>
资源描述
第三章 集中量数第一节 算术平均数第二节 中数与众数第三节 其他集中量数数据的特征集中趋势和离中趋势是数据的两个基本特征。一组变量的次数分布,一般至少要具有这两个特征,这两个特征又称为:1、中心位置:用来度量一组数据的集中趋势。描述它们的中心位于何处。对其数量化描述称为位置量数或集中量数。2、离散性:反映一组数据的分散程度,即次数分布的离散程度。对其数量化描述称为次数分布变异特性的度量或差异量数。几个基本概念集中趋势:数据取值向分布中心集中的趋势。离中趋势:数据取值从分布中心向外分散的趋势。集中量数:描述数据集中趋势或集中程度的统计量。差异量数:描述数据的离中趋势或离散程度的统计量。地位量数:一个特定的观察值在整个次数分布中占有一定的等级位置,描述这个位置的指标就是地位量数。常见的集中量数 算术平均数中数众数加权平均数几何平均数调和平均数第一节 算术平均数算术平均数简称平均数或均数、均值(mean),是用以度量连续变量次数分布集中趋势的最常用的集中量数。1、总体平均数2、样本平均数1、总体平均数如果一个总体X包含N个元素,Xi是这个总体中的第i个元素,则称Xi为第i个观测值,那么对于X来说,该总体的算术平均数被定义为:2、样本平均数实际上,我们无法对总体进行观测,我们得到的是关于被研究对象总体的一个样本X的观测值。对于这样样本的X变量来说,其算术平均数为:二、算术平均数的计算(一)数据未分组时,用基本公式计算(二)用估计平均数计算平均数(三)当数据分组的时候,用次数分布表来求(一)数据未分组时,用基本公式计算例3-1若某小组9个学生的语文测验成绩分别为:75、63、82、90、95、85、79、84、86。计算它们的平均数。(二)用估计平均数计算平均数如果数据的数目以及每个观测数据值(即数字)都很大时,应用基本公式计算较麻烦。在这种情况下,可以利用估计平均数来简化计算。方法:先设定一个估计平均数,用符号AM表示,从每一个数据中减去AM,使数值变小,容易计算。最后再在计算结果中加上这个估计平均数。计算公式如下:(三)当数据分组的时候,用次数分布表来求 用估计平均数来求:三、算术平均数的性质1、观察值的总和等于算术平均数的n倍,即2、各观察值与算术平均数之差(离差)的总和等于0,即3、每一个观测值都加上或减去同一个相同常数C后,计算得到的平均数等于原平均数加上或减去这个常数C,即三、算术平均数的性质4、每一个观测值都乘以一个相同常数C后,计算得到的平均数等于原平均数乘以这个常数C,即5、观测值与任意常数C的离差平方和,不小于观测值与平均数的离差平方和,即四、平均数的意义算术平均数是应用最普遍的一种集中量数。它是“真值”渐近、最佳的估计值。当观测次数无限增加时,算术平均数趋近于真值。(P197,点估计)五、平均数的优缺点算术平均数具备一个良好的集中量数应具备的一些条件(一)优点(二)缺点(三)适用条件(四)不适应情况(五)在报告平均数时,要按特别指定的单位来表达。六、计算和应用平均数的原则(一)优点1、反应灵敏2、计算严密3、计算简单4、简明易懂5、适合进一步代数运算6、较少受抽样变动的影响(二)缺点1、易受极端数据的影响修剪平均数也称截尾平均数,是从一组数据中去除一定百分比(如5)的最大值和最小值数据后,再次计算的算术平均数。2、若出现模糊不清的数据时,无法计算平均数。(三)适用条件1、如果一组数据比较准确、可靠又同质。2、无极端数据的影响。3、需要每一个数据都加入计算,同时还要作进一步代数运算时。(四)不适应情况1、如果一组数据中出现两个极端的数目,或数据不清楚、数据不同质时,不宜用。2、一些适用几何平均数或调和平均数的情境。(五)在报告平均数时,要按特别指定的单位来表达。在报告平均数时,要按特别指定的单位来表达。在书写平均数时,习惯上平均数保留的小数位数要比原来的测量数据多一位数字。六、计算和应用平均数的原则1、同质性原则2、平均数与个体数值相结合的原则3、平均数与标准差、方差相结合的原则第二节 中数与众数一、中数(median)二、众数(mode)三、平均数、中数、众数三者之间的关系 一、中数(median)中数,又称中点数、中位数、中值,符号为Md或Mdn。中数是按顺序排列在一起的一组数据中居于中间位置的数,即在这组数中,有一半的数据比它大,有一半的数据比它小。这个数可能是数据中的某一个,也可能根本不是原有的数。如果将数据按大小顺序排列,中数恰好位于中间,它将数据的数目分成较大的一半和较小的一半。中数的计算(一)未分组数据求中数的方法首先要将数据按其取值大小排序,然后找出位于中间的那个数就是中数。1、一组数据中无重复数值的情况(1)数据个数为奇数,则中数为 位置的那个数。即中数的计算例3-3,有下列9个数:13、14、9、8、7、4、10、11、12,求其中数。中数的计算(2)数据个数为偶数,则中数为居于中间位置两个数的平均数,即第 与第 位置的两个数据相加除以2。即例3-3,有下列8个数:5、7、9、15、19、3、4、10,求中数。中数的计算2、一组数据中有重复数值的情况(1)当重复数值没有位于数列中间时,求中数的方法与无重复数据时求中数的方法相同。例3-4,求数列3、3、4、4、7、9、10、13、15的中数。(2)当重复数目位于数列中间,数据的个数为奇数的情形。例3-5,求数列2、3、5、7、7、7、11的中数。(3)当重复数目位于数列中间,数据的个数为偶数的情形。例3-6,求2、3、5、7、7、7、11、13的中数。中数的计算(二)数据分组后,根据次数分布表来求中数。(三)中数的优缺点1、优点:计算简单,容易理解,不受极端数值的影响2、缺点:(1)中数的计算不是每个数据都加入,其大小不受制于全体数据。(2)反应不够灵敏,极端值的变化对中数不产生影响。(3)中数受抽样影响较大,不如平均数稳定。(4)计算时需要对数据先排列大小。(5)中数乘以总数与数据的总和不相等(除非:中数平均数)。(6)中数不能作进一步代数运算。3、使用条件:(1)当一组观测结果中出现两个极端数目时。(2)当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值。(3)当需要快速估计一组数据的代表值时,也常用中数。二、众数(mode)众数又称为范数、密集数、通常数等,常用符号Mo表示。众数是指次数分布中出现次数最多的那个数的数值。它也是一种集中量数,也可用来代表一组数据的集中趋势。(一)计算众数的方法(二)众数的意义与应用(一)计算众数的方法1、直接观察法求众数(1)未分组,出现次数最多的那个数据就是众数例3-8,求2、4、3、6、4、5、4的众数。(2)分组,次数最多的那个分组区间的组中值。(一)计算众数的方法2、用公式求众数(1)皮尔逊经验法:Mo3Md-2M(是一个近似值,不受次数分布的影响,但只能在分布接近正态的情况下应用)(2)金氏插补法:例一组数据的平均数为79.84,中数为79.71,求这组数据的众数。(二)众数的意义与应用1、优点:简单明了,容易理解,不受极端数值的影响。2、缺点:(1)不稳定,受分组影响,也受样本变动影响。(2)计算时不需每一个数据都加入,反应不够灵敏。(3)用观察法得到的众数,不是经过严格计算而来的,用公式计算所得众数也只是一个估计值。同时,众数不能作进一步代数运算。(4)总数乘以众数,也与数据总和不相等。(除非众数=平均数)(二)众数的意义与应用3、使用情况(1)当需要快速而粗略地寻求一组数据的代表值时。(2)当一组数据出现不同质的情况时,可用众数表示典型情况。(3)当次数分布中有两极端的数目时,除了一般用中数外,有时也用众数。(4)当粗略估计次数分布的形态时,有时用平均数与众数之差,作为表示次数分布是否偏态的指标。(5)当一组数据中同时有两个数值的次数都比较多时,即次数分布中出现双众数时,也多用众数来表示数据分布形态。有时候还有多众数。补充一个具有两个众数的分布被称为双峰分布,一个具有多于两个众数的分布被称为多峰分布。有些时候,一个具有数个等高点的分布也被称为无众数。众数是具有绝对最高频数的数值。然而术语众数经常也被用来指那些具有相对高频数的数值。较高的高峰被称为主要众数,较矮的高峰被称为次要众数。三、平均数、中数、众数三者之间的关系正态分布中:MMdMo正偏态(左偏):MMdMo负偏态(右偏):MMdMo皮尔逊研究发现,它们三者之间存在着这样的经验关系:Mo3Md-2M。第三节 其他集中量数一、加权平均数(Weighted mean)二、几何平均数(geometric mean)三、调和平均数(harmonic mean)一、加权平均数(Weighted mean)(一)表示方法:(二)含义与计算-1在计算平均数时,如果不仅考虑数据的大小,还要考虑各数据所起作用的大小,那么就要用加权平均数。数学上体现作用大小的办法就是将每个数据乘以不同大小的数值(权重,指各变量在构成总体中的相对重要性),用W表示。加权平均数就是具有不同权重的数据的平均数。设有n个数据 ,其权重分别为 ,则加权平均数的计算公式为:例3-8在学校里,学生整个学期的总评成绩往往是平时成绩和考试成绩按照一定的比例折算而成。假定这个比例是46,现有一个学生的平时成绩为80,考试成绩为90,问该生总评成绩应该是多少?(二)含义与计算-2如果知道n个组的算术平均数,要计算总的平均数,这时不能直接将几个平均数相加后除以组数,而是要在每个算术平均数之前乘以相应组的次数,计算总和以后再除以总次数。在这里,各组次数实际上就是该组平均数的权重。因此,通过该组平均数计算的总平均数也是一个加权平均数:例3-9有三个班级参加语言能力测验,A班30人,平均分数为82.6,B班40人,平均分数为90.2,C班35人,平均分数为85,问总平均分是多少?练习某学生甲数学的平时成绩为85分,期中考试的成绩为90分,期末考试成绩为80分;某学生乙的平时成绩为85分,期中考试成绩为80,期末考试成绩为90分。若不考虑平时成绩、期中考试成绩和期末考试成绩的相对重要性,则甲乙两生的平均成绩相同,若依照平时成绩占20,期中成绩占30,期末成绩占50的规定加权,则甲乙两生的加权平均成绩是多少?二、几何平均数(geometric mean)(一)表示方法:(二)含义几何平均数是成几何级数增长的变量值的平均数,适合于计算平均比率和平均发展速度。它是n个数值连乘积的n次方根,用几何平均数表示数据的集中趋势一般适用于两种情形:1、一组数据中任何两个相邻数据之比接近于常数,即数据按一定的比例关系变化。2、当一组数据中存在极端数据,分布呈偏态时,算术平均数不能很好地反映数据的典型情况,此时应使用几何平均数或其他集中量数(如中数、众数)来反映数据的典型情况。(三)几何平均数的计算1、基本公式:(三)几何平均数的计算如果数据值比较大,数据个数N又很多,计算常常非常困难,用计算器运算还可能产生“溢出”错误,为了解决这个问题,往往运用对数方法加以变换来计算。(四)几何平均数的应用1、心理物理学中等距与等比量表实验的数据处理2、教育与心理研究中平均增长率的计算三、调和平均数(harmonic mean)(一)表示方式:(二)含义与计算调和平均数在计算时,需要先将各数据取倒数平均,然后再取倒数,所以又称为倒数平均数。计算公式如下:(三)调和平均数的应用在心理与教育研究方面的应用,主要是用来描述学习速度方面的问题。调和平均数作为一种集中量数,在描述速度方面的集中趋势时,优于其他集中量数。在有关研究学习速度的实验设计中,反应指标一般常取两种形式:(1)工作量固定,记录各被试完成相同工作所用的时间。(2)学习时间一定,记录一定时间内各被试完成的工作量。例题例3-14例3-15在一个学习实验中,统计了6名被试在3小时的解题量,依次为24题、21题、18题、15题、12题、9题。试问这6名被试平均每小时解多少道题?例3-10欲研究介于S1与S2两感觉之间的感觉的物理刺激是多少,随机抽取10名样本,让其调节一个可变的物理量的刺激,使所产生的感觉恰好介于S1与S2之间,然后测试这个物理量,结果如下:5.7、6.2、6.7、6.9、7.5、8.0、7.6、10.0、15.6、18.0。问介于S1与S2两感觉之间的感觉的物理刺激是多少?写在最后写在最后成功的基成功的基础在于好的学在于好的学习习惯The foundation of success lies in good habits56 结束语当你尽了自己的最大努力时,失败也是伟大的,所以不要放弃,坚持就是正确的。When You Do Your Best,Failure Is Great,So DonT Give Up,Stick To The End演讲人:XXXXXX 时 间:XX年XX月XX日
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!