资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,次数分布表,简单次数分布(frequency distribution)表,相对次数(relative frequency)分布表,累积次数(cumulative frequency)分布表,大于制与小于制,累积相对次数分布表,次数分布表简单次数分布(frequency distribu,1,次数分布表,某学校学生人数按性别分类,性别,人数,百分比,男生,2000,40,女生,3000,60,总和,5000,100,次数分布表某学校学生人数按性别分类性别人数百分比男,2,次数分布表,妙峰山圣母灵签次数分布表,事件,次数,事件,次数,事件,次数,事件,次数,婚姻,51次,行人,34次,求财,18次,田蚕,14次,疾病,49次,胎产,26次,求官,18次,见贵,43次,词讼,24次,经营,17次,谋事,37次,失物,18次,宅舍,13次,次数分布表妙峰山圣母灵签次数分布表事件次数事件次数事件次数事,3,次数分布表,某学校一年级学生语言能力测验得分次数分布表,分数,人数,百分比,低于20分,20-39,40-59,60-69,70-79,80-89,90-99,100,10,30,40,51,70,54,40,5,3.33,10.00,13.33,17.00,23.33,18.00,13.33,1.67,总和,300,100,次数分布表某学校一年级学生语言能力测验得分次数分布表分数,4,某班级智商测验结果,学号,得分,学号,得分,学号,得分,1,2,3,4,5,6,7,8,9,10,103,114,129,105,103,97,102,108,102,87,11,12,13,14,15,16,17,18,19,20,107,85,110,94,108,92,113,108,122,107,21,22,23,24,25,26,27,28,29,30,119,98,95,118,88,94,105,102,97,108,某班级智商测验结果学号得分学号得分学号得分110311107,5,制作步骤,求全距,全距指的是全部观察值中最大值与最小值之差。,R,=12985=44。,决定组数和组距。,一般不少于5组,也不要超过15组。,组距指的是每一个组内包含的距离(用,i,表示),斯特奇斯(H.A.Sturges)根据经验公式:,本例将,N,=30代入,得,i,=7.45,将组距调节为10,即每10分为一个组。组数:44/10=4.4,应该分5组。,决定组限,组限就是每一组的起点值和终点值。,登记次数,制作步骤求全距,6,次数分布图,简单次(频)数分布图,相对次数分布图,累积次数分布图,累积相对次数分布图,次数分布图简单次(频)数分布图,7,简单次数分布图直方图(histogram),简单次数分布图直方图(histogram),8,简单次数分布图次数多边图(line graph),简单次数分布图次数多边图(line graph),9,次数多边图的优点,次数多边图的优点,10,累积次数分布图,累积次数分布图,11,累积相对次数分布图,累积相对次数分布图,12,散点图(scatter plot),散点图(scatter plot),13,轮廓图(profile chart),轮廓图(profile chart),14,雷达图(radar chart),雷达图(radar chart),15,脸谱图(face graph),脸谱图(face graph),16,常用统计指标,集中量,算术平均数,中位数,众数,加权平均数,几何平均数,调和平均数,差异量,全距,平均差,方差与标准差,相对差异量,差异系数,偏态量,峰态量,常用统计指标集中量差异量,17,集中量,集中量(measures of central tendency)是代表一组数据典型水平或集中趋势的量。它能反映频数分布中大量数据向某一点集中的情况。,集中量包括算术平均数、加权平均数、几何平均数、调和平均数、中位数、众数等。,集中量集中量(measures of central ten,18,算术平均数,算术平均数(arithmetic mean)是所有观察值的总和除以总频数所得之商,简称为平均数或均数。,算术平均数算术平均数(arithmetic mean)是所有,19,算术平均数的优点,反应灵敏;,严密确定,简明易懂,计算方便;,适合代数运算;,受抽样变动的影响较小;,样本算术平均数是总体平均数的最好估计值,算术平均数的优点反应灵敏;,20,算术平均数的缺点,易受两极端数值(极大或极小)的影响;,某村农户收入状况,120,127,130,131,132,132,135,136,137,139,140,145,146,149,153,158,160,320,400,平均数162.63,一组数据中某个数值的大小不够确切时就无法计算其算术平均数。,算术平均数的缺点易受两极端数值(极大或极小)的影响;,21,中位数,中位数(median)是位于依一定顺序排列的一组数据中央位置的数值,在这一数值上、下各有一半频数分布着。,中位数的原始数值计算方法:,12 14 15 15 17 18 20 23 24:17,12 14 15 15 17 18 20 23 24 25:17.5,中位数的应用及其优缺点,中位数中位数(median)是位于依一定顺序排列的一组数据中,22,中位数的应用及其优缺点,中位数虽然也具备一个良好的集中量所应具备的某些条件,例如比较严格确定、简明易懂,计算简便,受抽样变动影响较小,但是它不适合进一步的代数运算。它适用于以下几种情况:,一组数据中有特大或特小两极端数值时;,一组数据中有个别数据不确切时;,资料属于等级性质时。,中位数的应用及其优缺点中位数虽然也具备一个良好的集中量,23,众数,众数(mode)是集中量的一种指标。,对众数有理论众数及粗略众数两种定义方法,理论众数是指与频数分布曲线最高点相对应的横坐标上的一点。,粗略众数是指一组数据中频数出现最多的那个数。,众数众数(mode)是集中量的一种指标。,24,粗略众数的计算方法,可以用观察法直接寻找一组数据中频数出现最多的那个数,就是粗略众数;,也可以将频数分布表中频数最多的组的组中值作为粗略众数。,粗略众数的计算方法可以用观察法直接寻找一组数据中频数出现最多,25,众数的优缺点,众数虽然简明易懂,但是它并不具备一个良好的集中量的基本条件。它主要在以下情况下使用:,当需要快速而粗略地找出一组数据的代表值时;,当需要利用算术平均数、中位数和众数三者关系来粗略判断频数分布的形态时;,利用众数帮助分析解释一组频数分布是否确实具有两个频数最多的集中点时。,众数的优缺点众数虽然简明易懂,但是它并不具备一个良好的,26,加权平均数,加权平均数(weighted mean)是不同比重数据(或平均数)的平均数。计算公式为:,加权平均数加权平均数(weighted mean)是不同比重,27,几何平均数,几何平均数(geometric mean)是N个数值连乘积的N次方根。计算公式为,当一个数列的后一个数据是以前一个数据为基础成比例增长时,要用几何平均数求其平均增长率。,几何平均数几何平均数(geometric mean)是N个数,28,差异量,差异量(measures of dispersion)用于表示数据的变异程度或离散程度。常用的差异量有全距、平均差、方差、标准差和差异系数等。,差异量差异量(measures of dispersion),29,全距,全距(range)指一组数据中最大值与最小值之差。,优点:概念清楚,意义明确,计算简单;,缺点:容易受极端数值的影响,反应不灵敏。,全距全距(range)指一组数据中最大值与最小值之差。,30,平均差,平均差(average deviation)就是每一个数据与该组数据的中位数(或算术平均数)离差的绝对值的算术平均数。,计算公式:,平均差平均差(average deviation)就是每一,31,方差和标准差,方差(variance)指离差平方的算术平均数,定义公式和计算公式:,方差和标准差方差(variance)指离差平方的算术平均数,32,标准差,标准差(standard deviation)是指离差平方和平均后的方根。即方差的平方根。,定义公式和计算公式:,标准差标准差(standard deviation)是,33,样本的方差与标准差,样本的方差,样本的标准差,样本的方差与标准差样本的方差,34,相对差异量(差异系数),差异系数(coefficient of variation):标准差与其算术平均数的百分比。,其计算公式为,用途:,两种单位不同,单位相同而两个平均数相差较大的资料。,相对差异量(差异系数)差异系数(coefficient of,35,地位量*,百分位数(percentile)频数分布中相对于某个特定百分点的原始分数,它表明在分布中低于该分数的个案占总频数的百分比。,中位数与四分位数(quartile),百分等级(percentile rank)频数分布中低于特定原始分数的频数百分比。,地位量*百分位数(percentile)频数分布中相对,36,百分位数,百分位数,37,百分等级,百分等级,38,偏态量(skew),偏态量(skew),39,峰态量(kurtosis),峰态量(kurtosis),40,
展开阅读全文