描述性统计分析SPSS应用.ppt

上传人:za****8 文档编号:16590324 上传时间:2020-10-16 格式:PPT 页数:99 大小:712.50KB
返回 下载 相关 举报
描述性统计分析SPSS应用.ppt_第1页
第1页 / 共99页
描述性统计分析SPSS应用.ppt_第2页
第2页 / 共99页
描述性统计分析SPSS应用.ppt_第3页
第3页 / 共99页
点击查看更多>>
资源描述
第二章 描述性统计分析 主要内容 统计分析和研究的特点 单变量的描述性统计 频数分析 描述性分析 探索性分析 一、统计分析和研究的特点 大量观察、建立数据库 描述统计:用统计学来简化数据,描 述特征和关系。 推论统计:用统计学可以从局部(样 本)来推论总体的情况。 二、单变量的基本描述技术 一般来说,原始的资料往往是杂乱无章 的。零散地分布在问卷和文献中,因此 必须对资料进行加工 对资料的加工和分析从单变量的分析开 始。 单变量的特征包括分布、统计表和统计 图 分布特征如何? 频数 (Frequency) 百分比( percent) 对比值 (ratio) 累计频数( Cumulative Frequency) 累计百分比( cumulative percent) 基本技术之统计表 表号 在文章中便于查阅、引用。 表头,包括标题、时间和地点 纵栏标题 横行标题 总计行 (一)定类层次 1.频数与频数分布 (1).频数 (frequency):也称次数,它是归属各类 别的个案数。 (2) 频数分布 (frequency distribution):把各 个类别及其相应的频数全部列出,并用表格形 式表示出来,就是频数分布。这个表格就是频 数分布表。 频数分布表通过对原始资料的初步简化,可 以简洁明了地反映原始数据的情况。但是因 为样本规模的不同,通常不能直接用来比较 信息,为什么? 2.百分比 (percent):频率 社会统计中通常用百分比来表示,绘制的表格一 般是百分比表,但表的最下一行一般要注明频 数。 上表 1中,已婚者与各机关人数的比例分别是: 甲机关: 乙机关: 甲、乙机关已婚者所占的百分比分别是 65.0%和 57.1%, 1 130 0.650 200p 2 200 0 .5 7 1 350p 如果只看次数,乙机关已婚者远高于甲机关, 但从百分比来看,甲机关已婚的比例则较大。 频数分布表是不同类别的绝对数量的分布情况, 百分比分布表则是不同类别在总体中的相对数 量分布,因此,百分比分布除具备频数分布的 特点外,还可以十分方便地进行不同总体或不 同类别之间的比较,应用更为广泛。 3. 对比值 (ratio):不同类别数值之间的比 值,用 x:y的形式表示 如出生性别比为 105:100,则表示每出生 100个女孩则有 105个男孩出生 某班男女生比率为 3: 5 (二)定序层次:累积频数和累积频率 累积频数 (cumulative frequencies): 将各有序类别或组的频数逐级累加起来。 累积频率 (cumulative percentages): 就是将各有序类别或组的百分比逐渐累加 起来。 作用:使我们容易知道某值以下或以上的次 数或百分比之和 (1)向上累积 : 从类别顺序的开始的一方向类别顺序的 最后一方累加频数(由低级向高级水平的加和) (2)向下累积 从类别顺序的最后一方向类别顺序的开始的一 方累加频数。(由高级或大数值一方向低级或 较小数值一方的累加) 如:某校学生的家庭月收入 收入 (元 ) f Cf Cf 500-699 10 10 550 700-899 65 75 540 900-1099 126 211 475 1100-1299 158 369 339 1300-1499 141 510 181 1500-1699 40 550 40 总数 550 (三 )定距层次 :分组与组距 1、分组是根据统计研究的需要,将数据按照某种 标准化分成不同的组别,分组后再计算出各组 中出现的频数或频率,形成一张统计分析表。 ( 1)组限:每组的范围, 包括上限( Upper limit)和下限( lower limits) 如 100-200,下限就是 100,上限就是 200 ( 2)分组遵循的两大原则 “ 不重不漏 ” 的原则 “ 不重 ” 是指一项数据只能分在其中的某一组,不能 在其他组中重复出现。 “ 不漏 ” 是指组别能够穷尽,及在所分的全部组别中 某项数据都能分在其中的一组,不能遗漏。 “ 上组界不包括在内 ” 的原则 ( 3)组距:是一个组的上限与下限的差 , 可根据全部数据的最大值和最小值及所分的 组数来确定 组距 =(最大值 -最小值 )/组数 组距 =真实上限 -真实下限 (李沛良书 p41-42) 数据的分组,通过 “ transform”“recode”命令 完成 ( 4)组中值:处于一组中间位置的值 真实上限与真实下限的平均值 组中值 =(上限 +下限) /2 如, 100-200, 200-300, 300-400分组 数据的组中值: 150, 250, 350 那么 100-199, 200-299, 300-399分组 的组中值是多少? 基本技术之统计图 饼图 未婚 30% 已婚 65% 离异或丧偶 5% 未婚 已婚 离异或 丧偶 条形图 60 130 10 0 50 100 150 1 离异或丧偶 已婚 未婚 60 130 10 0 50 100 150 未婚 已婚 离异或丧偶 直方图 直方图是以长条的面 积(长与宽的乘积) 来表示频数或相对频 数;条形的长度,即 纵轴高度表示单位组 距所含有的所有频数 或相对频数的密度。 仅适用于定距及以上 层次的变量 折线和曲线图 0 2 4 6 8 10 12 14 6000 5000 4500 3000 2500 2000 1800 1600 1500 定距变量资料分布常用曲线 J形曲线 U形曲线 峰状曲线 对称与不对称曲线 注意:适用于较低测量层次的统计法,也适 用于较高的层次。 图形也同样:饼图主要是用于定类变量 条形图主要是用于定序变量;直方图、折线图 等主要是用于定距变量 练习:城镇自杀率的分组次数分布 自杀率 次数 组中值 向上累积次数 3-5 12 6-8 35 9-11 81 12-14 52 15-17 30 18-20 7 21-23 9 23-26 3 合计 229 三、集中趋势测量 用分布来研究单变量是最全面的分析方 法 在很多情况下,我们只要了解其大概或 分布的主要特征以便简化资料。于是就 产生了 用某一个典型的变量值或特征值 来代表全体变量 的问题,这个典型的变 量值或特征值就是 集中值或集中趋势 。 统计分析 首先要解决的问题,就是寻求 一个简单数值以代表搜集所得的资料。 下面是一个小故事: 一个人到某公司求职,经过调查,得出 关于该公司工资的一些数据,如果是你 ,应该如何选择? 挠头的数值 公司员工的月薪如下: 员工 经理 副经 理 职员 A 职员 B 职员 C 职员 D 职员 E 职员 F 职员 G 月薪 (元) 6000 4000 1700 1300 1200 1100 1100 1100 500 我们有三种方法选择集中趋势: ( 1)根据频数:哪个变量值出现次数越 多,就选择哪个变量值,比如民主决策的表决 机制。 ( 2)根据居中:比如一个城镇居民的生活 水平,居中的是小康家庭,那么就用小康家庭 来代表该城镇的生活水平。 ( 3)根据平均:用平均数来代表变量的 平均水平。 关于集中趋势的一个故事 吉斯莫先生有一个小工厂,生产超级小 玩意儿。 管理人员由吉斯莫先生、他的弟弟、六 个亲戚组成。工作人员由 5个领工和 10个 工人组成。工厂经营得很顺利,现在需 要一个新工人。 现在吉斯莫先生正在接见萨姆,谈工作 问题。 吉斯莫:我们这里报酬不错。平均薪金 是每周 300美元。你在学徒期间每周得 75 美元,不过很快就可以加工资。 萨姆工作了几天之后,要求见厂长。 萨姆;你欺骗我!我已经找其他工人核 对过了,没有一个人的工资超过每周 100 元。平均工资怎么可能是一周 300元呢? 吉斯莫:啊,萨姆,不要激动。平均工 资是 300元。我要向你证明这一点。 吉斯莫:这是我每周付出的酬金。我得 2400元,我弟弟得 1000元,我的六个亲 戚每人得 250元,五个领工每人得 200元, 10个工人每人 100元。总共是每周 6900 元,付给 23个人,对吧? 萨姆:对,对,对!你是对的,平均工 资是每周 300元。可你还是蒙骗了我。 吉斯莫;我不同意!你实在是不明白。 我已经把工资列了个表,并告诉了你, 工资的中位数是 200元,可这不是平均 工资,而是中等工资。 萨姆:每周 100元又是怎么回事呢? 吉斯莫:那称为众数,是大多数人挣 的工资。 吉斯莫:老弟,你的问题是出在你不 懂平均数、中位数和众数之间的区别。 萨姆:好,现在我可懂了。我 我 辞职! 描述集中趋势的统计量 Mean(均值) Median(中位值) Mode(众值) (一)均值(定距变量) 1. 对于未分组资料 例 求 74、 85、 69、 9l、 87、 74、 69这些数 字的算术平均数。 解 78.4 N X X N X X 7 69748791698574 2. 对于分组资料 很显然,算术平均数不仅受各变量值 (X)大小的影 响,而且受各组单位数 (频数 )的影响。由于对于总体的影 响要由频数 ( f )大小所决定,所以 f 也被称为权数。值得 注意的是,在统计计算中,权数不仅用来衡量总体中各标 志值在总体中作用,同时反映了指标的结构,所以它有两 种表现形式:绝对数(频数)和相对数(频率)。 PXffXX 例 求下表 (单项数列 )所示数据的算术平 均数 。 人口数( X) 户数 (f) 频率 (P) 2 3 4 5 6 7 8 5 8 16 10 6 4 1 0.10 0.16 0.32 0.20 0.12 0.08 0.02 合计 50 1.00 对于 组距数列 ,要用每一组的组中值权充该 组统一的变量值。 例 求下表所示数据的算术平均数 fXfX 间距 频数( f) 组中值( X) 148152 152156 156160 160164 164168 168172 172176 176180 180184 184188 188192 192196 1 2 5 10 19 25 17 12 5 3 0 1 150 154 158 162 166 170 174 178 182 186 190 194 合计 100 3. 算术平均数 的性质 各变量值与算术平均数的离差之和等于 0。 各变量值对算术平均数的平方和,小于它们对任 何他数偏差的平方和 算术平均数受抽样变动影响较小。 分组资料如遇有开放组距时,不经特殊处理 不能进行算术平均数的计算。 受极端值影响较大。 (二)中位值(定序变量、定距 变量) 定义:第 50百分位数上的值,即有 50% 的观察点落在这个值之下。 根据原始资料求中位值 :将各个案由低 至高排列起来,居于序列中央位置的个 案的值即为中位值。 观察总数为奇数: Md= (N+1)/2 当观察总数为偶数:将位于最中央位 置的两个数值的平均值作为中位值 。 1. 对未分组资料 (1)、先把所有数据按大小顺 序排列,如果总体单位数为 奇数,则取第( N+1) /2 位上 的变量值为中位数 ; ( 2)、如果总体单位数为偶 数。因为居中的数值不存在, 按惯例,取第 N/2位和第 ( N+1) /2 位上的两个变量值 的平均作为中位数。 例 求 54, 65, 78, 66, 43这些数字的中 位数。 例、求 54, 65, 78, 66, 43, 38 这些数字 的中位数。 你会吗? 2. 对于分组资料: ( 1)单项数列 根据 N/2在累计频数分布中找到中位数所在组, 该组变量值就是 Md 。 中 位 数 X f F 3 3 3 4 9 12 5 25 37 6 34 71 7 20 91 8 7 98 9 1 99 10 1 100 合计 100 ( 2)组距数列 ( 2)组距数列 按中位数所在组的下限: 按中位数所在组的上限: hf FNLM m m d 12/ 当根据组距数列求中位数时,要采用所谓的比 例插值法:先根据 N 2在累计频数分布中找到中位 数所在组,然后假定该组中各变量值是均匀分布的, 再用以下任何一种方法求出中位数 (注意:此处用 的是向上累计 )。 h f NFUM m m d 2/ 例 某年级学生身高如下,求中位数 组距 f F 150156 3 3 156162 9 12 162168 25 37 168174 34 71 174180 20 91 180186 7 98 186192 1 99 192198 1 100 合计 100 解 第一种方法 168 6 171 12(厘米 ) 25 372/100 25 372/100 请你用第二种方法 来做一下 hf FNLM m m d 12/ 3. 中位数的性质 (1)各变量值对中位数之差的绝对值总和, 小于它们对任何其他数的绝对值总和。 (2)中位数不受极端值的影响。 (3)分组资料有不确定组距时,仍可求得 中位数。 (4)中位数受抽样变动的影响较算术平均 数略大。 4. 四分位数 中位数所有单位被等分为两部分,因而被称为二分 位数。类似于求中位数,我们还可求出四分位数、十分 位数、百分位数。 将总体中的各单位分割成相等的四部分,则这三个 分割的变量值就是四分位数。若以 Q1、 Q2、 Q3分别代表 第一、第二、第三四分位数。 Q2 即中位数, Q1、 Q3的算 法分别是 3 3 3 33 4/3 h f FNlQ 1 1 1 11 4/ h f FNlQ 请从下表中指出第一四 分位数和第三四分位 数 X f F 3 3 3 4 9 12 5 25 37 6 34 71 7 20 91 8 7 98 9 1 99 10 1 100 合计 100 求出下表中的第一四分位数和第三四分数 组距 f F 150156 3 3 156162 9 12 162168 25 37 168174 34 71 174180 20 91 180186 7 98 186192 1 99 192198 1 100 合计 100 (三) 众数 (Mode) 众数是在一组资料中,出现次数 (或频 数 )呈现出“峰”值的那些变量值,用 Mo表 示。 众数只与次数有关,可以用于定类、 定序、定距、定比资料。 1. 对于未分组资料 直接观察 首先,将所有数据顺序排列;然后,只要 观察到某些变量值 (与相邻变量值相比较 )出现 的次数 (或频数 )呈现“峰”值,这些变量值就 是 众数。 2. 对于分组资料 单项式: 观察频数分布 (或频率分布 ) 组距式: Lo为众数组下限; 为众数组频数与前一组频数之差; 为众数组频数与后一组频数之差; ho为众数组组距。 oo hLM 21 1 人口数( X) 户数 (f) 频率 (P) 2 3 4 5 6 7 8 5 8 16 10 6 4 1 0.10 0.16 0.32 0.20 0.12 0.08 0.02 合计 50 1.00 求下表中的众数 众 数 求下表中的众数 组距 f F 150156 3 3 156162 9 12 162168 25 37 168174 34 71 174180 20 91 180186 7 98 186192 1 99 192198 1 100 合计 100 (1) 众数仅受上下相邻两组频数大小的影响,不受极 端值影响,对开口组仍可计算众数; (2) 受抽样变动影响大; (3) 众数不唯一确定。 (4) 众数标示为其峰值所对应的变量值,能很容易区 分出单峰、多峰。因而具有明显偏态集中趋势的频数分 布,用众数最合适。 3. 众数的性质 四、离散趋势测量 所谓离散趋势,是指数列中各变 量值之间的差距和离散程度。离势小, 平均数的代表性高;离势大,平均数代 表性低。 例如有 A、 B、 C三组学生各 5人的成绩 如下: A组: 60 , 60, 60, 60, 60 B组: 58, 59, 60, 61, 62 C组: 40, 50, 60, 70, 80 数据显示,平均数相同,离势可能不 同;平均数不同,离势可能相同。 描述离散趋势的统计量 异众比 极差 四分位差 方差 标准差 1、 Variation ratio(异众比) 界定:异众比也称离异比率,一般用异 众比来反映不同于众值的数在全体数值 中所占的比例,用于测量定类变量的离 散趋势。 计算公式: 异众比 =( N众值的频次) /N 2、 Range(极差) Range 也称全距或范围,即最大值与 最小值之间的距离,显示的是数据分布 的范围,但对于中间部分数据怎么变化, 则不能推知,此外,它受极端值的影响 大。 3、四分位差:适用于定序变量 界定:也叫四分位数偏差或四分互差。 通常数据按从小到大的顺序排列后,用三个四分位 数点 Q1、 Q2、 Q3将其分成四部分。 Q1是第 25百分位数 点或叫低四分位数点; Q2是第 50百分为位数点即中位 数; Q3是第 75百分位数点或叫高四分位数点。四分位 差规定为 Q1和 Q3之间的距离。 计算公式: Q= Q3 Q1 Q越大,表示有 50%的个案的分布越是远离中位值,中 位值的代表性就越小,以中位值作为估计或预测的效果 就越差。 Q越小,说明数据比较集中在中位值附近 4、 Variance(方差): 适用于定距变量 方差(观察值均值)的平方和 /n 一般方差越大,说明观察值离平均值的 距离越远,数据的离散程度也越大。 5、 Std.deviation(标准差) Std.deviation为 Standard Deviation的 简写,表示以均值做估计或预测变量时 所犯错误的大小。 总体的标准偏差 =根号 (观察值均值) 的平方和 /n SPSS应用 频数分析 描述性分析 探索性分析 频数分析 1频数分析目的和主要功能 频数就是一个变量在各个变量值上取值 的个案数,基本统计分析往往从频数分析开始。 通过频数分析能够了解变量取值的状况,对把 握数据的分布特征是非常有用的。 例如,调查消费者拥有数码产品的数量, 首先分析受访者的总人数、家庭收入情况、受 教育程度、性别等,获取样本是否具有总体代 表性、抽样是否存在系统偏差等信息。这些可 以通过频数分析来实现。 经过频数分析可以得到如下结果: ( 1)频数分布表:该表中包含频数、各频数 占总样本数的百分比、有效百分比、累计百分 比。 ( 2)统计图:用统计图形展示变量的取值状 况,频数分析中提供的统计图形可以是条形图、 饼图或者直方图。 2 频数分析过程的操作界面 ( 1)候选变量框 列出数据文件中所有的变量 ( 2) Variables框 从候选变量框中选择要分析的变量 移入此框中,可同时选择多个变量, 此时, SPSS就将分别产生多张 频数表或统计图形。 ( 3) Display frequency tables复选框 此复选框设置是否显示频数表, 系统默认选中,表示要显示频数表。 图 2-1 2频数分析过程的操作界面 ( 4) Statistics按钮 单击该按钮会弹出新的对话框, 该对话框主要用于确定将要在 输出结果中出现的统计量, 选中统计量前的复选框表示 输出该统计量。 ( 5) Charts按钮 用于确定将输出的图形类型 和图形取值。 ( 6) Format按钮 定义输出频数表的格式 图 2-1 3实例分析 【 例 1】 以下是调查问卷中针对被调查人设置的两个问题: 1、 您的家庭月收入大约是: ( 请包括所有工资 、 奖金 、 津 贴等在内 , 以人民币为单位 ) 单选 500-1000 .1 1000-1999 2 2000-2999 3 3000-3999 4 4000-4999 5 5000-5999 6 6000-6999 7 7000-7999 8 8000-8999 9 9000-9999 10 10000及以上 11 2、 您的教育程度: ( 指您受过的最高或正在接受的教育程 度 ) 单选 没有受过正式教育 /小学 .1 初中 2 高中 /中专 /技校 3 大专 /大学非本科 /高职高专 4 大学本科 5 研究生及以上 .6 从问卷中收集到的数据如表 2.1所示 3实例分析 试对收集到的数据进行频数分析 家庭月收 入 受教育程 度 3 5 1 5 2 5 1 5 1 5 6 4 10 5 4 5 表 2.1 3实例分析 第 1步 数据组织; 根据表 2.1生成 SPSS数据文件,建 2个变量:“收入”、“教 育”。 第 2步 打开主对话框; 选择 Analyze Descriptive Statistics Frequencies ,打开 同图 2-1一样的频数分析主对话框。 第 3步 确定要输出的统计量; 单击 Statistics 按钮,在 Statistics子对话框中选择 Mode(众 数)统计量。 第 4步 确定要输出的统计图形; 单击 Charts 按钮,在 Charts子对话框中选择 Histograms (直 方图) 运行结果及分析。 3实例分析 Frequ ency Perc ent Valid Percent Cumulativ e Percent Valid 1 8 1.0 1.0 1.0 2 39 4.7 4.7 5.6 3 114 13.6 13.7 19.3 4 165 19.7 19.8 39.0 5 456 54.5 54.6 93.7 6 53 6.3 6.3 100.0 Tot al 835 99.9 100.0 Miss ing Sys tem 1 .1 Total 836 100.0 图 2-2 变量“教育”的直 方图 表 2.2 变量“教育”的频数分布 表 描述性分析 1描述性分析目的和主要功能 描述性分析主要用于输出变量的各类描述性 统计量的值,通过上一节的学习可知,频数 分析同样可以做到,都是以计算数值型单变 量的统计量为主。描述性统计分析没有图形 功能,也不能生成频数表,但描述性分析可 以将原始数据转换成标准正态评分值,并以 变量形式存入数据文件中,以便后续分析时 应用。 2描述性分析的操作界面 列出数据 文件中的变 量,从中选 择要作描述 性分析的变 量 将需作描述性分析 的变量选入此框中, 可同时选择多个变量, 此时, SPSS就将分 别产生多个变量的描 述性分析结果 点击 Option 按钮设置需计 算的描述性统 计量。 图 2-3 3实例分析 【 例 2】 选择“身高”变量作描述性分析,选定要计算的统计量后, 运算得到表 2.3所示的结果 表 2.3 N Minimu m Maxim um Mean Std. Deviati on Skewness (偏度) Kurtosis (峰度) Statis tic Statistic Statisti c Statis tic Statisti c Statisti c Std. Error Statisti c Std. Error 身高 96 99.3 125.0 109.8 91 5.9633 .350 .246 -.446 .488 Valid N (listwis e) 96 探索性分析 1探索性分析目的和主要功能 与前面介绍的两种分析方法相比 , 探索性分析更加强大 , 它是对数据的探索和考察 , 可以对变量进行更为深入详尽的 统计分析 。 在进行统计分析前 , 通常需要寻求和确定适合所 研究的问题的统计方法 , SPSS提供的探索性分析是解决此 类问题的有效办法 。 探索性分析提供了很多关于数据的 概括分析 和 图表直观 描述 的方法,不仅对个案数据有效,而且还可以针对分组个 案。在输出常用描述性统计量的基础之上,探索性分析增加 了有关 数据详细分布特征 的文字与图形表述,如茎叶图、箱 图等,显得更加详细、完整,还可以以方差齐性为目的的变 量交换提供线索, 有助于用户制定更进一步分析的方案。 2探索性分析的操作界面 ( 1) Depend List框 选择待分析的变量,可以 同时选择多个变量。注意: 选择的变量必须是数值型 变量 ( 2) Factor List框 选择分组变量,根据该变 量的取值不同,分组分析 Dependlist框中的变量。 可以不选,也可以多选。 ( 3) statistics按钮:设 置输出的统计量; Plots按钮:设置输出的图 形; Option按钮:设置缺失值 的处理。 图 2-4 3实例分析 【 例 3】 表 2-4是 2007年各地区人口出生率和死亡率的统计数据, 试对其作探索性分析并做是否服从正态分布的检验。 表 2-4各地区人口自然变动情况 出生率 6.26 7.67 12.82 11.48 9.87 6.40 7.67 7.57 7.47 9.36 10.29 死亡率 4.97 6.07 6.59 5.73 5.91 5.30 5.00 5.18 5.89 7.08 5.42 出生率 9.08 11.92 11.78 14.44 14.59 9.90 9.14 13.97 13.20 17.40 10.19 死亡率 5.95 6.73 4.49 6.10 5.73 6.50 6.28 6.71 6.30 5.70 6.15 出生率 12.60 12.00 13.80 11.60 11.59 12.86 15.24 15.53 15.79 死亡率 6.30 5.75 6.01 6.10 6.27 6.62 6.27 4.84 5.03 3实例分析 第 1步 数据组织; 根据表 4.4生成 SPSS数据文件,建 2个变量:“出生 率”、“死亡率” 第 2步 打开主对话框; 选择 Analyze Descriptive Statistics Explore ,选择 变量“出生率”、“死亡率”移入“ Dependent List”文 本框中。 3实例分析 第 3步 确定探索性分析的描述统计量; 单击 Statistics 按钮,在 Statistics子对话框(图 4-5)中 选择 Descriptives 复选框、 M-estimators复选框,单击 Continue返回主对话框。 图 2-5 3实例分析 第 4步 确定探索性分析输出的统 计图形; 单击 Plots 按钮,在如图 2- 6的 Plots子对话框中选择 “ Dependents together”(不同 因变量显示在一个箱图中)、 “ Stem-and-leaf”(茎叶图)、 Normality Plots with tests(正态 分布检测统计图)。单击 Continue返回主对话框。 图 2-6 3实例分析 结果分析 表 2-5 描述性统计量 3实例分析 结果分析 表 2-6 M估计值 3实例分析 结果分析 分别利用 Kolmogorov-Smimov检验和 Shapiro-Wilk检验两种方法 来确定变量是否服从正态分布。其中, Statistic表示检验统计量的值, df代表自由度, Sig.表示显著性水平。一般来说, Sig.0.05则代表接 受零假设,即接受变量服从正态分布的假设。本例中,两个变量的 两种方法的 Sig.值均大于 0.05,因此两个变量均服从正态分布。 表 2-7 正态检验结果 3实例分析 结果分析 图 2-7 箱图 3实例分析 结果分析 图 2-8 出生率 QQ趋势图 Q-Q图可以用来检验数据是 否服从某种分布,在 Q-Q图 中,检验数据是否较好地服 从给定分布的标准有两个: 看 Q-Q图上的数据点与直 线的重合度; Q-Q趋势图 上的点是否关于直线 Y=0在 较小的范围内上下波动。 4.4 探索性分析 3实例分析 结果分析 图 2-9 出生率 QQ图 3实例分析 结果分析 茎叶图利用原始数据以图形的 形式表现了分布的形状,图中包括 频数( Frequency)、茎( Stem) 和叶( Leaf) 3部分 ,右图中 的下 方说明中给出了本图的茎宽为 10, 每片叶子代表一个数据。对应图中 的第一行数据,从左到右依次为: 频数为 6,茎为 0,有 6片叶子。也 就是指第一组里包含 6个数据,其 近似值为: 6、 6、 7、 7、 7、 7 图 2-10 出生率茎叶图 出生率 Stem-and-Leaf Plot Frequency Stem & Leaf 6.00 0 . 667777 5.00 0 . 99999 7.00 1 . 0011111 7.00 1 . 2222333 5.00 1 . 44555 1.00 1 . 7 Stem width: 10.00 Each leaf: 1 case(s)
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!