σ西格玛-MINITAB教程.ppt

上传人:sh****n 文档编号:6584701 上传时间:2020-02-29 格式:PPT 页数:102 大小:1.93MB
返回 下载 相关 举报
σ西格玛-MINITAB教程.ppt_第1页
第1页 / 共102页
σ西格玛-MINITAB教程.ppt_第2页
第2页 / 共102页
σ西格玛-MINITAB教程.ppt_第3页
第3页 / 共102页
点击查看更多>>
资源描述
提供 第一章Minitab概要第二章管理数据第三章操作和计算数据第四章使用数据分析和质量工具第五章基本操作示例第六章做一个简单分析第七章高级Minitab第八章质量管理和改善第九章实验设计 目录 提供 前言 MINITAB是为质量改善 教育和研究应用领域提供统计软件和服务的先导 是一个很好的质量管理和质量设计的工具软件 更是持续质量改进的良好工具软件 MINITAB统计软件为质量改善和概率应用提供准确和易用的工具 MINITAB被许多世界一流的公司所采用 包括通用电器 福特汽车 通用汽车 3M 霍尼韦尔 LG 东芝 诺基亚 以及SixSigma顾问公司 作为统计学入门教育方面技术领先的软件包 MINITAB也被4 000多所高等院校所采用 MINITAB总部位于StateCollege PA USA 美国 在英国和法国设有办事处 在世界各地拥有分销商 MINITAB包括 基础和高级统计回归和方差分析时间序列演示质量的图表模拟和分布灵活的数据导入 导出和操纵SPC StatisticalProcessControl 统计过程控制 DOE DesignofExperiments 试验设计 可靠性分析多变量分析样本量和幂计算强大的宏语言MINITAB 系统要求运行Windows r 95 98或者WindowsNT tm 4 需要16MB内存 处理器为486或以上的个人计算机 如使用486处理器 特别建议采用数学协处理器 完全安装需要35MB的硬盘空间VGA或SVGA显示器 建议最小分辨率为800X600 需要CD ROM驱动器某些功能需要使用鼠标本教材是为了配合我们LG曙光电子SixSigma活动而编写的 主要着重于对MINITAB软件包的基本操作和运用 没有深入该软件的介绍和运用 更没有跟随新版软件的升级更新 这些需要使用者自己深入钻研 提供 1 1Minitab系统操作环境简介1 2Minitab的工作步骤1 3关于Minitab的Project文件类型 第一章Minitab概要 提供 Minitab系统操作环境简介 在MINITAB里进行数据分析时 需要使用各种窗口和工具 下面是MINITAB环境下各部分的简介 各MINITAB窗口作用 会话窗口 Sessionwindow 显示诸如统计报表之类的输出文本 数据窗口 Datawindows 在此可以输入 修改数据和查看每个工作表的数据列 信息窗口 Infowindow 概括了每个打开的工作表 可以从下拉列表框中选择要查看的工作表 历史窗口 Historywindow 记录了所用过的命令 图形窗口 Graphwindows 显示各种图形 一次最多只能打开15个图形窗口 提供 Minitab的工作步骤 章节标题主要内容2数据管理在数据窗口中输入和修改数据 从文件中导入数据或将数据以文件形式保存 生成规则数据 3操作和计算数据在数据窗口中对数据列进行操作 排序 分组和生成方程式 4运用数据分析从基本的统计到质量管理 运用一系列的分析和质量工具方式 5图形数据生成 修改图形 同时打印并且用各种格式保存图形 6管理会话窗 查看输出文本 并且改变输出文本格式 打印生成报告和用各种格式保存 进行一个典型的分析往往要经过很多步骤 以下六章讲的就是与此相关的基本分析步骤 每章节主要讲了那一步的一些基本 常见的分析内容 以下是各章节的列表及内容简述 提供 打开 保存 关闭PROJECT文件 打开一个新的project文件 选择File New 按MinitabProject 再按OK 打开一个已有的project文件 选择File OpenProject 打开一个已有的projectworksheet 选择File OpenWorksheet 保存一个project文件 选择File SaveProject 关闭一个project文件 你必须打开一个新的project文件 或一个已有的project文件 或者退出 一个MINITABProject文件包含了所有的工作 收集的数据 输出的文本 图形等 当保存一个project文件时 所有的东西都保存下来了 但是一次只能打开一个project文件 Project文件里的各种工作表 data work sheet graph等 可以单独进行处理 可以生成数据 图形 也可以从别的文件中通过拷贝的形式向一个project文件添加数据和图形 Project文件里的大部分窗口的内容都能够单独保存和打印 也可以忽略某些工作表或图形 这样的话 这些工作表和图形便不会保存到project文件中去 每当保存一个project文件时 保存了以下一些内容 一 所有窗口的内容 其中包括 1 每个数据窗口 Datawindow 的数据列 2 信息窗口 Infowindow 中的常量 矩阵 3 会话窗口 Sessionwindow 和历史窗口 Historywindow 中的所有的文本 4 每个图形窗口 Graphwindow 二 通过命令File ProjectDescription生成的project文件注解 三 通过命令Editor WorksheetDescriptions生成的对每个工作表的注解 四 每个窗口的大小 位置和状态 提供 Minitab的工作步骤 在对话框中输入变量MINITAB的对话框和其他软件的对话框没什么两样 其最大的特点就是变量列表框 出现在很多对话框中 变量列表框一般显示的是一些变量列名 常量或矩阵 凡是在能够输入变量的文本框中 均可以输入这些列表框中所显示的 变量列表框的优点是可以准确无误的选择变量名 一般指数据列名 变量列表框中的内容即当前工作表的列 矩阵 变量文本框只容纳列 当光标停于其中时 左边的变量列表框仅显示数据表中的各列 提供 Minitab的工作步骤 在对话框中选择变量的几种方法 用鼠标选择一个变量1 点击需要填写变量的文本框 2 在变量列表框中用鼠标选择一个变量 然后双击此变量 用鼠标选择多个变量1 点击需要填写变量的文本框 2 点击变量列表框 3 点击某个变量 用鼠标拖画数个变量 或者按住Ctrl键点击不连续变量 4 点击Select按钮 用键盘选择一个变量1 按Tab键进入需要填写变量的文本框 2 按F2键 使得变量列表框被激活 3 使用上下箭头键 选择变量 4 再按F2键 将所选择的变量便出现在刚才被激活的文本框中了 提供 2 1数据管理概要2 2在数据窗口中输入数据2 3生成规则数据 第二章数据管理 ManagingData 提供 数据管理概要 1 数据保存在工作表中在MINITAB里 与特定的数据集有关的所有数据都包含在工作表中 一个project文件允许有许多工作表 工作表的个数取决于计算机的内存大小 一个工作表可以包含三种数据类型 数值型 numeric 文本型 text 和日期 时间 date time 型 表现形式为 数据列 columns 常量 constant 矩阵 matrices 可以在多个窗口中察看数据 但大多时候都是在数据窗口中处理数据列 2 数据的三种类型 数值型 numeric 文本型 text 日期 时间型 date time 数值型数据由数字构成 如 1 2 3 5 文本型数据由以下几种构成 字母 数字 空格和特殊字母如 Testnumber4 日期 时间型数据可以是日期 如Jan 1 2000或者3 13 1999 时间 例如 09 30 22AM 也可以是二者均有 如 5 13 200009 30 25AM MINITAB将日期和时间以数字的形式存储 但是可以选择任意一种格式来显示 3 与数据有关的三个窗口A 数据窗口 Datawindow 数据窗口中的内容即为工作表中的数据列 当打开了多个工作表时 每个工作表都有其自己的数据窗口 提供 数据管理概要 注意 数据窗口不是电子表格尽管数据窗口有行和列 但它不像EXCEL那样的电子表格 它的单元格数量是有限的 而且单元格中的数值只能手工输入或者有命令生成 它不能包含有方程式 它的值不会随其他单元格的值变化而变化 例如 想要C3 C1 C2 首先必须用计算器计算C1 C2的值 如果改变C1的值 若不用计算器再计算的话 C3的值是不会改变的 换而言之 C3不随C1变而变 在每个数据窗口里 可以 察看处于工作表中的各列数据 输入数值并以多种方式修改 对数据列进行多种操作 包括 改变格式 字体 名字 宽度 注解和列的位置 例 打开File OpenWorksheet Data MARKETD MTW 列号 列名 字母T表明是文本列 字母D表明是日期 时间列 行号 提供 数据管理概要 此窗口对当前活动工作表的数据 数据列 常量 矩阵 进行了概括 可以对这些数据进行修改 B 信息窗口 Infowindow C 会话窗口 Sessionwindow 打开File OpenWorksheet Data ACID MTW 选择菜单 Manip DisplayData 在Columns constants andmatricestodisplay框中选入Acid1Acid2 点击OK 选择Window Session便能看见会话窗口中的如下内容 DataDisplayRowAcid1Acid210 1230 10920 1090 11130 1100 11040 1090 11050 1120 105 如果是文本列 标志为T 日期列标志为D 其余列为数值型的列 如果要察看另外一个工作表的情况 可以从下拉列表框中选择一个工作表 提供 在数据窗口中输入数据 在数据窗口中的一个单元格中输入数据 只要点击一下此单元格 然后输入数据 再回车 输入数据时 该列的数据会自动格式化 当往一空列输入数据时 Minitab会给该列分配一种数据类型 数值型 文本型或者日期 时间型 如果此数据类型不是数值型 Minitab也会在列号后面添加一个标识符加以区分 D表示日期 时间型数据 T表示文本型数据 每一列单元格一般表示一个变量 提供 在数据窗口中输入数据 一 在一行 一列或者一块单元格中输入数据 1 输入一列数据a 点击数据方向箭头使之朝下b 输入数据 然后按Tab或者Enter键移动当前活动单元格 按Ctrl Enter组合键 当前活动单元格便跳到了下一列的顶部 注意 输入完一个值回车之后 当前活动单元格往下移动一格 数据方向箭头 2 输入一行数据a 点击数据方向箭头使之朝右b 输入数据 然后按Tab或者Enter键移动当前活动单元格 按Ctrl Enter组合键 当前活动单元格便跳到了下一行的顶部 注意 输入完一个值回车之后 当前活动单元格往右移动一格 数据方向箭头 提供 在数据窗口中输入数据 3 输入一块数据a 选择一块区域 使之高亮度显示 b 输入数据 当前活动单元格仅仅在所选区域内移动 c 如果要取消所选区域 可以按箭头键或者用鼠标点击数据窗口的任何地方 二 生成规则数据 可以按照一定的规则生成数据 如 按顺序生成一简单数据集或按字母顺序生成一列数据 也可以生成规则的日期 时间型数据 最常见的就是在一列中按照一定的顺序生成数据 如 从1到100的所有整数 或者介于1到50之间的所有偶数 尤其是这一列中的每个数可以重复 或者整个队列的数据也可以重复 在变量设计分析中 当输入因子水平时 将数据或序列反复多次是非常有用和简便的 提供 在数据窗口中输入数据 1 生成简单的数字集1 选择菜单 Calc MakePatternedData SimpleSetofNumbers 2 在Storepatterneddatain的文本框中 输入数据列名 此列既可以是新的列 也可以是已经存在的列 此列用来保存所生成的数据 3 在Fromfirstvalue 起始值 Tolastvalue 最终值 和Instepsof 步长 即增量 文本框中输入数字 4 若有必要 也可以在Listeachvalue 每个值显示的次数 和Listthewholesequence 显示整个编列的次数 文本框中输入一个数字 2 生成规则数据的几个例子 结果 从1到100的所有整数 Fromfirstvalue Tolastvalue Instepsof Listeachvalue Listthewholesequence 1 100 1 1 1 从10到1的所有偶数 10 1 2 1 1 1 0 5 0 4 0 3 0 2 0 1 0 5 0 1 0 1 1 11111222223333344444 1 4 1 5 1 11223344551122334455 1 5 1 2 2 提供 3 1改变列的数据类型和格式3 2归类数据并生成相应的子工作表3 3叠加列3 4对数据进行替换3 3使用计算器 第三章操作和计算数据 提供 改变列的数据类型和格式 进行分析之前 有时需要重新组织和安排输入到MINITAB里的数据 如 移动或者删除行和列 将一种数据类型转换成另一种数据类型 或者控制数据窗口中数据的显示方式 还可以基于原始变量之上再创建新的变量 可以合并两列 创建列的子列 一 改变列的数据类型和格式数据有三种类型 数值型 文本型 日期 时间型 一列只能包含一种类型的数据 可以给某一空列分配一种数据类型并且改变某一存在列的数据类型 一旦某一列已经有了一种数据类型的话 还可以为这列指定一种显示格式 当对此列的格式进行修改时 仅仅是改变了它的显示形式而已 并没有改变其真实值 例如 某一单元格有一个数 1 234567 如果你将其现实形式改成为只显示两位小数 数据窗口中的单元格会显示1 23 在图形窗口上那一点的显示也会为1 23 但是所有的计算都仍会使用1 234567 会话窗口的显示形式则由其所使用的分析命令语句决定 而不是数据窗口中的那种显示格式 1 改变列的数据类型 给一空列分配一种数据类型A 选择Editor FormatColumnB 选择Numeric Text 或Data Time 改变一非空列的数据类型A 选择Manip ChangeDataTypeB 选择要转换的数据类型 C 填完对话框 然后点击OK 提供 改变列的数据类型和格式 2 改变数值型和日期 时间型的格式 改变数值列中数据的小数位数A 选择一列或多列 这些列必须是空列 无格式 或者以数值型格式存在 B 选择Editor FormatColumn NumericC 选择Fixeddecimalwidth 在decimalplaces文本框中 输入小数的位数 然后点击OK 改变日期 时间列的数据显示形式单个的日期 时间数值可以是日期 时间或者二者兼有 入下列数据是有效的格式 1 1 96 3 04PM 5 23 20005 30PMA 选择一列或者多列 这些列必须是空列 无格式 或者以日期 时间型格式存在 B 选择Editor FormatColumn Date time C 从Date TimeColumnFormat文本框中 选择一种格式 然后点击OK 提供 归类并且生成相应的子工作表 二 将数据按不同类别归类并且生成相应的子工作表在一个比较大的数据集里面 经常需要对一组数据进行分析或生成图形 如 在某项调查中对女性聚焦 或聚焦于某一季度的销售额 对这些你感兴趣的数据 MINITAB能够另外生成一个子工作表来包含这些数据 可以基于某种条件来分类 或者对于指定的变量的所有组 分割一个工作表 1 按条件分类例 打开File OpenWorksheet Data MARKET MTW 可以基于一个或多个条件对数据分类 如 按两种条件创建一个子集 季度销售额大于100并且季度广告费用小于15 符合这两个条件的数据行将复到一个新的工作表 原来的工作表仍然没有变动 按条件分类A 选择Manip SubsetWorksheet Minitab自动为新工作表给一个缺省名 但是可以随意改动 按Condition 提供 归类并且生成相应的子工作表 B 在Specifywhichrowstoinclude exclude 指定哪行包括或者不包括 下面 选择Rowsthatmatch 匹配的行 然后点击Condition 条件 弹出一对话框 如图 C 在Condition一栏 输入条件方程式 例如 想要创建只包含销售额大于100的子集 只要输入Sales 100 在此 可以根据条件 选择一系列数学函数 注意 如果在Subset主对话框选择了excluderows的话 上面的方程式所生成的子集包含的数据将会是销售额不大于100的数据 提供 归类并且生成相应的子工作表 2 将一个变量按组分割成工作表在一个变量里 可以根据所有关键字将一个工作表分割成几组 例如 假设有一个关于销售额的工作表 有两列 sales这一列为一个财政季度所有的收入 Quarter这一列即为季度 1 2 3 4 如果你是基于变量Quarter来分割工作表 MINITAB会生成四个工作表 第一季度的所有数据 第二季度的所有数据 等等 原来工作表内容不变 将一个变量按组分割成工作表A 选择Manip SplitWorksheet 如果选中了includemissingasaBYlevel 假如在Byvariables文本框中的任意列含有空值 MINITAB会生成另外一个工作表 B 在Byvariables一栏 输入一列或多列 这些列即为分组条件 然后点击ok 如果选择了多列 对于这些列的每一种组合所得的数据 MINITAB都会为其生成一个新的工作表 例如 假设Year这一列有两个数据 1991 1992 Quarter这一列有四个 1 2 3 4 如果在ByVariables中选择了Year和Quarter Minitab会生成8个工作表 1991年每个季度一个工作表 1992年每个季度一个工作表 提供 叠加列 有时候需要将两列合并成一列以便用一条命令对其分析 Minitab能够快速容易的将一列数据叠加于另一列之上 你可以将叠加后的数据用另一列存储而使原来的列保持不便 当叠加列的时候 可以生成一个脚标列标明叠加后的数据是来自于哪一列 脚标还可以用于以后重新分类数据或者生成图形 在图形里数据点因来源于不同的组 显示有所不同 或者将叠加后的数据还原 叠加列A 选择Manip Stack Unstack Stack B 在Stackthefollowingcolumns中 输入想要叠加的列 输入的第一列将会处于第二列之上 第二列叠加在第三列之上 C 在Stockthestackeddatain一栏 输入一新列或者已经存在的列 输入一新列或者已经存在的列来存储脚标 提供 对数据进行替换 可以将一个值转换成另外一个值 或者是将一定范围的值转换成另一个值 也可以将一种数值型的数据转换成另一数值型的数据 例如 把1 0到1 9之间的所有数变成1 文本转换成文本 文本转换成数字或者数字转换成文本 把数字型数据编码为文本型数据A 选择Manip Code NumerictoText B 在Codedatafromcolumns一栏 输入一列或者多列 C 在Intocolumns 输入一个或者多个新的或已经存在的列 例如 假设没有叫做gender的列 当输入 gender 时 便会创建一个名称为gender的列 D 在位于Originalvalues下方的第一个文本框中 输入一个数值 或者一定范围的值 如1 12表示从1到12 E 在New下方的第一文本框中 输入想要转换成的值 F 另外 由此还可看出 一次可以转换8个数值 提供 使用计算器 使用计算器可以快速的进行基本的算术运算和复杂的数学函数计算 结果可以保存在某一列中 使用计算器A 选择Calc Calculator B 在Storeresultinvariable中 输入保存结果的列 C 在Expression中选择变量和各自的函数 也可以通过手动输入表达式 1 例 打开File OpenWorksheet Data PULSE MTW2 选择Calc Calculator3 在Storeresultinvariable中 输入pulseDif 4 在Expression中 输入算式pulse2 pulse1 例子 使用计算器对列进行计算 提供 使用计算器 5 点击OK后结果如所示 C2 C1 C9 Pulse2 Pulse1 pulseDif 1 88 64 24 2 70 58 12 3 76 62 14 4 78 66 12 5 80 64 16 6 84 74 10 7 84 84 0 提供 4 1概要4 2描述性统计4 3置信区间和平均值测试4 4相关4 5回归4 6分散分析4 7表4 8质量控制 第四章使用数据分析和质量工具 提供 概要 MINITAB提供了许多统计和图表技法来进行数据分析 常用的方法有 基本统计回归方差分析实验计划法管理图质量工具可靠度 残差分析多变量分析时间序列表非参数分析探测数据分析本章将会根据一个例子进行工序能力分析 其中包括 基本统计 描述性统计 一样本T检验 相关性回归 线性回归方差分析 One wayANOVA表 交叉表管理图 X R图 提供 描述性统计 MINITAB提供了两条命令 DisplayDescriptiveStatistics和StoreDescriptiveStatistics 这两条命令对每一列进行了计算并且将统计结果存储下来了 这些结果可以从会话窗口中显示出来 显示描述性统计结果A 选择Stat BasicStatistics DisplayDescriptiveStatisticsB 在Variables文本框中 输入想要进行分析统计的数据列 C 另外 还可以选择ByVariables 具体作用参见下例 和Graph按钮 一个描述性统计的例子假如想要对参加脉搏测试的男 sex 1 女 sex 2 学生进行统计 1 打开文件 pulse mtw 2 选择Stat BasicStatistics DisplayDescriptiveStatistics 3 在Variables一栏 输入Weight 4 选中Byvariables并且在文本框中输入Sex 然后点击OK结果如下 VariableSexNMeanMedianTrMeanStDevWeight157158 26155 00157 6118 64235123 80122 00123 7413 37VariableSexSEMeanMinimumMaximumQ1Q3Weight12 47123 00215 00145 00170 0022 2695 00150 00115 00131 00 结果解释在会话窗口中的这段文字对体重进行了描述性的统计 因为选中了Byvariables为sex 所以分别对男生 sex 1 女生 sex 2 进行了描述性统计 从结果可以看出 男生体重 mean意思为平均值 大于女生体重 mean 123 80 注意 1 ByVariables的意思是对每个关键值 如男和女 分别进行统计计算 2 Graph按钮的作用是以图形 直方图 正态曲线的直方图 点图 盒式图 boxplot 的方式表示统计结果 提供 置信区间和平均值测试 Minitab提供了一些命令计算一样本或两样本的置信区间以及进行平均值检验 工序能力包括Z test值 一样本t test值 两样本t test和配对t test Minitab也提供了概率估计和概率差别的方法 另外 当你不知道所收集的数据是否服从正态分布时 MINITAB又提供了计算置信区间和对中央值进行假设检测的方法 下面是一样本t置信区间和平均值假设检验 假设服从正态分布 的一个例子 计算t置信区间和平均值检验A 选择Stat BasicStatistics 1 SampletB 在Variables文本框中 输入包含样本的列 Minitab将对样本的每一列进行单个分析 C 以下二者中任选一项 若计算平均值的置信区间 选中Confidenceinterval 若进行假设检验 选中Testmean D 若想更进一步 还可以使用下面的选项 为置信区间指定一个置信度 缺省值为95 指定一个原假设检验值 缺省值为 0 通过选择小于 不等于 定义选择性假设 提供 置信区间和平均值测试 T置信区间的一个例子假设根据测得的样本数据 脉搏测验 想要得到平均值95 的t置信区间 1 打开文件PULSE MTW 2 选择Stat BasicStatistics 1 Samplet3 在Variables文本框中 输入Pulse1 点击OK Sessionwindow输出 TConfidenceIntervalsVariableNMeanStDevSEMean95 0 CIPulse19272 8711 011 15 70 59 75 15 结果解释根据输出结果 估计其平均值为72 87 有95 的把握认为真值落在区间 70 95 75 15 提供 相关 correlation 使用回归对成对变量计算相关系数和相关性 相关系数是衡量两个变量之间线性关系的程度 其值介于 1与 1之间 如果一个变量随另外一个变量减少而递增的话 那么相关系数为负值 相反的 如果这两个变量同时增加或同时减小 那么相关系数为正 计算两列的相关性A 选择Stat BasicStatistics CorrelationB 在Variables文本框中 输入包含测量数据的列 MINITAB便会计算两两列之间的相关性 提供 相关 correlation 相关性的一个例子假设要分析学生身高与体重的关系 1 打开文件PULSE MTW 2 选择Stat BasicStatistics Correlation3 在Variables文本框中 输入Height和Weight 点击OK Sessionwindow输出 Correlations Height WeightPearsoncorrelationofHeightandWeight 0 785P Value 0 000 结果解释根据输出结果 相关值 r 0 785 P Value 0 000 表明身高与体重正相关 提供 回归 regression 回归分析用于找出反应值 Y 与一个或者多个预测值 X 之间的关系 怎样做一个线性回归A 选择Stat Regression Regression B 在Response文本框中 输入包含反应值 Y 的列 C 在Predictors的文本框中 输入预测值 X 变量 提供 回归 regression 运行一个简单线性回归的例子假设想要找出体重与身高的关系1 打开文件PULSE MTW2 选择Stat Regression Regression3 在Response文本框中 输入WEIGHT 在Predictors中 输入Height 然后点击OK RegressionAnalysis WeightversusHeightTheregressionequationisWeight 205 5 09HeightPredictorCoefSECoefTPConstant 204 7429 16 7 020 000Height5 09180 423712 020 000S 14 79R Sq 61 6 R Sq adj 61 2 AnalysisofVarianceSourceDFSSMSFPRegression13159231592144 380 000ResidualError9019692219Total9151284UnusualObservationsObsHeightWeightFitSEFitResidualStResid972 0195 00161 872 0833 132 26R2561 0140 00105 863 6234 142 38R4072 0215 00161 872 0853 133 63R8468 0110 00141 501 57 31 50 2 14RRdenotesanobservationwithalargestandardizedresidual 结果解释P值等于0 表明体重是身高的一个显著性因子 R2等于61 6 表明此模型在反应值中所占的比率 提供 分散分析 ANOVA 分散分析 ANOVA 把比较两样本总体均值的T test扩充到比较多于两个均值的test MINITAB的ANOVA包括一次 二次或者更为复杂的ANOVA模型 等变量检验等 当按照单个变量进行分类时 一个一次ANOVA检验总体均值的相等性 下面我们举一个例子 说明当反应值数据在一列而区分总体的水平值在另一列时 怎样进行数据分析 如果你在工作表中将每个总体的数据置于不同的列 可以运用ONE WAY命令 怎样做one wayANOVAA 选择Stat ANOVA One wayB 在Response中 输入包含反应值的列 C 在Factor中 输入包含因子水平的列 一个one wayANOVA分析的例子1 打开文件PULSE MTW2 选择Stat ANOVA One way3 在反应值Response中 输入Weight 在Factor中 输入Sex 4 点击Graphs 5 选中Boxplotsofdata和Normalplotofresiduals 点击OK两次后 会话窗内容如下 提供 分散分析 ANOVA Boxplotsofdata和Normalplotofresiduals如下 结果解释分散分析输出结果和盒式图 boxplot 清楚地表明 女性和男性的体重是不一样的 F统计值比较大而p值比较小 表明男女存在统计上显著性差异 女性体重平均值的95 置信区间介限于118和130之间但是对于男性而言 95 置信区间介于155和162之间 One wayAnalysisofVarianceAnalysisofVarianceforWeightSourceDFSSMSFPSex1257552575590 800 000Error9025529284Total9151284Individual95 CIsForMeanBasedonPooledStDevLevelNMeanStDev 157158 2618 64 235123 8013 37 PooledStDev 16 84120135150165 提供 表 table 使用Minitab制表功能 可以将数据以表的形式归纳出来 或者对这些数据进行进一步的分析 也可以进行各种各样的统计 或者进行 2检验 也可以进行简单或者复杂的相应的分析 交叉表格可以显示一次 二次 多次表格数据 在这些表格里 包含常量 百分数 统计数据 例如平均 标准偏差 最大值以及相关变量 怎样创建一个统计表格A 选择Stat Tables CrossTabulation B 以下二者任选其一 对于原始数据 在Classificationvariables中 输入两到十个包含原始数据的列 对于频率数据 a 在Classificationvariables中 输入两到十个包含分类数据的列 b 选中Frequenciesarein并且输入包含频率数据的列 提供 表 table 假设你要对不同程度吸烟者的数量及各所占比率进行统计 1 打开文件PULSE MTW 2 选择Stat Tables CrossTabulation 3 在Classificationvariables中 输入Smokers和Activity 4 选中Columnpercents然后点击OK TabulatedStatistics Smokes ActivityRows SmokesColumns Activity0123All1100 0033 3331 1523 8130 432 66 6768 8576 1969 57All100 00100 00100 00100 00100 00CellContents ofCol 结果解释行表示Smokers变量 1表示经常吸烟者而2表示不常抽者 列表示水平程度 1 轻微 2 中等 3 许多 这里的0水平是因为测量者误输入 轻微抽烟者占1 3 抽烟量最大者占1 4 一个显示各列百分比的二次表的例子 提供 质量控制 B 以下二者任选其一1 如果子集处于一列 在Singlecolumn中输入数据列 在Subgroupsize中 输入子集尺寸或者子集标志列 2 如果子集处于行中 在Subgroupsacrossrowsof中输入一系列列 如果有必要 可以点击Option 可以作如下选择 如果对于 和 有一个目标值或者根据以前的数据知道这几个参数 则输入 的历史值 总体分布的平均值 和 总体分布的标准偏差 控制Minitab估计 和 值的方式 对于特殊原因做8个检验 当出现了偏移数据时 使用box cox转换 提供 质量控制 X R图的一个例子一制造车间制造金属固定件 需要估计其工序能力 目标值 2 4克 力求固件的重量变动最小 这些固件5个一包 随机选择20包画出X R图 估计他们的制造工序管理情况 1 打开文件FASTENER MTW 2 选择Stat Control harts Xbar R 3 在Singlecolumn中 输入Weights 在Subgroupsize中 输入5 4 在Historicalmean中输入2 4 点击OK TestResultsforXbarChartTEST1 Onepointmorethan3 00sigmasfromcenterline TestFailedatpoints 10 提供 质量控制 结果解释特殊原因检验表明只有一包的平均重量处于规格下限以下 低于目标值3个标准偏差 3 但是又注意到许多点落在中心线以下 表明此工序生产的固件经常低于目标值 质量工程师还得进行另外的特殊原因检验或者重估此工序 提供 5 1事例背景5 2打开一个工作表5 3从键盘输入数据5 3输入规则数据5 4描述性统计计算5 5算术运算5 6生成散点图5 7计算相关系数 第五章基本操作示例 提供 事例背景 实验背景克隆是单个基因细胞从同一个体繁衍而来 研究人员发现一种单性克隆物 生长快而且质硬的树 这些树某天也许会当作一种能源而取代传统燃料 宾夕法尼亚州立大学的研究人员在两个不同的地方 种植了一些白杨树 一个地方在小溪旁 土质肥沃 灌溉系统好 另一个地方是山地 土壤干燥 呈现沙性 他们以厘米为单位测量直径 以米为单位测量高度 然后把它烘干 测量它的重量 研究人员想知道 他们能否根据直径和高度 预测它的重量 在这一章里 你可以知道怎样 一 打开一个工作表二 输入和编辑数据三 保存数据四 基本统计计算五 数学运算六 画数据图七 计算相关系数 提供 打开一个工作表 步骤一 打开一个工作表当你打开Minitab时 便开始了一个新而且空的Project 可以通过多种方式向此Project里添加数据 但是最为普通的方式是打开一个工作表 只不过有一点要注意 打开工作表只是将数据拷贝到此Project里 对于Project里任何数据的变化都不会影响到原始数据 在这一节 使用的数据在文件POPLAR1 MTW里 1 选择文件FILE OpenWorksheet 2 找到子目录DATA 3 点击POPLAR1 MTW 打开 4 如果未见到数据窗口 按快捷键Ctrl D 这个工作表包含三个变量 分别为 Diameter Height Weight 每个变量包含15个值 到目前为止只有这么多 提供 从键盘输入数据 步骤二 从键盘输入数据到目前为止只有这么多数据 但是又从现场收集到了5行数据 需要通过键盘来输入 1 将光标放到第16行 数据窗口应当为下面式样 2 确保数据方向箭头向右 3 从左到右输入以下数据 1 522 90 074 515 270 791 182 20 033 174 930 443 334 890 52 Enter Enter Enter Enter Enter Enter Enter Enter Enter Enter Enter Ctrl Enter Ctrl Enter Ctrl Enter Ctrl Enter Ctrl 数据方向箭头 提供 输入规则数据 步骤三 输入规则数据一般是在数据窗口中通过键盘输入数据 但是当数据按照一定的规则时 还有一个简便的办法输入 现在要创建一个新的变量来标明所测数据值是来自于土壤肥沃 排水系统好的地方 记为1 还是来自于干燥多沙的地方 记为2 这个新的变量叫做Site 将包含10个 1 然后是10个 2 选择Calc MakePatternedData SimpleSetof umbers 保存数据于 在Storepatterneddatain中输入Site Minitab自动分配一个新的变量给第一个空列 在这里是C4 为了标明开始和结束顺序 在Fromfirstvalue中输入1 在Tolastvalue中输入2 既然有10个1和10个2 在Listeachvalue中 输入10 然后点击OK 新生成的数据如下 提供 描述性统计计算 步骤四 描述性统计计算Minitab提供了许多基本统计方法进行数据分析 例如描述性统计 t检验 z检验以及相关性 对于两个不同地方的树 应当分别生成统计表对三个变量Diameter Height和Weight进行说明 选择Stat BasicStatistics DisplayDescriptiveStatistics 在变量列表框中 点击Diameter然后拖曳鼠标使Diameter Height Weight高亮度显示 然后点击Select 选中Byvariable 输入Site 通过Minitab对不同地方的树在直径 高度 重量上分别生成统计结果 点击Graphs 5 选中Boxplotofdata 然后点击OK两次 提供 描述性统计计算 DescriptiveStatistics Diameter Height WeightbysiteVariablesiteNMeanMedianTrMeanStDevDiameter1102 5982 3202 6040 9162103 0283 2503 0411 284Height1104 0984 1204 1751 1032104 2554 8654 3511 254Weight1100 30900 20500 28630 25282100 3990 3800 3560 366VariablesiteSEMeanMinimumMaximumQ1Q3Diameter10 2901 0604 0902 1203 24520 4061 1804 7701 4884 053Height10 3491 8505 7303 5184 85320 3962 2005 5402 7755 143Weight10 08000 02000 78000 15750 460020 1160 0301 1100 0630 648 从盒式图 boxplot 可以判断出 地方2的树比地方1的树大 会话窗口的文本输出包含以下信息 在地方2三个变量都显示出比较大的平均值和中央值 而且 变量Weight相对其尺寸来说有一个比较大的标准偏差 在地方2 最小重量只有0 03kg而最大值是1 11kg 这表明一部分白杨树生长得很好 可是其他的仅仅只是活着而已 2 1 5 4 3 2 1 site D i a m e t e r BoxplotsofDiameterbysite 2 1 1 0 0 5 0 0 site W e i g h t BoxplotsofWeightbysite 2 1 6 5 4 3 2 site H e i g h t BoxplotsofHeightbysite 提供 算术运算 步骤五 进行算术运算现在的任务是估计树的重量 根据以前的工作 研究人员发现树的重量和直径平方与高度之积有关 手头有直径和高度的数据 利用计数器计算新的变量 计数器将输入的方程式结果计算出来并保存于指定的变量 1 选择Calc Calculator 2 将新的变量命名为D2H 表示直径的平方与高之积 在Storeresultinvariable中 输入D2H 3 在Expression中 键入C1 2 C2 点击OK 计算结果显示如下 提供 生成散点图 步骤六 生成散点图研究人员得出在重量与D2H之间存在一种关系 通过散点图 可以验证这一点 1 选择Graph Plot 2 在Y中 输入Weight 3 在X中 输入D2H然后点击OK 图形窗口输出结果 由此可以看出 Weight和D2H之间存在正的线性关系 也就是说 D2H增加的话 Weight也同样增加 图上出现了一个不正常点 有一棵树只有很小的重量 但D2H值却相当高 现在将其忽略 但以后还得进一步检查 下一步是计算这二者的相关性并且将其量化 不规则点 提供 计算相关系数 步骤七 计算相关系数从散点图知随着D2H增长 WEIGHT也同样增长 现在通过计算相关系数找出这两个变量的具体关联性 1 选择Stat BasicStatistics Correlation 2 在Variables中 输入Weight和D2H 点击OK 会话窗口输出 PearsoncorrelationofWeightandD2H 0 913P Value 0 000相关系数是两个变量之间线性关系的度量 其值介于 1和 1之间 此处 相关系数为正的0 913 接近于1 从而把散点图中所表示的关系量化了 说明变量WEIGHT和D2H之间存在很强的线性关系 提供 第六章做一个简单分析 提供 背景宾夕法尼亚州立大学的研究者们种植了成百上千的白杨树并且在一系列受控条件下让其生长 三年后 抽取一批为样本 以厘米为单位测量其直径 以米为单位测量其高度 千克为单位称其干重 前面知道 在干重与D2H之间存在相近的关系 但是到底是一种怎样的关系呢 这些快速生长 质地坚硬的树 将来某一天也许会作为燃料或者化学物质的一种选择 作为数据分析员 知道了直径和高度的测量值之后 能否可靠的预测出树的产量 步骤一 打开文件POPLAR2 MTW 步骤二 做一个简单的回归分析在上一个示例结尾 我们知道随着D2H增加 Weight也增加 由D2H的值预测Weight的一种方法是使用简单的回归命令 选择Stat Regression Regression在Response中 输入Weight 在Predictors中 输入D2H 不妨还做一系列残差分析图 以便找出潜在的问题 点击Graphs 提供 在ResidualsforPlots下 点击Standardized 在ResidualsPlots 点击Histogramofresiduals和Normalplotofresiduals 在Residualsversusthevariables下 输入D2H 点击OK两次 Minitab便显示会话窗口中的文本 三个图形 提供 RegressionAnalysisTheregressionequationisWeight 0 0196 0 00758D2HPredictorCoefStDevTPConstant0 019610 045660 430 673D2H0 00758380 00079949 490 000S 0 1298R Sq 83 3 R Sq adj 82 4 AnalysisofVarianceSourceDFSSMSFPRegression11 51551 515589 990 000ResidualError180 30310 0168Total191 8187UnusualObservationsObsD2HWeightFitStDevFitResidualStResid121261 11000 97560 07170 13441 24X15740 07000 57790 0374 0 5079 4 09RRdenotesanobservationwithalargestandardizedresidualXdenotesanobservationwhoseXvaluegivesitlargeinfluence 提供 Minitab显示了两个不规则的数据 12行和15行 进一步分析之前 首先要检查12行和15行是否包含了有效的数据 不规则点 提供 步骤三 编辑数据按键Ctrl D找到第一个不规则点 选择Editor GoTo 在Entercolumnnumberorname中 输入WEIGHT在Enterrownumber中 输入12 点击OK 在数据窗口中 光标置于12行weight单元格 可以看出 Weight和D2H看上去显得相当大 然后再检查原始记录 发现12号树生长很好 说明此数据正确 按照同样的方法 找到第15行 检查原始记录 发现这个数据错误 不是0 07 而是0 7 提供 简单的重复一下前面的菜单选择 1 首先关闭所有图形窗口 2 选择Stat Regression Regression RegressionAnalysisTheregressionequationisWeight 0 0200 0 00829D2HPredictorCoefStDevTPConstant0 019990 013651 460 160D2H0 00828970 000239034 680 000S 0 03880R Sq 98 5 R Sq adj 98 4 AnalysisofVarianceSourceDFSSMSFPRegression11 81081 81081202 890 000ResidualError180 02710 0015Total191 8379UnusualObservationsObsD2HWeightFitStDevFitResidualStResid121261 110001 064920 021420 045081 39X171070 790000 908580 01740 0 11858 3 42RRdenotesanobservationwithalargestandardizedresidualXdenotesanobservationwhoseXvaluegivesitlargeinfluence 如果有一个比较好的模型并且对所有的统计假设都感到满意的话 那么可以直接抽取一部分作白杨树为样本 测量直径和高度 然后预测其重量 而不用把树砍下来再去称量 由此回归输出结果可以看出 在系数表中 D2H有一个比较高的T值和很小的P值 有足够的理由说明D2H和Weight之间存在很强的关系 在变量分析表中比较大的F统计值和值比较小的P值将这种关系量化 R的平方 R Sq 以及R的调和平方 R Sq adj 的值都大于98 进一步证明D2H与Weight之间存在很强的线性关系 在下最后结论之前 再看一下图表 提供 从图表ResidualsversusD2H知道变动并未呈现出常数 此即符合一个很重要的回归假设模型 在比较大的D2H值处 标准残差也比较大 基于时间因素 以后章节还要进一步讨论 提供 步骤五 画一条合适的回归线下一步 画一个带回归线的散点图来看看那些测量的数据与回归线的接近程度 1 选择Stat Regression FittedLinePlot 2 在Response Y 中 输入Weight 3 在Predictor X 中 输入D2H 点击OK 输出结果如下 提供 步骤六 通过Brush 刷 图形找特殊点图形上有一点 其D2H值很大 想知道这到底是一个什么样的点 Brush可以快速方便的找到这一点 1 选择Editor Brush 2 在图形上将手状的图标圈住特殊点 特殊点便会显示出来 同时在数据窗口里相应的行上做一个标记 要找的点 刷板 提供 第七章高级Minitab 提供 提供 背景从这些种植的树木中真正能预计到多少可以当作能源的材料呢 又怎样将产量最大化呢 为了将产量最大化 研究人员
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!