SigmaGBImprovementProcess绿带分析阶段课程Analyze分析.ppt

上传人:丁** 文档编号:942533 上传时间:2019-09-30 格式:PPT 页数:122 大小:4.70MB
返回 下载 相关 举报
SigmaGBImprovementProcess绿带分析阶段课程Analyze分析.ppt_第1页
第1页 / 共122页
SigmaGBImprovementProcess绿带分析阶段课程Analyze分析.ppt_第2页
第2页 / 共122页
SigmaGBImprovementProcess绿带分析阶段课程Analyze分析.ppt_第3页
第3页 / 共122页
点击查看更多>>
资源描述
S I G M A,Sigma GB Improvement Process 绿带分析阶段课程,3.0 Analyze/分析,突破性改善的利器,Process 讲课,Exercise 小组讨论,Exercise 个人实习,Template 案例,Minitab,原因分析阶段的 Output : 发现散布的根本原因,查找散布的原因 发现 X 从多个原因中,找出核心因子(Vital Few) 设定根本原因的改善方向 计算改善时的有形效果,Analyze.,3. Analyze 原因分析,目 录,1. 分析计划树立 2. 定性分析 2-1. Why-why分析 2-2. PM分析 3. 统计分析 3-1. 假设检验 3-2. 方差分析 3-3. 相关分析 3-4. 回归分析,- 16,- 36,- 24,Analyze 阶段定义,分析阶段概要,词典中 Analyze的含义 分析 : 分类解析 6Sigma中的Analyze 按照影响Ys的潜在因子类,分类解析。 按原因类收集数据, : 收集数据 分析收集的数据, : 分析数据 导出结论 : 选定Vital Few Xs,找出Y = f(X)是分析的目的。,分析阶段概要,在Measure阶段调查了Y的现水平, 挖掘了潜在 Xs。 在Analyze阶段 为了使 Xs客观化,收集具体证据,并分析的阶段。 利用收集的具体证据,对Y的影响被得到验证时,潜在Xs才能确定为 Vital Few Xs。,为了查找Vital Few(核心因子), 从多样的视角,进行层别 排列图、因果图、散点图、Run-chart 等基本的工具更重要 没有被统计证明的不是核心因子(Vital Few) 排除所有感情、成见,彻底集中于数据 检讨各种要因,其中选别 Vital Few,分析阶段概要,注意避免在根本原因分析中的障碍物, 定量(统计)分析,如何查找核心因子(Vital Few)?, 定性分析,未定量化的现象 固有技术问题 设备方面问题解决,定量化的现象 管理方面问题解决 运行条件方面问题,Process 层别,排列图 Run-chart 散点图,判定问题在哪个领域,量化变量 对问题结果的 影响程度,分析工具,潜在原因导出,工程现状调查(IPO) 逻辑树,对于未定量化的问题,定性的原因分析方法最有效,定性的原因分析,固有技术,设备技术 制造技术,明确引起问题的制造 Process 以问题发生部位为中心实施分析,本来的状态 与现状的比较,以技术的角度, 追溯问题原因,Why-why分析,技术分析,Benchmarking,现场 现物 现象, 定性分析,PM分析,对于定量化的问题通过统计分析,检验各原因对散布有没有显著影响,统计分析,t 检验 (平均),F 检验 (散布),方差分析,相关分析,卡方检验,回归分析, 统计分析,计量型数据,- 对两样本平均(mean)差别的显著性进行检验 - 检验两组或两组以上数据的散布是否存在显著性 差异 - 检验两个以上样本平均差别的显著性检验(ANOVA) - 研究两个变量之间相关程度大小及相关关系 密切程度 (Correlation) - 对多个计数型数据样本的率(构成比)差别的 显著性进行检验 - 利用回归模型(关系式),预测因子(X,Y)之间关系,计数型数据,连续型数据,卡方检验,方差 (Variance),均值,F 检验,比较两组,比较多组,t 检验,ANOVA,统计分析,统计分析方法的应用,接近容易性 vs 风险大小,风险的大小,高,低,接近容易性,难,容易,定量分析,定性分析,风险越大,改善投资的决策越难,6Sigma推进方向,数据分析方法 vs 风险性,关键注意事项,分析阶段的关键注意事项 分析的核心是,如何更好地收集数据 答案在现场。一直要参与 。 (Be there !三现原则和Lean无区别) 首先画图表观察 (视觉确认,可视化原则之一) 不要混淆统计的显著性(P-Value)与实际重要性 (Pareto Chart),目的 : 对于已分析的因子,树立验证计划,设定正确的分析方向 定义 : 树立主要改善因子的分析计划 即,树立对于在现状调查中选定的主要改善因子,分类为定性因子或统计因子,并选定适当的 分析工具, 实施分析的计划 Check List 项目 : - CTQ(评价特性值) - 主要因子(Xs) - 分析内容 - 分析方法 - 日程 - 担当者 主要内容 : - 确认评价特性值(CTQ) - 分类主要因子 - 确认分析内容,选定分析方法 - 确认日程及担当者 树立正确的分析方向和分析计划,1. 分析计划树立,数据收集计划,收集哪些数据? - 需要测量哪些性能或成果? 需要分析Process低效率的哪些原因? 使用数据的目的是什么? - 日别、周别使用 - 掌握趋势 - 掌握低效率性 - 现Process运行状况的明示 - 确认Process中的散布 - 分析因果关系,数据收集方法是否合理? - 谁收集数据? - 在哪儿收集数据? - 什么时候收集? - 需要哪些追加支援? 是否分析所有关联数据或样本? - 样本大小? - 频度? - 样本选定方法? 需要哪些工具?,- 数据Check sheet ? - 测量及分析软件?,数据收集计划(1/4),抽样 通过抽样分析,可使用少量的数据,但能得到好的答案 从样本中,可以获得总体及Process的信息。 选择的样本应该能代表研究对象总体或Process 也要现实的问题 (费用、支援等),好的抽样应具备的条件,数据收集计划(2/4),数据收集的简单化,样本大小以分析所必需的最少数量为原则,维持数据的一贯性,设定具体的指南和数据收集方法/时期/地点,使数据收集容易,提前准备各种表格和样式,收集预备数据,从数据收集初期阶段开始,仔细观察数据,确认数据 是否合理或有无错误,使数据收集的变动最少化,数据收集的人员不能同时执行多个业务,对数据收集者的教育,数据收集人员不仅了解数据收集方法,还要明确数据收集的目的,关于数据操作的注意,也可能发生意外,出现数据不正确的状况,因此在数据收集期间随时确认进行情况,抽样时考虑事项,数据收集计划(3/4),不同工具样本大小例示 Tip Sheet 工具 或 统计 最少样本大小 平均 5 标准偏差 25 直方图 或排列图 50 散点图 25 管理图 20 要注意这只是最少样本大小。这说明从更多的样本数据中 得出的结论更具有可靠性。,数据收集计划(4/4),1) 确认CTQ 因子(Y) - 填入在课题选定阶段调查的CTQ。,分析计划树立方法-1/2,2) 分类主要因子 (y,x) - 填入确认的主要因子 x - 因子分类为定性 或 统计因子,3) 确认分析内容,选定分析方法 - CTQ与主要因子进行比较,决定要分析的内容。 - 决定适合于分析内容的分析方法。,4) 选定日程及担当者,CTQ(Y),No,主要因子,分析内容,分析方法,Xs,EDC Loss 含量,1,305-E 下部温度,分析温度和Loss量之间有没有关系,散点图 相关回归分析,2,305-E Reflux量,分析Reflux量和 Loss量之间有没有关系,散点图 相关回归分析,分析计划树立方法-2/2,分析计划树立(案例),树立分析计划,明确从XY Matrix中导出的主要因子的现状态和通过分析想了解的内容。,2. 定性分析,2-1. Why-why分析 2-2. PM分析,2-1. Why-why 分析,作为解释不良/故障发生要因的手段,按照规则顺序,反复喊 “Why?”,无遗漏地 查找要因的分析方法。,-1,-1-1,-1-2,-1 为何发生,-2,-1-1,-1-2,-2 为何发生,-1,-2,最终的Why! (对于现象的根本原因),反复地喊“Why?” ,无遗漏地查找最终的 Why(对于现象的根本原因) 。,最终的Why! (对于现象的根本原因),现象,原有的思考和 Why-Why分析的差异,Why-why 分析,原有的 思考方式,反复Why! 5次以上,才可以系统地、彻底地查明目的和手段或原因和结果的关系,-若发生问题,凭着自己的经验查找原因 -自身的知识和经验不足时,则找不到真正的原因,原有的思考方法,分析为什么发生,制定对策,有疑问,以知识和 经验为 基础思考,原因就在 知识和 经验当中,判断原因,原因不在 知识和 经验当中,估计,偶然猜中 原因,找出了 错误的原因,原因不明,Whywhy思考,1) 不要混淆 Why 和 哪里 重要的不是故障发生在哪个部品上, 重要的是,为什么那个部品会发生那些故障,2) 在查找原因前,首先要明确要因 要因是 ? : 能引起现象的所有的可能性(所有的嫌疑人) 原因是 ? : 在要因中引起现象的犯人 (若漏掉要因会判定错误的原因),原因 (对策),现象 (结果),2-2. PM分析,Phenomena (non) - 把现象 Physical - 以物理的方法解释,P,Mechanism - 解释现象的机理 - 解释设备的机理 Machine Man - 检讨设备、人员、材料、方法的 关联性 Material Method,M,分析,解释要因,改善,查找不合理点进行改善,统计思考和 PM分析的差异,从重点主义思考脱胎换骨,根据逻辑、原理进行思考,调查所有问题的要因,去除不合理,进行改善, 达到不良或损失零化的目标。,1次对策,2次对策,慢性损失,慢性损失,1次 PM分析,2次 PM分析,慢性损失,“0”化,QC思考的改善,PM分析的改善,展开形式就是QC手法的系统图 。如图所示,样式为按照PM分析的Step顺序解释的形式。 下图中只能记录到 4M(2次)项目,但以后根据需要要因解释也可展开到 (3次), (4次)项目。,PM分析的结构,PM 分析的最大特征是, 在要因分析以前,对于发生现象的机理,实施以物理的、工学的角度进行物理解释。,1) 现象和要因之间需要进行物理解释 2) 因此,现象和要因之间具有逻辑性 3) 为了做好物理解释,必须要充分理解加工原理、设备机构/构造、部品功能等 。因此,最终会成为加工/设备的专家。 4) 应该具备以原理原则的角度理解事物/进行思考的习惯和能力 5) 应该具备系统地展开/整理偏差要因的能力 6) 明确品质特性和设备.夹工具.材料.方法.人员的关联,设定品质保全的不发生 不良的条件,PM分析的特征,例) 手电筒原理 原则 和物理解释、成立的条件之间的关系,原理.原则和成立条件例示,PM 分析程序,PM分析按照现象的正确分析阶段、彻底的要因解释、要因调查及问题点的挖掘、复原及维持管理的顺序细分为8阶段进行分析。,2阶段,1阶段,4阶段,3阶段,6阶段,5阶段,8阶段,7阶段,现象的明确化,物理解释,检讨与4-M的关联性,成立条件,不合理的发掘,调查方法的检讨,效果分析/维持管理体系,复原及改善,改善小组编制,课题选定,课题的现状调查(在现场利用现物) 现象的明确化,通过5W 1H的层别化 ( 改善课题的细分化 ),加工原理原则的理解,机构图的作成 (设备装置类的机能、结构) 加工条件的理解,物理量变换的理解,物理的解释,成立物理解释的条件的整理 功能部位的结构和作用的理解,设备标准全工程品质条件的检讨,4M的 1次要因调查 4M的 2次要因调查 ( 调查有逻辑因果关系的所有要因),各个的成立条件,4M项目的基准值(临时基准值)的设定 各项目的调查,实测方法的检讨及调查计划的制定,发掘超出调查结果基准值的不合理项目,制定复原计划,改善及复原方案的制定及实施 改善以前先进行复原,防止再发对策的实施,效果分析 (目标达成与否, “0”化目标 ) 维持管理体系的建立,PM分析(案例1),为了减少PWE螺杆冷却温度偏差, 实施PM分析。,PM分析(案例2),对于液状计量量进行 PM分析结果,需要进行落差补正、阀门更换及温度管理改善,3. 统计分析(定量分析),3-1. 假设检验 3-2. 方差分析 3-3. 相关分析 3-4. 回归分析,假设检验,确认比较对象之间的显著性差别 对于平均的检验: t 检验, ANOVA 对于方差的检验: F 检验 对于比率的检验: Proportion 检验, 2 检验,相关分析,回归分析,相关分析: 确认x和 y的关系的程度 回归分析: 表现x和 y的数学关系式,统计分析,3-1. 假设检验,X X X . . .,数据处理,Sampling,样本,统计推论 (Statistical inference),: 根据样本所提供的信息,对总体进行推测或决定的过程,连续型 : 平均 , 散布 离散型 : 不良率 p, 不良个数 c,推论的一般对象, 统计推论的范畴,估计 (Estimation) : 点估计和区间估计,假设检验 (Hypothesis testing) : 对总体的预想、主张或单纯化推测等, 判定正确与否的过程,总体,统计推论,估计(Estimation)的定义,总体平均 : ,总体方差 : 2,总体标准偏差 : ,样本平均 :,样本方差 : s2,样本标准偏差 : s,A,A,A,A,A,A,A,B,B,B,B,B,B,C,C,C,C,C,C,D,D,D,D,D,D,D,总体,A,A,B,D,D,D,C,C,C,C,B,样本,总体,统计量,估计,抽样 (Sampling),估计是?,实际中的假设检验问题 ?,1.产品自动生产线工作是否正常; 2.某种新生产方法是否会降低产品成本; 3.治疗某疾病的新药是否比旧药疗效更高; 4.厂商声称产品质量符合标准,是否可信; 5.学生考试成绩是否服从正态分布, 假设检验事先作出关于总体参数、分布形式、相互关系等的命题(假设),然后通过样本信息来判断该命题是否成立(检验) 。,假设检验(Hypothesis testing) : 明确设定主张或假定,利用数据,进行统计证明。 检验方法: t-检验(t-Tests) F-检验(F-Tests) 方差分析(ANOVA) 相关关系(Correlation)分析 回归(Regression)分析 卡方检验(Chi-squared tests) 比率检验(Proportion tests) 假设 从总体中随机抽样了充分多的试料 数据分布为正态分布(稳定的状态),假设检验的概要,原假设 Ho,决定 显著性水平 (a=0.05),备择假设 Ha,选定合理的 检验方法,计算检验统计量 和p-value,p-value , 不能拒绝Ho,p-value ,拒绝Ho,问题定义,假设检验的进行顺序,统计假设是,对于一个或一个以上总体的参数的陈述,假设(Hypothesis)的定义,原假设(H0): 说明没有变化或差异的假设(原有主张) - H0 : = 0, 1 = 2 - H0 : 2 = 20, 21 = 22 备择假设(H1): 相反于H0 假设(新的主张) - 双侧检验 ; H1 : 0, 1 2 , 2 20 , 21 22 - 单侧检验 ; H1 : 0, 0, 12, 12, 220, 220, 2122, 2122,一般, 我们想做的假设检验是 “证明原假设是错误的” 。,例,原假设: 两个总体均值没有差异 (改善前和改善后没有差异) 回归式不具有显著性。 即, 回归式的斜率为0。 例外) 原假设 : 该资料属于正态分布。 正态性检验的情况,假设的三种形式:,左侧检验与右侧检验统称为单侧检验。,根据比较的数据类型,使用的统计方法也不同,连续型 假设检验,离散型 假设检验,对于方差的 检验,对于平均的 检验,数据类型别检验方法,显著性水平() - 原假设真,而拒绝原假设的概率 拒绝域 - 拒绝原假设的领域 - 如检验统计量属于拒绝域 ,就拒绝原假设,采纳备择假设。 显著性概率 (p-value) - 对于检验统计量的观测值,拒绝原假设的最小的显著性水平 - 如显著性概率值比实验者提前选择的(0.05)值小,拒绝原假设, 如p值大于 (0.05)值,就采纳原假设。,显著性水平和显著性概率, 和 的关系, 和 的关系,在检验中人们总希望犯两类错误的可能性都很小,然而,在其它条件不变的情况下, 和不可能同时减小,就象交易中买卖双方各自承担的风险一样。 一般说,哪一类错误带来的后果越严重、危害越大,就应该作为首要的控制目标. 在假设检验中,一般都首先控制第一类错误.,假设检验,决定显著性水平 ,实施统计检验,导出统计结论,选择适当的统计 假设检验方法 (Tool),明确陈述实际问题,根据数据类型、假设的内容等,选择适当的检验方法,从统计结论,导出实际结论,实际问题陈述,设定假设 (原假设, 备择假设),通过P-Value解释,导出统计结论 ( 如P-Value ,拒绝原假设(采纳备择假设),利用Minitab计算 P-Value,决定显著性水平 ,假设检验程序,导出实际结论,分析方法决定,X的变化如何影响Y的变化? 统计 : 相关, 回归分析 图形 : 散点图,X的变化如何影响Y的变化? 统计 : LOGISTIC 回归分析,平均值的比较 统计 : 两个总体的比较 (T检验) 三个总体以上的比较(方差) 图形 : 箱线图,直方图,方差的比较 统计: 两个总体的比较(检验) 三个总体以上比较(,) 图形 : 箱线图,比率 统计 : 一个总体和标准(1P) 两个总体的比较(2P) 三个总体以上的比较 (卡方检验) 图形 : 排列图,利用Minitab进行单样本t检验,对话框项,选择单样本t检验,如果已在列中输入原始数据,则选择此项。输入包含样本数据的列。,如果有样本数量和平均值的汇总值,请选择此项,输入样本数量的值,输入样本平均值,输入样本标准差值,输入检验均值 m 0,选中此项将执行假设检验,利用Minitab进行单样本t检验(续),显示变量的直方图、单值图和箱线图。这些图形显示样本平均值以及平均值的置信区间 (或置信限)。进行假设检验 时,这些图形还会显示原假设检验值。,输入所需的置信水平。输入 0 与 100 之间的任意数字。输入 90 代表 90% 置信区间。默认置信水平为 95%,选择小于(左侧)、不等于(双侧)或大于(右侧)。,单样本t检验范例一,工程师对某个料号的九个小配件进行了测量。根据历史经验,小配件的测量数据的分布接近于正态,但假设不知道 。他想知道检验总体平均值是否为5 并获得平均值的 95% 置信区间,怎么办?,分析: 根据已知,数据接近正态,但不知道 想把抽样的样本平均值跟特定值5相比较 因此符合单样本t检验的条件,选用单样本t检验,单样本t检验范例的Minitab操作步骤,1 打开Minitab样本文件夹中的工作表“统计示例.MTW”。 2 选择统计 基本统计量 单样本 t。 3 在样本所在列中,输入值。 4 选中进行假设检验。在假设均值中,输入 5。 6 单击选项。在置信水平中,输入 95。单击确定。 7 单击图形。选中单值图。在每个对话框中单击确定。,单样本t检验范例练习一输出结果,会话窗口输出,解释结果 此检验的 p 值 为 0.0340.05。因此,否定 H0。,H0: = 5,某厂以前生产的电子元件的平均使用寿命不低于1000小时。已知使用寿命服从正态分布,标准差为100小时。现随机抽取了25件,得知样本平均使用寿命为1050小时。 问: 这批产品的寿命是否有显著性提高? (0.05) 该选用什么检验?为什么? H0和H1分别是什么? Minitab中怎么操作?,单样本t检验练习,单样本t检验练习答案,Minitab操作步骤: 1 选择统计 基本统计量 单样本 t。 2 选择汇总数据 3 在样本数量中,输入25值,在均值中输入1050 。 4 在标准差中,输入 100。 5 选中进行假设检验。在假设均值中,输入1000。 6 单击选项。在置信水平中,输入 95。在备择中选择大于。单击确定。 7 单击图形。不选中任何图形。在每个对话框中单击确定。,分析:根据已知,数据正态,但不知道总体方差。 想把抽样的样本平均值跟特定值1000相比较,因此符合单样本t检验的条件,选用单样本t检验,单样本 T mu = 1000 与 1000 的检验 假定标准差 = 100 平均值 N 平均值 标准误 95% 下限 Z P 25 1050.0 20.0 1015.8 2.50 0.010,单样本t检验练习答案,结论: p=0.0100.05在 = 0.05的水平上能拒绝H0,接受备择假设,即有证据表明这批产品的平均使用寿命高于1000小时。,Minitab会话窗口输出,H0: = 1000,H1: 1000,利用Minitab进行双样本t检验,对话框项,选择双样本t检验,如果样本数据在一列中,并以另一列中的下标 值(组代码)来区分,请选择此项,如果两个样本的数据在不同的列中,请选择此项,选中此项即假定总体具有相等的方差 。默认设置为假定方差不等,如果有每个样本的样本数量 、均值和标准差的汇总值,请选择此项,双样本t检验范例,为了提高家庭暖气系统的效率,进行了一项旨在评估两种设备功效的研究。安装其中一种设备后,对房舍的能耗进行了测量。这两种设备分别是电动气闸 (气闸=1) 和热活化气闸 (气闸=2)。能耗数据 堆叠在一列中,另外还有一个分组列 (气闸),包含用于表示总体的标识符或下标。现在,您要确定是否有证据证明这两种设备之间的差值不为零,以比较出这两种设备的功效。,分析: 总体数据是否正态未知,且不知道总体方差 需要比较两组抽样的样本平均值 因此如果总体数据经检验为正态,选用双样本t检验,范例一的Minitab操作,1 Minitab样本文件夹中的工作表“炉子.MTW”。 2 选择统计 基本统计量 双样本 T。 3 选择样本在一列中。 4 在样本中,输入气闸内置能量消耗。 5 在下标中,输入气闸。单击确定。,范例练习一Minitab操作解析,双样本 T 检验和置信区间: 气闸内置能量消耗, 气闸 气闸内置能量消耗 双样本 T 平均值 气闸 N 平均值 标准差 标准误 1 40 9.91 3.02 0.48 2 50 10.14 2.77 0.39 差值 = mu (1) - mu (2) 差值估计: -0.235 差值的 95% 置信区间: (-1.464, 0.993) 差值 = 0 (与 ) 的 T 检验: T 值 = -0.38 P 值 = 0.704 自由度 = 80,由于 p 值 大于通常选择的 a 水平 ,因此接受H0,没有证据证明,使用电动气闸与使用热活化气闸在能耗上有差异,H0:1 = 2 H1: 1 2,练习,接上一例,还是利用打开的工作表“炉子.MTW”,用双样本分析比较一下气闸内置能量消耗和气闸外置能量消耗之间有无区别,三 对比率的假设检验 p检验,无论是z检验还是t检验,其数据都是符合一定分布的连续性数据。但是如果您关心的是整体的相对部分(即比率。例如,假设您的公司生产用于照相胶卷的银合金。如果您感兴趣的是银在混合物中的比率(按重量),则不会关注工厂一天使用多少银,而是关注银相对于整个合金的比率。假设合金中刚好有一半是银,则银的比率可以表示为百分比 (50%)、小数 (0.5) 或分数 (1/2)。 通过比率可以比较大小不同的组。例如,每天处理 10,000 次呼叫的呼叫中心可能比每天处理 500 次呼叫的机构记录的掉线呼叫要多,但它们的掉线呼叫比率却可能相同。 P检验就是用来进行一个总体比率同一个指定值的假设检验 (1p单比率检验),或用来进行两个总体比率的假设检验 (2p双比率检验),单比率假设检验范例,县地区检察官想竞选州地区检察官职位。她已决定,如果她的党派成员中支持她的人超过 65%,她就放弃县检察官职位,而竞选州检察官职位。您需要检验 H0:p = .65 与 H1:p .65。 作为竞选活动管理者,您收集了 950 名随机选择的党派成员的数据,并发现有 630 人支持该候选人。您进行了一项比率检验,以确定支持者的比率是否大于必需比率 0.65。此外,还构造了 95% 的置信限,以确定支持者比率的下限。,单比率假设检验范例的Minitab结果,单比率检验和置信区间 p = 0.65 与 p 0.65 的检验 样本 X N 样本 p 95% 下限 精确 P 值 1 630 950 0.663158 0.637057 0.208,由于 p 值 大于通常选择的 a 水平 ,因此,没有证据证明拒绝原假设-持候选人的党派成员的比率不大于 0.65 这一必需比率。作为活动管理者,您建议她不要竞选州地区检察官职位。,双比率假设检验范例,作为公司的采购经理,您需要授权采购二十台新复印机。在根据价格、复印质量、保修和功能对多个品牌进行比较后,将选择范围缩小到两个品牌:X 品牌和 Y 品牌。您认为决定性因素是品牌的可靠性,定义为在购买后一年内需要维修的比率。 由于您的公司已经使用过这两种品牌,因此可获得每种品牌随机选择的 50 台机器的维修历史记录信息。记录显示,六台 X 品牌的机器和八台 Y 品牌的机器需要维修。使用此信息可以指导您选择要购买的品牌。,双比率假设检验的Minitab操作,1 选择统计 基本统计量 双比率。 2 选择汇总数据。 3 在第一样本中的事件下,输入 44。在试验下,输入 50。 4 在第二样本中的事件下,输入 42。在试验下,输入 50。单击确定。,双比率假设检验范例的Minitab结果,会话窗口输出 双比率检验和置信区间 样本 X N 样本 p 1 44 50 0.880000 2 42 50 0.840000 差值 = p (1) - p (2) 差值估计: 0.04 差值的 95% 置信区间: (-0.0957903, 0.175790) 差值 = 0(与 0) 的检验: Z = 0.58 P 值 = 0.564 Fisher 精确检验: P 值 = 0.774,正态近似检验报告 p 值为 0.564,Fisher 精确检验报告 p 值为 0.774。这两个 p 值都大于通常选择的 a 水平。因此,数据与总体比率相等的原假设一致。换句话说,在第一年内需要维修的复印机比率不因品牌不同而存在差异。作为采购经理,您需要根据别的标准来决定采购哪种品牌的复印机。,对于Y,选定X 因子,分3个水平,进行方差分析。,Lead Time(Y),SSW(群内变动),SSB(群间变动),1,2,3,4,x x x x x x,y,x x x x x,y,y,=,SST(整体变动),由因子水平变化 (factor level)引起的变动,群之间,由实验噪音(experimental noise) 引起的变动,群内,=,=,+,+,2 4 6,方差分析(ANOVA)的概念,3-2. 方差分析(ANOVA ; Analysis of Variance),方差分析是 决定群间的平均值 差异是否大于群内 发生的变动,现工程,提案的工程,差异(),总变动,(群间变动),群内变动,方差分析(Analysis of Variance)的定义? 检验两个以上的总体的平均的统计上有没有显著性差异 比较总体之间的方差(群间变动)和各总体内方差(群内变动)的方式,方差分析(ANOVA)的概念,因子 (Factor) : 影响特性值Y的所有潜在原因 水平 (Level) : 因子的条件 实验的Balance / Unbalance : 对于所有因子水平组合的样本数量或 数据数量一样/不一样的情况,Y = f(X), X 因子 30 / 150 水平 1因子 2水平,各水平反复2次,因此是平衡(Balance)状态。 如果30是1次150是3次,就是不平衡(Unbalance)状态。,用语整理,ANOVA 使用的假定,ANOVA分析假定在各水平(level)的数据散布一样。 因此适用ANOVA以前, 首先对各散布实施正态性检验 (Normality Check)。 ANOVA 分析的假设,ANOVA(案例),调查一个因子对测量值的影响程度的方法。 因子有k个水平,取得适用各水平的测量值,检验各水平别平均是否相同。 这相当于比较多个总体的平均。总体k的平均设为 k,单因子方差分析要检验的假设是 假设 : H0 : 1 = 2 = . = k H1 : 至少一个平均不一样 方差分析结果,显著性水平0.05时,相关项目的P-Value小于 0.05,拒绝原假设,至少有一个平均不一样。 为了应用单因子方差分析, 必须要确认数据的正态性及等方差性,可以利用 MINITAB的正态性检验 (Normality Test)和等方差性检验 (Test for Equal variances)进行确认。, 单因子方差分析(One-way ANOVA)实习-1/8,2个因子,水平 2 多数的因子和水平 (平衡化的数据),各水平数据在不同的 列时,单因子方差分析实习-2/8,1个因子,水平 2 (堆叠存放数据),例题) 单因子方差分析 (数据 : Anova01.mtw) 建装材工厂的重步行生产部开发了新产品,测量了5 批NEOVIA 半成品的厚度。在相同的条件生产,不应该发生批次之间的差异。首先,想分析批次别厚度有没有差异。 分析批次别半成品有没有差异。,假设 : H0 : A = B = C = D = E H1 : 至少有一个平均不一样 输入数据 在MINITAB工作表中输入下面的数据,单因子方差分析实习-3/8,2. 数据堆叠准备分析。 - 数据 堆叠 列,单因子方差分析实习-4/8,3. 生成主效应图 统计 方差分析 主效应图, 在响应栏里输入 C7,在因子栏里输入 C8,单因子方差分析实习-5/8, 图形窗口显示的结果 ,图中可以看出半成品3的厚度最厚, 半成品5的厚度最薄。 预测半成品的厚度有差异。,单因子方差分析实习-6/8,4. 实施方差分析 统计 方差分析 单因子, 在响应栏里选择输入 半成品厚度列, 在因子栏里选择输入 半成品批次列, 选择 确定,单因子方差分析实习-7/8, 会话窗口显示的结果 ,上面的结果中对于半成品因子的P-value=0.001,小于显著性水平5%,因此拒绝原假设。 结论:5种半成品批次之间的厚度存在差异。,可以看出半成品1的厚度的 总体平均置信区间大致 (16.4, 18.1),p-value 0.05 ; 拒绝H0 即, 具有显著性影响,单因子方差分析实习-8/8, 双因子方差分析方法(Two-way ANOVA) 实习-1/9,分析两个因子对测量值的影响的方法。 以两个因子为基准,调查各水平别平均的同一性和交互作用的效果。 交互作用(Interaction)是,两个以上因子的组合中发生的变动。 举例说明,影响引张强度的变动要因可以分为合成温度的效果、制造工法的效果、合成温度和制造工法的组合而产生的交互作用的效果、实验误差组成。想要调查交互作用,必须在各因子水平组合下实验要反复两次以上。 利用 MINITAB 统计方差分析交互作用图 ,得出交互作用图表。,统计方差分析交互作用图,问题的提出,单因子方差分析时,只有一个因素在改变,比如温度1,2,3之间的比较;压力1,2,3之间的比较等 如果我想同时比较温度和压力对强度的影响哪个强时,怎么办?,交互作用的概念,一因子对另一因子的不同水准有不同的效果 当存在交互作用时,单纯研究某个因素的作用是没有意义的,必须分另一个因素的不同水平研究该因素的作用大小,86,如同单因子方差分析一样,总方差可以分为因素的平方和 : SST= SSA+ SSB + SSAB + SSe 条件是: SST 是总变异的平方和, SSA 是因素 A 所产生变异的平方和, SSB是因素 B 所产生变异的平方和, SSAB 是由于A与B的交互作用所产生变异的平方和 SSe 是残差变异的平方和,双因子方差方差的组成,双因子方差分析案例,设为比较三种松树在四个不同的地区的生长情况有无差别,在每个地区对每种松树随机地选取五株,测量它们的胸径,得到的数据列于表:,88,MINITAB 操作,89,因子“松树种类”的P值小于0.05,所以主效应是显著的,或者说松树的不同种类对树的胸径有显著影响; 而因子“地区”主效应和因子交互效应都不显著.,MINITAB 输出结果,主效应图,90,1选择统计 方差分析 主效应图 2 按照图分别在响应、因子各输入相应内容。 3 单击确定,91,主效应图解读,与地区的效应相比,松树种类的效应较大. 用图形进一步说明了方差分析的结果。,交互作用图,92,1选择统计 方差分析 交互作用图 2 按照图分别在响应、因子各输入相应内容。 3 单击确定,交互作用图解读,93,交互作用不明显. 用图形进一步说明了方差分析的结果。,案例:作为一位生物学家,您正在研究生活在两个湖中的浮游动物。您在实验室中放置了十二个容器,每六个容器一组分别装有取自两个湖的水。您在每个容器中添加了三种营养补充物质中的一种,30 天后对单位体积水中的浮游动物进行计数。您使用双因子方差分析检验总体平均值是否相等,这相当于检验是否有显著证据证明存在交互作用 和主效应 。 双因子方差分析: 浮游动物 与 补充, 湖 作出主效应图和交互作用图,ANOVA 练习,数据在INITAB样本数据文件夹中的工作表“方差分析示例.MTW,两个变量之间的相互依存关系,它们之间有什么关系? 它们之间关系的密切 程度如何?,3-3. 相关分析 (Correlation Analysis),智能指数 VS. 学习成绩 吸烟量 VS. 肺癌发生率 工程温度 VS. 产品强度,变量间的关系(函数关系),96,97,变量间的关系(函数关系),98,变量间的关系(相关关系),99,变量间的关系(相关关系),散点图和相关关系,强的正的相关关系,弱的正的相关关系,中间程度的正的相关关系,强的负的相关关系,弱的负的相关关系,中间程度的负的相关关系,相关常数 (Correlation Coefficient),相关系数的性质,| r | 0.8,两个变量之间的相关关系很重要(非常密切)。 r 值越接近 1,相关关系越高。,-1.0,0,+1.0,负的相关系数,正的相关系数,“r”,无相关系数,- 0.8,- 0.2,0.2,0.8,某公司想知道的广告费用和销售额之间关系的是否相关。 如果相关,其相关常数是多少。,案例,通过散点图的观察, 预测是正的相关关系。,步骤1,通过散点图观察,步骤2,利用Minitab计算相关常数,相关系数的乱用与误用 两个变量之间存在相关关系,并不能断言其中一个变量就是另外一个变量的原因 也可存在影响这两个变量的第3个变量。,随着被蚊子叮咬的次数的增加,冰淇淋的销售量也增加?,季节,第3个 变量 作用,相关关系不一定意味着因果关系,相关分析时注意点,练习,现有 200 名学生的语文和数学 SAT 得分以及大学一年级平均成绩,我们要研究这些变量之间的相关性。我们使用具有默认选项的相关来显示 p 值。,数据在INITAB样本数据文件夹中的工作表“年级.MTW”。,为了预测几个变量对特定变量的影响,利用函数关系表示 其关系进行分析的方法论,为了查明变量之间的关联性,假定数学模型,利用测量的各变量数据检验其模型的 统计分析方法。 其目的是,指定自变量值时,正确估计因变量的值,3-4. 回归分析 (简),直线式 :,Y= 0 +1X,Y = 结果 (反应变量,因变量) X = 输入 (说明变量,自变量) 1= 直线的斜率=X变化 1单位时 Y变化的比率 0= y 截距. 即, X=0时,Y=0,回归分析是?,因变量 Y和 自变量 X之间 关系式的导出,为了查明变量之间函数的相关性而假定某数学模型,从已测定变量的数据中推定其模型的统计性分析方法。根据这样的函数模型,从一个变量的变化 能预测另一个变量的变化,例) 父亲和儿子的身高关系 工程温度影响的制品强度,回归分析 (Regression Analysis),R-Sq值叫决定系数用 R2表示。 在0 R2 1范围,总变动中被回归线说明的变动所占的比率。 R2 值越接近1时,回归线越高,判断有意义。合理的值是多少? 根据情况不同。化学者要求的是 0.99程度的R2 值, 但根据工程和产业不同。一般值为0.7以上是可以认为输出变量和输入变量的关系大。如果R2是0.679(67.9%) ,用回归方程式能说明散布的67.9%, 剩下的 32.1%是别的原因造成的。,决定系数(Coefficient of Determination ),案例分析,为了知道机械的使用年度和 整备费用之间有什么关系,得到了有关对相同机械整备记录的如下数据。,观察回归分析和决定系数 对这个数据求说明 x与 y之间关系的单纯回归方程式。 使用年度为10年时,整备费用是多少?,1.在工作表里 输入数据,2 选择统计 回归 回归。,选择输出变量列,选择输入变量列,(回归分析数据.xsl),选择显示在残差图的残差形态,点图形选项,进入如下 对话 框: 选择为帮助最佳回归模型分析的残差 图的形态,选择残差图的类型,试试选四合一,残差图的分析,以后详解,输入所需的x 值,通过得出的回归式 可以求 值和信赖区间。 输入10,能计算出10年后的整备 费用(预测值)。,点选项后,进入以下对话框: 可以选择加重值列,预测新的观测值确认信赖区间。,点结果后,进入以下对话框: 可以调整对显示在会话框的回归模型的分析结果范围。,选择,回归分析结果确认,关于整备费用和使用年度的回归式是,决定系数R-Sq 值为61%,在全体变动中按回归直线 说明的变动是61%.,使用年度10年的机械的整备费用 期待值是165.48,对其的95% 信赖区间是(123.66, 207.29).,p 值为0.001小于留意水准0.05, 所以认为上面的回归式有意义。,R-Sq(adj)是在回归式上每追加变量R-Sq 值就增加的调整值。 输入变量两个以上时,此值有意义, 所以一般分析 R-Sq(adj).,选择统计 回归 拟合线图,选择输出变量列,选择输入变量列,回归模型的类型决定,回归分析之拟合线图: 欲用图形分析时活用,拟合线图形结果确认,残差分析,从实际值中减掉被回归模型适合的值叫残差,通过残差分析我们要确认模型的适合性。,残差分析,残差越小,推定的回归式越准确 说明实际观测结果。 残差是误差最好的推定值。 残差按独立变量的大小顺序或者 资料的输入顺序排列时,确认他 们对0对称 ,不显示特别的倾向。,残差,实际值,回归模型,残差 :,残差范例,为了知道机械的使用年度和整备费用之间有什么关系,得到了对相同机械的整备记录有关的如下数据。得出适合值和残差后执行残差分析。,3 1 5 8 1 4 2 6 9 3 5 7 2 6,39 24 115 105 50 86 67 90 140 112 70 186 43 126,使用年度(年) 整备费用(千元),(Residuals.mtw),1.在工作表里 输入数据,2 选择统计 回归 回归。,选择输出变量列,选择输入变量列,(回归分析数据.xsl),残差图形,
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文书 > 各类标准


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!