六西格玛之分析阶段S848卡方检验p23

合集下载

六西格玛方差分析214601705

六西格玛方差分析214601705

Descriptive 统计与正态
检验
堆叠资料与方差 等同性检验
资料是否为正态分布? 小P-Value(<0.5)值,资料为非正态分布 注意样本大小的问题
正态
非正态
Bartlett Test (F-Test) Ho:σ2A=σ2B
Leven’s Test Ho:σ2A=σ2B
Small P-Value(<0.5) 方差不相等
方差相等
1 Way ANOVA Ho: μA=μB=μC
1 Way ANOVA If N>25 or transformed) Kruskal-Wallis/Moods Median (Med A=Med B=Med C)
方差不相等 1 way ANOVA (See MBB) Kruskal-Wallis/Moods Medians (Med A=Med B=Med C)
i=1 j=1
i=1 j=1
i=1
六西格玛方差分析214601705
One-way ANOVA : Cycle times versus Factor
Analysis of variance for CycleTim
Source Week Error Total
DF
SS
3 1032.48
96 110.36
六西格玛方差分析214601705
和以前相同——但只针对一个 Level
Customr1,2,3的资料
六西格玛方差分析214601705
分析Roadmap:3个或更多样本
+3 Level X 的比较
研究 Stability (若可行) 研究 Shape 研究Spread 研究Centering

精选6sigma统计数据分析教程培训教材gka

精选6sigma统计数据分析教程培训教材gka
数理统计基础
统计基础
六西格马突破步骤
定义
测量
分析
改进
控制
步骤 1 - 选择输出特性 - 定义过程输入/输出变量步骤 2 - 确定绩效标准步骤 3 - 定义测量系统步骤 4 - 建立过程能力步骤 5 - 定义绩效目标步骤 6 - 定义差异来源步骤 7 - 查找潜在因素步骤 8 - 发掘变量之间相互关系步骤 9 - 建立操作公差范围步骤 10 - 重新验证测量系统步骤 11 - 重新计算过程能力步骤12 - 实施过程控制
变异性的测量 - 公式
极差: 在某一数据集合中最大值同最小值之间的数字化的距离样本方差 (s2 ; s2 ): 每一单个数据同均值的差的平方和的平均值标准偏差 (s ; s): 方差的平方根。通常表示数据的分散程度。它越小,数据分散程度越小,加工精度越好。
计算机可以胜任所有艰难的工作
变异性练习
统计 – 测绘数据的益处
统计是工具. 象其它工具一样,它们同样可以被误用,导致令人误解的,歪曲的,或不正确的结论。仅能够计算是不够的,我们必须对数据作出正确的解释。统计中一项重要的分析工具就是不断描绘数据。
变异性, 中心度, 和稳定性
变异某一过程的差异有多大?众所周知,每一过程都会有一定的移动,但不是每一个移动都会得到完全相同的结果。通常我们采用标准变差对过程的差异进行衡量。这是我们的重点。其它关于差异的参数有:极差 (最大之与最小值之差)偏差平方和
数据基础: 需解答的问题
什么是数据? 什么是不同类型的数据? 为什么连续性的数据会更好? 什么是数据采集计划? 什么是合理的分组?
数据基础: 问题总结
数据是相关主题的单个事实或事实的集合体 数据有两种:计数型和计量型 计量型数据之所以比计数型数据好是因为其所提供的信息要更丰富。 一个数据采样计划是采集同项目有关的,必要的数据大纲 合理分组是对某一过程的相同类别负荷逻辑的挑选。

六西格玛 第6章 分析(含补充参考答案)

六西格玛 第6章 分析(含补充参考答案)
6Sigma
第6章 分析
LSL -6σ
Cp: 2.0 cpk: 1.5
USL
x-
+6σ
分析阶段概述
6 Sigma
1.分析阶段工作内容
(1)流程分析。流程步骤的详细分析,如绘制微观流程图,明晰每 一个关键步骤的KPIV和KPOV。区分出哪些是 增用基本描述性统计图表,如直方图、柏拉图 、散点图、饼图、雷达图等,对输入变量的影响做初步评价;运用多 变异图比较多个X的影响,直观的看哪些关键X重要,哪些不重要。
6.2.2 点估计和区间估计
6 Sigma
置信水平:如果将构造置信区间的步骤重复多次,置信区间中包含总体 参数真值的次数所占的比率,称为置信水平,或称为置信系数。
在构造置信区间时,比较常用的置信水平为90%、95%、99%三种, 分别对应显著性水平α 为0.1、0.05、0.01。
置信区间的宽度随置信系数的增大而增大。
X
μ
σ X Z1α / 2 n
σ X Z1α / 2 n
9
6.2.2 点估计和区间估计
如果抽取的样本均值如
X
图所示,则以
样本均值 X 为中心, σ
以 Z1α / 2 n 为半区
间宽度构造的置信区间 没有包含总体均值μ。
6 Sigma
σ X Z1α / 2 n
μσ X Z1α / 2 n
10
σ Z1α / 2 n
μ Z1α / 2
σ n
μ
1-α
σ Z1α / 2 n
μ Z1α / 2
σ n
8
6.2.2 点估计和区间估计
实际工作中,只进行一 次抽样,如果抽取的样 本均值如图所示,则以
样本均值 X 为中心,

6西格玛分析课件

6西格玛分析课件
0 0 0
检验统计量 拒绝域 z z1 x 0 z z z
n
1 2
z z
Z检验
σ未知 大样本 n 30
0 0 0
Байду номын сангаас
z
x 0 s n
z z1 z z
1 2
T检验
未知
1 , 2
ts
z
x y
1 1 n m
t t1 (n m 2) t t (n m 2)
w
t t
z
1 2
(n m 2)

近似Z 检验
未知 m,n大样本
1 , 2
x y
2 s2 sx y n m
z z1 z z
研究问题的 真正原因
探索性数据分析(exploratory data analysis, EDA) 分析数据全过 程的早期阶段 过程分析
推测阶段
提出关于原因 的假设阶段
证实或排除 原因阶段
探索性数据分析
推测阶段 排列图 趋势图 直方图 多变异图
提出关于原因 的假设阶段
证实或排除 原因阶段 因果逻 辑分析 统计假 设检验 试验 验证
原来的冷拉钢筋生产线上的钢筋平均抗拉强度为 2000kg,标准差为300kg。希望经过调整参数后, 钢筋的平均抗拉强度能有所提高。项目团队实施 改进后抽取了25根钢筋,测得钢筋平均抗拉强度 为2150kg。问:能否断言,钢筋平均抗拉强度确 有提高?
是 我们所看 到的不同 还是
所取样品的不同
流程变化的不同
α

2

2
z H0 : 0 , H1 : 0

六西格玛的计算公式解读

六西格玛的计算公式解读

6西格玛1西格玛=690000次失误/百万次操作2西格玛=308000次失误/百万次操作3西格玛=66800次失误/百万次操作4西格玛=6210次失误/百万次操作5西格玛=230次失误/百万次操作6西格玛=3。

4次失误/百万次操作7西格玛=0次失误/百万次操作什么是6西格玛”σ”是希腊文的字母,是用来衡量一个总数里标准误差的统计单位。

一,以4西格玛而言般企业的瑕疵率大约是3到4个西格玛,相当于每一百万个机会里,有6210次误差。

如果企业不断追求品质改进,达到6西格玛的程度,绩效就几近于完美地达成顾客要求,在一百万个机会里,只找得出3。

4个瑕疪。

6西格玛(6Sigma是在九十年代中期开始从一种全面质量管理方法演变成为一个高度有效的企业流程设计、改善和优化技术,并提供了一系列同等地适用于设计、生产和服务的新产品开发工具。

继而与全球化、产品服务、电子商务等战略齐头并进,成为全世界上追求管理卓越性的企业最为重要的战略举措.6西格玛逐步发展成为以顾客为主体来确定企业战略目标和产品开发设计的标尺,追求持续进步的一种质量管理哲学。

6西格玛的主要原则(一在推动6西格玛时,企业要真正能够获得巨大成效,必须把6西格玛当成一种管理哲学。

这个哲学里,有六个重要主旨,每项主旨背后都有很多工具和方法来支持。

6西格玛的主要原则(二真诚关心顾客。

6西格玛把顾客放在第一位.例如在衡量部门或员工绩效时,必须站在顾客的角度思考。

先了解顾客的需求是什么,再针对这些需求来设定企业目标,衡量绩效.6西格玛的主要原则(三根据资料和事实管理。

近年来,虽然知识管理渐渐受到重视,但是大多数企业仍然根据意见和假设来作决策。

6西格玛的首要规则便是厘清,要评定绩效,究竟应该要做哪些衡量(measurement,然后再运用资料和分析,了解公司表现距离目标有多少差距。

6西格玛的主要原则(四以流程为重。

无论是设计产品,或提升顾客满意,6西格玛都把流程当作是通往成功的交通工具,是一种提供顾客价值与竞争优势的方法。

6西格玛管理项目辅导数据分析的第二阶段:分析原因

6西格玛管理项目辅导数据分析的第二阶段:分析原因

6西格玛管理项目辅导数据分析的第二阶段:分析原因一、六西格玛管理数据分析原因在绘制流程图的过程中,团队成员就会产生很多的疑问,会提出形形色色的问题。

在这个阶段中,先要根据流程图识别流程中明显存在的问题,再进行量化分析。

1、识别流程中明显存在的问题流程冗余:不同流程中的不同环节提出了相同的活动和结果。

流程中断:流程中前后环节信息的中断。

如顾客和供应商之间没有及时沟通,造成顾客对产品货源信息的中断。

流程瓶颈:流程中因为某个环节不能及时完成任务而延误整个流程。

流程循环:流程中某环节的输出产品有缺陷,必须送回其上游环节,或另设“返工”直到必需的工作完成为止。

检验这一步往往是返工循环的起始点。

2、量化分析①价值分析在现代商业社会中,任何一件产品都为顾客提供了价值,商品的生产过程就是创造价值的过程。

价值分析通过外部顾客的角度来识别流程中的每个环节是否是满足顾客需求。

企业在进行价值流程图分析时,首先要挑选出典型的产品作为深入调查分析的对象,从而绘制出信息流程和实物流程的现状图,然后再绘制理想的价值流程图,通过将现状图与理想状况图相比较,发现当前组织生产过程中存在的问题点,进而针对问题点提出改进措施。

②时间分析对于流程时间维度的分析可能会带给你意外的惊奇:流程中往往有许多时间是空闲着的,并不是人闲坐在那里,而是忙的事情并不能创造价值。

等待、多余的动作、无意义的工步、重复的搬运、批次生产和返工使得流程变得漫长。

在完成六西格玛分析过程的推测时,团队已经对何时、何地、问题如何暴露出来有了一定的了解,同时对潜在原因也有了初步分析。

天行健咨询指出本阶段的任务就是关注问题的定义,组织探查、分析工作,透过问题的表面现象进行深入研究,找出问题的真正潜在原因,了解事物的本质。

只有确保找到所要研究问题的真正潜在原因,以后才能真正找到解决办法。

二、六西格玛分析阶段最常用的分析工具是因果图和关系图它们为找到根源性原因提供了方向,但使用这些工具时有两点要注意:一是它们仅仅帮助团队进行系统的思考并发现问题可能的潜在原因,仍需收集数据才能证实究竟什么才是问题的真正原因。

六西格玛分析阶段

六西格玛分析阶段
75%数(3/4分位)-Q3
中位数(1/2分位)-Q2 25%的数(1/4分位)-Q1
Q1-Max{Minimum, Q1 - 1.5 IQR}
注:箱子的高度——内四分位极差 IQR = Inter Quartile Range= Q3-Q1
Histogram直方图
主要应用在了解数据的形状及形态 便于掌握数据的集中倾向、位置、平均、分布等
把关键因素(X’s)压缩到
分析 改进 控制
4-8 3-6 2-4
确认重要 X’s
重要 X’s最佳化 重要 X’s 控制
4~8个左右之后, 在改进 阶段找出最适合的条件
最佳化的过程
分析阶段的步骤
制定数据收集计划 确定X的量化指标,数据类型、以及数据收集目标 根据X的特点确定采用的分析方法,可以每个因子单独验证(如比较分 析),也可以几个因子合在一起验证(如多变量分析、回归分析、DOE) 制作数据收集表,包括X及其响应(Y)的数据,确定收集的样本量 如需要通过试验来收集,如通过人为改变X的状态来观察Y的变化,还 需要做好试验计划
多变量分析
比较分析
均值检验:1-sample t, 2-sample t, Paired t (样本中同一 个体测量两次前后比较-总体不独立), ANOVA(正态总体>=2)
方差检验:Test for Equal variance-F test(正态总体=2), Bartlett’s Test(正态总体>=2),Levene’s Test(非正态总 体)
图表分析的步骤
选定要分析的变量 搜集及整理数据 进行图表分析 结果解释
重点:可靠数据的收集和正确的图表解释
选择要分析的变量
我们要分析的变量来自测量阶段的结果, 在利用图表分析前我们首先要确定变量的类 型、分析的目的、选择什么方法等

SPSS学习系列24. 卡方检验

SPSS学习系列24. 卡方检验

24. 卡方检验卡方检验,是针对无序分类变量的一种非参数检验,其理论依据是:实际观察频数f 0与理论频数f e (又称期望频数)之差的平方再除以理论频数所得的统计量,近似服从2χ分布,即)(n f f f ee 2202~)(χχ∑-= 卡方检验的一般是用来检验无序分类变量的实际观察频数和理论频数分布之间是否存在显著差异,二者差异越小,2χ值越小。

卡方检验要求:(1)分类相互排斥,互不包容; (2)观察值相互独立;(3) 样本容量不宜太小,理论频数≥5,否则需要进行校正(合并单元格、增加样本数、去除样本法、使用校正公式校正卡方值)。

卡方校正公式为:∑--=ee f f f 202)5.0(χ卡方检验的原假设H 0: 2χ= 0; 备择假设H 1: 2χ≠0; 卡方检验的用途:(1)检验某连续变量的数据是否服从某种分布(拟合优度检验); (2)检验某分类变量各类的出现概率是否等于指定概率; (3)检验两个分类变量是否相互独立(关联性检验); (4)检验控制某几个分类因素之后,其余两个分类变量是否相互独立;(5)检验两种方法的结果是否一致,例如两种方法对同一批人进行诊断,其结果是否一致。

(一)检验单样本某水平概率是否等于某指定概率一、单样本案例例如,检验彩票中奖号码的分布是否服从均匀分布(概率=某常值);检验某产品市场份额是否比以前更大;检验某疾病的发病率是否比以前降低。

有数据文件:检验“性别”的男女比例是否相同(各占1/2)。

1. 【分析】——【非参数检验】——【单样本】,打开“单样本非参数检验”窗口,【目标】界面勾选“自动比较观察数据和假设数据”2.【字段】界面,勾选“使用定制字段分配”,将变量“性别”选入【检验字段】框;注意:变量“性别”的度量标准必须改为“名义”类型。

3. 【设置】界面,选择“自定义检验”,勾选“比较观察可能性和假设可能性(卡方检验)”;4. 点【选项】,打开“卡方检验选项”子窗口,本例要检验男女概率都=0.5,勾选“所有类别概率相等”;注:若有类别概率不等,需要勾选“自定义期望概率”,在其表中设置各类别水平及相应概率。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

•年老 •年轻
•被雇佣
•75•x 180 •= 29.6
•455
•___
•未被雇佣
•___ •___
•合计
•75
•380
•单元的期待频率是:
•(列合计)× (行合计) •总计
•合计
•180 •275 •455
步骤 #3 (继续) •如果这两个因素真的不相关,29.6 正是我们所期望的
•年老 •年轻
分析路径
•Χ2 无关性检验
•收集数据
•运行 Minitab •表格 卡方检
验 命令
•评价 P 值
•检查偶然性 •表格
•作出结论
用 Minitab 分析数据
用 Minitab 分析数据
•卡方检验: Hired, Not
•在观测计数下方给出的是期望计数 •在期望计数下方给出的是卡方贡献 • Hired Not 合计 • 1 30 150 180 • 29.67 150.33 • 0.004 0.001 • 2 45 230 275 • 45.33 229.67 • 0.002 0.000 •合计 75 380 455 •卡方 = 0.007, DF = 1, P 值 = 0.932
•合计
•180 •275 •455
•你做完了这个表格!
步骤 #5
•将差值平方 •(O-E)^2
•年老 •年轻 •合计
•被雇佣
•(.4)*(.4)=.16 •_.0_9_ •75
•未被雇佣
•._0_9_ •._0_9_ •380
•你做完了这个表格!
•合计
•180 •275 •455
步骤#6
•计算相对的差值的平方 •(O-E)^2 / E
•150 •230 •380
•合计
•180 •275 •455
步骤#3
•建立一个 观察频率表.也就是说, 如果这2个因素真的不相关,
•这个表会显示出什么?
•年老 •年轻
•被雇佣
•未被雇佣
•我们应该怎么做?
步骤 #3 (继续)
•建立一个 期望频率表. 也就是说, 如果这2个因素真的不相关,
•这个表会显示出什么?
步骤#1
•我们必须建立一个观察频率表,把我们的两个变量分
•成两个等级。
•年龄: 年老 & 年轻 •雇佣实际: 雇佣 &不雇佣
•然后我们收集数据来进行分析.
•被雇佣
•未被雇佣
•年老
•30
•150
•年轻
•45
•230
步骤#2
•计算列和行的合计
•年老
•年 轻
•合计
•被雇佣
•30 •45 •75
•未被雇佣
•合计
•被雇佣
•29.6 •4_5_.3_ •75
•未被雇佣
1•5_0_._3 2•_2_9_.7
•380
•合计
•180 •275 •455
•你做完了这个表格!
步骤 #4
•从观察值中减去期望值 •(O-E)
•年老 •年轻 •合计
•被雇佣
•30-29.6=.4 •-_0_.3_ •75
•未被雇佣
•-_0_.3_ •_0_.3_ •380
•年老 •年轻
•被雇佣
•.16 / 29.6 = .005 •.0_0_2_
•未被雇佣
.•0_0_0_6 .•0_0_0_4
•合计
•75
•380
•合计
•180 •275 •455
•你做完了这个表格!
所以怎么样? •相对的方差的和是一个Χ2分布!
•0 •1 •2 •3 •4 •5
•如果不相关,我们期望这个差值接近于0。随着我们做得越来越深入 ,这两个变量看起来就越像相关了。为了帮助我们作出这个判断,我 们将依靠P值。
•Step 9- Vital Few X’的选定
•Improve •Control
目 标
介绍无关性Χ2 -检验的基本概念 把无关性Χ2 -检验和 MAIC 路径联系起来
记住这个例题?
•人事部想调查人的年龄(年老和年轻)和被雇佣与否之间是否有关联 •什么是 Y ?被__雇__佣_________ 数据类型 ? _____分_立_____ •什么是 X ? _年__龄__________ 数据类型 ? ____分__立________
•Ho: 数据是无关的 (没有关联) Ha: 数据是相关的 (有关联)
•如果 P 值 <0.05 , 就推翻 Ho
理论
•让我们查看一下我们的例子…. •假设我们要决定 年龄 和 雇佣实际 相关或不相关,
因而我们的假设描述如下... •Ho: 年龄 和雇佣实际 不相关 •Ha: 年龄 和 雇佣实际 相关
注意: 观测值和期望值与刚才的计算结果 是相同的
你将做出什么样的判断?
一个 P-值 !
另外一个例子 . . .
•年老
•年 轻
•被雇佣
•45 •45
•未被雇佣
•135 •230
你将作出什么判断?
Χ2 注释
•Χ2 是我们本星期所学的最不容易识别,通常也是比较“难分析” 的工具。但当我们处理记数性数据时会发生同样的事情。 •为了进行Χ2-检验你必须有至少 5个期望频率值,或使用 Minitab 。 •你收集的数据必须确保是随机性的. 小心其他的隐藏因素 (X).
六西格玛之分析阶段 S848卡方检验p23
2020年6月2日星期二
路径位置
•Define
•Measure •Analyze
•Step 7- Data 收集 •Step 8- Data 分析
Multi Vari Central limit Hypothesis testing Confidence interval ANOVA, T-test Chi-square Correlation,regression
回顾
介绍无关性Χ2-检验的基本概念 将无关性Χ2-检验与MAIC路径相联系
选择练习 - 1

测量系统评价

以下关联是不良数的监控过程Βιβλιοθήκη •# 合格•
Al
232

Eric
590

Debbie
45
#不合格 434 1199 83

作业者与产品等级之间是否有联系呢?

如果有联系,是什么造成了差异?

下一步你该做什么?
•你将采用什么类型的工具 ? __________Χ_2_____________
数据
•年老 •年轻 •合计
•被雇佣
•30 •45 •75
•未被雇佣
•150 •230 •380
•合计
•180 •275 •455
•在此你如何做出判断?
假设
•根据无关性Χ2-检验, 统计学家假设在现实生活中 绝大部分变量之间是无关的,因此:
相关文档
最新文档