六西格玛6个sigma黑带系列十七:相关和简单线性回归(附有案例和数据源)
六西格玛黑带项目案例

六西格玛黑带项目案例项目背景在当今激烈的市场竞争中,企业为了提高效率、优化流程、降低成本、提高客户满意度等方面的需求,越来越多地开始关注质量管理和业务流程改进。
六西格玛(Six Sigma)作为一种业务流程改进管理方法,被广泛应用于各种行业和组织中。
本文将介绍一个六西格玛黑带项目的案例,展示其应用过程和取得的成效。
项目目标该项目旨在提高一个制造企业的生产线效率和质量水平。
项目团队的目标是将生产线的缺陷率从目前的2%降低到0.5%,同时提高产品的生产速度。
DMC方法该项目采用了六西格玛方法中的DMC(Define、Measure、Analyze、Improve、Control)改进周期。
下面将详细介绍每个阶段的工作内容和取得的成绩。
Define(定义)在这个阶段,项目团队明确了项目的目标和范围,同时确定了关键问题和要解决的业务痛点。
通过与业务部门和生产线工人的讨论,团队明确了以下几个要素:•项目目标:将生产线缺陷率降低到0.5%;•项目范围:仅限于某个特定的生产线;•项目关键问题:什么原因导致了缺陷率高、生产速度低的问题。
Measure(测量)在这个阶段,项目团队收集了与生产线相关的数据,并进行了详细的测量和分析。
通过使用六西格玛的统计工具和方法,团队发现了一些关键的缺陷点和生产过程中的瓶颈。
团队还制定了一套标准的测量指标,以便在后续的改进过程中进行跟踪和评估。
Analyze(分析)在这个阶段,项目团队对收集到的数据进行了详细的分析,并找出了导致生产线缺陷率高和生产速度低的根本原因。
通过使用问题解决方法,如因果关系图、5W1H等,团队确定了以下几个可能的原因:•人员培训不足;•设备维护不及时;•生产线布局不合理。
Improve(改进)在这个阶段,项目团队提出了一系列的改进方案,并进行了实施和验证。
团队采取了以下措施进行改进:•加强员工培训和技能提升计划;•定期维护设备,确保设备的正常运行;•对生产线进行重新布局,以提高生产效率。
6 Sigma_分析阶段_相关及回归

y = 0.86 + 4.14x 需要用30天完成的项目 的预期成本是多少?
y: 成本 (千美元)
150
100
y = 0.86 + 4.14x X= 30时, y = 125,000美元
50
10
20
30
x: 时间(天数)
27
使用回归模型预测
我们可以预测两个数量:
在给出x值时,预测 y的平均值 y 。 在给出x值时,预测 y 值。
平方总和图解
y
*
*
** * SST * ** * * * * * * * * * * *
SSE
x
如图所示,y值中的大部分变化量是由于y 随x的增加而增加。 (SSR )
21
ANOVA(续)
来自ANOVA 的两项重要结果为:
1.) 决定系数R2 Coefficient of Determination R2
100
50
b1: 斜率为x中每一单元变化(1天)后y的 变化量。
10 20 30
x: 时间 (天数)
16
简单线性回归
将
y = b0 + b1x
与样例数据相匹配。
成本相对时间的散点图显示线性趋势。我们可使用Minitab找 出最佳拟合线(回归线)。
选择:Stat >Regression > Regression
150
y = 0.86 + 4.14x
y: 成本 (千美元)
100
修正决定系数 = 63% P值 = 0.004 由回归关系解释的y 中63% 的 变化性具有统计学意义。
50
10
20
30
6西格玛回归分析

110
Input
100 90
Output
80 70 60 50 40
Y = 90.3013 - 0.645418X R-Squared = 0.359
Weak Negative Correlation
0
10
20
30
40
50
Input
85
75
Output
Y = 74.8524 - 0.181987X 65 R-Squared = 0.115
回归分析
Regression Analysis
目的
Objectives
介绍相关性及回归的基本概念 介绍相关性及回归的基本概念 介绍相关性及回归的基本概念
Introduce The Basic Concepts of Correlation and Regression Introduce The Basic Concepts of Correlation and Regression
r or t
2 t 2 n 2 t
n 2 r 1 r 2
Sample Size n 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 27 32 37 42 47 52 62 72 82 92 102
d.f. n-2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 35 40 45 50 60 70 80 90 100
(根据需要使用)
客户心声/业务之声调查 VOC/VOB
需求分析
流程再造
解决方案设计
再造路线图的日程是独立计算的 与以上DMAIC的日期不相关
六西格玛:相关和回归分析

六西格玛:相关和回归分析引言六西格玛是一种管理方法,旨在通过减少和控制过程中的变异性来改善组织的业绩。
它强调数据分析和统计技术的应用,以帮助组织发现问题、改进过程,并取得持续的质量改进。
在六西格玛中,相关和回归分析是常用的统计技术,用于识别和量化变量之间的关系。
本文将介绍相关和回归分析的基本概念、应用和注意事项。
相关分析相关分析是一种用于衡量两个变量之间关系的统计方法。
它衡量了两个变量之间的线性关系的强度和方向。
相关系数的取值范围为-1到1,接近-1表示负相关,接近1表示正相关,接近0表示无相关。
相关分析的应用非常广泛,例如市场研究、数据挖掘、客户满意度调查等。
它可以帮助组织识别关键影响因素,发现变量之间的相互关系,并做出相应的决策。
回归分析回归分析是一种用于研究变量之间关系的统计方法。
它可以帮助我们了解一个或多个自变量对一个因变量的影响,并建立一个数学模型来预测因变量的值。
回归分析有多种类型,最常见的是线性回归分析。
线性回归分析假设自变量和因变量之间存在线性关系,通过最小化观测值和模型预测值之间的差距来确定回归方程。
回归分析的好处是可以帮助我们理解变量之间的因果关系,并预测未来的趋势。
它在市场研究、需求预测、风险管理等领域有着广泛的应用。
相关和回归分析的注意事项在进行相关和回归分析时,我们需要注意以下几点:1.数据的选择:数据应该准确、完整,并且具有代表性。
无效或缺失的数据将影响分析结果的准确性和可靠性。
2.假设的验证:在进行回归分析时,我们需要验证一些假设,如线性关系、正态分布等。
如果假设不成立,分析结果可能不可靠。
3.多重共线性:如果自变量之间存在高度相关性,会导致回归系数的不稳定性和模型的不准确性。
因此,我们需要进行多重共线性诊断,并在需要时进行变量选择。
4.异常值的处理:异常值可能对回归分析结果产生很大影响。
我们需要识别和处理异常值,以确保模型的准确性。
5.模型的验证:完成回归分析后,我们需要验证模型的拟合度和预测能力。
6Sigmal培训之相关及回归分析

6Sigmal培训之相关及回归分析
6Sigmal 培训之相关及回归分析
一. 相关和回归分析在6Sigmal 突破模式各阶段的作用:
二. 相关分析概述
1. 变量间的相关性.
2. 散布图是将一对变量用图形表示出来,两个变量分别对应于图上的x 和y 座标轴.这样对应的x,y 数据均可在散布图上以一个点来表示.观察散布图的形状即可直观地了解变量x 和y 的相互关系.
3.相关系数相关系数是用来描述变量x 和y 之间线性相关程度的参数,用r 表示. r 值特性: 当r 的值介于(-1,1)之间,r 的绝对值越接近1表示x 和y 之间的线性关系越密切. r>0, x 与y 正相关,r<0,x 与y 负相关.r=0,x 与y 不相关.
r 计算公式: r=Lxy/(Lxx X L yy)^1/2
Lxy=Σ(Xi-X 平)(Yi-Y 平)
Lxx=Σ(Xi- X 平)^2
Lyy=Σ(Yi-Y 平)^2
三. 一元线性回归分析概述
回归分析就是用来定量描述因素x 和因变量y 关系的方法.回归分析可以筛选潜在的少数x;对y 进行预测和优化及确定对应于y 的最优值的x 的水平设置.
1. 一元线性回归模型.
Y= a+bx+ε 式中: a b 称为回归系数. B 直线斜率, a=y 截距. ε随机误差.
相关和回归分析的作用1. 验证原因的真实性. 2. 确定关键少数变量 3. 对结果进行预测
2.建立回归模型
3. 进行殘差分析.。
六西格玛管理-经典六西格玛黑带项目案例 精品

Why many quality warning
(TX component crack)
Internal customer: QA External customer: Dell/BenQ
voc
Customer Feedback
CTQ
Improve FPY (first pass yield)
11
Complex unstable process High rework
Monitor Fixing
Final 1
Monitor Fixing
Burn In
Output
16
Define
(试跑实验-Trial Run1)
实验目的:取消点胶找出TX零件是在哪个制成段发生。 专案选择 实验方法:取消点胶,在每个制成增加人员用放大镜目检。
实验时间:2008. 07.28~2008.08.08 鉴别问题 实验机种选择
Plan
Actual
14
Define
(绘制宏观流程图COPIS)
专案选择
鉴别问题
OOB/IPQC
鉴别顾客 关键特性
Good Products
SMT process MI process Final Assy Process
绘制 流程图
Level I
确认 问题范围
SMT Process
MI Process
合 计
迫 意 酬 略 在发 掌完量
度 高 目 问展 控成化
标 题性
成
为
本
次 Champion/
主
Leader
导
专
案
权重
10 8 5 4 3 5 10 10 10 650
6SIGMA-相关分析及回归分析

•• •
• • ••••
强的阴的相关关系
| r | = 0.560
•
• •••••••••••••••••••••••••••••••••••••••••••
中间程度的阴的相关关系
弱的阳的相关关系
•
•
•
• •
• •
••••••••••••
•••••••••••••••••••• •
•
••
•
| r | = 0.3390
➢ 回归分析的一次目的是 在即定范围內 预测.
回归分析的种类
• 单纯线性回归模型:设定直线关系后分析
例 Y = a + bx
• 曲线回归模型 : 设定曲线关系后分析
例 Y = a + bx + cx2 + dx3 Y = a bx
• 单纯回归模型:独立变量为一个 • 多重回归模型:独立变量为两个以上
188
事例分析
为了加工M制品的面要进行Lapping. Lapping时使用 Diamond powder,我们想知道根据 Powder的使用量, Lapping的高度. 为此我们进行几次实验后得出如下资料.求此资料的 散点图及标本的相关系数.
打开 A15_相关分析.mtw.
189
Stat > Basic Statistics > Correlation
•
•
•
••••••••••••••••••••••••••••••••••••
•
••
• •
• •
•
弱的阴的相关关系
186
判断相关类型…
✓对结果 Y影响最大的因子,可从点的密集程度判断 ✓单纯通过散点图,分析相关关系时也存在着不客观的短处,
六西格玛公式计算案例资料

六西格玛公式计算案例资料六西格玛是一种统计学工具,用于测量产品或过程的质量水平。
它是由因特尔公司于1986年引入,并成为了全球范围内的一种质量管理方法。
在本文中,我们将讨论六西格玛公式的计算案例资料。
六西格玛公式的基本原理是通过测量和控制过程的变异性,以减少不合格产品的数量。
这个公式是通过将变量的规格范围除以六倍标准偏差来计算的。
标准偏差是一个测量数据变异程度的统计量,可以通过计算数据的方差和平方根来获得。
将六倍标准偏差与规格范围相除,就可以得到一个衡量过程能否满足规格要求的指标。
假设我们有一个生产过程,需要根据规格要求制造一种零件。
规格要求是直径在10毫米到11毫米之间。
我们需要使用六西格玛公式来确定该过程是否满足规格要求。
以下是我们采集到的一些样本数据:样本1:10.2毫米、10.5毫米、10.8毫米、10.3毫米、10.7毫米样本2:10.4毫米、10.6毫米、10.9毫米、10.8毫米、10.6毫米样本3:10.3毫米、10.7毫米、10.5毫米、10.4毫米、10.6毫米首先,我们需要计算每个样本的平均值和标准偏差。
然后,我们将标准偏差与规格范围相除,得到一个公式值,该值应小于1才表示过程满足规格要求。
样本1的平均值是(10.2+10.5+10.8+10.3+10.7)/5=10.5毫米样本1的标准偏差是sqrt[((10.2 - 10.5)^2 + (10.5 - 10.5)^2 + (10.8 - 10.5)^2 + (10.3 - 10.5)^2 + (10.7 - 10.5)^2) / 5] =0.2449毫米样本2的平均值是(10.4+10.6+10.9+10.8+10.6)/5=10.66毫米样本2的标准偏差是sqrt[((10.4 - 10.66)^2 + (10.6 - 10.66)^2 + (10.9 - 10.66)^2 + (10.8 - 10.66)^2 + (10.6 - 10.66)^2) / 5] = 0.1789毫米样本3的平均值是(10.3+10.7+10.5+10.4+10.6)/5=10.5毫米样本3的标准偏差是sqrt[((10.3 - 10.5)^2 + (10.7 - 10.5)^2 + (10.5 - 10.5)^2 + (10.4 - 10.5)^2 + (10.6 - 10.5)^2) / 5] =0.1414毫米现在,我们将标准偏差与规格范围相除,得到公式值:样本1的公式值是0.2449毫米/(11毫米-10毫米)=2.449样本2的公式值是0.1789毫米/(11毫米-10毫米)=1.789样本3的公式值是0.1414毫米/(11毫米-10毫米)=1.414根据计算结果,我们可以发现样本1的公式值大于1,这意味着该过程不满足规格要求。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对任何一项数据都可进行回归分析
何种类型的数据更有利于 建立一个好的预测模型?
8
W3-4 Correlation and Linear Regression_Inst.ppt
什么是相关
▪ 当两个变量以某种形式彼此联系时,便存在相关
Time Project (Days)
1. 14 2. 29 3. 26 4. 10 5. 18 6. 11 7. 34 8. 26 9. 24 10. 21
冷却速率和定位销尺寸 是否相关
▪ 回归是用于理解X(自变量)和Y(因变量)的关系 ▪ 简单线性回归体现X和Y的相关关系 在控制阶段 ▪ 回归用于建立前馈或反馈控制系统
Y: Pin Dimension
X: Coolant flow Rate
4
W3-4 Correlation and Linear Regression_Inst.ppt
Correlation and Simple Linear Regression
相关和简单线性回归
第3周—模块4
黑带培训
第1周 5个自学模块
✓ 1. 6 Sigma概述 ✓ 2. 认知改进机会 ✓ 3. 在Sigma TRAC中定义机会 ✓ 4. 初识Minitab ® ✓ 5. 数据收集及分析
第2周 衡量阶段
Cost ($k)
80 111
76 27 55 51 150 140 80 120
Cost ($k)
Time vs. Cost of Projects
150
100
50
10
20
30
Time (Days)
项目时间增加, 成本随之增加
9
W3-4 Correlation and Linear Regression_Inst.ppt
2
W2-3 Characterize Defect_Inst.ppt
六西格玛突破性策略
定义
1 确定客户的重要因素。确定项目范围。
衡量
2 确定衡量对象(Y)并验证衡量系统。 3 量化当前业绩,设定改进目标。
分析 4 确定偏差和缺陷的原因(Xs)。 5 提供统计数据说明原因是真实的。
改进
6 确定解决方案(消除原因的方法),包括运作水平和允许误差。 7 实施解决方案,提供统计数据证明方案起作用。
相关系数
▪ 相关系数 r, 是两个变量之
间线性关系强度的统计学
衡量标准。
▪ r 总是介于 -1 和 1之间。
▪ 当 r 接近零时,不存在线 性关系。
Perfect Positive 完全正相关
No Correlation 无相关
Negative Correlation 负相关
Strong Negative 强负相关
Perfect Negative 完全负相关
Nonlinear Correlation 非线性相关
11
W3-4 Correlation and Linear Regression_Inst.ppt
Cost ($k)
Time vs. Cost of Projects
150
100
50
10
20
30
Time (Days)
项目时间增加成本随之增加
10
W3-4 Correlation and Linear Regression_Inst.ppt
关系类型
Positive Correlation 正相关
Strong Positive 强正相关
✓ 介绍 ✓ 明确过程/产品及客户CTs
✓ 描述缺陷 ✓ 衡量期望功能 ✓ 验证衡量系统 ✓ 评估过程习性 ✓ 评估过程能力 ✓ 识别潜在自变量Xs
项目管理
第3周 分析阶段
✓ 介绍 ✓ 估计及置信区间 ✓ 假设检验 4. 相关及简单线性回归
5. ANOVA 6. DOE基础 7. 全析因设计 8. 验证自变量Xs
相关和简单线性回归:内容
第一部分
: 相关 ▪ 什么是相关 ▪ 散点图 ▪ 相关系数r
第二部分: 简单线性回归 ▪ 决定系数R2 ▪ 修正系数R2 ▪ 整体显著性 ▪ 为什么应用回归方程式
第三部分:模型检验
6
W3-4 Correlation and Linear Regression_Inst.ppt
第一部分
Correlation 相关
获取数据的2种方法
观察数据
• 使用历史数据,或者
▪ 过程运行时被动获得实时 数据
实验数据
▪ 从设计实验中获得数据
▪ Factors (the x variables) are deliberately set at specific levels in a designed fashion to see their effect on the dependent variable, y. 在具体水平上预先设定因子(x变量)观 察其对因变量y的影响。
散点图
▪ 散点图是以图的形式表示成对数据(x,y)。
▪ 当一组数据中的值与另一组数据中的值相对应,而你有意了解两者中的关系时, 便可使用该图 。
Time
Project (Days)
1.
14
2.
29
3.
26
4.
10
5.
18
6.11Biblioteka 7.348.
26
9.
24
10.
21
Cost ($k)
80 111
76 27 55 51 150 140 80 120
学习目标
在学完这个模块之后,你可以:
1. 理解散点图和相关系数r ,确定两个变量是否相关。 2. 进行简单线性回归分析,解释回归方程式 3. 解释R2和P值,确定数学模型的充分性(回归方程式)。 4. 运用数学模型进行预测
5
W3-4 Correlation and Linear Regression_Inst.ppt
控制
8 适当控制以长期保持改进。 9 提供统计数据证明改进得以保持。
3
W3-4 Correlation and Linear Regression_Inst.ppt
关于这个模块
分析 4 确定偏差和缺陷的原因(Xs)。 5 提供统计数据说明原因是真实的。
相关和回归的用途
在分析阶段
▪ 相关用于验证XS
LEADERSHIP
项目陈述
第4周 改进及控制阶段
1. 介绍 2. 确定反作用方案 3. 多元及多项回归 4. 部分析因设计
5. Robust Design (Static) 6. 控制阶段 7. 防错 8. 总结
VSM
项目陈述
第5周: 评审改进阶段已完成的项目 Review projects through Improve Phase