基于数据挖掘的统计过程控制项目研究.doc
质量控制中的统计过程控制研究

质量控制中的统计过程控制研究一、引言质量控制是企业生产过程中非常重要的一环。
而统计过程控制则是其中的一种有效管理方法,可以在生产过程中实时监测各项指标是否正常,及时发现异常并进行调整,进而保证生产工艺的稳定性和产品质量的稳定性。
本文将从统计过程控制的概念、优点、应用以及实施方法等方面进行探讨,以期为读者提供一些参考。
二、统计过程控制的概念统计过程控制是一种企业管理工具,类似于一种质量控制手段,也被称为SPC (Statistical Process Control)。
其基本思想是对生产过程中各项指标进行监控,以统计学的方法来对生产质量进行控制,最终达到稳定生产、提高产品质量的目的。
在应用统计过程控制的过程中,企业需要选择合适的输入和输出指标,通过统计分析的方法对各项指标进行实时监控,及时发现并解决生产过程中的质量问题。
三、统计过程控制的优点统计过程控制可以带来多方面的优点,包括:1.减少生产成本和废品减少。
当生产过程中存在质量问题或出现异常情况时,及时采取措施可以避免生产成本和废品费用的增加,提高企业的经济效益。
2.提高产品质量和稳定性。
经过统计分析对企业生产过程中各项指标进行监测和控制,可以实时发现并调整生产过程中的问题,有效提升产品质量和稳定性。
3.提高客户满意度和品牌形象。
合格的产品质量可以提高客户的满意度,从而促进企业的发展和品牌形象的提高。
四、统计过程控制的应用统计过程控制可以应用在食品、汽车、电子、医疗器械等多个行业。
以下介绍几种常见应用:1.制造业。
在制造业中,统计过程控制可以帮助企业实时监测生产过程中的各项指标,减少因人为和机器设备等原因导致的不良品率,提高生产效率和产品质量。
2.电子行业。
在电子行业中,统计过程控制可以帮助企业实时监测电子零件的质量指标,降低制造过程中的失效率,提高产品的可靠性和稳定性。
3.食品行业。
在食品行业中,食品的纯度和安全性对消费者来说至关重要,将统计过程控制应用于食品生产中可以确保食品的成分和安全性符合标准,从而提高产品质量和安全性。
数据挖掘实验报告结论(3篇)

第1篇一、实验概述本次数据挖掘实验以Apriori算法为核心,通过对GutenBerg和DBLP两个数据集进行关联规则挖掘,旨在探讨数据挖掘技术在知识发现中的应用。
实验过程中,我们遵循数据挖掘的一般流程,包括数据预处理、关联规则挖掘、结果分析和可视化等步骤。
二、实验结果分析1. 数据预处理在实验开始之前,我们对GutenBerg和DBLP数据集进行了预处理,包括数据清洗、数据集成和数据变换等。
通过对数据集的分析,我们发现了以下问题:(1)数据缺失:部分数据集存在缺失值,需要通过插补或删除缺失数据的方法进行处理。
(2)数据不一致:数据集中存在不同格式的数据,需要进行统一处理。
(3)数据噪声:数据集中存在一些异常值,需要通过滤波或聚类等方法进行处理。
2. 关联规则挖掘在数据预处理完成后,我们使用Apriori算法对数据集进行关联规则挖掘。
实验中,我们设置了不同的最小支持度和最小置信度阈值,以挖掘出不同粒度的关联规则。
以下是实验结果分析:(1)GutenBerg数据集在GutenBerg数据集中,我们以句子为篮子粒度,挖掘了林肯演讲集的关联规则。
通过分析挖掘结果,我们发现:- 单词“the”和“of”在句子中频繁出现,表明这两个词在林肯演讲中具有较高的出现频率。
- “and”和“to”等连接词也具有较高的出现频率,说明林肯演讲中句子结构较为复杂。
- 部分单词组合具有较高的置信度,如“war”和“soldier”,表明在林肯演讲中提到“war”时,很可能同时提到“soldier”。
(2)DBLP数据集在DBLP数据集中,我们以作者为单位,挖掘了作者之间的合作关系。
实验结果表明:- 部分作者之间存在较强的合作关系,如同一研究领域内的作者。
- 部分作者在多个研究领域均有合作关系,表明他们在不同领域具有一定的学术影响力。
3. 结果分析和可视化为了更好地展示实验结果,我们对挖掘出的关联规则进行了可视化处理。
通过可视化,我们可以直观地看出以下信息:(1)频繁项集的分布情况:通过柱状图展示频繁项集的分布情况,便于分析不同项集的出现频率。
基于数据挖掘的测控系统设计优化

基于数据挖掘的测控系统设计优化在当今科技飞速发展的时代,测控系统在各个领域都发挥着至关重要的作用。
从工业生产中的质量控制到航空航天领域的精密测量,从环境监测的实时数据采集到医疗设备的精准诊断,测控系统的性能和效率直接影响着相关工作的准确性和可靠性。
然而,随着应用场景的日益复杂和数据量的急剧增长,传统的测控系统设计方法逐渐暴露出一些局限性。
为了应对这些挑战,基于数据挖掘的测控系统设计优化应运而生。
数据挖掘作为一种从大量数据中提取有价值信息的技术手段,为测控系统的设计优化提供了全新的思路和方法。
通过对海量数据的深入分析和挖掘,我们可以发现隐藏在数据背后的规律和模式,从而为测控系统的设计提供更加科学合理的依据。
在测控系统中,数据的来源十分广泛。
传感器采集到的物理量、设备运行过程中的状态参数、控制系统的指令和反馈信号等,都构成了丰富的数据资源。
然而,这些数据往往具有高维度、复杂性和不确定性等特点,如果不进行有效的处理和分析,很难从中获取有用的信息。
数据挖掘技术则可以通过数据清洗、预处理、特征提取等步骤,将原始数据转化为易于理解和分析的形式。
例如,在工业生产线上,通过对传感器采集到的温度、压力、流量等数据进行挖掘,可以发现设备在不同工况下的运行规律,从而优化测控系统的参数设置,提高生产效率和产品质量。
在环境监测中,对多个监测站点采集到的空气质量、水质等数据进行挖掘,可以建立更加准确的污染预测模型,为环境保护提供科学依据。
数据挖掘在测控系统设计优化中的应用主要体现在以下几个方面:首先是系统模型的建立。
通过对历史数据的挖掘和分析,可以建立更加精确的测控系统模型。
传统的建模方法往往基于简化的假设和理论推导,难以准确反映实际系统的复杂特性。
而数据挖掘技术可以从大量的实际运行数据中自动学习系统的内在规律,建立更加贴近实际的模型。
例如,利用神经网络、支持向量机等机器学习算法,可以对测控系统的输入输出关系进行建模,为系统的设计和优化提供基础。
基于统计过程控制(SPC)的软件过程度量系统的设计与实现的开题报告

基于统计过程控制(SPC)的软件过程度量系统的设计与实现的开题报告一、研究背景和意义随着软件发展日趋复杂和规模不断增大,对软件过程的控制与度量显得越来越重要。
统计过程控制(SPC)作为一个有效的管理方法,已经被广泛地应用于工业生产过程中。
同时,SPC还可以用于软件过程的控制与度量,以提高软件开发过程的效率和质量。
当前国内外研究仍比较少,相关的软件过程度量系统也不够完善,因此进行相关的研究和开发,具有重要的理论和实际意义。
二、研究内容和方案本研究旨在开发一个基于SPC的软件过程度量系统。
具体研究内容包括以下几个方面:1.软件过程度量指标体系的设计首先需要设计一个完整的软件过程度量指标体系。
该体系应当包含针对软件过程的各个方面的度量指标,这样才能更全面地评价软件过程的效率与质量。
2.数据采集与处理技术的研究为了获得可靠的数据,需要设计数据采集与处理技术。
同时,必须保证数据的真实性和可比性,并进行数据清洗和预处理操作,以便后续的分析和评估工作。
3.统计分析方法的选取与应用本系统需要运用SPC等统计分析方法来对数据进行处理,并针对这些数据进行分析和建模,以便进行合理的控制与度量。
在这方面,需要选取适用的统计分析方法,比如控制图、方差分析等方法。
4.系统架构的设计系统应当具有良好的交互性和可扩展性,可以支持多种不同的数据输入方式,并可扩展到其他相关领域。
因此,在系统架构的设计上,需要充分考虑这些因素,以便在系统的后续开发中具备更好的可扩展性。
三、预期成果与意义本研究预期将研究出一个基于SPC的软件过程度量系统的设计与实现方法。
该系统将针对软件过程的控制与度量问题提供有效的解决方案,促进软件开发过程的效率和质量的提高。
此外,本研究还为SPC在软件开发领域的推广和应用提供了新的思路和方法。
四、研究进度和计划本研究计划在以下几个方面展开工作:1.对已有的文献和方法进行综述和分析,明确SPC在软件过程控制和度量中的应用现状和研究热点。
基于数理统计的数据挖掘深度探讨与研究

基于数理统计的数据挖掘深度探讨与研究作者:黄艳梅来源:《电脑知识与技术》2017年第27期摘要:互联网进入了DT时代,对于数据研究不断深入。
信息化时代,通过对大数据的挖掘处理,提取有效数据,能够帮助企业不断提升自身的发展。
大数据的挖掘也推动了相关挖掘技术的提升,使得计算机技术进一步提升。
该文主要讲述利用数理统计进行信息提取的流程,并具体讲述所用的步骤和数学公式,希望对数据的处理有所帮助。
关键词:数理统计;数据挖掘;数学模型中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2017)27-0269-03信息化时代的发展,使得互联网中积沉了大量的数据,但是由于这些数据存在的方式比较杂乱,数目巨大,导致其数据利用效率低、利用程序复杂。
但是计算机人员已经发现多种办法能够对这些数据进行处理,摘取出有效的数据信息,帮助推动企业自身的发展。
现在对于大数据的处理方式除了云计算外,利用数学法对其进行处理也是常用的一种。
利用数理统计对数据的处理,主要是为了找出数据之间存在的各种规律,然后提取出有效的数据,提升数据的利用率和价值。
1 数据挖掘流程利用统计方式对数据进行处理,需要经过一系列的处理过程。
图1是数据分析筛选的几个关键程序。
而进行数据分析的大致流程如下[1]:1.1 取样由于数据整体量大,类目杂多,想要提取出精确的数据信息,必须按照数据的类目对其进行筛选,选出所需的数据库,从该数据库中选出需要的样本数据,对其进行下一步的分析。
1.2 分选在样本中的数据,需要根据具体的需求进行进一步的分选,通过这样的筛选工作,能尽可能地降低样本数据中非关键数据的干扰,提升有效数据的所占比重。
1.3 调整进行初步分类的数据,需要进一步的整理。
为了理清数据之间的各种关系,需要通过多种方式对数据进行深入处理,保证其数据调整符合数据挖掘的原则与标准。
使得调整过的数据之间的关系更加清晰。
1.4 分析对于样本中调整过的大量数据,利用各种模型、分析方法对其进行归类存放。
基于数据挖掘的PSS生产工艺的SPC研究

基于数据挖掘的PSS生产工艺的SPC研究 摘 要:文章研究了藻酸双酯钠原料生产企业、原料药合成及制剂生产企业的综合生产流程结构,设计了统计过程控制的结构平台,选择了统计质量控制工具,构建了统计过程控制体系模型;在此基础上实施过程监控,对提高质量、降低成本提出了改进意见。
标签:海洋生物制药 藻酸双酯钠 生产工艺 统计过程控制 数据挖掘 藻酸双酯钠是强活性的抗心血管海洋新药。生产过程中原料的提取、原料药的合成工艺、制剂工艺对其临床应用有着重大影响。本文深入学习了数据挖掘和SPC相关理论、方法及其发展、变化,研究了藻酸双酯钠上下游原料生产、原料药合成及制剂生产企业的生产流程,阐述了PSS生产工艺的SPC需求分析,设计了数据挖掘的SPC功能模型,设计了PSS生产工艺的数据挖掘SPC系统。
一、PSS质量控制及数据挖掘SPC技术研究 (一)PSS质量控制 藻酸双酯钠是藻酸丙酯的硫酸酯钠盐的简称,是一种类肝素样海洋药物,多用于治疗冠心病;脑血栓形成、梗塞;高血脂症。藻酸双酯钠于1990年经山东省卫生厅审查制定正式标准(地方),此后据不完全统计,全国生产藻酸双酯钠的厂家近百余家。PPS自投放市场以来已创产值数十亿元,实现利税三个多亿元。用于临床的藻酸双酯钠生产过程概括起来可划分为三个阶段:主原料褐藻酸钠的提取,即药源问题;藻酸双酯钠的化学合成过程,即活性成分的化学修饰;用于临床的产成品生产过程,即剂型选择及制剂过程。
1、主原料褐藻酸钠的提取工艺。藻酸双酯钠的主原料是褐藻酸钠,是褐藻酸的盐。提取纯化技术的发展是降低生产成本、生产符合药品质量指标的关键。目前世界范围内提取海藻酸钠可分为四种工艺:钙凝酸化法、酸凝酸化法、钙凝离子交换法、酶解提取法,目前国内绝大部分厂家采用钙凝酸化法。
2、藻酸双脂钠化学合成工艺。(1)褐藻酸钠在盐酸中浸泡10小时,每隔1小时搅拌一次。浸泡毕,倾去酸液。水解制取褐藻酸。(2)在上述褐藻酸加入环氧丙烷,褐藻酸的克数与环氧丙烷的毫升数比值为l∶2-5,并以NaOH或KOH或NaAC为催化剂,其用量为褐藻酸重量的0.5%-l.0%,在50oC-80oC和l.5kg/cm2-3.0kg/cm2的压力下或常压、40oC-50oC条件下回流即得藻酸丙二酯。(3)最后以甲酰胺或吡啶为溶剂,在60oC-80oC的条件下用氯磺酸磺化。
基于统计方法的数据挖掘算法研究

收稿日期:2004-10-121基金项目:交通部基础研究专项基金项目(20031981408).作者简介:王政霞(1977-),女,讲师,硕士,主要从事嵌入式操作系统,数据挖掘及信息融合理论研究.基于统计方法的数据挖掘算法研究王政霞1,黄大荣2(1.重庆交通学院理学院,重庆400074;2.重庆交通学院计算机学院,重庆400074)摘要:在统计方法的基础上提出了一种根据数据集合本身的统计特性数据挖掘算法.该算法利用数据本身的统计特性对数据仓库中的数据进行分析,在给定重要性比例程度的前提下,经过系列的统计运算,得到简化的数据仓库集,并根据分析得到了数据挖掘算法的流程图.提出了比例大小关系函数,反映了数据自身的统计特性,分析表明:这种算法极大的提高了数据的有效水平.关键词:数据仓库;统计特性;数据挖掘;量纲的统一中图分类号:TP182文献标识码:A 文章编号:1008-8423(2005)01-0042-03数据挖掘DM (Data M ining )是20世纪90年代中期兴起的一项新技术,是多门学科和多种技术相结合的产物[1].1989年在美国底特律召开的第11届国际人工智能联合会议的专题讨论会上,首次提出了知识发现(K DD )这个概念.1995年,美国计算机学会(AC M )会议提出了数据挖掘[2],其基本思想是:对观测到的庞大数据集进行分析,研究未知的关系和以数据拥有者可以理解的方式来总结数据[3].数据挖掘常采用的算法及理论有粗糙集[4]、人工神经网络[5]、决策树[6]、遗传算法[2]、Agent 算法[7]等.这些算法都在不同的领域内取得比较好的效果,但都对噪声的干扰比较敏感.同时,在现代社会中,随着信息产业的发展,大量的数据信息不可能都存储在数据库中[8,9],需要清除掉那些冗余数据,但是由于主观性的意愿,可能删除了对决策有用的数据,影响决策的正确实施.为了解决这些问题,本文从数据集合本身的统计特性出发,提出了一个比较有效的数据挖掘算法,并给出了算法实现的流程图,得到了比较好的效果.1 参数结构模型分析假设在决策系统中对n 个相关的数据因素实现了m 次的观测,并把这些数据因素的集合记为X ={x 1,x 2,…,x n },对于每一个数据因素来说,在不同的观测点会观测到不同的状态值.由于决策系统中观测点存在m 个,因而对于数据因素集合来说,将全部的观测结果用一个n ×m 阶矩阵X 表示,得到下面的数据库矩阵:12m x 1x 2…x n x 11 x 12 … x 1m x 21 x 22 … x 2m… … … …x n 1 x n 2 … x nm=X (1)显然,这些数据来自于决策系统本身,在每一个观测点都会有相应的反映,称之为观测数据库矩阵或样本资料库.显然,把所有的n 个相关的数据因素都拿来作为决策依据是不可取的,为了简化决策的实施,可以运用统计手段从观测数据库矩阵出发去清洗冗余数据,提取有关信息.1.1 量纲的统一在决策系统中,各种数据因素的量纲是不一致的,为了解决量纲的统一问题,对观测数据库中的观测值第23卷第1期 湖北民族学院学报(自然科学版) Vol .23 No .12005年3月 Journal of Hubei I nstitute f or Nati onalities (Natural Science Editi on ) Mar .2005定义一个合理的量纲统一法则,是基于统计方法的数据挖掘算法的关键之一,鉴于此定义决策系统数据观测值在数据因素所有的观测点占有比例大小为量纲统一规则,如式(2):r ij △x ij 6m j =1x ij (i =1,2,…,n;j =1,2,…,m )(2)这样,就得到了数据因素量纲统一矩阵R,如式(3)所示.12m x 1x 2…x n r 11 r 12 … r 1m r 21 r 22 … r 2m… … … …r n 1 r n 2 … r nm=R (3)通过这个量纲统一矩阵,就把数据因素转化为同量纲的可以比较大小的观测数据,进而可以作进一步的分析.1.2 统计规则参数从上面的分析可以看到,各个数据因素的量纲是统一的,因而可以定义第i 个数据因素在各个观测点的观测平均值如下:r i △6m j =1x ij n (i =1,2,…,n )(4) 这样,对于决策系统的第(i =1,2,…,n )个数据因素来说,每一个数据因素观测值都和这个平均值之间存在误差,记为:△ij =r ij -r i (i =1,2,…,n;j =1,2,…,m )(5) 显然,决策系统的任何一个数据因素其相应的观测实际值和平均值之间有不同的差异,因而对于每一个数据因素来说,观测值的变化在每个观测点都能得到体现,因此本文把每个数据因素的误差平方和在整体中所占比例作为数据挖掘分析的量化指标,记为:σi 2=6mj =1△ij 2n =6m j =1(r ij -i )2n (i =1,2,…,n;j =1,2,…,m )(6)ηi =σi 26n i =1σi 2 (i =1,2,…,n )(7)有了这个量化指标后,对于第i 个数据因素来说,由于数据观测值相对于整体来说所占比例大小在每个观测点都能得到体现,因而根据文献[7]的思想,为了能够决定是否删除掉数据因素,就可以对这个数据因素状态设置一个比例下限η0i ,也就是重要性度量,一旦计算得到的误差和ηi (i =1,2,…,n )超过这个估计值,说明这个数据因素对于决策系统来说是“重要”的,保留这个数据因素,否则就删除.显然,由于这个下限值是基于专家和经验给定的,可以认为他对于决策系统来说是“公平”的.2 算法的提出和实现访问数据仓库中庞大的数据集会产生很多问题,其中最为重要的就是数据采集方式导致产生的冗余数据问题,如何去把这些冗余数据清除掉,是数据仓库中很关键的一个问题,否则在决策中会因为“失真”的问题导致决策失误.一般来说,数据本身能反映很多的属性,通过对属性的分析可以获得比较可靠的数据.鉴于此,提出给予统计方法的数据挖掘算法如下:(1)专家系统调研:对决策系统中的的数据因素提供重要性度量关系η0i (i =1,2,…,n ),预存到计算机程序中;(2)系统初始化:建立初始数据因素矩阵X,预存到计算机程序中;(3)接受来自于计算机程序中的初始状态数据矩阵X,利用式(2)计算数据因素量纲统一矩阵R,输入到下一步;(4)接受数据因素量纲统一矩阵R,根据式(4)和式(5)计算数据因素的观测值误差Δij (i =1,2,…,n;j =1,2,…,m ),输入到下一步;34第1期 王政霞等:基于统计方法的数据挖掘算法研究 (5)根据式(6)和式(7)计算各个数据因素在整体因素中占有比例ηi (i =1,2,…,n ),并从计算机程序中调用比利下限σ0i (i =1,2,…,n ),比较ηi 与σ0i 知识库中的大小,如果有不成立,保留数据;否则,删除;图1 流程图Fig .3 Fl ow chart(6)输出结果,得到数据仓库的分析报告.根据这个算法步骤,可以用流程图描述如图1.显然,从这个流程图的设计中,可以简洁明了地得到有用的数据仓库,而且由于充分考虑了数据的本身特性,从而得到了符合实际情形的数据集合.在故障预测的实际应用中,很好地解决了数据“丢失”的问题.3 结论在对大量数据和多属性的数据仓库的挖掘中,该算法相对于其他的算法来说,极大的简化了决策的复杂度,可以给决策部门提供一个迅速准确的决策平台.决策部门的风险承受能力的再次得到了体现,同时可以在不丢失数据的前提下极大的简化决策规则.然而,由于实际应用中数据都是在不断的变化,随机因素的存在将导致数据的极大的不平衡,如何来调节这种平衡还是一个难点,笔者正在做进一步的工作.关于这方面的文献,限于篇幅,将另文给出.参考文献:[1]徐泽柱,王林.基于粗糙集理论和BP 神经网络的数据挖掘算法[J ].计算机工程与应用,2004(40):169~175.[2]刘同明.数据挖掘技术及其应用[M ].北京:国防工业出版社,2001.[3]David Hard,HerkiMannila,Padhraic S myth .Princi p les of Data M ining[M ].北京:机械工业出版社,2003.[4]Pa wlak Z .Rough set theory and its app licati on t o data analysis[J ].Cybernetics and System,1998(29):661~668.[5]Martin T Hagan,Howard B De muth,Mark Beal .Neural Net w ork Design[M ].北京:机械工业出版社,中信出版社,2002.[6]张方明.人工神经网络的模型及应用[M ].上海:复旦大学出版社,1992.[7]于海防,解福.基于Agent 的数据挖掘在CR M 中的应用[J ].山东师范大学学报(自然科学版),2004,19(1):82~85.[8]黄大荣,黄席樾.基于粗糙集理论的数据清洗模型[J ].计算机工程与应用,2004,40:164~182.[9]张兆中,李建中,张艳秋.海量数据上挖掘关联规则的并行算法[J ].哈尔滨工业大学学报(自然科学版),2004(5):561~565.Study of Da t a M i n i n g A lgor ithm s Ba sed on St a tisti ca l M ethodWANG Zheng -xia 1,HUANG Da -r ong 2(1.College of Science,Chongqing J iaot ong University ,Chongqing 400074,China;2.College of Computer Science,Chongqing J iaot ong University,Chongqing 400074,China )Abstract:On the basis of statistical method,this paper put f or ward one data m ining algorithm according t o statis 2tics characteristic of the data ′s set itself .This algorith m utilizes the statistical characteristic of data t o analyze the data in the data warehouse,on the p re m ise of giving definitely degree of p r oporti on of i m portance,thr ough a series of statistics operati on,get the si m p le data warehouse set,and gained the fl ow chart of data m ining algorithm s ac 2cording t o analysis .The paper p r oposed the relati on functi on of the p r oporti on that reflects the statistical character 2istic of data itself .The analysis th9at shows this alg orithm has i m p r oved greatly the effective level of data .Key words:data warehouse;statistical characteristic;data m ining;di m ensi on unificati on44 湖北民族学院学报(自然科学版) 第23卷。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于数据挖掘的统计过程控制项目研究
统计过程控制(Statistical Process Control)是一种借助数理
统计方法的先进质量管理和控制技术,以过程的稳定性为主要目
标,强调全过程的预防,能够有效地降低产品的不合格率,从而
降低生产成本。 近年来SPC技术在国外的应用已经非常广泛,
已经成为提高企业管理的有效工具,通过 SPC 方法运用统计技
术对生产过程中的各工序参数进行监控,从而达到保证产品质量
和生产精细化的目的。目前 SPC 在国内烟草企业的生产过程应
用在生产管理和统计数据分析中大多只停留在现场的监控,和事
后数据罗列。大部分还停留在使用MiniTab软件,或应用Excel
表格中的一些简单SPC统计功能。只能进行事后分析和处理,
数据处理滞后且效率较低,不能达到实时监控。 本文基于数据
挖掘(data mining) SPC项目应用,利用数据挖掘理论识别卷烟生
产关键工序,从大量数据中获取有效的、稳定模式的生产过程数
据,对其进行分析建模。进行软件开发,采用面向多对象的思想,
将制丝生产中所有质量特征经过检测仪器实时检测后,转换为计
算机能识别连续型的随机变量数值,进一步更好的应用实时数据
指导生产。 首先,介绍了我国烟草行业的概况和研究背景,论
述了国内外相关技术的发展状况和研究状况,阐述了本课题的研
究内容和意义并探讨了SPC及数据挖掘的原理及发展。 其次,
进行了数据挖掘SPC质量控制系统设计。主要内容包括青岛卷
烟厂企业信息化现状,确定实施SPC背景,及实施项目的软硬
件基础。 再次,进行了数据挖掘SPC系统在关键工序中的应用。
根据业务相关需求设计了可行的数据挖掘的功能模型及算法、系
统架构及其实现,包括具体的功能的实现,主要是在混丝加香段
这个关键工序上验证了设计的可行性。具体是由带智能积分器的
微分控制器保证其精度,并通过采集的样本来测算关键性能指
标,使其符合预期的期望,满足生产工艺的要求,从而实现烟草
质量控制的实时化、智能化。 最后,对全文进行了总结,并对
课题下一步工作做了展望。