改进K-MEANS算法在多晶硅干法回收氢中的研究及应用
K_means算法的改进及应用

邮局订阅号:82-946120元/年技术创新软件时空《PLC 技术应用200例》您的论文得到两院院士关注K-means 算法的改进及应用Improvement and Application of k-means Algorithm(上海大学)王刚勇周维民WANG Gang-yong ZHOU Wei-min摘要:针对k-means 算法在聚类过程中受初始聚类中心影响很大的问题,本文提出了一种优化初始聚类中心的方法。
此方法通过计算聚类中心与其他各个点之间的距离,依次找到最佳的一组初始聚类中心组合。
实验表明改进后的k-means 算法提高了检测率,降低了误检率,产生了质量较高的聚类结果。
关键词:K-means 算法;中心对象;聚类中图分类号:TP393.08文献标识码:AAbstract:In allusion to the problem of k-means algorithm that is greatly affected by the initial clustering center,a new method is proposed to optimize the initial clustering center.The method calculating the distance between the clustering center and other points will find the best clustering center combination.Experiments on the web-log show that the improved k-means algorithm can improve the detection rate,reduce error rate,and produce a high clustering result.Key words:K-means algorithm;Center object;Clustering文章编号:1008-0570(2012)10-0431-021引言随着计算机技术的不断发展,网络已经遍布于世界的各个领域和角落,随着而出的信息安全问题显得尤为重要。
改进的K-means聚类算法及应用

改进的K-means聚类算法及应用摘要:传统的k-means算法需要事先确定初始聚类中心,聚类精确程度不高。
针对以上问题,本文结合熵值法和动态规划算法来对传统的k-means算法进行改进,提出了基于熵值法及动态规划的改进k-means算法。
熵值法用来修订算法的距离计算公式,以提高算法的聚类精确程度, 动态规划算法用来确定算法的初始聚类中心。
将改进算法应用于矿井监测传感器聚类中,结果显示较传统的k-means算法,改进算法效率有了明显提高,聚类精确程度有较大增强。
关键词:k-means;动态规划;熵值法;聚类精确度;矿井监测传感器【abstract】the traditional k-means has sensitivity to the initial clustering centers, and its clustering accuracy is low. to against these short comings, an improved k-means algorithm based on the combination of dynamic programming algorithm and entropy method is proposed. the entropy method is used to amend the distance calculating formula to improve the clustering accuracy, and dynamic programming algorithm is used to define the initial cluster centers. the result of the simulation on the clustering in the mine monitoring sensors shows that the proposed algorithm has betterperformance than the traditional k-means algorithm in terms of efficiency and clustering accuracy .【key words】k-means; dynamic programming; entropy; clustering accuracy; mine monitoring sensors0 引言k-means算法是数据挖掘技术中基于分裂法的一个经典的聚类算法,因为该算法的理论可靠、算法简单、收敛迅速而被广泛应用[1-2]。
改进K-means算法的MapReduce并行化研究

改进K-means算法的MapReduce并行化研究李兰英;董义明;孔银;周秋丽【摘要】针对K-means在处理海量数据时,因初始聚类中心的选取不确定,从而导致收敛速度过慢的问题,本文提出了改进的K-means算法,首先用模糊聚类的思想对数据集进行模糊分类,其次采用动态计算聚类中心的方式对数据集进行二次分类,最后将算法在MapReduce模型上进行了实现.实验结果表明,改进后的算法不仅提高了加速比,而且算法的收敛速度更快.【期刊名称】《哈尔滨理工大学学报》【年(卷),期】2016(021)001【总页数】5页(P31-35)【关键词】聚类;MapReduce;K-means;加速比【作者】李兰英;董义明;孔银;周秋丽【作者单位】哈尔滨理工大学计算机科学与技术学院,黑龙江哈尔滨150080;哈尔滨理工大学计算机科学与技术学院,黑龙江哈尔滨150080;哈尔滨理工大学计算机科学与技术学院,黑龙江哈尔滨150080;哈尔滨理工大学计算机科学与技术学院,黑龙江哈尔滨150080【正文语种】中文【中图分类】TP301随着信息技术的高速发展,尤其是当今大数据时代的来临,如何从复杂高维的数据中快速、准确地挖掘出有用的信息,已成为现在研究的一个热点[1].传统的聚类算法在面对复杂多变的数据格式以及高维数据时,无论从算法的时效性还是资源的利用率等方面,都不能提供一个有效的解决方案[2].传统的数据挖掘算法已经远远不能满足现在计算的要求,而计算规模方面的巨大差距,是无法依靠单纯的硬件升级来实现的[3],只能通过改进传统聚类算法或者彻底改变计算模式,才能解决这个问题.近几年来并行计算编程模型的提出,为解决这个问题提供了新的方向,而谷歌提出的MapReduce[4]并行化计算模型在处理海量数据方面具有巨大的优势,成为新的研究热点[5].传统的以K-means为代表的数据挖掘算法,在面对大量、高维的数据时,易出现局部最优、收敛速度过慢的问题[6].针对该问题国内外许多专家已经开始了研究,如江小平等首先对K-means算法实现了MapReduce化,但该算法没有完善初始聚类中心[7];周婷等进一步完善了K-means聚类算法的MapReduce化,使得其稳定性和扩展性有了进一步提高[8];赵庆运用Canopy的“最大最下原则”实现了Canopy-Kmeans算法,使得系统的运行时间有了很大提高,抗噪能力得到增强,但其“最大最小”难以控制[9];贾瑞玉将遗传算法的粗粒度思想引入并行化设计中,运用遗传算法对k-means算法进行了改进,实现了并行遗传k-means算法,但需要进一步改进遗传因子[10].为了提高算法的收敛速度和加速比,在总结前人工作的基础上,首先对MapReduce[11]编程模型进行了研究,然后对K-means算法进行了并行化的研究与改进,避免了K-means算法的硬性划分问题和初始聚类中心不确定问题.分布式编程模型MapReduce最早是由Google提出的,后来Apache基金会开发的分布式开发环境Hadoop也是在MapReduce分布式框架的基础上发展而来的[12].MapReduce采用“分而治之”的思想,首先将数据集进行不断地拆分处理,得到千千万万个小数据集[13],然后由NameNode将这些小数据集交给集群中的节点进行处理,这些节点可以并行地执行map计算任务,这样可以将一个任务交给多个节点执行,整体计算效率得到了提高.通过Map计算得到的大量中间计算结果,又由Reduce进行再次计算汇总,形成一个新的计算结果,最后将各个节点处理完的数据集再合成.MapReduce库函数UserProgram先将输入文件划分为若干份split,每一份大小通常为64M,作为初始输入,然后由fork函数将这些拆分的split文件拷贝到各个节点上.节点上的Map函数首先会读取片中的数据信息,抽取其中的键值对,然后经过一系列的中间计算产生一个中间键值对.Reduce函数会将Map函数输出的中间键值对作为本函数的输入,进行一系列的汇总,计算处理后得到最后的键值对输出OutputFile.MapReduce的模型如图1所示:K-means[14]算法是一种优化的聚类算法.改进K-means算法的核心思想为:针对某一个数据集合,首先运用FCM[15]算法对初始数据集进行粗略的分类,使得分类结果具有较高的簇内相似性和较低的簇间相似性.然后将粗略分类的数据集运用动态K-means算法进行进一步的聚类,在聚类的过程中采用加权欧式聚类以及动态计算聚类节点的方法,得到最后的分类结果.2.1 改进算法描述设X={X1,X2,…,Xi,…,XN}为原始的数据集,N为数据集中的样本数量,Xi代表不同的样本,每个样本为n维向量,可一般化表示为Xi={xi1,xi2,…,xij,…,xin}[16],其中xij代表第i个样本的第j个特性值.FCM算法的迭代过程就是一个不断寻求目标函数最小化的过程,目标函数值的求解表达式为:其中:uij代表数据集X的第j个样本Xj隶属于第i个分类的隶属度;d(Xj,vi)表示第j 个样本与第i个聚类中心vi之间的欧式距离;vi表示第i类的聚类中心[17].对目标函数应用Lagrange乘法可求解出隶属度uij,uij表达式为:其中,m∈[1,∞)是数据集的加权指数,在本实验中取值为2.隶属度uij应满足式(3):不同数据样本间的欧式距离按式(4)计算:其中,xik,xjk分别表示样本Xi和Xj的第k维的值,n为数据样本的维数.聚类中心集合V={v1,v2,…,vi,…,vn}(vi⊂V,i=1,2,…,C),其中用vi表示第i个聚类中心,vi的计算式为:定义:K-means算法的聚类中心为本数据集所有数据在n维数据对象上的平均值[18],聚类中心mi计算式为:定义:dw(xa,xb)为任意两个类之间的加权欧式距离[19],其计算公式为:其中wi表示第i维属性的权重[20],wi的计算公式为:2.2 改进算法的实现步骤聚类实质上就是一个不断迭代的过程,算法的具体步骤为:Step1:给出初始的聚类个数C,加权指数m和容许误差ξ的值,并按照式(5)计算各个类的初始化聚类中心vi(k),i=1,2,…,C,并令循环次数为1;Step2:按照公式(2)计算类的隶属度uij,(i=1,2,…,C;j=1,2,…,N),按照公式(5)计算所有的聚类中心vi(k+1),i=1,2,…,C;Step3:计算误差‖vi(k+1)-vi(k)‖2,如果f<ξ则算法结束分类,否则令k=k+1,转向Step2;Step4:由式(6)计算出聚类中心mi,然后随机选择其中的k个作为类的初始质心,k 小于聚类中心的个数;Step5:在第n次迭代中,对任意一个数据对象xa,按照式(7)计算与聚类中心mi间的加权欧式距离,依次比较与各个聚类中心间的距离,找出与其距离最小的那个类,将该对象归入那个类;Step6:再次计算到每个类到聚类中心的加权欧式距离;按式(9)计算聚类的标准方差: 当标准方差E小于极限limit时,算法终止,否则回到步骤Step5.2.3 K-means算法的时间复杂度假设有d个数据集需要进行分类,每个数据集有k个不同的类,改进K-means算法完成每个聚类的过程需要t次迭代,计算距离消耗的时间为n,那么传统串行K-means算法的时间复杂度是O(d×k×t×n).假设一个集群节点可以完成h个任务,完成一次聚类的过程共有g个节点参加,那么并行K-means算法的时间复杂度为.对MapReduce编程模型,Map和Reduce的每一步计算都可独立分开,且各个元素在运行过程中没有关联,故在实现基于MapReduce的改进K-means算法时,需要每个质点之间的距离计算都能单独运行.该算法MapReduce化的基本思路是:针对每一次迭代启动一个MapReduce过程,计算不同数据类之间的距离以及聚类中心,进行聚类,通过不断迭代形成新的聚类.3.1 Map函数的设计Map函数主要完成从HDFS的文件中逐行读取数据,并且针对每一条记录分类标记,计算它到每个质心的距离及隶属度,最后产生中间键值组,并输出给Reduce函数.Map函数的伪代码描述如下:Public void map(Object key, Object value){计算样本到每一个质心的距离;将上述距离进行比较;找出离样本距离最近的那个类,并将该样本归入那个类;将<所属类别,初始聚类>写入中间键值组,并输出;}3.2 Reduce函数的设计Reduce函数接受来自Map函数输出的中间键值组,将键值组不断进行合并、计算,产生新的聚类,将最终计算结果上传.Reduce函数的具体描述如下:public void reduce(Object key, Object value){for(对于key相同的所有记录){记录不同维度的属性值;计算记录到其质心的距离;对上述距离进行计算并分类汇总;}将<记录所属类别,聚类值>写入最后的聚类分组中;}改进K-means算法结构流程描述如图2所示.首先,经过分片的输入数据集会先执行FCM算法的MapReduce过程,产生一个初始的聚类,然后运用K-means算法的MapReduce过程对初始聚类进行进一步的分类,产生最后的聚类.4.1 实验环境本实验在由7台计算机组成的集群上运行,实验采用了Apache基金会下的Hadoop平分布式框架.将其中1台机器作为主节点即NameNode(或JobTracker)节点,其余6台机器作为从节点即DataNode(或TaskTracker)节点.每台机器的硬件配置如下:CPU型号为AMD Trinity APU A8-5800B、频率为3.2GHz,内存大小为4G,硬盘大小为1T,操作系统为Ubuntu 13.10,100M的D-Link交换机,开发工具和平台为Eclipse 8.5、JDK 1.7、Hadoop 2.2.0.4.2 性能实验分析4.2.1 单机性能比较实验实验分为两组,一组由单台机器运行串行K-means算法,另一组由仅有一个节点的集群运行改进K-means算法,在相同数据量,相同的硬件环境的情况下,比较它们在数据读入到完成聚类所需要的时间.其中t1为第一组运行串行算法的单台机器所需要的时间,t2为第二组运行基于MapReduce的改进K-means算法的Hadoop 集群所需要的时间.最终的实验结果如表1所示:由表1可以看出传统串行k-means算法在处理少量数据的时候具有一定的优势,运行速度较快,但是随着处理数据量的不断增大,串行k-means算法的不足表现的越来越明显,当数据规模增大到一定程度的时候,系统内存不足.但是集群虽然在刚开始的时候,因为系统的I/O消耗资源较多,但随着数据量的增大,处理数据的优势越来越明显.4.2.2 集群性能实验针对集群运行改进的K-means算法进行3个实验.实验一选取数据量大小分别为:39.8 M、423.1 M、1.0 G、2.7 G的数据集,将数据节点由1个逐步增加到6个,分别比较集群完成最终聚类所需要的时间,实验结果如图3所示.由图3可以看出数据量和集群节点数同时增加时,系统稳定,扩展能力良好.实验二选取数据量大小分别为436.9 M,1.0 G和1.7 G的数据集,集群节点数由1个节点逐步增加到6个,比较它们的所用时间的加速比,实验结果如图4所示.由图可以看出该集群具有良好的加速比.实验三:集群运行A,B,C,D (其中A为改进K-means算法,B为Canopy-Kmeans算法,C为遗传K-means算法,D为并行K-means算法) 4种算法,在处理的数据量相同时逐步增加节点数,比较集群完成聚类所需要的时间,实验结果如图5所示.可以看出基于MapReduce的改进K-means算法收敛速度较快.随着大数据时代的来临,无论是数据的规模还是数据结构的多样性都在急速扩张,为了将传统聚类算法应用于海量数据的挖掘中,本文对传统聚类算法K-means进行并行化改进.首先用模糊聚类算法思想对数据集进行分类,然后采用动态计算聚类中心的方式进一步聚类,这样不仅克服了K-means算法初始聚类中心选择的不确定问题,而且使得算法的收敛速度更快,最后将改进后的算法用MapReduce平台实现.实验结果表明:基于MapReduce的改进K-means算法,算法加速比提高,收敛速度加快.【相关文献】[1] 朱林,雷景生,毕忠勤.一种基于数据流的软子空间聚类算法[J],软件学报,2013, 24(10):2610-2627.[2] 吴烨,钟志农,熊伟,等.一种高效的属性图聚类方法[J].计算机学报,2013, 36(8):1704-1713.[3] 陈吉荣,乐嘉锦.基于Hadoop生态系统的大数据解决方案综述[J].计算机工程与科学,2013,35(10):25-35.[4] 李建江,崔健.MapReduce并行编程模型研究综述[J].电子学报,2013,11(11):2635-2642.[5] 许丞,刘洪,谭良.Hadoop云平台的一种新的任务调度和监控机制[J].计算机科学,2013,40(1):112-117.[6] 胡伟. 一种改进的动态k-均值聚类算法[J].计算机系统与应用,2013,22(5):116-121.[7] 江小平,李成华,向文. k-means聚类算法的MapReduce并行化[J].华中科技大学学报,2011,39(1):120-124.[8] 周婷,张君瑛,罗成. 基于Hadoop的K-means聚类算法的实现[J].计算机技术与发展,2013,23(7):18-21.[9] 赵庆.基于Hadoop平台下的Canopy-Kmeans高效算法[J].电子科技,2014,27(2):29-31.[10]贾瑞玉,管玉勇,李亚龙.基于MapReduce模型的并行遗传k-means聚类算法[J].计算机工程与设计,2014,35(2):657-660.[11]毛典辉.基于MapReduce的Canopy-Kmeans改进算法[J].计算机工程与应用,2012,48(27):22-27.[12]赵卫中,马慧芳,傅燕翔.基于云计算平台Hadoop的并行k-means聚类算法设计研究[J].计算机科学,2012,38(10):166-169.[13]武森,冯小东,杨杰,等.基于MapReduce的大规模文本聚类并行化[J].北京科技大学学报,2014,36(10):1411-1419.[14]詹辉煌,朱敏琛.一种改进的动态K-means聚类算法[J].微型机与应用,2012,31(20):74-76.[15]余长俊,张燃.云环境下基于Canopy聚类的FCM算法研究[J].计算机科学,2014,14(11A):316-319.[16]李玲俐.一种基于属性分解的FCM融合聚类算法[J].计算机应用,2013,30(8):65-68.[17]宋琳,高满屯,王三民,等.模糊C均值与多相水平集图割优化相结合的图像分割[J].图形学报,2015,36(4): 563-569.[18]张婷,戴芳,郭文艳.基于ISODATA聚类的词汇树图像检索法[J].计算机科学,2014,41(11A):123-127.[19]李海洋,文永革,何洪州,等. 基于随机权重粒子群和K-均值聚类的图像分割[J].图形学报,2014,35(5):755-761.[20]张琳,陈燕.一种基于密度的K-means算法研究[J].计算机应用研究,2012,28(11):4071-4073.。
一种改进的K_means聚类方法

一种改进的K_means聚类方法胡伟【期刊名称】《计算机与现代化》【年(卷),期】2012(000)001【摘要】针对传统K_means聚类方法采用随机选择初始聚类中心而导致的收敛速度慢的问题,本文结合空间中的距离度量提出一种改进的K_means聚类算法.该方法通过给出有效的启发式信息,选择较好的聚类中心,减少聚类达到稳定状态所需要的迭代步骤,加速算法的执行.标准数据集上的实验结果表明,与传统的K_means 聚类方法相比,本文提出的改进的聚类方法收敛速度快,从而在较少的迭代后得到良好的聚类效果.%This paper presents an improved clustering model based on distance measurement, in order to solve the problem of slow convergence rate of traditional K_means clustering method by selecting initial cluster centers randomly. By using effective heuristic information, this method selects better clustering centers and reduces the iteration steps of attaining stable clustering state. Then the speed of algorithm is accelerated. Simulation results on UCI datasets demonstrate that comparing with traditional K_ means clustering means, the improved K_means has fast convergence rate and the better clustering results are obtained by this model after less iterations.【总页数】4页(P22-24,56)【作者】胡伟【作者单位】山西财经大学实验教学中心,山西太原030006【正文语种】中文【中图分类】TP18【相关文献】1.一种改进的K_means算法在旅游客户细分中的应用 [J], 汪永旗2.一种改进型TF-IDF文本聚类方法 [J], 张蕾;姜宇;孙莉3.一种基于改进自编码器的二进制协议聚类方法 [J], 彭博一;张钊;蒋鸿宇4.一种优化的改进k_means算法 [J], 张淑清;黄震坤;冯铭5.一种基于SOM改进的PCM聚类方法 [J], 兰雁宁;郑陈达因版权原因,仅展示原文概要,查看原文内容请购买。
多晶硅生产中氢气消耗分析及优化

多晶硅生产中氢气消耗分析及优化摘要:氢气是多晶硅生产中的主要原料,其消耗量直接影响多晶硅生产成本。
本文对多晶硅生产过程中氢气用点逐一进行分析、探讨,并提出相应的优化措施,以降低氢气的消耗量,进而降低多晶硅生产成本。
关键词:多晶硅;氢气;消耗量多晶硅是半导体集成电路和太阳能光伏发电的关键原料。
随着信息技术和太阳能光伏产业的发展,全球市场对多晶硅的需求快速增长。
目前大部分多晶硅生产企业采用技术为相对成熟的改良西门子法工艺,将高纯的三氯氢硅在氢气环境的还原炉中气相沉积为多晶硅产品。
氢气作为主要性生产原料,在多晶硅生产过程中用点较多、用气量大(目前国内多晶硅企业单位多晶硅产品消耗氢气量约在0.4-1.0Nm3/Kg-Si,我司氢气消耗见图所示),因此降低氢气消耗量可有效的降低多晶硅生产成本。
图氢气消耗一览1多晶硅生产工艺简介改良西门子多晶硅生产工艺包括六大生产工序:三氯氢硅合成、四氯化硅氢化、三硅烷提纯、三氢氢硅还原、尾气回收、多晶硅后处理,工艺流程见图所示。
工业硅粉与氯化氢气体(氢气和氯气合成)在合成炉中生产三氯氢硅、四氯化硅,后经氯硅烷提纯工序提纯到高纯三氯氢硅,高纯三氯氢硅与氢气在还原炉内气相沉积为高纯多晶硅产品,含氯硅烷、氢气、氯化氢的还原尾气进入尾气回收工序分离,回收的氢气返回还原工序,氯化氢返回三氯氢硅合成工序,三氯氢硅经提纯后返回还原工序,四氯化硅经氢化工序转化为三氯氢硅后进入氯硅烷提纯工序进一步提纯,后续再进入还原工序使用。
处了少量的杂志排出和部分尾气排放处理外,整个多晶硅系统基本上是一个理想的自身物料循环、能量回收利用的闭路系统。
图多晶硅生产工艺流程简图2氢气消耗点分析在多晶硅生产中,氢气作为主要物料参与三氯氢硅合成、三氯氢硅还原、四氯化硅氢化等反应。
在整个生产过程中,氢气的损耗点主要有:2.1 三氯氢硅合成工序氢气与氯气反应生成氯化氢,氯化氢与工业硅粉在合成炉中生成三氯氢硅、四氯化硅,合成尾气从合成炉排出后经过滤、冷凝、加压冷凝、吸附净化回收氢气等处理后,尾气中的氯硅烷冷凝进入提纯工序以得到高纯三氯氢硅,回收的氢气返回系统与氯气生成氯化氢。
多晶硅生产中氢气消耗分析及优化

图 1 多 晶 硅 生 产 工 艺 流 程 简 图
1 多晶硅生产 工艺简介
改 良西 门 子 多 晶 硅 生 产 工 艺 包 括 六 大 生 产 工 序 : 三 氯 氢 硅合 成 、 氯 硅 烷 提纯 、 三 氯 氢 硅 氢还 原 、 还 原 尾 气干 法 回 收 、四氯 化 硅 氢 化 、多 晶 硅 后处 理 ,工 艺 流程 见 图 1 所示。
关键 词 : 多 晶硅 ; 氢气 ; 消耗 量 中 图分 类号 : TQ1 2 7 . 2 文 献 标识 码 : A
Th e An a l y s i s a nd Opt i mi z a t i on s ol u t i on of Hydr og en c on su mp t i on i n Pol y si l i c on Pr o duc t i o n
生 成三 氯氢 硅 、四 氯 化 硅 ,后 经 氯 硅 烷 提 纯 得 到 高 纯 三
2 氢气消耗点分析
收稿 日期 : 2 0 1 7 - 0 1 作 者简介 : 张志 刚( 1 9 8 4 一) , 男, 研 究生, 工程 师, 主要从 事多 晶硅 工艺 设 计工作 。
返 回还 原 工 序 ,四 氯 化硅 经 氢化 工序 转 化 为 三 氯 氢 硅 后 基 本上 是一 个 理 想 的 自身 物 料 循 环 、能 量 回收 利用 的 闭
路 系统 。
整 个 多 晶 硅 生 产 系 统 工 业硅粉 与氯化 氢气体 ( 氢气和 氯气 合成 ) 在合 成炉 中 进 入还 原 工 序 。除 了 少 量 排 杂 外 ,
多晶硅太阳能电池技术的研究及应用
多晶硅太阳能电池技术的研究及应用近年来,环境污染和化石能源的逐渐枯竭已经成为全球面临的重大问题之一,因此,对于可再生能源的研究特别受到人们的关注。
其中,太阳能是最具潜力的可再生能源之一。
太阳能电池作为太阳能发电的核心,其效率和性价比一直是太阳能电力领域的关键研究方向。
多晶硅太阳能电池技术作为太阳能电池的主流技术之一,目前广泛被应用于工业生产。
一、多晶硅太阳能电池技术的基本原理多晶硅太阳能电池技术的基本原理就是将硅源料熔化后,通过技术手段来使其冷却结晶形成多晶硅块,在之后的切割和抛光等工艺处理中得到多晶硅太阳能电池片。
而多晶硅太阳能电池片内部是由微米级别大小的晶粒组成的,因此分界面和晶界的比例比单晶硅太阳能电池片更高,这也是多晶硅太阳能电池片在电路增益和填充因子这些关键参数上相对差的原因之一。
二、多晶硅太阳能电池技术的研究进展及通用化多晶硅太阳能电池技术起步较早,但是由于钻石丝锯切技术及抛光等技术上的欠缺,以前的太阳能电池效率非常低。
近年来,在新工艺的加持下,多晶硅太阳能电池的效率得到了提升。
例如,钻石丝锯切技术越来越流行,可以生产高质量的硅片,这使得多晶硅太阳能电池在市场上得到更广泛的应用。
另外,多晶硅太阳能电池技术的通用化也是当前研究的一个焦点。
在多晶硅太阳能电池技术的普及过程中,其中一个关键因素就是生产成本。
现有的生产工艺中,硅片的成本占了太阳能电池整个产品成本的比重较大。
然而,通过创新设计和改进生产工艺,可以推动多晶硅太阳能电池技术的规模化制造和降低成本。
三、多晶硅太阳能电池技术的应用多晶硅太阳能电池技术广泛应用于家庭太阳能电源、商业和工业用途、建筑物外墙等几个方面。
对于家庭太阳能电源,多晶硅钙钛矿太阳能电池可以根据电力需求进行灵活组合,且效果显著,可以让家庭节约不少电费。
在商业和工业用途方面,多晶硅太阳能电池的特点是具有较强的承受压力能力和较强的耐候性,可以用于户外广告牌、停车场照明等等。
多晶硅尾气干法回收工艺简述
多晶硅尾气干法回收工艺简述多晶硅尾气干法回收工艺简述一、概述“传统西门子法”还原尾气回收是“湿法回收”,即还原尾气中没有反应的三氯氢硅、氢气和反应过程中生成的氯化氢、四氯化硅、二氯二氢硅等气体,经过-80℃冷却装置,三氯氢硅、四氯化硅冷凝为液体后回收利用,不凝的氢气、氯化氢及少量的氯硅烷再经过水洗喷淋,氯化氢和少量的氯硅烷被水溶解带走,氢气再经过纯化干燥后重新利用。
“改良西门子法” 还原尾气回收过程中物料不接触水,相对于“传统西门子法”的“湿法回收”而言,称之为“干法回收”。
干法回收主要是利用还原尾气中氢气、氯化氢、三氯氢硅、四氯化硅、二氯二氢硅等各组分物理化学性质的差异,通过溶解吸收,吸收—脱吸,吸附—脱附等化工操作实现各组分的分离,并重新利用。
由于“湿法回收”中采用水洗来除去氢气中氯化氢、氯硅烷,在损失氯化氢、氯硅烷同时,增加了废水的处理量,并且水分及水中、空气中的杂质进入到氢气中,污染了氢气,必须另外采用氢气纯化干燥装置将其纯化干燥后才能重新返回系统利用。
湿法回收工艺消耗大、收率低,从而增加了整个多晶硅生产的成本。
采用干法回收工艺,还原尾气中的各组分几乎可以100%分离回收,由于整个系统是闭路循环,不引入新的污染源,故回收各组分品质稳定,可直接返回系统重新利用,从而提高了收率,减少了消耗。
二、干法回收工艺原理还原尾气干法回收主要包括:鼓泡淋洗、加压冷凝、吸收脱吸、活性炭吸附四个主要工艺过程,每个过程的原理如下:1. 鼓泡淋洗:利用四氯化硅在一定温度下对还原尾气中个组分溶解度的不同,通过鼓泡淋洗塔对还原尾气淋洗,溶解度大的三氯氢硅、四氯化硅绝大部分被溶解吸收,溶解度小的氢气、氯化氢、二氯二氢硅便分离出来。
2. 加压冷凝:从鼓泡淋洗塔出来的不溶性气体,里面含有少量的三氯氢硅、四氯化硅,在常压下把其冷凝出来需要大量的冷量和很低的冷却温度,采取加压冷凝的办法,三氯氢硅、四氯化硅可在较高的温度下按照相平衡的规律几乎全部冷凝下来,同时大大减少冷媒的用量。
多晶硅生产中回收氢气的净化
多晶硅生产中回收氢气的净化刘建军(北京有色冶金设计研究总院,北京 100038)[摘 要] 本文介绍了回收氢气净化的基本原理、工艺流程,及用回收氢气生产多晶硅的实践结果,分析了半导体多晶硅生产中,利用活性炭净化从还原炉尾气中回收的氢气。
[关键词] 多晶硅;活性碳;氢气;净化[中图分类号] TN 304105[文献标识码] B[文章编号] 100228943(2000)0620017203Pur if ica tion i n Recover i ng Hydrogen dur i ng Production ofPolycrysta ll i ne Sil icon[A b stract ] It describes fundam en tal p rinci p le and techno logical p rocess of pu rificati on in recovering hydrogen and resu lts of po lycrystalline silicon p roducti on u sing hydrogen recovered ,and analyses recovery of hydrogen from reducti on fu rnace gas th rough pu rificati on w ith activated carbon du ring p roducti on of po lycrystalline silicon .[Key w o rds ] po lycrystalline silicon ;activated carbon ;hydrogen ;pu rificati on[作者简介] 刘建军(1968-),男,工程师,从事半导体材料及稀有金属设计和研究。
[收稿日期] 20002032011 概述目前,国内多晶硅的生产主要采用传统西门子工艺——三氯氢硅氢还原[1],主反应如下:Si HC l 3+H 2=Si +3HC l(1)4Si HC l 3=3Si C l 4+Si +2H 2(2)在生产中,为了使反应顺利进行,高纯氢气和三氯氢硅的摩尔比为10∶1,高纯氢气用量大,加上三氯氢硅的一次转化率仅为20%~25%,因此高纯氢气的利用率极低,98%以上未进行反应,随还原炉尾气一起排出。
《基于改进的K-means聚类算法的火电厂锅炉燃烧优化研究》
《基于改进的K-means聚类算法的火电厂锅炉燃烧优化研究》篇一一、引言随着工业化的快速发展,火电厂作为重要的能源供应设施,其运行效率和环保性能日益受到关注。
锅炉燃烧作为火电厂的核心过程,其优化控制对于提高能源利用效率、减少污染物排放具有重要意义。
传统的火电厂锅炉燃烧优化方法多依赖于经验模型和人工调整,难以实现精确控制和优化。
因此,研究新的优化方法,如基于改进的K-means聚类算法的火电厂锅炉燃烧优化技术,具有很高的实际价值和应用前景。
二、K-means聚类算法的改进K-means聚类算法是一种常用的无监督学习方法,能够根据数据点的相似性将数据划分为不同的簇。
在火电厂锅炉燃烧优化中,我们可以通过改进K-means聚类算法,对锅炉运行数据进行分析和处理,发现燃烧过程中的潜在规律和优化空间。
针对传统的K-means算法易陷入局部最优、对初始值敏感等问题,我们提出了以下改进措施:1. 引入遗传算法优化初始聚类中心的选择,以提高算法的稳定性和全局搜索能力。
2. 引入距离和密度两个指标进行聚类,提高聚类的准确性和鲁棒性。
3. 采用动态调整聚类数的方法,根据数据分布自动确定最佳的聚类数,以更好地反映锅炉燃烧的实际情况。
三、火电厂锅炉燃烧优化研究基于改进的K-means聚类算法,我们可以对火电厂锅炉运行数据进行处理和分析,发现燃烧过程中的规律和问题。
具体而言,我们可以通过以下步骤进行锅炉燃烧优化:1. 数据收集与预处理:收集火电厂锅炉运行数据,包括燃料类型、空气流量、炉膛温度等,进行数据清洗和预处理。
2. 聚类分析:运用改进的K-means聚类算法对预处理后的数据进行聚类分析,发现燃烧过程中的不同工况和模式。
3. 模式识别与评估:对不同工况和模式进行识别和评估,确定各模式的运行效率和污染物排放情况。
4. 优化策略制定:根据模式识别与评估的结果,制定针对性的优化策略,如调整燃料配比、优化空气流量等。
5. 实施与反馈:将优化策略应用于实际生产过程中,收集实施后的数据,与优化前的数据进行对比分析,评估优化效果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
改进K-means算法在多晶硅干法回收氢中的研究及应用
摘要本文针对k-means算法的初始聚类个数K值较难的确定问题提出改进,确定一个最佳聚类个数范围,利用逐个归类法获得初始聚类划分,然后根据函数对初始聚类划分进行估算,降低确定一个较优的K值的难度,并将其应用到多晶硅质量分析中,找出造成干法回收氢不合格的因素,提高产品质量。
关键词数据挖掘;聚类;多晶硅;干法回收氢;K-means算法
Abstract Aiming at the problem of the initial number k is difficult to determine when using k-means algorithm, an improvement of the algorithm is proposed. To reduce the difficult of determining an optimal value of k, first, determine the range of the best number of cluster and individually classified method to obtain the divided of the initial clustering, then to estimate the initial clustering is divided according with the function. Applied the improvement algorithm into the quality analysis of polysilicon and identify the factors that cause the dry hudrogen recovery failure. Through the analysis of the factors will help the enterprises to improve the quality of the product.
Keywordsdata mining; clustering; polysilicon; quality analysis; K-means
1 引言
随着各个行业的不断发展,能源危机是世界各国相继面临的严峻现实,寻求新能源、新技术是人们不断探索的课题,由此,太阳能光伏产业成为人们日益关注的焦点。
太阳能光伏发电将日益成为能源消费的首选,加上基于多晶硅材料基础的半导体器件在各大行业的广泛应用,极大地带动了处于光伏产业链中最上游的多晶硅产业的发展[14]。
中国的多晶硅制造业在近几年得到了很大的发展,也积累了很多技术经验,但由于世界经济一体化的形成,越来越多的国外技术、资金流向中国,中国企业面对着前所未有的激烈竞争,竞争要求企业从提高产品质量、降低生产成本,交货及时、服务好等,而传统的多晶硅数据分析依靠统计得出,由于这些数据的分散性和无序性,大大降低了统计分析的可实施性和可靠性[14]。
因此,如何高效、准确的从数据中找出隐藏的、有用的知识,是企业决策层一直关心的问题。
而另一种知识发现的方法-数据挖掘能从海量数据中自动寻找规律,发觉海量数据中潜在隐藏的知识,它帮助企业将数据挖掘中的模型应用在多晶硅的质量分析中,对引起多晶硅各类质量问题的因素进行预测,从而达到提高多晶硅质量的目的。
由于多晶硅质量检验数据具有不确定性、动态性等特点,选取聚类挖掘中经典的K-means算法。