集合代数与粗糙集之间的关系研究【文献综述】
模糊粗糙集理论介绍和研究综述

Ξ 收稿日期:2006-03-10作者简介:姚红霞(1979-),女,硕士研究生,主要从事粗糙集理论和模糊集理论研究.【数理科学】模糊粗糙集理论介绍和研究综述Ξ姚红霞(西北师范大学数学与信息科学学院,兰州 730070)摘要:回顾了粗糙集理论,引出了模糊粗糙集的产生背景,介绍了模糊粗糙集模型的一些主要概念和性质,并给出了模糊粗糙集属性重要性的定义,探讨了模糊粗糙集合的应用和发展现状.关 键 词:粗糙集;模糊集;模糊粗糙集中图分类号:TH164 文献标识码:A 文章编号:1671-0924(2006)08-0132-04I ntroduction to and Survey for the Studies of Fuzzy R ough Sets TheoryY AO H ong-xia(Department of Mathematics and In formation Sciences ,N orthwest N ormal University ,Lanzhou 730070,China )Abstract :This paper firstly reviews the theory of rough set and brings out the generation background aboutfuzzy rough sets ,secondly ,introduces the main concept and property of fuzzy rough sets and proposes its significance ,and finally ,discusses the application and recent studies for this theory.K ey w ords :rough sets ;fuzzy sets ;fuzzy rough sets0 引言 粗糙集(R ough Sets )理论最初是由波兰数学家Z.Pawlak 于1982年[1]提出的,是一种处理不完整和不确定性知识的数学工具[1-2].经过多年的发展,该理论已被成功的用于决策支持系统、人工智能、模式识别与分类、故障检测、金融、医学、知识发现、数据挖掘和专家系统等领域.但由于其严格的等价关系,限制了粗糙模型的发展和应用.针对这个问题,Dub ois 和Prade [3-4]提出模糊粗糙集的概念,作为粗糙集的一个模糊推广.模糊集理论首先是由美国控制论专家L ・A ・扎德(L.A.Z adeh )教授于1965年[5]提出的.也是一种处理模糊和不确定性知识的数学工具,它已成功的应用于模糊控制、模糊识别、模糊聚类分析、模糊决策、模糊评判、系统理论、信息检索、医学、生物学等各个方面.虽然2者都可以用来处理模糊和不确定问题,但2者的着眼点不同.粗糙集理论在处理模糊和不确定性问题方面着眼于知识的粗糙性,强调的是集合对象间的不可分辨性;而模糊集在处理不确定性问题时,主要着眼于知识的模糊性,强调的是集合边界的不分明性.由于这2种理论在处理不确定和模糊问题时具有一定的相似性,因此把它们结合起来的研究前景或许更有实际价值,Dubois 和Prade 是最早研究粗糙模糊集和模糊粗糙集问题的代表人物之一.当知识库中的知识模块是清晰概念,而被近似的概念是一个模糊概念时,就得到粗糙模糊集;当知识库中的知识模块是模糊概念,而被近似的概念是模糊概念时,则可得到模糊粗糙集.粗糙模糊集是模糊粗糙集的特殊情况,因此一般只讨论模糊粗糙集.于是根据问题的实际需要,在文献[3-4]中,用论域上的模糊关系代替分明的二元关系,提出模糊粗糙集合的概念,作为粗糙集合的模糊推广.第20卷 第8期Vol.20 No.8重 庆 工 学 院 学 报Journal of Chongqing Institute of T echnology2006年8月Aug.20061 粗糙集理论的发展 自1992年在波兰召开了RS理论的第一届国际学术会议以来,现在每年都召开以RS为主题的国际会议,大大推动了RS理论的发展.参加的成员主要来自波兰、美国、加拿大、日本、俄罗斯等国家.在Pawlak粗糙集模型中,等价关系是关键概念,等价类是构成上下近似结构的构造性知识块,用任意的二元关系取代等价关系,就得到Pawlak粗糙集模型的不同推广,即一般关系下的RS模型、变精度RS模型、概率RS模型、基于随机集的RS模型[9],而且在一个分明的,自反和传递关系下,一对上下近似算子正好是一个拓扑空间的内部封闭的算子[10-12].在RS集理论中,基本的运算符是近似的.对RS理论发展的研究至少有2种方法,即构造性方法和公理化方法.在构造性方法下,论域上的二元关系、论域的划分、领域体系、布尔代数都是最原始的概念.文献[1,13-15]用这些概念构造了下近似和上近似算子,构造性方法尤其对RS的实际应用有重要的实用价值.另一方面,公理化方法,是一种研究粗糙代数结构近似的,用上下近似算子作为最初的概念,在这种方法下,用一个公理化集合刻画的近似算子和用构造性方法产生的算子是一样[15-16].比较构造性和公理化这2种方法,对分明粗糙集最典型的公理化研究是文献[15],在文献[17]中,用不同的公理化集合刻画了不同类型的粗糙集代数.2 模糊粗糙集的产生背景 粗糙集理论最初和主要的研究采用的是构造性方法.在Z.Pawlak粗糙集模型中,等价关系是关键和原始的概念.然而,等价关系是一个过于严格的条件,其限制了粗糙集模型的一些主要应用.针对这个问题,文献[12-13,18]用非等价二元关系推广了粗集近似算子,这一成果的出现,引起了学术界研究其它不同类型近似算子的热潮.另一方面,用U上的一个等价关系,在模糊关系理论下,引入上下近似,就得到了一个推广的概念,称为粗糙模糊集[4,17,19],相反的,用模糊相似关系代替等价关系,就得到模糊粗糙集合[4-8,19].因此后来有很多模糊粗糙集合的类型,如基于模糊T相似关系的一般结构[21],基于U上弱模糊划分的结构[22-23],以及基于模糊集合上的布尔子代数[7],等等.3 模糊粗糙集合的基本概念和理论3.1 等价关系下的模糊粗糙集定义定义1[9] 设(U,R)是Pawlak近似空间,R是论域U 上的一个等价关系,若A是U上的一个模糊集合,则A关于(U,R)的一对下近似A R和上近似 A R定义为U上的一对模糊集合,其隶属度函数分别定义为:A R(x)=in f{A(y)|y∈[x]R},x∈U,A R(x)=sup{A(y)|y∈[x]R},x∈U,其中[x]R为元素x在关系R下的等价类.若A R= A R,则称A是可定义的,否则称A是模糊粗糙集(Fuzzy rough set).称A R是A关于(U,R)的正域,称 A R是A关于(U,R)的负域,称 A R∩( A R)为A的边界.3.2 一般关系下的模糊粗糙集合及其属性重要性定义2[24] 称I=(U,A)是一个决策表信息系统,若有:①U是一个非空对象集合;②A={C,D}是一个有限非空属性集合,其中C是条件属性的非空集合,D是决策属性的非空集合;③对每个属性a∈A,定义了一个从U到V a的映射: a:U→V a,其中V a是属性a的值集.定义3[25] 设U是一个非空集合,称U上的模糊二元关系是相似关系,当且仅当R是:①自反的:R(x,x)=1对所有x∈U;②对称的:R(x,y)=R(y,x),对所有x,y∈U,U上的每个条件属性子集决定了一个U上的相似关系;③传递的:R(x,y)∧R(y,z)ΦR(x,z),对所有x, y,z∈U.则称R是U上的一个等价关系.在文献[4-8]中,用论域上的模糊关系代替分明的二元关系,提出了模糊粗糙集合的概念,粗糙集合研究对象是分明的等价类,而模糊粗糙集合研究对象是模糊等价类.将论域U上的元素在相似关系下划分模糊等价类,以下记论域U上的模糊关系为S,对象x和y之间的相似度记为u s(x,y)=u s(y,x),它同样满足定义3的条件,即自反性:u s(x,x)=1;对称性u s(x,y)=u s(y,x);传递性u s (x,z)Εu s(x,y)∧u s(y,z).因此对对象x∈U的等价类[x]s定义为:u[x]s(y)=u s(x,y)定义4[26] 模糊P上近似和P下近似定义为:uP X(F i)=sup x min{u Fi(x),u X(x)}Πi. uPX(F i)=in f x max{1-u Fi(x),u X(x)}Πi.其中F i是属于U/P的模糊等价类,PΑA,XΑU,u X (x)是对象x属于U上的任意模糊集合X的程度,则称序对(u P X(F i),u PX(F i))为模糊粗糙集合.由于模糊上下近似的定义和分明的定义有一些差异,个体对象的隶属度的近似不是十分有用的,由于这个原因,模糊上下近似可以定义为:uP X(x)=sup F∈U/P min(u F(x),sup y∈U min{u F(y),u x (y)})uPX(x)=sup F∈U/P min(u F(x),in f y∈U max{1-u F(y),u x (y)})定义5[26] 条件属性C关于决策属性D的正域为:uPOSC(D)(x)=sup u CX(x) X∈U/D定义6[26] 根据模糊正域的定义,可以求出模糊粗糙集合条件下决策属性D对条件属性集合C的依赖性:331姚红霞:模糊粗糙集理论介绍和研究综述γC (D)=∑x∈U uPOSC(D)(x)|U|定义7 令C和D分别为模糊粗糙集的条件属性和决策属性集,属性子集C′ΑC关于D的重要性定义为:σCD(C′)=γC(D)-γC-C′(D)特别当C′={a}时,属性a∈C关于D的重要性为σCD(a)=γC(D)-γC-{a}(D).4 模糊粗糙集属性约简 为了对模糊粗糙集合进行属性约简,必须先对属性模糊化.在粗糙集合中,属性对应的等价类是普通集合,而在模糊粗糙集合中,属性对应的等价类是模糊集,因此,往往把属性的等价类划分过程称为属性模糊化过程.在粗糙集中,每个对象属于且仅属于一个等价类,在模糊粗糙集中,每个对象可以属于多个模糊等价类.为了进行属性约简,必须求出复合属性的模糊等价类,具体模糊化的过程见文献[26].在文献[17]中给出了模糊粗糙集基于属性依赖性的属性约简的降维算法和例子,在文献[24]中研究了一种面向连续属性空间的模糊粗糙约简算法.5 模糊粗糙集发展现状 在文献[4-8]中,用论域上的模糊关系代替分明的二元关系,提出了模糊粗糙集合的概念,作为粗糙集合的模糊推广.在RS集理论中,基本的运算符是近似.对RS理论发展的研究至少有2种方法,即构造性方法和公理化方法.因此对模糊粗糙集的研究很多也是建立在这2种方法上的.在文献[17]中研究了模糊粗糙集上的一系列公理化集合,但他们的研究局限与用模糊T相似关系定义的模糊T 粗糙集上,而当模糊关系退化为分明关系时,就是一般的等价关系.然而,到目前为止,对一般关系下模糊粗糙集公理化方法的研究还不是很多,在文献[21]中给出了公理化的模糊粗糙集模型,在文献[25]中运用构造性和公理化方法,给出了模糊粗糙集研究的一般结构.在构造性方法下,基于一个任意的模糊关系定义了一对一般关系下的模糊粗糙集上下近似算子,在公理化方法下,用不同的公理集合刻画了不同类型的模糊粗糙近似算子,这些公理保证了确定类型的模糊关系的存在产生相同的算子.在文献[28]中,应用扩展原理,定义了依靠模糊关联和模糊隐含算子的模糊粗糙集合,并考虑了3个常用的算子,即S-,R-,Q L-算子,用其定义了3种类型的模糊粗糙集,并讨论了各自的性质,使其更好的用于不完全和不确定信息系统.在文献[27]中,讨论了在有限论域上模糊粗糙集模型和模糊拓扑空间之间的关系,提出了模糊拓扑空间上的T C 公理,并证明了所有基于自反和对称模糊关系的上下近似集合包含了一个满足T C公理的模糊拓扑空间,并且相反的,一个满足T C公理的模糊拓扑空间正好是在自反和对称模糊关系下的所有的上下近似集合.即在所有自反和对称模糊关系下的集合和所有满足T C公理的模糊拓扑空间之间,存在一个一对一的关系.但这只是在有限论域情况下的结论,在无限论域上的还不确定成立,需要进一步探讨.粗糙集理论已经被广泛和成功的应用许多领域,主要是由于它能发现隐藏在数据中的事实,而不需要额外的如专家系统或者阈值之类的信息,能在无监督条件下,挖掘出数据库里的最小知识表示.但粗糙理论在应用过程中,主要的载体是信息表,信息表中的对象是处理和挖掘的对象,而信息表中的对象的属性值要么是分明的,或者是实值的,虽然连续的属性值可以通过属性离散化方法离散,但势必会丢失一些重要信息,而且在粗糙理论下,无法判断2个属性值是相似的,或者在某种扩展意义下是相同的.因此,针对这个问题,文献[29-30]用模糊粗糙集来解决这些不确定问题,并将这个理论用于网络数据分类和挖掘上,收到了很好的效果.文献[26]将其进行了推广和完善.目前,国外学者主要从不同角度考虑模糊粗糙集的性质,根据模糊集近似推理方式的不同,主要形成了从3种不同角度研究的模糊粗糙集:基于形式逻辑的模糊粗糙集,基于三角模的模糊粗糙集,基于-截集的模糊粗糙集.6 模糊粗糙集发展展望 虽然模糊粗糙集已经发展了十几年,但作为一种理论,它还有很多的不完善,尤其是目前研究属性约简的算法还是相当少,而属性约简在实际生活中具有重要的意义.今后,模糊粗糙集还有很大的发展空间,它可能更广泛的应用于数据挖掘,知识发现等重要领域.参考文献:[1] Pawlak Z.R ough[J].International Journal of C omputerand in formation Science,1982,11:341-356.[2] Pawlak Z.R ough sets:theoretical aspects of reas oning aboutdata[M].Boston:K luwer Academic Publishers,1991:66-90.[3] Dubois D,Prade H.R ough fuzzy sets and fuzzy rough sets[J].International Journal of G eneral System,1990,17:191-208.[4] Dubois D,Prade H.Putting rough sets and fuzzy sets to2gether[C]∥S lowinski R,Intelligent Decision Support.[S.l.]:K luwer Academic,D ordrecht,1992:203-232. [5] Z adeh L A.Fuzzy sets[J].In formation and C ontrol,1965(8):338-353.[6] Nakamura A.Fuzzy rough sets[J].N ote on Multiple-Val2ued Logic in Japan,1988,9(8):1-8.[7] Nanda S.fuzzy rough sets[J].Fuzzy Sets and Systems,1992(45):157-160.[8] Thiele H.on the definition of m odel operators in fuzzy logic[C]∥Proc.IS M V L-93.Sacramento,C A:[s.n.],1993:62-67.431重庆工学院学报[9] 张文修.粗糙集理论与方法[M].北京:科学出版社,2001.[10]K ortelainen J.on the relationship beween m odified sets,topological spaces and rough sets[J].Fuzzy Sets and Sys2tem,1994(61):91-95.[11]Y ao Y Y.T w o views of the theory of rough sets in finiteuni2verses[J].InternetJ.Approx.Reas ons,1996(15):291-317.[12]Y ao Y Y,Lin T Y.G eneralization of rough sets using m odallogics[J].Intell.Automat.S oft C omputer,1996(2):103-120.[13]K ryszkiewicz M.R ough set approach to incomplete in forma2tion systems[J].In formation Sciences,1998(112):39-49.[14]P omykala J A.Approximation operations in Approximationspaces[J].Bullerin of the P olish Academy of sciences:Mathmatics,1987(35):653-662.[15]Y ao Y Y.C onstrctive and algebraic methods of the theory ofrough sets[J].Journal of In formation Sciences,1998(109):21-27.[16]Lin T Y,Liu Q.R ough approximate operators:axiomaticrough sets theory[M]∥Z iarko W,R ough Sets,Fuzzy Setsand K nowledge Discovery.Berlin:S pringer,1994:256-260.[17]Pal S K.R oughness of a fuzzy set[J].In formation Sciences,1996(93):235-246.[18]Y ao Y Y.Relational interpretations of neighborhood opera2tors and rough set approximation operators[J].In formationSciences,1998(111):239-259.[19]Chakrabarty K,Biswas R,Nanda S.Fuzziness in rough sets[J].Fuzzy Sets And Systems,2000(110):247-251. [20]Y ao Y Y.C ombination of rough and fuzzy sets based on-level sets[C]∥Lin T Y,Cercone N.R ough Sets and DataMining:Analysis for Imprecise Data.Boston:K luwer Aca2demic Publishers,1997:301-321.[21]M orsi N N,Y akout M M.Axiomatics for fuzzy rough sets[J].Fuzzy sets And Systemss,1998(100):327-342. [22]Bodjanova S.Approximation of a fuzzy concepts in decisionmaking[J].Fuzzy Ses and Systems,1997(85):23-29.[23]K uncheva L I.Fuzzy rough sets:Application to feature selec2tion[J].Fuzzy Sets and System,1992(51):147-153. [24]聂作先,刘建成.一种面向连续属性空间的模糊粗糙约简[J].计算机工程,2005,31(6):88-90.[25]WeiZhi Wu,JuSheng Mi,WenX iu Zhang.G eneralized fuzzyrough sets[J].In formation Sciences,2003(151):263-282.[26]Richard Jensen,Qiang Shen.Fuzzy rough attribute reductinwith application to web categ orization[J].Fuzzy sets andSystem,2004(141):469-485.[27]K eyun Qin,Zheng Pei.On the topological properties of fuzzyrough sets[J].Fuzzy Sets and System,2005(151)601-613.[28]K erre E,E tienne A.Anna Maria Radzikowska[J].C om2parative study of fuzzy rough sets,2002(126):137-155.[29]Jensen R,Shen Q.A rough set-aided system for s ortingWWW bookmarks[M]∥Zhong N.Web Intelligence:Re2search and Development.[S.l.]:[s.n.],2001:95-105.[30]Jensen R,Shen Q.Fuzzy-rough sets for descriptive dimen2sionality reduction[C]∥Proc,11th Internat.C on f.onFuzzy Systems.[S.l.]:[s.n.],2002,29-34.(责任编辑 刘 舸)(上接第129页)systems with product recovery[J].C omputers&IndustrialEngineering,2004,46:431-441.[4] 陈秋双,刘东红.再制造系统的库存控制研究[J].南开大学学报:自然科学版,2003,36(3):67-72. [5] Inderfurth K.Optimal policies in hybrid manu facturing/re2manu facturing systems with product substitution[J].Inter2 national Journal of Production economics,2004,90:325-343.[6] 赵昱卿,王东,奚立峰.制造与再制造决策的优化[J].工业工程与管理,2003,8(2):18-21.[7] 厉以宁.西方经济学[M].北京:高等教育出版社,2000,33-37.[8] Petruzzi N,Dada M.Pricing and the new-vendor problem:A review with extension[J].Operations Research,1999,47(2):183-194.[9] Jinn-Tsair T eng,Chun-T ao Chang.Economic productionquantity m odels for deteriorating items with price and stock-dependent demand[J].C omputers&operations research, 2005(32):297-308.[10]G upate D,Arthur V H,T atiana Bouzdine-Chameeva.Apricing m odel for clearing end-of-seas on retail inventory [J].European Journal of Operational Research,2006(170):518-540.(责任编辑 刘 舸)531姚红霞:模糊粗糙集理论介绍和研究综述。
粗糙集代数

粗糙集代数(Rough Set Algebra)是一种数学框架,建立在粗糙集理论的基础上,用于粗糙集不确定性和近似推理的形式化描述和处理。
其基本概念包括属性约简、近似集
和粗糙等价类等,可以应用于数据挖掘、模式识别、智能推理等领域。
在粗糙集代数中,属性约简是一个重要的概念。
假设有一个包含m个属性的数据集,
每个属性具有不同的取值,可以将数据集表示为一个m维属性空间。
属性约简就是从
这个属性空间中找出其中最重要的属性子集,使得这个子集可以保留原始数据集的所
有决策信息。
具体来说,属性约简可以看作是通过去掉不必要的属性,减少决策规则
的数量,提高规则表达的精度和通用性。
近似集和粗糙等价类等概念则是用于描述粗糙集中的不确定性和近似性质的重要概念。
在粗糙集中,数据对象的属性值通常是不完备的或不精确的,因此需要使用近似集来
描述数据对象的属性分布情况。
而粗糙等价类则是将原始数据集中存在相似或不同的
数据对象划分为等价类,从而建立起数据对象之间粗略的等价关系。
总的来说,粗糙集代数是一种基于粗糙集理论的形式化描述和处理框架,可以用于处
理不完备、不精确的数据,提高数据挖掘、模式识别、智能推理等任务的效果和精度。
粗糙集理论及其应用研究

粗糙集理论的核心内容
知识的约简与核
知识的约简: 通过删除不重 要的知识,保 留关键信息
核的概念:核 是知识的最小 表示,包含所 有必要信息
核的性质:核 具有独立性、 完备性和最小 性
核的求取方法: 基于信息熵、 信息增益等方 法进行求取
0
0
0
0
1
2
3
4
决策表的简化
决策表:用于描述决策问题的表格 简化目标:减少决策表的规模,提高决策效率 简化方法:合并条件属性,删除冗余属性 简化效果:提高决策表的可读性和可理解性,降低决策复杂度
粗糙集理论在聚类分析中的应用:利用粗糙集理论处理不确定和不完整的数据,提高聚类 分析的准确性和效率。
聚类分析在数据挖掘中的应用:可以帮助发现数据中的模式和趋势,为决策提供支持。
粗糙集理论在其他领域的应用
决策支持系统
粗糙集理论可以帮助决策者 处理不确定性和模糊性
粗糙集理论在决策支持系统 中的应用
粗糙集理论可以提高决策支 持系统的准确性和效率
粗糙集理论在决策支持系统 中的实际应用案例分析
智能控制
粗糙集理论在模糊控制中的 应用
粗糙集理论在智能控制中的 应用
粗糙集理论在神经网络控制 中的应用
粗糙集理论在自适应控制中 的应用
模式识别
粗糙集理论在模式 识别中的应用
粗糙集理论在图像 识别中的应用
粗糙集理论在语音 识别中的应用
粗糙集理论在生物 信息学中的应用
添加标题
添加标题
ห้องสมุดไป่ตู้添加标题
添加标题
机器学习
粗糙集理论在机器学习中的应用 粗糙集理论在数据挖掘中的应用 粗糙集理论在模式识别中的应用 粗糙集理论在自然语言处理中的应用
粗糙集综述word版

粗糙集论文题目 粗糙集综述1 粗糙集属性约简1.1 经典粗糙集属性约简对于经典粗糙集我们可以用上下近似来描述。
给定知识库()R U K ,=,对于每个子集U X ⊆和一个等价关系()K ind R ∈,定义两个上下近似:{}{}.|/,|/ U U φ≠⋂∈=⊆∈=X Y R U Y X R X Y R U Y X R 另外上下近似还可以用以下的等式表达:[]{}[]{}.|,| U U φ≠⋂∈=⊆∈=X x U x X R X x U x X R R R 当利用区分矩阵来表达知识时有许多优点,特别是他能很容易计算约简和核。
约简是满足能区别由整个属性集区别的所有对象的属性极小子集。
如果A 包含B 是满足B 交区别对象x 和y 的所有属性集合的极小子集不为空,且区别对象x 和y 的所有属性集合的极小子集不为空,则B 是A 的一个约简。
核是区分矩阵中所有单个元素组成的集合。
对于决策表,C 为条件属性集,D 为决策属性集,决策表S 的区分矩阵是一个n n ⨯矩阵,其任一元素为},x ),(),(|{),(a *)(且y a y f a x f C a y x ω≠∈=对于满足),(,,x y x U y ω∈)(y )(x D pos D pos C C ∉∈且,或者)(y )(x D pos D pos C C ∈∉且,或者).(),()(,D ind y x D pos y x C ∉∈且如果φφ≠∀≠⋂⊆),(,),(C C C **''y x a y x a 满足条件的极小子集(关于包含),则'C 是C 的D 约简(相对约简).D 核(相对核)是决策表S 的区分矩阵中所有单个元素组成的集合,即}.,},{),(a |{)(core *U y x a y x C a C D ∈=∈=其中1.2 变精度粗糙集属性约简变精度粗糙集是粗糙集的扩充,它是在基本粗糙集模型的基础上引入)5.00(<≤ββ,即允许一定程度的错误分类率存在。
基于集对分析下的粗糙集理论模型研究论文 精品

基于集对分析下的粗糙集理论模型研究摘要:粗糙集理论是一种新的处理模糊和不确定性知识的数学工具,其主要思想就是在保持分类能力不变的前提下,通过知识简约,导出问题的决策分析或分类规则。
而用集对分析理论的方法来建立概率粗糙集理论的模型,是一种研究粗糙集模型的新方法,它为处理不确定信息方面提供了一种新的途径和方法。
本文是用概率粗糙集模型,然后引入集对分析理论,把两者结合起来,提出一个新的集对分析下的粗糙集模型,并且讨论和研究该模型的一些性质。
关键字:集对,基对分析,粗糙集,概率粗糙集ABSTRACTRough set theory is one kind of new deal with the fuzzy andnon-deterministic mathematical tool, the main idea of Jiu Shi Zai Bao Chi Xia premise constant classification ability, through knowledge and simple, export issues of Juecefenxi 或classification rules. The use of set pair analysis theory is applied to establish the probability model of rough set theory, rough set model is a study of new methods for handling uncertain information that it provides a new approach and methods. This article is a rough set model with a probability, then the introduction of set pair analysis theory, the two together with a new set on the analysis of the rough set model, and discuss and study some properties of themodel.Key words:Set right, Based On The Analysis, Rough Sets, Probabilistic Rough Set一.引入集对分析的概念1.集对的概念集对是由一定联系的两个集合组成的基本单位。
粗糙集信息观与代数观联系研究

., , Y= Y ,Y , ., , X1 f z .. Y J
2 相容 决策 表 中两种 观点 的关 系
由于相容决策表和不相容决策表的数据有不同特征, 因此 首 先分析相容决策表 中信息观和代数观的关系。
定义9设U 为一个论 域 ,、 为定义在 U 的两个 等价 关 PO 上 系族 , 为P Q独立子族( c )且 P S( )P S( )则 当s 的 S P , O Q = O Q , 族s 称为 P Q约简。 的
Ke r s:r u h s t i f r a i n v e ; ag b a v e ; r l t e e u to y wo d o g e; no m to i w le r iw e a i r d c i n v
0 引言
粗 糙集理 论是近 年来发 展起来 的一种 处理不 确定信 息 的
பைடு நூலகம்
在一 定 的问题 , 本文 主要 针对相 对 约简 中两种观 点 的关 系进
行讨论 。
数 学工具 , 它能有效地分析和 处理不精确 、 不一致 、 不完整等各 1粗糙 集 的基本 概 念 种不 完备信息 , 并从 中发现隐含 的知识 , 揭示潜在的规律 , 广泛 11粗糙集代数观 中的基本概念 . 应用 于机 器学 习 、 数据挖掘等领域 。 粗糙集代数观 是由集合理论发展而来 的 , 该理论 的所有概 目 , 前 粗糙集理论存在两种观点 , —种是基于等价关系的代数 念和 计算 都 以等价关系为 基础 , 通过 引入 上近 似集 合 、 下近似 观, —种是基于信 息 论的信息观。其中代数观是指ZP w a提 出 . l a k 集合来定义粗糙集 , 并通过不可 区分关系定义决策表 中条件属 的粗糙集理论 , 该理论的所有概念和计算 都是以 等价 关系 为基 性的必要性 , 找到核屙 陛及决策表 的约简 。 础, 通过引入上近似集和下近似集 , 并进行集合运算来定义 定义 1设u为一个论域, 、 PQ为定义在u上的两个等价关
粗糙集理论及其应用综述

粗糙集理论及其应用综述3韩祯祥 张 琦 文福拴(浙江大学电机系・杭州,310027) 摘要:粗糙集理论是一种较新的软计算方法,可以有效地分析和处理不完备信息.该理论近年日益受到国际学术届的重视,已经在模式识别、机器学习、决策支持、过程控制、预测建模等许多科学与工程领域得到成功的应用.本文介绍了粗糙集理论的基本概念,对其在各领域的应用情况进行了综述.关键词:粗糙集;不确定性;数据分析;软计算;粗糙控制A Survey on R ough Set Theory and Its ApplicationHan Zhenxiang , Zhang Qi and Wen Fushuan(Department of E lectrical Engineering ,Zhejiang University ・Hangzhou ,310027,P.R.China )Abstract :R ough set theory is a relatively new s oft com putingtool to deal with vagueness and uncertainty.I t has received much attention of the researchers around the w orld.R ough set theory has been applied to many areas success fully including pattern recognition ,machine learning ,decision support ,process control and predictive m odeling.This paper introduces the basic concepts of rough set.A survey on its applicatoins is als o given.K ey w ords :rough set ;uncertainty ;data analysis ;s oft com puting ;rough control1 引言(Introduction )粗糙集(R ougn Set ,RS )理论是一种刻划不完整性和不确定性的数学工具,能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律[1].RS 理论是由波兰学者Pawlak Z 在1982年[2]提出的.1991年Pawlak Z 出版了专著[3],系统全面地阐述了RS 理论,奠定了严密的数学基础.该书与1992年出版的RS 理论应用专集[4]较好地总结了这一时期RS 理论与实践的研究成果,促进了它的进一步发展,现已成为学习和应用RS 理论的重要文献.从1992年至今,每年都召开以RS 为主题的国际会议,推动了RS 理论的拓展和应用.国际上成立了粗糙集学术研究会,参加的成员来自波兰、美国、加拿大、日本、挪威、俄罗斯、乌克兰和印度等国家.目前RS 理论已成为人工智能领域中一个较新的学术热点,引起了越来越多的科研人员的关注.2 粗糙集理论的基本概念(Basic concepts of rough settheory )2.1 知识与不可分辨关系(K nowledge and indiscernibility rela 2tion )在RS 理论中,“知识”被认为一种将现实或抽象的对象进行分类的能力[3].假定我们具有关于论域的某种知识,并使用属性(attribute )及其值(value )来描述论域中的对象.例如:空间物体集合U 具有“颜色”、“形状”这两种属性,“颜色”的属性值取为红、黄、绿,“形状”的属性值取为方、圆、三角形.从离散数学的观点看,“颜色”、“形状”构成了U 上的一族等效关系(equivalent relation ).U 中的物体,按照“颜色”这一等效关系,可以划分为“红色的物体”、“黄色的物体”、“绿色的物体”等集合;按照“形状”这一等效关系,可以划分为“方的物体”、“圆的物体”、“三角形的物体”等集合;按照“颜色+形状”这一合成等效关系,又可以划分为“红色的圆物体”、“黄色的方物体”、“绿色的三角形物体”…等集合.如果两个物体同属于“红色的圆物体”这一集合,它们之间是不可分辨关系(indiscernibility relation ),因为描述它们的属性都是“红”和“圆”.不可分辨关系的概念是RS 理论的基石,它揭示出论域知识的颗粒状结构.2.2 粗糙集合的下逼近、上逼近、边界区和粗糙隶属函数(Lower and upper approximation of rough set ,boundary region and rough membership function )给定一个有限的非空集合U 称为论域,R 为U 上的一族等效关系.R 将U 划分为互不相交的基本等效类,二元对K=(U ,R )构成一个近似空间(approximation space ).设X 为U的一个子集,a 为U 中的一个对象,[a ]R 表示所有与a 不可分辨的对象所组成的集合,即由a 决定的等效类.当集合X 能表示成基本等效类组成的并集时,则称集合X 是可以精确定义的;否则,集合X 只能通过逼近的方式来刻划.集合X 关于R 的下逼近(lower approximation )定义为:R 3(X )={a ∈U :[a ]R ΑX}.(1)R 3(X )实际上是由那些根据已有知识判断肯定属于X 的对象所组成的最大的集合,也称为X 的正区(positive region ),记 3国家自然科学基金资助项目(59777011).本文于1997年9月3日收到.1998年11月18日收到修改稿.第16卷第2期1999年4月控制理论与应用CONTROL THEORY AND APPLICATIONS Vol.16,No.2Apr.,1999作POS (X ).由根据已有知识判断肯定不属于X 的对象组成的集合称为X 的负区(negative region ).记作NEG (X ).集合X 关于R 的上逼近(upper approximation )定义为R 3(X )={a∈U :[a ]R ∩X ≠ }.(2)R 3(X )是由所有与X 相交非空的等效类[a ]R 的并集,是那些可能属于X 的对象组成的最小集合.显然,R 3(X )+NEG (X )=论域U.集合X 的边界区(boundary region )定义为:BN (X )=R 3(X )-R 3(X ).(3)BN (X )为集合X 的上逼近与下逼近之差.如果BN (X )是空集,则称X 关于R 是清晰的(crisp );反之如果BN (X )不是空集,则称集合X 为关于R 的粗糙集(rough set ).图1为粗糙集概念的示意图.下逼近、上逼近及边界区等概念刻划了一个不能精确定义的集合的逼近特性.逼近精度定义为αR (X )=|R 3(X )||R 3(X )|.(4)式中|R 3(X )|表示集合R 3(X )的基数或势(cardinality ),对有限集合来说表示集合中所包含元素的个数.显然,0≤αR (X )≤1,如果αR (X )=1,则称集合X 相对于R 是清晰的;αR (X )<1,则称集合X 相对于R 是粗糙的.αR (X )可认为是在等效关系R 下逼近集合X 的精度.RS 理论中定义了粗糙隶属函数(rough membership func 2tion ).通过使用不可分辨关系,定义元素a 对集合X 的粗糙隶属函数如下μRX (a )=|X ∩[a ]R ||[a ]R |.(5)显然0≤μRX ≤1,粗糙隶属函数也可以用来定义集合X 的上、下逼近和边界区.现举例说明粗糙集的概念.论域U 及等效关系R ={R 1,R 2}采用如下定义:U ={x 1,x 2,x 3,x 4,x 5,x 6,x 7,x 8,x 9,x 10},U/R 1={{x 1,x 2,x 3,x 4},{x 5,x 6,x 7,x 8,x 9,x 10}},U/R 2={{x 1,x 2,x 3},{x 4,x 5,x 6,x 7},{x 8,x 9,x 10}},U/R ={{x 2,x 3},{x 4},{x 5,x 6,x 7},{x 8,x 9,x 10}}.则关于集合X ={x 1,x 2,x 3,x 4,x 5}的逼近为POS (X )={x 4},NEG (X )={x 8,x 9,x 10},BN (X )={x 1,x 2,x 3,x 5,x 6,x 7}.{x 4}是集合X 的正区,因为x 4肯定属于X ;{x 8,x 9,x 10}肯定不属于X ,因此为X 的负区;{x 1,x 2,x 3,x 5,x 6,x 7}是否属于X 在等效关系R 下无法确定,构成了X 的边界区.2.3 决策表、约简与核(Decision table ,reduct and core )RS 理论中应用决策表来描述论域中对象.它是一张二维表格,每一行描述一个对象,每一列描述对象的一种属性.属性分为条件属性和决策属性,论域中的对象根据条件属性的不同,被划分到具有不同决策属性的决策类.表1为一张决策表,论域U 有5个对象,编号1~5,{a ,b ,c}是条件属性集,d 为决策属性.对于分类来说,并非所有的条件属性都是必要的,有些是多余的,去除这些属性不会影响原来的分类效果.约简(reduct )定义为不含多余属性并保证分类正确的最小条件属性集.一个决策表可能同时存在几个约简,这些约简的交集定义为决策表的核(core ),核中的属性是影响分类的重要属性.表1化简后得到了两个约简:{a ,c}和{b ,c},见表2和表3.它们维持了与原有条件属性集{a ,b ,c}相同的分类能力.{c}是核,表明c 是影响分类的重要属性.表1 决策表T able 1 Decision tableUabcd110212210232123412215123表2 约简{a ,c}T able 2 Reduct {a ,c}Uacd112122023223513表3 约简{b ,c}T able 3 Reduct {b ,c}Ubcd10312102312342215203 从另一个角度看,决策表中每一个对象都蕴含着一条分类规则,决策表实际上也是一组逻辑规则的集合.例如表1中的对象1蕴含的规则是a 1b 0c 2]d 1.化简决策表的过程也就是抽取分类规则的过程.表2中对象4在去掉属性b 后154 控制理论与应用16卷 与对象1蕴含相同的分类规则,为避免重复而被除去.约简中的规则还可进一步化简,删除那些与分类无关的次要属性.表3第一行中的“3”表示属性c的取值不重要,即只要b =0,d一定为1(b0]d1).“约简”和“核”这两个概念很重要,是RS方法的精华. RS理论提供了搜索约简和核的方法.计算约简的复杂性随着决策表的增大呈指数增长,是一个典型的NP完全问题,当然实际中没有必要求出所有的约简.引入启发式的搜索方法如遗传算法[10]有助于找到较优的约简,即所含条件属性最少的约简.3 粗糙集理论的特点(Features of rough set theory)1)RS不需要先验知识.模糊集和概率统计方法是处理不确定信息的常用方法,但这些方法需要一些数据的附加信息或先验知识,如模糊隶属函数和概率分布等,这些信息有时并不容易得到.RS分析方法仅利用数据本身提供的信息,无须任何先验知识.2)RS是一个强大的数据分析工具.它能表达和处理不完备信息;能在保留关键信息的前提下对数据进行化简并求得知识的最小表达;能识别并评估数据之间的依赖关系,揭示出概念简单的模式;能从经验数据中获取易于证实的规则知识,特别适于智能控制.3)RS与模糊集分别刻划了不完备信息的两个方面[5]: RS以不可分辨关系为基础,侧重分类,模糊集基于元素对集合隶属程度的不同,强调集合本身的含混性(vagueness).从RS的观点看,粗糙集合不能清晰定义的原因是缺乏足够的论域知识,但可以用一对清晰集合逼近.有关RS和模糊集内在联系的阐述及模糊粗糙集(fuzzy2rough set)的概念,请参见文[6~8].RS和证据理论也有一些相互交叠之处[9],在实际应用中可以相互补充.4 粗糙集理论的应用(Applications of rough set theo2 ry)RS理论的生命力在于它具有较强的实用性,从诞生到现在虽然只有十几年的时间,但已经在许多领域取得了令人鼓舞的成果.1)股票数据分析.文[11]应用RS方法分析了十年间股票的历史数据,研究了股票价格与经济指数之间的依赖关系,获得的预测规则得到了华尔街证券交易专家的认可.2)模式识别.文[12]应用RS方法研究了手写字符识别问题,提取出了特征属性.3)地震预报.文[13]研究了地震前的地质和气象数据与里氏地震级别的依赖关系.4)冲突分析.文[14]应用RS方法建立了反映以色列、巴勒斯坦、约旦、埃及、叙利亚和沙特阿拉伯等六国关于中东和平问题各自立场的谈判模型.5)从数据库中知识发现(knowledge discovery in database, K DD)[15,16].K DD又称数据发掘(data mining),是当前人工智能和数据库技术交叉学科的研究热点之一.RS方法现已成为K DD的一种重要方法,其导出的知识精练且更便于存储和使用.6)粗糙控制(rough control)[17~23].RS根据观测数据获得控制策略的方法被称为从范例中学习(learning from exam2 ples),属于智能控制的范畴.基本步骤是:把控制过程中的一些有代表性的状态以及操作人员在这些状态下所采取的控制策略都记录下来,形成决策表,然后对其分析化简,总结出控制规则[17,18].形式为:IF C ondition=N满足THE N采取De2 cision=M.RS方法是一类符号化分析方法,需要将连续的控制变量离散化,为此Pawlak Z提出了粗糙函数(rough func2 tion)的概念[19],为粗糙控制打下了理论基础.文[20,21]应用粗糙控制研究了“小车—倒立摆系统”这一经典控制问题,取得了较好的结果.在过程控制领域,文[22]应用RS方法成功地提取出了水泥窑炉的控制规则.粗糙控制的优点是简单迅速、实现容易,不需要象Fuzzy控制那样进行模糊化和去模糊化.因此在特别要求控制器结构与算法简单的场合,采取粗糙控制较为合适.另外,由于控制算法完全来自观测数据本身,其决策和推理过程可以很容易被检验和证实.一种新的有吸引力的控制策略“模糊2粗糙控制(fuzzy2rough control)”正悄然兴起,其主要思路是利用RS获取模糊控制规则.7)医疗诊断.RS方法根据以往的病例归纳出诊断规则,用来指导新的病例.现有的人工预测早产的准确率只有17%~38%,应用粗糙集理论则可提高到68%~90%[1].8)专家系统(ES).RS抽取规则的特点,为构造ES知识库提供了一条崭新的途径[24].9)人工神经元网络(ANN).训练时间过于漫长的固有缺点是制约ANN实用化的因素之一.文[25]应用RS化简神经网络训练样本数据集,在保留重要信息的前提下消除了多余的数据,使训练速度提高了4177倍,获得了较好的效果.文[26,27]将RS与ANN结合起来,充分利用RS处理不确定性的特长以增强ANN的信息处理能力.10)决策分析[28~30].RS的决策规则是在分析以往经验数据的基础上得到的.RS允许决策对象中存在一些不太明确、不太完整的属性,弥补了常规决策方法的不足.希腊工业发展银行ETE VA应用RS理论协助制订信贷政策,是RS多准测决策方法的一个成功范例.RS理论的应用领域还包括:近似推理[31,32]、软件工程数据分析[33]、图象处理[34]、材料科学中的晶体结构分析[35]、预测建模[36,37]、结构建模[38]、投票分析[39]、电力系统[40,42]等. RS在我国的研究刚刚起步,有关文献还不多[43~44].5 结束语(C onclusion)虽然RS至今只有十几年的发展历史,但取得的研究成果是令人瞩目的.它是一种较有前途的软计算方法,为处理不确定性信息提供了有力的分析手段[45].我们相信RS具有广阔的发展空间,今后会在更多的实际领域中发挥作用.致谢 波兰华沙工业大学计算机科学研究所(Institute of C om puter Science,Warsaw University of T echnology)的Zdzislaw Pawlak教授和Bozena Skalska博士赠送了部分研究报告,在此向他们表示感谢. 1期粗糙集理论及其应用综述155参考文献(References)1 Pawlak Z et al.R ough sets.C ommunications of AC M,1995,38(11):89 -952 Pawlak Z.R ough sets.International Journal of In formation and C om puter Science,1982,(11):341-3563 Pawlak Z.R ough set-theoretical aspects of reas oning about data.D or2 drecht:K luwer Academ ic Publishers,19914 S lowinski R.Intelligent decision support-handbook of applications and advances of the rough sets theory.D ordrecht:K luwer Academ ic Publish2 ers,19925 Pawlak Z.Vagueness and uncertainty-a rough set perspective.C om puta2 tional Intelligence,1995,11(2):227-2326 W ygralak M.R ough sets and fuzzy sets-s ome remarks on interrelations.Fuzzy Sets and Systems,1989,29(3):241-2437 Nanda S et al.Fuzzy rough sets.Fuzzy Sets and Systems,1992,45(2): 157-1608 Banerjee M and Pal S K.R oughness of a fuzzy set.In formation Sciences, 1996,93(3,4):235-2469 Skowton A et al.From rough set theory to evidence theory.Advances in the Dem pster Shafer Theory of Evidence.New Y ork:John W iley&S ons Inc.,1994,193-23610 Jakub W.Finding m inimal reducts using genetic alg orithm.Institute ofC om puter Science Reports,W arsaw University of T echnology,W arsaw,199511 G olan R and Z iarko W.M ethodology for stock market analysis utilizing rough set theory.Proc.of IEEE/IAFE C on ference on C om putational In2 telligence for Financial Engineering,New Jersey,1995,32-4012 Nejman D.A rough set based method of handwritten numerals classifica2 tion.Institutc of C om puter Science Reports,W arsaw University of T ech2 nology,W arsaw,199413 T eghem J et e of rough sets method to draw prem onitory factors for earthquakes by em phasizing gas geochem istry.In:Intelligent Decision Support-Handbook of applications and Advances of the R ough Sets Theory.D ordrecht:K luwer Academ ic Publishers,1992,165-17914 Deja R.C on flict m odel with neg otiations.In:Institute of C om puter Sci2 ence Reports.W arsaw University of T echnlolgy,W arsaw,199515 Hu X iaohua et al.M ining knowledge rules from databases-a rough set approach.Proc.of IEEE International C on ference on Data Engineering, Los Alam itos,1996,96-10516 Tsum oto Sh et al.Extraction of domain knowledge from databases based on rough set theory.IEEE International C on ference on Fuzzy Systems, New Jersey,1996,748-75417 S ienkiewicz J.R ough set and rough function approaches to the control al2g orithm reconstruction.Institute of C om puter Science Reports,W arsaw U2niversity of T echnology,W arsaw,199618 Mrozek A et al.M ethodology of rough controller synthesis.Proc.of IEEE International C on ference on Fuzzy Systems,New Jersey,1996,1135-113919 Pawlak Z.R ough sets,rough relations and rough functions.Fundamenta In formaticae,1996,27(2,3):103-10820 Plonka L and Mrozek A.Rule2based stabilization of the inverted pendu2lum.C om putational Intelligence,1995,11(2):348-35621 C z ogala E et al.Idea of a rough fuzzy controller and its application to the stabilization of a pendulum2car system.Fuzzy Sets and systems,1995,72(1):6127322 Mrozek A.R ough sets and dependency analysis am ong attributes in com2 puter im plementations of expert’s in ference m odels.International Journal of M an2M achine S tudies,1989,30(4):457-47323 Arima M et al.Fuzzy logic and rough sets controller for HVAC systems.Proc.of IEEE WESCANEX C ommunications,P ower,and C om puting, New Y ork,1995,133-13824 Tsum oto S et al.Automated discovery of medical expert system rules from clinical databases based on rough sets.Proc.of Second InternationalC on f.on K nowledge Discovery and Data M ining,US A,1996,63-7225 Jelonek J et al.R ough set reduction of attributes and their domains for neural netw orks.C om putational Intelligence,1995,11(2):339-34726 Peng C et al.Multi2valued neural netw ork and the knowledge acquisition method by the rough sets for ambiguous recognition problem.Proc.of the IEEE International C on ference on Systems,M an and Cybernetics,Bei2 jing,1996,736-74027 Y asdi R.C ombining rough sets learning and neural learning2method to deal with uncertain and im precise in formation.Neurocom puting,1995,7(1):61-8428 S lowinski R.R ough set approach to decision analysis.AI Expert,M arch 1995,19-2529 Pawlak Z.R ough set approach to knowledge2based decision support.In2 stitute of C om puter Science Reports,W arsaw University of T echnology, W arsaw,199530 S lowinski R et al.R ough set s orting of firms according to bankruptcy risk.In:Applying Multiple Criteria aid for Decision to Environment M an2 agement,D ordrecht:K luwer Academ ic Publishers,1994,339-35731 S lowinski R et al.R ough set reas oning about uncertain data.Fundamenta In formaticae,1996,27(2,3):229-24332 Pars ons S et al.A rough set approach to reas oning under uncertainty.Journal of Exprimental and Theoretical AI,1995,7(2):175-19333 Ruhe Gand G esselschaft F.R ough set based data analysis in g oal2orient2 ed s oftware measurement.Proc.of IEEE International s oftware M etrics Sym posium,Los Alam itos,1996,10-1934 W ojcik Z et al.Application of rough sets for edge enhancing image fil2 ters.Proc.of IEEE International C on ference on Image Processing,Los Alam itos,1994,525-52935 Jacks on A et al.R ough sets applied to materials data.Acta M aterialia, 1996,44(11):4475-448436 C ollette T and S zladow e rough sets and spectral data for building predictive m odels of reaction rate constants.Applied S pectroscopy, 1994,48(11):1379-138637 Aijun A et al.Discovering rules for water demand prediction-an en2 hanced rough set approach.Engineering Applications of Artificial Intelli2 gence,1996,9(6):645-65338 W ojcik Z et al.S tructural m odeling using rough sets.Proc.of IEEE Inter2 national C on ference on Fuzzy Systems,New Jersey,1996,761-76639 Nurm i H et al.Probabilistic,fuzzy and rough concepts in s ocial choice.European Journal of Operational Research,1996,95(2):264-277156 控制理论与应用16卷 40 Lambert2T orres G et al.Data M ining into a C ontrol Center Database via R ough Set T echniques.Proc.of the International C on ference on Intelli2 gent Systems Applications to P ower Systems(IS AP’97),Seoul,1997, 246-25041 Zhang Q,Han Z X and W en F S.A new approach for fault diagnosis in power systems based on rough set theory.Proceedings of APSCOM’97,H ong K ong,1997,597-60242 张琦,韩祯祥,文福拴.一种基于粗糙集方法的电力系统故障诊断/警报处理的新方法.中国电力,1998,31(4):32-3843 王珏,苗夺谦,周育键.关于R ough Set理论与应用的综述.模式识别与人工智能,1996,9(4):337-34444 曾黄麟.粗集理论及其应用.重庆:重庆大学出版社,199845 E wa Orlowska(ed.).Incom plete in formation2rough set analysis.New Y ork:Physica2Verlag,1998本文作者简介韩祯祥 1930年生.浙江大学教授,博士生导师.研究领域为软计算方法及其在电力系统中的应用.张 琦 1971年生.浙江大学在读博士生.研究方向为粗糙集理论在电力系统中的应用.文福拴 1965年生.浙江大学教授,博士生导师.研究领域为软计算方法在电力系统中的应用. 1期粗糙集理论及其应用综述157。
粗_糙_集_理_论

,
则X关于R是精确的。
相反地,Rough隶属函数可用来定义一个集合 的上、下近似集及边界集
R x 1 apr X x U , X
X U
R x 0 apr X x U , X
R bn X x U ,0 X
x 1
粗糙集理论的基本概念
RS理论认为知识即是将对象进行分类的能力, 假定我们起初对全域里的元素(对象)具有必要的 信息、或知识,通过这些知识能够将其划分到不同 的类别。若我们对两个元素具有相同的信息,则它 们就是不可区分的(即根据已有的信息不能够将其 划分开)。显然这是一种等价关系。不可区分关系 是RS理论最基本概念。在此基础上引入了成员关系, 上近似和下近似等概念来刻划不精确性与模糊性[1, 2,4,5]。
粗糙集的几种表示(续)
③
R X
card apr X card apr X
称 R ( X )为X的近似精度, 0 R X 1 (粗糙程度。 于是也可用 R ( X ) 来定义Rough集。 当 R X 1 ,称U上子集X关于U上不分明关系R是 Rough的; 当 R X 1 ,称X关于R是精确的;
粗糙集的几种表示(续)
无论哪一种Rough集的表示形式都离不开全域U 上的不分明关系R以及由R定义的下和上近似集。因 此对Rough集理论中的不分明关系以及下和上近似 集的研究尤其重要。定义观点的不同往往带来研究 的侧重面的不同。
X关于A的度量
X关于A的近似质量: apr X card apr X rA X card U U 近似质量 rA ( X ) 反映了知识X中肯定在知识库中的部 分在现有知识中的百分比。 apr X X关于A的粗糙性测度: A X 1 apr X 则 0 A X 1 ,且X是可定义的 A X 0 X是粗糙的 A X 0 。 粗糙性测度反映了知识的不完全程度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
文献综述
信息与计算科学
集合代数与粗糙集之间的关系研究
粗糙集理论是波兰数学家Pawlak于1982年提出的用于数据分析的理论. 由于该理论能够处理模糊和不确定性信息, 因此作为一种有效的知识获取工具受到了人工智能研究者的关注. 目前粗糙集理论已被成功应用在机器学习与知识发现、过程控制、数据挖掘、决策分析、模式识别等领域, 成为信息科学的研究热点之一.
1965年, 美国加利福尼亚大学控制论专家扎德(L. A. Zadeh)教授在《信息与控制》杂志上发表了一篇开创性论文<模糊集合>, 这标志着模糊数学的诞生. L. A. Zadeh教授多年来致力于“计算机”与“大系统”的矛盾研究, 集中思考了计算机为什么不能象人脑那样进行灵活的思维与判断问题. 计算机为什么不能象人脑思维那样处理模糊信息呢? 其原因在于传统的数学. 例如精确数学, 是建立在经典集合论的基础之上, 一个研究的对象对于某个给定的经典集合的关系要么是属于, 要么是不属于, 二者必居其一. [2]19世纪, 由于英国数学家布尔(Bool)等人的研究, 这种基于二值逻辑的绝对思维方法抽象后成为布尔代数, 它的出现促使数理逻辑成为一门很有适用价值的学科, 同时也成为计算机科学的基础. 但是, 1923年, 大哲学家罗素(Russell)就在其著名论文<论模糊性>中提出“整个语言或多或少是模糊的”及“所有二值逻辑都习惯上假定使用精确符号. 因此它仅适用于虚幻的存在. 而不适用于现实生活. 逻辑比其他学科使我们更接近天堂”[1]时认识到二值逻辑的不足. 二值逻辑无法解决一些逻辑悖论, 如著名的罗素(Russell)“理发师悖论”、“秃头悖论”、“克利特岛人说谎悖论”等等悖论问题. 这就是目前计算机不能象人脑思维那样灵活、敏捷地处理模糊信息的重要原因. 为克服这一障碍, L. A. Zadeh教授提出了“模糊集合论”. 在此基础上, 现在已形成一个模糊数学体系.
1960年柏克莱加州大学电子工程系扎德(L. A. Zadeh)教授, 提出“模糊”的概念. 1965年发表关于模糊集合理论的论文. 1966年马里诺斯(P. N. Marinos)发表关于模糊逻辑的研究报告. 以后, 扎德(L. A. Zadeh)又提出关于模糊语言变量的概念. 1974年扎德(L. A. Zadeh)进行有关模糊逻辑推理的研究. 1978年, 国际上第一本以模糊数学为主题的学术刊物《Fuzzy Sets
and Systems》在欧洲创刊. 模糊数学于1976年传入我国后得到了迅速发展: 1980年成立了中国模糊数学与模糊系统学会, 1981年创办了《模糊数学》(武汉, 华中工学院)杂志, 1987年创办了《模糊系统与数学》(长沙, 国防科技大学)杂志. 2005年8月20日, 中国运筹会Fuzzy信息与工程分会正式成立, Fuzzy数学的创始人扎德教授的出席会议. 同年经国际模糊系统协会(IFSA)专家评审, 最终授予中国四川大学副校长刘应明院士“FuzzyFellow奖”. 中国科研人员在Fuzzy领域中取得了卓越成就.
模糊数学是一门新兴学科, 可是由于模糊数学突破了传统精确数学绝不允许模棱两可的约束, 使过去那些与数学毫不相关或关系不大的学科都有可能用定量化和数学化加以描述和处理, 从而显示了强大的生命力和渗透力. 自1965年以来, 模糊集理论几乎已经渗入到基于经典集合理论的纯数学的所有分支中: 拓扑、代数结构、几何、算术、测皮论、概率论、范畴论等, 更引人注目的是这一新理论应用领域的广泛性: 近似推理模型、专家系统、语言学、定理证明技术以及逻辑编程、学习系统、信息检索、数据库、病理诊断、模式识别、聚类与分类技术、图像处理与计算机视觉、控制论与系统论、决策与偏好结构、可靠性理论、心理学、社会学等. 而且在模糊数学最重要的应用领域是计算机智能, 不少人认为它与新一代计算机的研制有密切的联系.
关系是一个基本概念. 在日常生活中有“朋友关系”、“师生关系”等, 在数学上有“大于关系”、“等于关系”等, 而序对又可以表达两个对象之间的关系. 普通关系是序偶的经典集合, 模糊关系则是序偶的模糊集合. 所以关系是集合论中的一个重要概念, 同时在模糊集合论中, 模糊关系也是很重要的一部分. 模糊关系是模糊理论中最重要的内容之一, 其应用范围十分广泛, 几乎遍及模糊数学的所有应用领域. 事实上, 模糊关系, 作为集论中普通关系概念的推广, 不仅描述客观事物之间有无关系, 而且描述其程度. 诸如“x比y大得多”, “x熟悉y”, “x与y相似”等用模糊语言表达的关系, 都是模糊关系.
因为模糊关系应用的广泛性, 如模糊聚类分析、模糊选择、模糊量排序、模糊偏好结构等, 其研究都是建立在模糊关系基础之上的. 而在对模糊关系及其应用的研究中, 模糊关系性质的讨论又占据着举足轻重的地位, 如前面所提及的应用中, 均须讨论模糊关系性质中的传递性. 本文首先定义了各种类型的经典二元关系和模糊二元关系, 再给出了它们的多种性质并予以证明, 同时说明二者的联系.
集合代数是经典命题演算形式系统的语义解释[4], 而经典命题演算系统(CPC)的公式只是一些形式符号, 其意义是由具体的解释给出的. 逻辑代数和集合代数都是布尔代数, 都
是CPC的解释. 集合代数是CPC的集合语义, 其中对联结词的解释就是集合运算;对形式公式的解释就是集合函数; 对逻辑蕴涵、逻辑等价的解释就是集合包含和集合相等. 标准概率逻辑是在标准概率集合语义上建立的逻辑体系, 命题表示随机事件, 随机事件是集合, 开率空间中的事件域是集合代数, 概率逻辑就是CPC集合语义的实际应用.
在粗糙集理论中有两种方式来推广定义近似算子: 构造性方法和公理化方法. 构造性方法是以论域上的二元关系[6]、领域系统或布尔子代数作为基本要素构造性地定义近似算子, 然后导出粗糙集代数系统. 由于二元关系常用来表示信息系统中的可利用信息, 所以目前所见的粗糙集在数据分析中的应用基本上都是用构造性方法去定义近似算子. 公理化方法的基本要素是满足某些公理集的近似算子, 即粗糙集代数系统是事先给定的, 然后定义二元关系使得由二元关系通过构造性方法定义的近似算子及其导出的粗糙集代数系统恰好就是事先给定的近似算子和粗糙集代数系统. 这种粗糙集代数[5]系统是由集合代数系统中的三个集合算子(交、并、补)加上两个粗糙近似算子(下近似算子和上近似算子)形成. 在这种意义, 粗糙集理论可以看成是集合论的又一推广形式. 另外粗糙集理论中的下近似算子和上近似算子与模态逻辑学中必然性(box)算子和可鞥性(diamond)算子、拓扑空间中的内部算子和闭包算子、Dempster-Shafer证据理论中的信任函数与似然都有着密切的联系. 因此, 公理化方法更有助于我们深入了解粗糙集和数学结构.
参考文献
[1] Etienne E Kerre. Fuzzy Sets and Approximate Reasoning (English Edition) [M]. 西安:
西安交通大学出版社, 1999.
[2] 李洪兴, 汪培庄. 模糊数学[M]. 北京: 国防工业出版社, 1994.
[3] 杨纶标, 高英仪. 模糊数学原理及应用[M]. 广州: 华南理工大学出版社, 2005.
[4] 刘宏岚, 高庆狮, 杨炳儒. 集合代数是经典命题演算形式系统的语义解释[J]. 计算
机学报, 2010, 09.
[5] 徐优红. 模糊粗糙集代数[J]. 计算机学, 2007, 02.
[6] 徐优红. 二元关系的复合与近似算子的合成[J]. 计算机科学, 2009, 36(2): 194~198.
[7] 韩立岩, 汪培庄. 应用模糊数学[M]. 北京: 首都经济贸易大学出版社, 1989.
[8] 张文修, 吴伟志, 梁吉业, 李德玉. 粗糙集理论与方法[M]. 北京: 科学出版社,
2001.。