粗糙集理论介绍和研究综述
粒计算研究综述

第2卷第6期 智 能 系 统 学 报 V ol.2 .62007年12月 CAAI T ransactions on Intelligent Systems D ec.2007粒计算研究综述王国胤1,2,张清华1,2,胡 军1,3(1.重庆邮电大学计算机科学与技术研究所,重庆400065; 2.西南交通大学信息科学与技术学院,四川成都610031;3.西安电子科技大学电子工程学院,陕西西安710071)摘 要:粒计算(gr anular computing)是当前计算智能研究领域中模拟人类思维和解决复杂问题的新方法.它覆盖了所有有关粒度的理论、方法和技术,是复杂问题求解、海量数据挖掘、模糊信息处理的有效工具.首先回顾了粒计算研究和发展状况,介绍了粒计算的基本组成和问题,综述了粒计算的基本模型和方法,并讨论了它们之间的相互关系,最后探讨了构建统一的粒计算模型、复杂问题空间的粒化、粒层之间的转换、高效的粒计算方法、新的粒计算模型、动态粒计算模型、自主粒计算模型、粒计算方法的模糊化以及粒计算模型的应用和推广等几个方面的关键问题.关键词:粒计算;数据挖掘;智能信息处理;粗糙集;模糊集;商空间中图分类号:T P18 文献标识码:A 文章编号:1673 4785(2007)06 0008 19An overview of granular computingWAN G Guo yin 1,2,ZHANG Qing hua 1,2,HU Jun 1,3(1.Institute of Comput er Science &T echno lo gy ,Cho ng qing U niversit y of Po st s and T eleco mmunications,Chong qing 400065,China;2.Scho ol of Infor matio n Science &T echnolog y,Southwest Jiao tong U niv ersit y,Chengdu 610031,China; 3.School of Electro nic Engineer ing,Xidian U niver sity,Xi an 710071,China)Abstract:In the field of com putational intelligence,granular computing (GrC)is a new w ay to simulate hu m an thinking to help solve co mplicated problems.Gr C involv es all the theories,methodo logies and tech niques o f granularity,pr oviding a pow erful to ol for the so lution of complex problems,m assiv e data min ing,and fuzzy information pr ocessing.In this paper,first the current situation and the developm ent pros pects of GrC are introduced,then the fundamental and ex isting problem s r elated to GrC ar e presented and its basic models and metho ds summ arized.Finally,som e future research topics abo ut GrC are presented,such as,uniform granular co mputing mo del,granulation of complex pro blem space,transform ation be tw een granule spaces,efficient g ranular co mputing algor ithm,nov el g ranular co mputing model,dy namic granular co mputing m odel,data driven g ranular co mputing m odel,fuzzy gr anular co mputing method,and the applications of gr anular computing models,etc.Keywords:g ranular computing;data m ining;intelligent inform ation processing;roug h sets;fuzzy sets;quotient space收稿日期:2007 04 02.基金项目:国家自然科学基金资助项目(60573068);新世纪优秀人才支持计划;重庆市教委科学技术研究资助项目(KJ060517).自Zadeh 1979年发表论文!Fuzzy sets and in form ation granularity ∀以来[1],研究人员对信息粒度化的思想产生了浓厚的兴趣.Zadeh 认为很多领域都存在信息粒的概念,只是在不同领域中的表现形式不同.自动机与系统论中的!分解与划分∀、最优控制中的!不确定性∀、区间分析里的!区间数运算∀、以及D S 证据理论中的!证据∀都与信息粒密切相关.H obss 在1985年直接用!粒度(granularity)∀作为论文题目发表论文[2],讨论了粒的分解和合并,以及如何得到不同大小的粒,并提出了产生不同大小粒的模型.Lin 在1988年提出邻域系统并研究了邻域系统与关系数据库之间的关系[3].1996年,他在U C Berkeley 大学访问时,向Zadeh 提出作!granular computing∀的研究,Zadeh称之为!g ranular mathematics∀,Lin改称为!granular co mputing∀,并缩写成Gr C.他发表了一系列关于粒计算与邻域系统的论文[4-10],主要是研究二元关系(邻域系统、Rough集和信任函数)下的粒计算模型,论述基于邻域系统的粒计算在粒结构、粒表示和粒应用等方面的问题,讨论了粒计算中的模糊集和粗糙集方法,并将粒计算方法引入数据挖掘和机器发现.依据人们在解决问题时能从不同的粒度世界去分析和观察同一问题,并且很容易地从一个粒度世界转到另一个粒度世界,张钹和张铃在1990年针对复杂问题求解,建立了一种复杂问题求解的商结构形式化体系,给出了一套解决信息融合、启发式搜索、路径规划和推理等问题的理论和算法[11-12].1997年,Zadeh进一步指出[13],世上有3个基本概念构成人类认知的基础:粒化、组织及因果关系.其中,粒化是整体分解为部分,组织是部分结合为整体,而因果关系则涉及原因与结果间的联系.物体的粒化产生一系列的粒子,每个粒子即为一簇点(物体),这些点难以区别,或相似、或接近、或以某种功能结合在一起.一般来说,粒化在本质上是分层次的,时间可粒化为年、月、日、小时、分、秒就是大家熟悉的例子.在Lin的研究基础上,Yao结合邻域系统对粒计算进行了详细的研究[14-16],发表了一系列研究成果[17-22],并将它应用于知识挖掘等领域,建立了概念之间的if then规则与粒度集合之间的包含关系,提出利用由所有划分构成的格求解一致分类问题,为数据挖掘提供了新的方法和视角.结合粗糙集理论,Yao探讨了粒计算方法在机器学习、数据分析、数据挖掘、规则提取、智能数据处理和粒逻辑等方面的应用.Yao给出了粒计算的3种观点[22]:1)从哲学角度看,粒计算是一种结构化的思想方法;2)从应用角度看,粒计算是一个通用的结构化问题求解方法;3)从计算角度看,粒计算是一个信息处理的典型方法.随着粒计算研究的发展,近年来国内外又有很多学者加入到了粒计算研究的领域.为了探讨粗糙集理论在各种环境下的应用,Skow r on[23-27]以包含度概念来研究粒近似空间上的Rough下近似和Rough上近似.刘清[28-30]在Roug h逻辑的基础上,提出了粒-逻辑的概念(G 逻辑),构造了这种逻辑的近似推理系统,并应用于医疗诊断.近几年来,在掀起粒计算研究的热潮中,商空间理论被人们广泛认识和推广,2003年张铃和张钹将模糊概念与商空间理论结合,提出模糊商空间理论,为粒计算提供了新的数学模型和工具,并成功应用于数据挖掘等领域[31-35].2002年苗夺谦等人[36]对知识的粒计算进行探讨,引入属性的重要度,并在求最小属性约简方面得到应用.王飞跃等人[37]对词计算和语言动力学进行了探讨,以词计算为基础,对问题进行动态描述、分析和综合,提出了设计、控制和评估的语言动力学系统.王国胤等人[38-44]提出了基于容差关系的粒计算模型,利用属性值上的容差关系给出了不完备信息系统的粒表示、粒运算规则和粒分解算法,同时结合粗糙集中的属性约简问题,提出了不完备信息系统在粒表示下属性必要性的判定条件,对粒计算方法在规则提取方面进行了探索.郑征等人[45-47]提出了相容粒度空间模型,并在图像纹理识别和数据挖掘中取得了成功,他们认为,人类具有根据具体的任务特性把相关数据和知识泛化或者特化成不同程度、不同大小的粒的能力,以及进一步根据这些粒和粒之间的关系进行问题求解的能力.卜东波等人[48]从信息粒度的角度剖析聚类和分类技术,试图使用信息粒度原理的框架来统一聚类和分类,指出从信息粒度的观点来看,聚类是在一个统一的粒度下进行计算,而分类却是在不同的粒度下进行计算,并根据粒度原理设计了一种新的分类算法,大规模中文文本分类的应用实践表明,这种分类算法有较强的泛化能力.Zhang等人[49-50]对粒神经网络进行了探讨,并在高效知识发现中得到很好的应用.李道国等人[51]研究了基于粒向量空间的人工神经网络模型,在一定程度上提高了人工神经网络的时效性、知识表达的可理解性.杜伟林等人[52]根据概念格[53]与粒度划分在概念聚类的过程中都是基于不同层次的概念结构来进行分类表示,而且粒度划分本身构成一个格结构的特点,研究了概念格与粒度划分格在概念描述与概念层次转换之间的联系,通过对概念的分层递阶来进行概念的泛化与例化,使概念在递阶方面忽略不必要的冗余信息.Yager[54]探讨了基于粒计算的学习方法和应用.Lin[55]在2006年粒计算国际会议上提出了新的研究思路!infrastruc tures for AI engineering∀.同时,Bargiela和Pe dry cz[56]也从各个侧面对粒计算的根源和实质进行了详细的探讨和总结.Yag er指出,发展信息粒的操作方法是当前粒计算研究的一个重要任务[57].1 粒计算的基本组成粒计算的基本组成主要包括3部分:粒子、粒层#9#第6期 王国胤,等:粒计算研究综述和粒结构.1 1 粒 子粒子是构成粒计算模型的最基本元素[58-59],是粒计算模型的原语.一个粒可以被解释为许多小颗粒构成的一个大个体,现实生活中,粒子无处不在,如在地图上观察洲、国家、海洋、大陆和山脉等是一些粗的粒子(大的粒子),观察省、市、区等是一些中等的粒子,而观察街道、饭店、机场等是一些相对较小的粒子.一个粒子可以被同时看作是由内部属性描述的个体元素的集合,以及由它的外部属性所描述的整体.一个粒子的存在仅仅在一个特定的环境中才有意义.一个粒子的元素可以是粒子,一个粒子也可以是另外一个粒子的元素.而衡量粒子!大小∀的概念是粒度,一般来讲,对粒子进行!量化∀时用粒度来反映粒化的程度[59].1 2 粒 层按照某个实际需求的粒化准则得到的所有粒子的全体构成一个粒层,是对问题空间的一种抽象化描述.根据某种关系或算子,问题空间产生相应的粒子.同一层的粒子内部往往具有相同的某种性质或功能.由于粒化的程度不同,导致同一问题空间会产生不同的粒层.粒层的内部结构是指在该粒层上的各个粒子组成的论域的结构,即粒子之间的相互关系.在问题求解中,选择最合适的粒层对于问题求解尤为关键,因为,在不同粒层求解同一问题的复杂度往往不同.在高一级粒层上的粒子能够分解成为下一级粒层上的多个粒子(增加一些属性),在低一级粒层上的多个粒子可以合并成高一级粒层上的粒子(忽略一些属性).粒计算模型的主要目标是能够在不同粒层上进行问题求解,且不同粒层上的解能够相互转化.1 3 粒结构一个粒化准则对应一个粒层,不同的粒化准则对应多个粒层,它反应了人们从不同角度、不同侧面来观察问题、理解问题、求解问题.所有粒层之间的相互联系构成一个关系结构,称为粒结构[20].粒结构给出了一个系统或者问题的结构化描述.通过从系统思维、复杂系统理论和层次结构理论(技术)中得到的启发至少需要确定一个粒结构网[20]中3个层次的结构:粒子的内部结构、粒子集结构和粒子网的层次结构.粒子集的集体结构可以看作是全部层次结构中一个层次或者一个粒度视图中的结构.它本身可以看作是粒的内部连接网络.对于同一个系统或者同一个问题,许多解释和描述可能是同时存在的.所以,粒结构需要被模型化为多种层次结构,以及在一个层次结构中的不同层次.虽然一个粒子在某个粒层上被视为一个整体,但粒子内部元素(子粒子)的结构在问题求解时也很重要,因为它能提供粒子更为详细的特性.而在同一层上的粒子之间也具有某种特殊的结构,它们可能是相互独立,或者部分包含.如果同一粒层上的粒子之间的独立性越好,可能问题求解后合并起来越方便;反之,如果粒子之间的相关性越好,则问题求解后的合并工作相对越繁杂.粒子网的层次结构是对整个问题空间的概括,它的复杂性在一定程度上决定了问题求解的复杂程度.2 粒计算的基本问题粒计算中存在2个最基本的问题,即粒化和粒的计算.问题空间的粒化是指将问题空间分解为许多子空间,或是基于有用的信息和知识将问题空间中的个体聚集成不同的类,这些类称之为粒.粒中的元素可以理解为对应概念的实例.可以把粒计算和概念生成、知识发现和数据挖掘联系起来,因为概念生成的目的之一是对具有某些概念的粒的表示、特征化、描述和解释,而知识发现和数据挖掘就是在粒之间建立关联和因果等联系.2 1 粒 化粒化是问题求解空间的一个构造性过程,它可以简单理解为在给定粒化准则下得到一个粒层的过程,是粒计算基础单元的构建,包括粒子、粒视图、粒网和层次结构.在不同的粒化准则下就得到多个粒层,进而得到粒层的网络结构.通常的粒化方法有自顶而下通过分解粗粒子得到细粒子的方法,和自底向上将细粒子通过合并得到粗粒子的方法.粒化过程是粒计算的必要过程.问题空间的粒化过程主要涉及粒化准则、粒化算法(方法)、粒子和粒结构的表示(描述)以及粒子和粒结构的定性(定量)描述等问题[59].粒化准则主要是语义方面的问题,解决为什么2个对象能放进同一个粒子内的问题.它是根据实际问题求解的具体需求和具体精度要求得到的.粒化准则的一个基本要求是忽略掉那些无关紧要的细节,从而达到降低问题求解复杂度的目的.粒化方法面对实际问题,回答如何对问题空间进行粒化,采用什么算法或工具实现粒层的构造,它属于算法方面的问题.如在粗糙集理论中,如何对对象集进行划分产生粒层,如何高效实现属性的约简等问题.粒子的结构描述主要是用粒化方法得到的粒子,如何用形式化的语言表述出来,以便后面进行计算.例如在粗糙集理论模型中,粒子的表示可能是一个子集.而#10#智 能 系 统 学 报 第2卷在概念格理论中,粒子的表述就是一个概念,它包括概念的外延(一个对象子集)和内涵(一个属性子集) 2部分.粒结构的描述往往形式多样,在商空间理论模型中,粒结构是一种分层递阶的结构,在概念格模型中,粒结构是一种H asse图.粒子和粒结构的定性、定量描述主要指粒子和粒结构的大小(主要是指粒度的结果)和复杂性度量.当前,成功的粒化方法往往都是以将解空间形成划分空间为主要的目标,这样便于将子空间上的解合成原问题空间的解,商空间理论就是这样一个成功的实例.当然,如果用某种粒化方法形成的解空间不是划分(如覆盖),这将增加合成的复杂度.2 2 粒的计算以粒子为运算对象进行问题的求解或推理,是狭义的粒计算.粒计算可以通过系统访问粒结构来解决问题,包括在层次结构中向上和向下2个方向的交互,以及在同一层次内的移动,主要分为2种[59]:同一粒层上粒子之间相互转换和推理,不同粒层上粒子之间的转换或推理.不同粒层之间的联系可以由映射来表示,在不同粒层上同一问题以不同的粒度、不同的细节表示,粒层之间的映射就建立了同一问题的不同细节描述之间的关系.商空间理论模型就是通过自然投影建立了分层递阶的商空间链式结构.粒计算的主要特点是同一问题的解可以在不同粒层之间自由转化.正是基于这一点,人们才能用粒计算方法高效地实现复杂问题的求解.模糊商空间上的分层递阶结构可以通过模糊等价关系的截关系建立相应的转化联系;粗糙集理论中的划分粒度可以通过属性的增加或删减来控制;而概念格理论模型中的概念粒子的相互转化可以通过改变概念的内涵来实现.这些转化虽然方式不同,但一个共同的特点是在转化的过程中,问题求解的重要性质必须能在不同粒层上表现出来,这也是评价粒化方法好坏的一个重要指标.如果在粒化后粒层之间的相互转化过程中,某些重要属性不能体现出来,这不但不利于问题的求解,反而会导致问题求解过程发散,从而增加问题求解的复杂度.商空间理论模型中的!保真∀和!保假∀原理使得粒化后形成的商空间具有!保序∀性,使得问题求解的搜索空间大大减少,复杂度由相乘变为相加.粒计算的2个基本问题中,粒化是关键,它直接决定粒计算的成功与否.因此,粒化方法是人们研究的热点问题.目前,粒化方法很多,如基于等价关系的划分产生粒子[17],基于模糊集产生模糊信息粒[1],基于模糊等价关系截集产生分层递阶粒空间[35],基于概念格产生概念信息粒和概念知识粒[60],基于邻域系统产生邻域粒子[3]等等.总之,粒计算是一个多准则学科,它从许多领域中获得其基本的思想、准则和方法,是基于不同层次粒度和细节的问题求解的一般性理论.在粒计算的!大伞∀下进行统一的研究,可以发现不同学科之间原理的关联,它与具体的学科研究是相互独立的[59].一旦掌握了粒计算中的结构化思维和结构化问题求解的抽象思想,就可以很容易地在任何领域中运用.3 粒计算的主要模型与理论方法3 1 词计算模型高标准的精确表达,普遍存在于数学、化学、工程学和另外一些!硬∀科学之中,而不精确表达却普遍存在于社会、心理、政治、历史、哲学、语言、人类学、文学、文艺及相关的领域中[61].针对复杂且非明晰定义的现象,无法用精确的数学方法来描述,但可以用一些程度词语,如不很可能、十分不可能、极不可能等,来对某些模糊概念进行修饰.尽管普通的精确方法(如数学)在某些科学领域应用相当广泛,也一直尝试着应用到人文学科中,但人们在长期的实践中已经清楚地认识到精确的方法应用到人文学科有很大的局限性.面对巨大而又复杂的人文学科系统,区别于传统方法的新方法∃∃∃模糊计算方法被Zadeh提出.在人类的认识中,粒的模糊性直接源于无区别、相似性、接近性以及功能性等这些概念的模糊性.人类具有在不精确性、部分知识、部分确定以及部分真实的环境下作出合理决策这一不同寻常的能力,而模糊信息粒化正是这种能力的基础.在模糊逻辑中,模糊信息粒化是语言变量、模糊!if then∀规则以及模糊图的基础.词计算(com puting w ith w o rds)是用词语代替数进行计算及推理的方法[62].如何利用语言进行推理判断,这就要进行词计算.信息粒化为词计算提供了前提条件,词计算在信息粒度、语言变量和约束概念上产生了自己的理论与方法,意在解决模糊集合论的数值化隶属度函数表示法的局限性、表达的概念缺乏前后联系、逻辑表达和算子实现的复杂性等问题,使它们能够更符合人类的思维特点.词计算有狭义和广义2个方面的概念.狭义的模糊词计算理论是指利用通常意义下的数学概念和运算(如加、减、乘、除等)构造的带有语义的模糊数值型的词计算的理论体系;广义的词计算理论统指用词进行推理、用词构建原型系统和用词编程,前者是后者的基#11#第6期 王国胤,等:粒计算研究综述础[63].模糊逻辑在词计算中起中心作用,它可以近似地被认为与词计算相同[62].在词计算中存在2个核心问题:模糊约束的表现问题和模糊约束的繁殖问题,它们是模糊信息粒化的基本准则.信息粒化(infor mation granulation)是粒化的一种形式.在众多的信息粒化中,非模糊粒化的方法很多,如将问题求解空间形成划分空间,每个粒子都是精确的.但这种粒化方法不能解决很多现实问题,如将人的头部粒化为脸、鼻子、额头、耳朵、头盖、脖子等粒子,这些粒子之间没有明确的分界线,它们都是模糊的粒子.模糊信息粒化是传统信息粒化的一种推广.模糊信息粒化理论[64-65](theor y of fuzzy information g ranulation,TFIG)建立在模糊逻辑和信息粒化方法基础之上,是从人类利用模糊信息粒化方式中获得的启发,其方法的实质是数学.Zadeh指出[64],除模糊逻辑外,没有一种方法能提供概念框架及相关技术,它能在模糊信息粒化起主导作用.继Zadeh之后,许多学者开始了有关词计算的研究工作,Wang[66]编写了词计算一书.广义词计算理论的研究工作,中国刚刚起步,李征等人[67-68]通过研究模糊控制器的结构,认为模糊控制实际上是应用了信息粒化和词计算技术,但却只是应用了该技术的初级形式,而基于信息粒化和词计算(IGCW)的模糊控制系统,将具有更强的信息处理和推理判断能力,是对人类智能更高程度的模拟.他们指出,基于信息粒化和词计算的模糊控制系统是通过信息粒化和重组、多层次的思维决策,动态地改变下层控制器的参数和推理方法或控制规则,因而使控制器具有变结构和多模态的特性.信息太多会延误推理计算的时间,给系统带来不必要的处理任务;而信息太少,则会降低推理结果的完善性.因此,提出了合理重新组织信息的研究课题.随着近年来智能信息处理的不断深入与普及,特别是处理复杂系统分析与评估时的迫切需要,人们越来越发现排除自然语言的代价太大了.首先,从应用角度来看,人类已习惯于用自然语言描述和分析事物,特别是涉及社会、政治、经济和管理中的复杂过程.人类可以方便地利用以自然语言表示的前提进行推理和计算,并得到用自然语言表达的结果;其次,从理论角度来看,不利用自然语言,现有的理论很难甚至不能够处理感性信息,而只能处理测度信息.感性信息或知识通常只能用自然语言来描述,由于人类分辨细节和存储信息的认知能力的内在限制,感性信息在本质上是不精确的[69-72].W ang利用自然语言知识和信息,建立以词计算为基础的语言动力学系统(linguistic dynamic system s,LDS),并通过融合几个不同领域的概念和方法[37],提出基于词计算的语言动力学系统的计算理论框架,根据这个计算理论框架,利用常规或传统数值动力学系统中已有的成熟概念和方法,对语言动力学系统进行动力学分析、设计、控制和性能评估.这些研究的目的是建立连接人类的语言知识表示与计算机的数字知识表示的桥梁,成为下一代智能化人机交互的理论基础之一.总之,词计算理论和方法对于复杂信息系统的模糊推理和控制非常重要,但由于自身的局限性,它必须和其他理论体系相结合,才能更有效地处理复杂信息.3 2 粗糙集模型一个对象属于某个集合的程度随着属性粒度的不同而不同,为了更好地刻画集合边界的模糊性,波兰学者Paw lak[73]在20世纪80年代提出了粗糙集理论,其本质思想是利用不可分辨关系(等价关系)来建立论域的一个划分,得到不区分的等价类(即不同属性粒度下的概念粒),从而建立一个近似空间(由不同大小的概念粒形成).在近似空间上,用2个精确的集合(上近似集和下近似集)来逼近一个边界模糊的集合.如果近似空间的粒度较粗,被近似的集合的边界域较宽,而如果近似空间的粒度较细,被近似集合的边界域较窄.给定集合X上的一个划分等价于在X上给定一个等价关系R.X/R表示U上由R导出的所有等价类,[x]R表示包含元素x的等价类,其中x%U. Paw lak称之为在论域上给定了一个知识基(X,R),然后讨论一个一般的概念X(U中的一个子集)如何用知识基中的知识来表示.对那些无法用(X,R)中的集合的并来表示的集合,借用拓扑中的内核和闭包的概念,引入下近似和上近似的概念:R-(X)= {x%U|[x]R X}和R-(X)={x%U|[x]R&X∋ }.当R-(X)∋R-(X)时,就称X为粗糙集,从而创立了!粗糙集理论∀.粗糙集理论是一种软计算方法.软计算(soft computing)概念是由模糊集创始人Zadea提出的[61-65].传统的计算方法即所谓硬计算,使用精确、固定和不变的算法来表达和解决问题;而软计算的指导原则是利用所允许的不精确、不确定性和部分真实性得到易于处理、鲁棒性强和成本较低的解决方案,以便更好地与现实系统相协调.粗糙集理论的研究,已经经历了20多年的时间,无论是在系统理论、计算模型的建立和应用系统的研制开发上,都已经取得了很多成果,也建立了一套较为完善的粗糙集理论体系[74-75].目前粗糙集理#12#智 能 系 统 学 报 第2卷。
自己为什么选择这个课题

自己为什么选择这个课题?(选题的缘由)主要有两种写法:一、是由于看到与你论文中观点一致或相反的资料、事例引发的思考。
这种要求你把事例或是资料解析一下,并着重强调自己的思考。
最后要求阐述一下你思考后的结论和你为了证明自己观点所做的研究。
二、是由于你所研究的内容具有明确的理论价值和实践意义。
要从观点的由来和研究历程着手,提出你的论文对以往研究的总结还是创新。
你的研究有利于完善或是明确这一观点,而且可以指导实践,既有理论价值又有实践意义。
最后提出自己的观点是什么。
基本上,就是一个文献综述的形式吧,但是如果你论文结构中有单独的文献综述,那么你在这一部分就不能罗列过多的研究成果。
要表明研究的价值与意义,研究的可行性与必要性等,讲清楚这个了,就是让别人理解你为什么要选这个题目。
研究这个课题的意义和目的是什么?首先纲领性把握两者区别:目的——重在阐述论文要解决的问题。
即为什么选这样一个题目进行论述,要论述出什么东西。
意义——重在表明论文选题对理论研究有哪些贡献,或对实践具有哪些帮助和指导。
在明确两部分的区别之后可以对选题的相关领域进行搜索,明确当下该选题有哪些研究成果,还有哪些部分是你的选题需要补充和完善的。
对选题的价值有一个综合性的判断。
最后进入实战部分:可以先简单叙述该课题的起源或者发展状况,然后阐明选题着重解决哪些问题(讨论范围)。
最后对你的选题进行价值性评估,说清楚这篇论文将对理论产生哪些推动作用,或者对实践有什么指导意义就可以了。
PS.目的和意义可以分开写,也可以合并写,看个人爱好以及资料的详实程度。
论文选题的立论、目的和意义:软件测试的根本目的是在花费尽可能少的人力物力的前提下,寻找并改正软件的故障及缺陷,由此提高软件的可靠性。
根据软件开发各阶段的规格说明和程序结构选取测试数据,设计得到测试用例后驱动被测程序,观察并记录程序执行结果,并与预期的结果进行比较。
根据比较结果修正程序,排除故障。
可见,测试用例的设计是软件测试的重点与关键,因为构成用例的各个测试数据即是对应于程序各个输入变量的输入数据。
[课件]智能计算理论PPT
![[课件]智能计算理论PPT](https://img.taocdn.com/s3/m/d0b8c3a5bceb19e8b8f6ba97.png)
陕西师范大学 计算机科学学院 9
陕西师范大学 计算机科学学院 14
2018/12/9
从符号主义到连接主义:行为主义
行为主义(actionism),又称为进化主义(evolutionism)或 控制论学派(cyberneticsism),其原理为控制论及感知-动 作型控制系统。 行为主义认为人工智能源于控制论。控制论思想早在20 世纪40~50年代就成为时代思潮的重要部分,影响了早 期的人工智能工作者。维纳(Wiener)和麦克洛克 (McCulloch)等人提出的控制论和自组织系统以及钱学 森等人提出的工程控制论和生物控制论,影响了许多领 域。控制论把神经系统的工作原理与信息理论、控制理 论、逻辑以及计算机联系起来。
陕西师范大学 计算机科学学院 10
2018/12/9
从符号主义到连结主义:符号主义
符号主义者,在1956年首先采用“人工智能”这个术语。 后来又发展了启发式算法->专家系统->知识工程理论与 技术,并在20世纪80年代取得很大发展。符号主义曾长 期一枝独秀,为人工智能的发展作出重要贡献,尤其是 专家系统的成功开发与应用,为人工智能走向工程应用 和实现理论联系实际具有特别重要的意义。在人工智能 的其他学派出现之后,符号主义仍然是人工智能的主流 派别。这个学派的代表人物有纽厄尔(Newell)、西蒙 (Simon)和尼尔逊(Nilsson)等。
航材分类方法的研究综述和启示

C6
C8
C9
初始件
后续件
长期件(有寿件)
C10 消耗频率
快速消耗
慢速消耗件
稳定消耗件
C11 消耗流动性
消耗数据记录多
消耗数据记录少 消耗数据稳定
基本无消耗数据
C12 功能载体
机械件
电子器件
机电复合件
特殊材料件
C13 订货优先级
飞机停场件(立即反馈) 紧急件
加快件
普通件
C14 使用特性
标准件
特制件
专用件
备件分类方法进行了总结,梳理提出一些意见,并
更换与维护、安全保障等环节产生影响。当前航空
大胆做出初步的设想,为方便研究和具体的实际应
飞行器发展迅速,具有机型多、专用航材种类多、储
用,可建立航材分类系统。
备成本高等特点 ,因此要根据不同的需求,或定
性分析,或定量分析,或者结合两者,研究与之相匹
2
航材分类的原则和指标
ing to provide the reference.
Key Words
tors
classification of aircraft spare parts,aircraft spare parts management,classification method,principle,indica⁃
parts spare parts to the defects of classification method are summarized,the preliminary aircraft spare parts classification system is
put forward,in order to further study and rich aircraft spare parts classification,prediction,fine management,and decision-mak⁃
若干Rough函数及其性质

收稿日期:2014-05-10基金项目:河南省基础与前沿科学技术研究基金资助项目(122300410222);河南省教育厅科学技术研究重点基金资助项目(2012B120011、2011A120007)作者简介:梁俊奇(1958-),男,河南宁陵人,商丘师范学院教授,硕士研究生导师,主要从事智能计算与不确定信息处理及其应用等方面的研究.第30卷第12期2014年12月商丘师范学院学报JOURNALOFSHANGQIUNORMALUNIVERSITYVol.30No.12Dec. 2014若干Rough函数及其性质梁俊奇1,阙凤珍2(1畅商丘师范学院数学与信息科学学院,河南商丘476000;2畅黄河交通学院基础教学部,河南焦作454950) 摘 要:简要介绍Rough函数的基本概念,给出并证明它们的性质,即定理1,2,3.关键词:粗糙集;Rough函数;性质中图分类号:TP18 文献标识码:A 文章编号:1672-3600(2014)12-0015-03SomRoughfunctionsanditspropertiesLIANGJunqi1,QUEFengzhen2(1.SchoolofmathematicsandInformationSciences,ShangqiuNormalUniversity,Shangqiu476000,China;2.BasicTeachingDepartmentoftheYellowRiverInstituteofTraffic,Jiaozuo454950,China)Abstract:ThispaperintroducesthebasicconceptsoftheRoughfunctionisgivenandprovedtheirproperties,Theorem1,2.3.Keywords:roughsets;Roughfunction;properties0 引言与预备谓词逻辑的创始人G.Frege于1904年提出了含糊边界线问题,即如何计算边界线上含糊元素数量[1-2],许多数学家和计算机科学家都为之而进行研究.L.A.Zadeh于1965年提出了Fuzzy集[3],试图通过这一理论解决G.Frege的含糊概念,但遗憾的是模糊集没有给出精确的数学公式描述这一模糊概念,故无法计算出G.Frege边界线上具体的含糊元素数目.如模糊集中的隶属函数μ和模糊逻辑中的算子λ都是如此.时隔20年后的1982年,Z.Pawlak针对G.Frege的边界线区域思想提出了Rough集[4],把那些无法确认的元素都归属于边界线区域,而这种边界线区域被定义为上近似集和下近似集之差集.由于上近似集和下近似集都可以通过等价关系给出确定的数学公式描述,所以边界线上含糊元素数目被认为可以计算出来,从而实现了G.Frege的边界线思想.Rough集理论主要兴趣在于它恰好反映了人们用Rough集方法处理不可区分问题的常规性,即以不完全信息或知识去处理一些不分明现象的能力,或依据观察、度量到的某些不精确的结果而进行分类数据的能力.Rough集理论是一种处理含糊和不精确性问题的新型数学工具.对于不可定义的不精确集,显然只能通过上、下界逼近的方式来刻画,这就是Rough集理论中的上、下近似算子.本文以近似算子为核心基础,试图从数学分析的角度,给出Rough集中的几个函数,并讨论它们的性质.1 Rough函数的概念1.1 Rough隶属函数[5]定义1[5] 设U是一非空有限集合,称为论域,R是U上的一个等价关系,称二元组(U,R)为一个Z.Pawlak近似空间.对于任意X彻U,X关于近似空间(U,R)的下近似算子R(X)与上近似算子R(X)分别定义为:R(X)={x∈U;[x]R彻X},R(X)={x∈U;[x]R∩X≠矱}其中[x]R={y∈U;(x,y)∈R}为x关于R的等价类.集合bnR(X)=R(X)-R(X)称为X的R边界域,posR(X)=R(X)称为X的R正域,negR(X)=U-R(X)称为X的R负域.定义2 设二元组(U,R)为一个Z.Pawlak近似空间,则Rough隶属函数可定义为:μRX(x)=Card(X∩[x]R)Card([x]R),其中Card(·)表示集合·的元素个数,μRX(x)表示任一x∈U属于X炒U的程度.1.2 Rough距离函数[6]定义3 设二元组(U,R)为一个Z.Pawlak近似空间,则Rough距离函数可定义为:d(R(X),R(X))=Card(R(X)∪R(X)-R(X)∩R(X))Card(R(X)∪R(X)).1.3 Rough精度函数定义4 设二元组(U,R)为一个Z.Pawlak近似空间,则Rough精度函数可定义为:αR(X)=Card(R(X))Card(R(X)).2 Rough函数的性质定理1 (1)Rough隶属函数μRX(X)是一个确切值,μRX(x)∈[0,1],而Fuzzy隶属函数则不然;(2)R(X)、R(X)与μRX(x)是等价的,即R(X)={x∈U:μRX(x)=1},R(X)={x∈U:μRX(x)>0}.证明:由μRX(x)和R(X)、R(X)的定义易证.定理2[7] Rough距离函数d(R(x),R(x))与Rough精度函数αR(X)互补,即d(R(X),R(X))=1-αR(X).证明:因为d(R(X),R(X))=Card(R(X)∪R(X)-R(X)∩R(X))Card(R(X)∪R(X))=Card(R(X)-R(X))Card(R(X))=1-Card(R(X))Card(R(X))=1-αR(X).所以,定理结论成立.定理3[8] 设μRX(X)是Rough隶属函数,则(1)μRX(x)=1当且仅当X∩[x]R=[x]R.(2)μRX(x)=0当且仅当X∩[x]R=矱.(3)0<μRX(x)<1当且仅当x∈bngR(X).(4)对任意x∈U,有μRU-X(x)=1-μRX(x).(5)对任意x∈U,μRX∪Y(x)≥max(μRX(x),μRY(x)).(6)对任意x∈U,μRX∪Y(x)≤min(μRX(x),μRY(x)).(7)如果Xi炒U,i=1,2,3,…,且Xi∩Xj=矱,i≠j,则对任意x∈U,有μ∪RiX(x)=∑iμRXi(x).证明:(1),(2),(3)显然.下面证明(4)-(7).(4)对任意x∈U,有μRU-X(x)=Card[(U-X)∩[x]R]Card([x]R)=Card[U∩[x]R-X∩X]Card([x]R)=Card([x]R)-Card(X∩[x]R)Card([x]R)=1-μRX(x).61商丘师范学院学报 2014年 (5)对任意x∈U,有μRX∪Y(x)=Card[(X∪Y)∩[x]R]Card([x]R)=Card[(X∩[x]R)∪Y∩[x]R]Card([x]R)≥Card(X∩[x]R)Card([x]R)(orCard(Y∩[x]R)Card([x]R))=max(μRX(x),μRY(x)).(6)类似于(5)的证明.(7)因为Xi∩Xj=矱,i≠j,所以对任意x∈U,有μ∪RiXi(x)=Card[(∪iXi)∩[x]R]Card([x]R)=Card[∪i(Xi∩[x]R]Card([x]R)=∑iCard(Xi∩[x]R)Card([x]R)=∑iμRXi(x).3 结 语粗集理论在解决不确定性因素影响下的决策分析等方面有其独到之处.通过研究Rough函数及其性质,可以有效地从众多相关属性中选出条件属性相关度最高、决策属性最优的属性,最终以定量的方式给出更合理的预测结果而不是简单的随机预测值.参考文献:[1]Z.Pawlak.RoughSets:PresentStateandFurtherProspects[C].TheProceedingsoftheThirdInternationalWorkshoponRoughSetsandSoftComputing(RSSC94),USA,1994(11):72-77.[2]FregeG.GrundgesetzederArihtmentik[M].GeachandBlack(Eds.),SelectionsfromthePhilosophicalWritingsofGotlobFrege,Balckweil,Oxford,1970.[3]Zadeh.FuzzySets[J].InformationandControl,1965(8):338-353.[4]Z.Pawlak.RoughSets[J].Int.J.ofInf.AndComp.Sci.,1982,11(5):341-356.[5]张文修,吴伟志,等.粗糙集理论与方法[M].北京:科学出版社,2001.[6]刘清.Rough集及Rough推理[M].北京:科学出版社,2001.[7]YaoYY.Relationalinterpretationsofneighborhoodoperatorsandroughsetapproximationoperators[J].InformationSciences,1998,111(1-4):239-259.[8]司红颖,阙凤珍,梁俊奇.变精度Rough隶属函数及其性质[J].模糊系统与数学,2014,27(4):157-159.[9]王国胤,姚一豫,于洪.粗糙集理论与应用研究综述[J].计算机学报,2009(7):1229-1246.【责任编辑:王军】71 第12期 梁俊奇,等:若干Rough函数及其性质。
商业综合体火灾风险多因素耦合致灾机理与评价模型研究

消防设施因素分析
消防设施配备
商业综合体内的消防设施配备情况对火灾扑救和救援有重要影响。例如,灭火器、喷淋系统、防火分隔等消防 设施的配备和使用可以有效地控制火灾蔓延和烟气扩散。
4. 基于大数据和人工智能的火灾 风险评价模型构建
1. 商业综合体火灾风险特点与现 状分析
3. 多因素耦合致灾机理研究
5. 实证分析与验证
04
商业综合体火灾风险耦合 致灾因素分析
建筑结构因素分析
建筑结构安全
建筑物的设计、施工质量和结构安全对火灾风险有重要影响 。例如,建筑物的梁、柱、楼板等结构构件的材料和设计需 要考虑到火灾荷载的作用,以防止火灾引起的结构失效。
筑群。
商业综合体特点
商业综合体具有建筑规模大、功 能复杂、人员密集、电气设备繁 多等特点,这些因素都增加了火 灾风险。
火灾风险来源
商业综合体的火灾风险主要来自电 气事故、用火不慎、设备故障、违 规操作等多个方面。
数据采集与处理
数据采集方法
数据采集主要通过问卷调查 、实地勘查、历史资料收集
等方法进行。
详细阐述基于贝叶斯网络的耦合致灾模型构建 方法,包括网络结构设计、参数学习等步骤。
实例应用
将该方法应用于具体的商业综合体火灾风险评估中,验证其有效性。
06
商业综合体火灾风险评价 模型应用与验证
商业综合体概况
商业综合体定义
商业综合体是一种集商业、办 公、居住、旅店、展览、餐饮 等多元功能于一体的综合性建
耦合致灾因素权重确定方法
详细阐述基于粗糙集理论的耦合致灾因素权重确定方法,包括属 性约简、属性重要性评估等步骤。
介值定理的推广及其应用

【 摘 要 】 对 于 介 值 定 理 , 从 两 个 方 面 进 行 了 推 广 。 利 用 推 广 的 介 值 定 理 , 得 到 了 求
A 一 类 方 程 绝 对 误 差 为 ( 的 近 似 解 的 一 种 行 之 有 效 的 方 法 。 " ’ # A!=)
【 文 章 编 号 】 " ( ) # " ! > ? ) # " ! " " " " ) > " " @ " > " ?
介 值 定 理 的 推 广 及 其 应 用
叶 国 炳
( 株 洲 职 业 技 术 学 院 基 础 部 , 湖 南 株 洲 ) ) # ! " " "
"
6!#
又 )
( , % ( , ( % & ’! " & ’! " )) &&&-。 ! . 6) . 6) 6 # " )
!
. 6!
是 方 程! ( ( 内 的 一 个 解 。 * ) 也 ") $ - 在 #, /) 由 解 的 唯 一 性 知 , $" 即 ) % & ’" -, . 6 &" - 。
6!# 6!# 6!# 6!#
( 内 的 那 个 唯 一 解 。 $ -在 #, /)
" . 4 %" , , . 4 5 为 5 ’" 绝 对 误 差 为 " 的 近 似 值 。 " - 的 , , 证 明 ! 因 为 函 数! ( 在 闭 区 间 [ #, 上 单 调 连 续 ,且 ! ( ( 所 以 方 程 ") /] #) /) $ - 。 ! ( ( 内 只 有 一 个 解 " 即 ( ") $ -在 #, /) " $ - 。 ! ! -, -) … , . … 单 调 增 加 有 上 界 。 ) " " " . ., . ,, 6, ( 常 数 , $ 。 * % & ’" ) 为 # )$ /) . 6 &)
形式概念分析国内外研究现状综述_许涛

8 系 统 、西 南 交 通 大 学 学 报 、山
9
13.8
西 大 学 学 报 、吉 林 大 学 学 报
合计
190
58.3
注: 为便于说明问题, 将统计结果中的研究生学位论文归入相应学校中。
方面, 结果在表3中列出。
表3 国内概念格文献主题关键词分布统计
主题
相关关键词
占论文总数 百分比( %)
建格算法
图2 国内期刊发表论文数比例
图3 国内外形式概念分析应用类文章比例对比
通 过 对 2003 ̄2007年 前 五 届 ICFCA会 议 收 录 的 论 文 进 行 分 析, 在图3中可以发现, 接近一半的文章都以概念格在各个领域 的应用为主题( 前五届会议共收录论文122篇, 与应用相关的有 62篇, 并且每届会议中应用类文章占当年会议论文总数的比例 也都在半数左右, 年度间没有太大的变化) 。由此可见, 国际上 概念格理论的发展已经比较成熟, 开始更多地关注概念格的具 体应用。图3对国内外概念格的应用情况作了对比, 清晰地反映 了两者之间的差距, 从而认识到国内概念格理论还处在初期发 展阶段, 应用类文章的比例低, 研究人员更加注重理论体系的 发展。因此, 加强概念格的应用研究还需更多的各领域学者参 与进来, 给概念格理论带来新方法, 注入新思想; 同时还应密切 关注国际上的发展动态, 加强与国外研究人员的交流沟通, 缩 小于国际先进水平的差距。
1 统计分析
年代
表1 论文年代分布 2000 以前 2000 2001 2002 2003 2004 2005 2006 2007 年前 10 个月
本节采用文献统计方法, 对我国有关概念格相 论文数 关 论 文 从 发 文 数 、年 代 、来 源 期 刊 、主 题 等 多 方 面 进 百分比(%) 行分 析 , 并 且 和ICFCA( 2003- 07年 ) 历 年 会 议 论 文 作 对比, 旨在明确概念格的核心期刊、发展趋势以及发现目前研 究中存在的不足, 从而推动概念格理论的发展。本节的统计数 据 主 要 来 源 于 中 国 知 网 的 中 国 学 术 期 刊 全 文 数 据 库 、中 国 优 秀 博硕士学位论文全文数据库和中国重要会议论文全文数据库 中 收 录 的 有关 概 念 格 的 文 献 ( 截 止2007年10月 ) 和ICFCA前 五 届会议出版的论文集。在对国内文献的统计中, 笔者利用“概念 格 ”、“形 式 概 念 分 析 ”、“形 式 背 景 ”等 多 个 检 索 词 在 多 个 字 段 中 进行检索, 经过去重整理后得到了326篇相关文献。其中各类期 刊学报中234篇, 优秀学位论文81篇, 各类会议文章11篇。以下 是根据该统计结果进行的相关分析。 1.1 年代分布
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
X n}是由 U 的子集所构成的集类, 则 F 关于近似空间A 的下近似 ap rF 和上近似 ap rF 定
义为
ap rF = {ap rX 1, ap rX 2, …, ap rX n}
ap rF = {ap rX 1, ap rX 2, …, ap rX n}
F 关于 A 的近似精度 ΑA (F ) 和近似质量 rA (F ) 分别定义为
例3. 1 (无决策情形) S = (U , A , V , Θ) , 其中 U = {x 1, x 2, …, x 8}, 属性集 A = {c1, c2, c3, c4}, V 1= V 2= V 3= {1, 2, 3}, V 4= {1, 2}, 信息函数 Θ见表3. 1。
表311 一个信息系统
关于决策属性D 1Α D
是协调的, 这时也称决策表 (U , C 1∪D 1, V , Θ) 是协调的, 否则为不协调。如果用包含度理
论[48]来解释, 则决策表 (U , C 1∪D 1, V , Θ) 是协调的当且仅当包含度
ap rX = ∪ { [ x ] [ x ] ∩ X ≠ } = {x ∈ U [ x ] ∩ X ≠ } 其中[x ]是 x 所在的 R 2等价类。
下近似 ap r 也称作 X 关于A 的正域, 记作 PO S (X ) , 它可以解释为由那些根据现有
知识判断出肯定属于 X 的对象所组成的最大集合, 上近似 ap r 可以解释为由那些根据现 有知识判断出可能属于 X 的对象所组成的最小集合。U ap rX 称作 X 关于 A 的负域, 记 作 N EG (X ) , 可以解释为由那些根据现有知识判断出肯定不属于 X 的对象所组成的集 合。ap r ap rX 称作 X 的边界 (域) , 记作 B N (X ) , 它可以解释为由那些根据现有知识判断 出可能属于 X 但不能完全肯定是否一定属于 X 的对象中所组成的集合。
U c3 = {{x 1, x 3, x 5, x 6}, {x 2, x 4}, {x 7, x 8}}
U c4 = {{x 1, x 2, x 3, x 4, x 5, x 6}, {x 7, x 8}}
U C = {{x 1, x 3}, {x 2, x 4}, {x 5, x 6}, {x 7, x 8}} 将对象及其信息压缩后得表3. 2。
粗糙性测度反映了知识的不完全程度。
第4期 张文修, 吴伟志: 粗糙集理论介绍和研究综述
3
称 ΑA (X ) =
ap rX ap rX
为 X 关于 A 的近似精度, 近似精度反映了根据现有知识对 X 的
了解程度。
粗糙集理论还对于集合类关于近似空间定义了下近似和上近似。设 F = {X 1, X 2, …,
X 关于 A 的近似质量定义为
rA (X ) =
ap rX U
其中 X 表示集合 X 的基数。近似质量反映了知识 X 中肯定在知识库中的部分在现有知
识中的百分比。
X 关于 A 的粗糙性测度定义为
ΘA (X ) = 1 -
ap rX ap rX
显然, 0≤ΘA (X ) ≤1, X 是可定义的当且仅当 ΘA (X ) = 0, X 是粗糙的当且仅当 ΘA (X ) > 0。
表312 压缩后的信息表
UC
c1
c2
c3
c4
{x 1, x 3}
1
1
1
1
{x 2, x 4}
1
2
2
1
{x 5, x 6}
2
2
1
1
{x 7, x 8}
3
3
3
2
表3. 2可以简明地表示为表3. 3。
可以验证, 信息表3. 1 (或表3. 2) 中属性 c4是多余属性, 而且可以计算此信息表有三个
最简属性约简, {c1, c2}, {c1, c3}和{c2, c3}, 从而可得信息系统的三个最简约简表3. 4、表3. 5
和表3. 6。
表313 最简压缩表
表314 约简表
表315 约简表
表316 约简表
c1
c2
c3
c4
c1
c2
c1
c3
c2
c3
1111 1221 2211 3332
1
1
1
2
2
2
3
3
1
1
1
2
2
1
3
3
1
1
2
2
2
1
3
3
第4期 张文修, 吴伟志: 粗糙集理论介绍和研究综述
5
粗糙集理论除了给出了对知识 (或数据) 的约简和求核的方法外, 还提供了从决策表
义RB:
x R B y Ζ Θx (b) = Θy (b) , Π b ∈ B
由此可见, 信息系统类似于关系数据库模型的表达方式。有时属性集A 还分为条件属性 C
和决策 (结论) 属性D , 这时的信息系统称为决策表, 常记为 (U , C ∪D , V , Θ)。无决策的数
据分析和有决策的数据分析是粗糙集理论在数据分析中的两个主要应用。
粗糙集理论是建立在分类机制的基础上的, 它将分类理解为在特定空间上的等价关 系, 而等价关系构成了对该空间的划分。粗糙集理论将知识理解为对数据的划分, 每一被 划分的集合称为概念。粗糙集理论的主要思想是利用已知的知识库, 将不精确或不确定的 知识用已知的知识库中的知识来 (近似) 刻画。该理论与其他处理不确定和不精确问题理 论的最显著的区别是它无需提供问题所需处理的数据集合之外的任何先验信息, 所以对 问题的不确定性的描述或处理可以说是比较客观的, 由于这个理论未能包含处理不精确 或不确定原始数据的机制, 所以这个理论与概率论, 模糊数学和证据理论等其他处理不确 定或不精确问题的理论有很强的互补性。
U
c1
c2
c3
c4
x1
1
1
1
1
x2
1
2
2
1
x3
1
1
1
1
x4
1
2
2
1
x5
2
2
1
1
x6
2
2
1
1
x7
3
3
3
2
x8
33ຫໍສະໝຸດ 32显然U c1 = {{x 1, x 2, x 3, x 4}, {x 5, x 6}, {x 7, x 8}}
U c2 = {{x 1, x 3}, {x 2, x 4, x 5, x 6}, {x 7, x 8}}
从上面的定义可以看出, 下近似 ap r 是A 中含在 X 中的最大可定义集, 而上近似 ap r
是 A 中包含 X 的最小可定义集。因此, X 是可定义的当且仅当 ap r= ap r; X 是不可定义
的当且仅当 ap r≠ap r, 这时称 X 是粗糙集。称 (2U , ∩, ∪,~ , ap r, ap r) 为粗糙集代数系 统, 其中~ 表示集合补。
1 引言
粗糙集作为一种处理不精确、不确定与不完全数据的新的数学理论, 最初是由波兰 数学家Z. Paw lak [24]于1982年提出的。由于最初关于粗糙集理论的研究大部分是用波兰语 发表的, 因此当时没有引起国际计算机学界和数学界的重视, 研究地域也仅局限在东欧 一些国家, 直到20世纪80年代末才逐渐引起各国学者的注意。近几年来, 由于它在机器 学习与知识发现[6, 25 ]、数据挖掘[4, 18 ]、决策支持与分析[19, 29, 30 ] 等方面的广泛应用, 研究逐 渐趋热。1992年, 第一届关于粗糙集理论国际学术会议在波兰召开。1995年, A CM Com 2 m un ication 将其列为新浮现的计算机科学的研究课题。1998年, 国际信息科学杂志 ( Info r2 m ation Sciences) 还为粗糙集理论的研究出了一期专辑。
事, 陕西省数学会理事长, 研究方向: 应用概率与集值随机过程, 计算机智能推理与计算机仿真, 遗传算法等; 吴伟志 (19642) , 男, 浙江舟山人, 浙江海洋学院数学系副主任, 副教授, 西安交通大学理学院信息与系统科学研究所博士研究 生, 研究方向: 粗糙集理论, 集值分析与随机集等。
2
模 糊 系 统 与 数 学 2000年
的研究现状。
2 粗糙集理论的基本概念
设 U 是非空有限论域, R 是 U 上的二元等价关系, R 称为不可分辨关系, 序对 A = (U , R ) 称为近似空间。Π (x , y ) ∈U ×U , 若 (x , y ) ∈R , 则称对象 x 与 y 在近似空间A 中是 不可分辨的。U R 是 U 上由 R 生成的等价类全体, 它构成了U 的一个划分。可以证明, U 上划分可以与U 上的二元等价关系之间建立一一对应。U R 中的集合称为基本集或原子 集。若将 U 中的集合称为概念或表示知识, 则A = (U , R ) 称为知识库, 原子集表示基本概 念或知识模块。任意有限的基本集的并和空集均称为可定义集, 否则称为不可定义的。可 定义集也称为精确集, 它可以在知识库中被精确地定义或描述, 可表示已知的知识。可以 验证所有可定义集全体可构成U 上的一个拓扑。
为四元有序组 K = (U , A , V , Θ) , 其中
U 是对象的全体, 即论域;
A 是属性全体;
V
=
∪V
a∈A
a, V
a
是属性的值域;
Θ: U ×A →V 是一个信息函数, Θx: A →V , x ∈U , 反映了对象 x 在 K 中的完全信息,
其中 Θx (a) = Θ(x , a)。 对于这样的信息系统, 每个属性子集就定义了论域上的一个等价关系, 即ΠB Α A , 定