粗糙集理论论文

合集下载

粗糙集理论优质获奖课件

粗糙集理论优质获奖课件
点之
若rij=1, 且 i≠j, 则rji=0
对M2中1所 在位置,M 中相应位置 都是1
假如两 假如顶
点之
点xi
间有边, 到xj有边,
一定
xj
13
4、等价关系
等价关系旳定义:设R是非空集合A上旳关系,假如满足 ⑴ R是自反旳; ⑵ R是对称旳; ⑶ R是传递旳; 则称R是A上旳等价关系。
21
内容提要
一、概述 二、知识分类 三、知识旳约简 四、决策表旳约简 五、粗糙集旳扩展模型 六、粗糙集旳试验系统 七、粒度计算简介
22
一、 概述
现实生活中有许多模糊现象并不能简朴地 用真、假值来表达﹐怎样表达和处理这些现 象就成为一种研究领域。早在1923年谓词逻 辑旳创始人G.Frege就提出了模糊(Vague)一 词,他把它归结到边界线上,也就是说在全 域上存在某些个体既不能在其某个子集上分 类,也不能在该子集旳补集上分类。
自反性 反自反性 对称性 反对称性 传递性
12
关系性质旳三种等价条件
体 现 式
关系 矩阵
关系图
自反性 IAR
主对角 线元素 全是1
每个顶 点都有 环
反自反性 R∩IA=
主对角线 元素全是 0
每个顶点 都没有环
对称性 R=R1
反对称性 R∩R1 IA
传递性 RRR
矩阵是对称 矩阵
假如 两个 顶
定义 假如一种集合满足下列条件之一: (1)集合非空, 且它旳元素都是有序对 (2)集合是空集 则称该集合为一种二元关系, 简称为关系,记作R. 如<x,y>∈R, 可记作 xRy;假如<x,y>R, 则记作xRy
实例:R={<1,2>,<a,b>}, S={<1,2>,a,b}. R是二元关系, 当a, b不是有序对时,S不是二元关系 根据上面旳记法,能够写1R2, aRb, aSb等.

浙江大学研究生《人工智能引论》课件--第六讲 粗糙集理论及其应用.ppt

浙江大学研究生《人工智能引论》课件--第六讲   粗糙集理论及其应用.ppt
November 18, 2002第一稿 September 30, 2006第四次修改稿
2019年8月23
感谢你的观看
1
Outline
Rough sets理论的快速入门方法 Rough sets理论的发展概述 Rough sets理论的基本原理 计算举例 课后研读论文
2019年8月23
“模糊集”(Fuzzy Sets) 1965年美国数学家L. A. Zadeh首次提出 无法解决G. Frege提出的“含糊”问题 未给出计算含糊元素数目的数学公式
……
2019年8月23
感谢你的观看
6
粗糙集理论的提出(续2)
“粗糙集”(Rough Sets)
1982年波兰数学家Z. Pawlak首次提出 将边界线区域定义为“上近似集”与“下近似集”的差
2019年8月23
感谢你的观看
10
粗糙集理论的发展历程(续2)
1993和1994年,分别在加拿大、美国召开第二、三届 国际粗糙集与知识发现(或软计算)研讨会。
1995年,Pawlak等人在《ACM Communications》上 发表“Rough sets”,极大地扩大了该理论的国际影响。
评价某一分类(属性)的重要性
剔除冗余属性
数据集的降维
发现数据模式
挖掘决策规则
在其它领域的应用
金融商业
……
2019年8月23
感谢你的观看
18
6.3 粗糙集理论的基本原理
6.3.1 基本概念 “知识”的定义
使用等价关系集R对离散表示的空间U进行 划分,知识就是R对U划分的结果。
理论、Dempster-Shafer证据理论的关系和互补 粒度计算:粗糙集理论是其重要组成之一 高效算法:导出规则的增量式算法、简约的启发式

论文作者冲突域

论文作者冲突域

论文作者冲突域
1.冲突域和广播域是计算机网络中两个非常重要而又容易混淆的概念,正确掌握和应用这两个概念对计算机网络技术的理解和掌握非常关键.主要论述了计算机网络中冲突域和广播域的概念、两者的比较。

2.属性约简是粗糙集理论的核心内容之一。

目前,从不同的观点已经提出了一些不完备决策表中粗糙集属性约简算法。

但是,这些算法相对于完备决策表还是有待进一步考虑。

3.本文针对适用于DS-UWB通信系统的CT-MAC协议,结合具体的调制、多址方式,研究其最佳冲突域范围,并根据分析结果进行了Matlab仿真。

4.由于集中式交换结构面临当今网络端口速度不断提高和需要QoS保证的挑战,提出了基于冲突域的分布式并行流水交换结(DPPS),并给出了一种基于缓存队列的DPPS实现方案。

5.为了满足网络循环时间的要求(固定为512bit),不同配置的以太网的直径被限制在一定的范围内,使网络系统的覆盖范围受到很大的限制,要扩大网络系统的覆盖范围,必须使用网络互连设,求核是粗糙集理论中的重要研究之一。

近年来在不完备决策表中的求核算法相对较少。

通过对葛浩引入冲突域的概念进行研究,设计一种在不完备决策表中的新的求核算法。

6.近几年,随着医院发展规模的不断扩大,医院医护工作人员的上网需求与日俱增,新出现的网络问题也是层出不穷。

小的如个人主
机染上病毒,硬件故障;大的如局部网络瘫痪,或整个医院都不能上网。

7.针对决策系统存在冲突对象的情况,提出一个基于冲突域的权
重约简的启发式算法来降低属性约简的测试成本。

8.以不完备决策表为研究对象,通过对冲突域的概念进行研究,
给出在不完备决策表下的基于冲突域的属性约简的定义。

商务智能计算二进制差异矩阵

商务智能计算二进制差异矩阵

商务智能计算二进制差异矩阵
粗糙集理论是一种能有效地分析和处理不精确、不一致、不完整等各种不完备信息的数据分析工具。

知识约简是粗糙集理论的核心内容之一,是粗糙集应用的关键技术,也是知识发现的重要研究课题。

通过约简删除信息系统中的冗余信息,达到简化知识的目的。

本文围绕知识约简中的两个重要问题:属性约简和值约简,在一致和不一致决策表上分别提出了新的算法,并通过实验证明算法的有效性。

主要研究工作及创新点如下: (1)论文主要对粗糙集理论中的基于二进制区分矩阵约简算法进行研究,提出了一种新的二进制区分矩阵的构造方法,有效地减少了存储空间,加快了扫描速度。

在二进制区分矩阵上,总结归纳出一些相关的性质和定理,并对其进行了相应的证明。

算法只需对二进制区分矩阵进行简单的算术运算即可完成对决策表的约简操作; (2)给出了一种基于二进制区分矩阵的启发式属性约简算法,以属性重要度作为启发信息。

对于不一致决策表的属性约简,给出了一种快速、简便的计算负域的方法; (3)分析了值约简的过程及本质,提出了基于对象的二进制区分矩阵概念,并在此矩阵上进行值约简。

在值约简过程中定义了新的启发信息,以属性归纳性作为规则约简的度量标准;给出了一种新的规则准确度的简便计算方法和对重复或冗余规则的判定、处理办法。

根据规则的准确度和属性归纳性求得决策表的最简规则,有效地提高了约简的速度。

数学工作效率公式

数学工作效率公式

数学工作效率公式摘要:在敏捷制造的动态盟员选择中,如何选择高效率的企业组成动态联盟是一个基本而又关键的问题。

对企业效率进行评估可以应用计量经济学里的生产函数模型,一般的生产函数是以劳动力和资金两大项作为主要投入因素。

然而,实际上不同行业在特定条件下,企业效率评估的主要投入属性是各不相同的。

论文首先通过粗糙集的方法对企业的各投入因素进行属性约简,归约出对企业生产起主要影响作用的投入因素,再通过前沿生产函数来计算企业的效率值,从而挑选出相对效率最高的企业组成动态联盟。

论文对中国13家上市钢铁企业进行了实证分析,进一步说明该方法具有较强的实用性。

关键词:动态盟员;粗糙集;前沿生产函数;效率评估;钢铁企业以敏捷制造、虚拟企业、动态联盟等为代表的新一代制造业信息化建设已经成为当今制造企业研究和学习的热点[1]。

同时,用现代信息技术对传统制造业进行改造,也是现代制造企业发展的必然趋势。

在虚拟企业的组织结构中,运用科学的方法在众多候选企业中选择出高效率的优势企业组成动态联盟是起关键性作用的第一步[2]。

因此,如何通过有效方法对企业进行效率评估,是动态盟员选择中一个基本而又重要的问题。

生产效率反映了企业中各类经济因素对生产经营活动的影响程度,也综合体现了企业生产能力的大小和竞争实力的强弱[3]。

在动态盟员选择的过程中,盟主企业可以通过对候选企业的效率评估来进行动态联盟的组合。

企业的效率评估往往和两个因素有关,即企业的投入与产出,可是在一般情况下,企业的投入因素往往有多个,而产出则主要以产量值为主。

如果能正确选择出对企业效率产生影响的主要投入因素,并通过一个定量化方法正确分析投入与产出之间的关系,则可以对企业的效率进行更恰当的评估。

生产函数模型是二十世纪初由柯布-道格拉斯首先提出的,利用生产函数模型进行效率评估是传统的常用工具。

在此基础上,Farrell在1957年又进一步提出的前沿生产函数是反映在一定技术和生产要素组合的条件下,企业各投入因素与最优产出之间的函数关系。

粒度粗糙理论研究

粒度粗糙理论研究
维普资讯
I N 0 0 9 25 CO D E RUX U E SS 1 0 - 8 , N W
J un l Sfw r, o. , ., rh20 ,P5 5 5 3 o ra otae V 1 9 No3Mac 0 8P . — 8 f o 1 6
o n o ma i n t cu e o a a t r u h e s me h d lg o ic p i e r v n b r o o y n o e h b t f i f r t sr t r ,t d p o g o u n s t o o o y t d s i l s d i e y me e l g ,a d t x i i n p t n i l f c mb n n r o o y a d c mp tr s i n e i h e s f d v l p n n o a i e i tr ic p i a y o e t s o o i i g me e l g n o u e c e c n t e s n e o e e o i g i n v t n e d s i l r a v n
使 其兼具一般信息源和粗糙性 方法底层表 示 系统的双重功能, 在此基础上构造 内核 、外 壳及主体信 息颗粒, 分别对
应粗糙 性的下界近似 、边界 区域及上界近似概念、 上, 出了通 过“ 实现 提 实体一 属性. 模型 开 源系统进行粒度 粗糙 理 值”
・Re ev d2 0 - 1 1 Ac e t d2 0 - 8 0 c i e 0 6 1 - 7; c p e 0 7 0 - 3
维普资讯
JunlfS tae软件 学报 V 19 N . Ma h2 0 ora o o w r f o. , o , r 08 1 3 c

决策树论文20篇050122

决策树论文20篇050122

收稿日期:!""#$"#$"%基金项目:教育部博士启动基金资助项目(!""""&#%!")・作者简介:王庆(&’(")),男,辽宁沈阳人,东北大学博士研究生,讲师;巴德纯(&’%#)),男,辽宁沈阳人,东北大学教授,博士生导师・第!*卷第&期!""%年&月东北大学学报(自然科学版)+,-./01,23,.4560746./8/9:6.794;(304-.01<=96/=6)>,1?!*,3,@&!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!+0/@!""%文章编号:&""%$A "!*(!""%)"&$""B "$"#智能故障诊断的粗糙决策模型王庆,巴德纯,王晓冬(东北大学机械工程与自动化学院,辽宁沈阳&&"""#)摘要:为了提高故障诊断的精度和降低误报率,提出了粗糙决策智能故障诊断模型・该模型可以对决策表进行无教师的规则提取;通过自学习,用较少的样本即可对故障进行分类・将复杂系统的原始样本集转化成了决策表,利用粗糙集具有较强的处理不确定和不完备信息的能力,对原始样本集的条件属性进行了约简处理;同时,利用决策树具有快速学习及分类的优势对约简后的决策表进行规则提取,提高了故障诊断的鲁棒性・给出了基于该模型的故障诊断步骤・以实例介绍了利用该模型进行故障诊断的全过程・关键词:粗糙集;约简;决策树;规则;故障诊断中图分类号:C D&B !;C D&B A文献标识码:E如何从不完备及冗余数据中准确提取征兆,以提高故障诊断的鲁棒性,是近年来故障诊断的研究热点[&]・同时建立高效的故障诊断器,以提高诊断的精度和速度也受到学者的广泛关注[!]・粗糙集理论[A ]作为一种处理不确定和不精确问题的工具广泛应用于数据挖掘和模式识别领域[#!B ],近年来也被用于智能故障诊断・在故障模式的识别中,粗糙集能在保证信息不丢失的前提下,对决策系统进行有效约简,去除多余信息,减轻故障分类器的压力;同时也能进行规则提取与规则约简・但其对规则的处理多基于知识库逻辑理论,效率不高;特别是它没有给出规则间的关系,得到的规则对故障状态的推理为产生式的推理,诊断速度不高・郝丽娜等[’]提出了基于粗糙集和神经元网络的故障诊断模型,利用粗糙集对决策表进行约简,同时发挥神经元网络并行计算的优点,对故障快速分类・但神经元网络学习速度慢是实时快速故障诊断的瓶颈,并且用神经元网络的故障分类结果不便于解释,往往要加入解释器・本文研究粗糙集与决策树融合的故障诊断方法・决策树[&",&&]具有对无次序的实例进行快速分类并记忆的能力,其产生的规则是树状结构,规则间关系清晰,使得推理的结果便于解释;利用粗糙集对决策表进行离散化及约简,并用决策树提取规则产生故障分类器,达到了对故障进行快速诊断的目的,并以实例验证了该模型的有效性・&理论基础定义!!F 〈",#,$,%〉为信息系统,其中"F {&&,&!,…,&’}为全体样本集(论域)・#F (")为全部属性集,(为条件属性集,)为决策属性集,(#)F !・$为全部属性的值域,设*是任一属性,&+是任一个对象,则%(&+,*)表示&+在*属性的取值・定义"设任一属性子集,$#,-(,)F {(&+,&.)%"!&’*%,,%(&+,*)F %(&.,*)},二元关系-(,)称为不可分辨关系・属性子集,将全部样本"划分成若干等价类,称为,基本元素・,基本元素中的任意两个对象&,/关于,是不可区分的,称&,/在属性集合,上不可分辨・决策表可以看作是"的一族等价关系,即知识库・定义#,$#,0$";,0F "{1%"/23)(,):1$0};,0F ";{1%"/23)(,):1#0(!}分别称为下近似和上近似・定义$"((,))为近似质量・如果(4是(去掉某些条件属性后的条件属性集合,并能保持近似质量不变,即:"((4,))F "((,))则(4为(的一个)约简,其中"((,))5)0%"/)6(066"6・万方数据定义!令!"#($)为$所有约简的集合,%&!"($)!!!"#($)为$的属性约简的核・!!(%’())")为信息系统*的分明矩阵,%’(!{+"%#+(,’)$+(,()},’,(!#,$,…,);-(%)!!{%.’(:#&(&’&);.’($%}为分明函数・定义"设/!(0#,0$,…,0’,…,01)为信源发出的信息;2!(3#,3$,…,3’,…,34)为信宿收到的信息・5(0’)为0’发生的概率;5(3(/0’)为收到3(后判定为0’的概率・6(/)78’5(0’)&’($5(0’)为信息/所能提供的信息量(熵)・6/()27’(5(3()’’50’3()(&’($50’3()(为信宿收到全部信息2后对信源发出的信息/的不确信性・定义#收到2后获得关于/的信息量为9!6(:))6(:/;),为平均互信息量或熵降量,它表示2能提供的关于/的信息量的大小・$基于粗糙决策模型故障诊断步骤故障诊断中的条件属性多为连续值,为了对其进行约简和规则提取要对其进行离散化处理・即在连续的属性域上寻找若干个断点,用断点将连续的属性值划分为离散的区间・最后用离散的决策表代替了原来的连续的决策表・然后根据定义求取决策表分明矩阵,根据分明矩阵求取其分明函数,并将分明函数化简成若干合取的析取式形式,则析取式中每个合取对应一个条件属性约简的结果・所谓规则的提取就是从约简决策表中得到推理规则集,该规则集是用来对一个新对象(新设备状态)进行分类的故障诊断器・本文采用决策树*+,算法对约简表进行规则提取・*+,算法是利用信息论中的信息熵降作为评判函数・它在决策表(属性集)上寻找一个最佳的分类条件属性,该属性作为决策树的一个分支节点(该节点上条件属性的熵降最大)・然后再根据该节点上条件属性的值进行分支,选取其中一个分支再根据最大熵降从其他条件属性中搜索最佳属性作为下一级的新节点,直到形成一个完整的决策树・该决策树即为故障诊断的规则集・该规则集作为故障分类器对故障进行诊断・最后给定一个测试集,用上述粗糙决策故障诊断模型对测试集中的各个对象进行分类,得到每一个对象对应的设备状态・,基于粗糙决策模型故障诊断算例以上海宝钢-./012设备为对象,对其进行了状态量的获取,分别提取了各种过程量(如水蒸气、冷凝水及各种压力)的原始数据信息・并建立如下信息系统,*!(/,$%#),/为对象集,即-./012设备状态集;$!{+#,+$,…,+#3}代表条件属性,即代表-./012各个参量域集・其中,+’,’!#,$,…,#4分别代表系统真空度<%,一级泵入口压力<#,二级泵入口压力<$,三级泵入口压力<,,四级泵入口压力<4,水池压力<3,系统入口温度=%,冷凝器#回水温度=#,冷凝器$回水温度=$,水蒸气流量4(,冷凝水流量45,水蒸气温度=(,冷凝水温度=5,水蒸气压力<(,冷凝水压力<5・#!{>}为决策属性,>!’,’!#,$,…,#$分别代表设备的状态(水蒸气压力、流量太低;四级泵故障;冷凝器$回水温度太高;冷凝水温度太高;冷凝水压力、流量太低;水蒸气温度过高;水蒸气压力、流量太低;三级泵抽气故障;冷凝器#回水温度过高;冷凝器#故障;一级泵故障;系统状态正常)・对决策表进行离散化处理,并用符号代表离散决策表中各个条件属性的分段值(自然数#,%,$分别代表偏大,中间,偏低的分段),得离散化的决策表并用矩阵"表示,阵中’!#,$,…,#4代表对象集;(!#表示为对象域,(!$,,,…,#6表示条件属性;(!#7表示决策属性・根据离散化的决策表首先求取决策表的分明矩阵并根据分明函数-的定义对分明矩阵进行约简计算,即计算分明函数-的最小析取范式・其中,每一个析取分量对应一个约简・从中任选一个约简,该约简对应的决策表用矩阵"(表示・"7#%%%%#%%%%$%%%$%#$%%%%#%%%%%%%%%%$,%%%#%%%%#%%%%%%,4%%%#%%%%%%%%#%%43%%%#%%%%%%$%%%$36%%%#%%%%%%%$%%%67%%%#%%%%%$%%%$%78%%%#%%%%%%%%%%%89%%#%%%%#%%%%%%%9#%%%#%%%%%%%%%%%%#%####%%%%%%%%%$%%%6#$##%%%%%%%%%%%%%###,##%%%%%%%$%%%$%#)*+,#4%%%%%%%%%%%%%%%#$#8第#期王庆等:智能故障诊断的粗糙决策模型万方数据!!!!"""!""""""!#"""!""#"""#$""!""!""""$%""!""""""!%&""!""""#""&’""!"""""#"’(""!"""#"""()""!""""""")*"!""!"""""*!""!""""""""!"!!!"""""""#"’!#!"""""""""!!!$!"""""#"""!"#$%!%""""""""""!#由矩阵!和!!可见经过了属性的约简,去除了信息系统的多余属性,使决策表得到了简化・用属性"","#,"$,"%,#!,##,$+,$,,#+,#,所包含的信息可完全代表原来决策表中的信息,达到了约简的目的・约简!!对应的决策表中有!#种不同的决策属性,即有!#种故障类型,其中有!%个样本・根据决策树-.$算法,首先计算决策表的初始熵:%(&)!’#!%/0+##!%’#!%/0+##!%’!"!%/0+#!"!%!$(&#・计算属性""的条件熵:%(&/"")!$!%’$$/0+#()!$)!!!%’!!!!/0+#!()!!!$("&((・同理计算其他属性的条件熵・经计算得知"$的条件熵最小说明其熵降最大,所以选择"$为第一级结点・"$有两个分支,"$1"和"$1!・分别以这两个分支为起点计算・以"$1"分支计算其对应的初始熵和条件熵・经计算得知"#和$+的条件熵最小说明其熵降最大,所以任选"$为第二级结点・"#有两个分支,"#1"和"#1!・分别再以这两个分支为起点计算・"#1!分支计算得#!为其下级结点,同理计算#!的两个分支的初始熵为"说明它不能再分,都为最终接点(叶接点),分别对应于故障*和故障!"・以次类推・逐步计算各级结点和叶结点,最后得到决策树如图!所示・从图!可见利用决策树-.$算法形成了以下!$条规则:"$1!&##1"’*1$;"$1!&##1!&#+1#’*1’;"$1!&##1!&#+1"&$,1#’*1&;"$1!&##1!&#+1"&$,1"&#,1!’*1%;"$1!&##1!&#+1"&$,1"&#,1"&$+1"’*1’;"$1!&##1!&#+1"&$,1"&#,1"&$+1"’*1(;"$1"&"#1!&#!1"’*1!";"$1"&"#1!&#!1!’*1*;"$1"&"#1"&$+1#’*1!;"$1"&"#1"&$+1"&""1!&#+1"’*1!!;"$1"&"#1"&$+1"&""1!&#+1#’*1’;"$1"&"#1"&$+1"&""1"&"%1"’*1!#;"$1"&"#1"&$+1"&""1"&"%1!’*1#・图!"#$%&’决策树图()*+!,-.)/)0123--04"#$%&’234567粗糙决策故障诊断的故障分类器(诊断器)就由上述!$条规则组成・由!!可见,*1)对应的条件属性集包含于*1$,*1%,*1&,*1’,*1(的条件属性集,所以上述规则中没有对故障类型*1)进行推理,即由决策树-.$算法自动形成的决策树中不包含故障类型*1)的叶结点・看来决策树-.$算法也能够对一些特例进行排除,说明具有规则的过滤能力・给定包含!$对象的测试集",应用该模型对其诊断,结果见表!・"!!""""!""""#"""#"#""!""""""""""""$!!"""""""""#"""%"""!""""""""!""&!!"""""""""""""’"""!""""""#"""#("""!"""""""#""")"""""""""#"""#"*"""""""""""""""!"""""!""""""""""!!"""!""""!""""""!#!!"""""""#"""#""#$%!$""!""""!"""""""・#)东北大学学报(自然科学版)第#’卷万方数据表!故障诊断结果"#$%&!’&()%*+,,#)%*-.#/0+(.(样本对象诊断结果!!"!#$%&&’!!%’(%样本对象诊断结果)(*!"!#"!!$!"!!$*与训练集比较表明,上述分类结果完全正确,这说明该粗糙决策故障诊断模型能够对+,-./0的故障进行正确的诊断・&结论复杂系统故障诊断中,数据样本集中有大量重复样本和冗余属性,甚至干扰信息;粗糙集能够对包含干扰和冗余信息的决策表进行约简处理并提取征兆,表现出较强的鲁棒性・决策树可以对决策表进行快速无教师的规则提取,得到树状规则集,诊断时它用较少的属性即可对故障进行分类,适用于快速故障分类・因此基于粗糙集和决策树理论相融合的故障诊断技术对复杂系统的快速鲁棒故障诊断具有现实意义・参考文献:[!]1234,/5678,,9:14;75:<=>25?@A B 2B :B 2@?C A :?D BE =B =D E A C 6[F ];!"#$%&’()*+,+-%)&(.,"###,&$($):%!G (";["]陶志,许宝栋,汪定伟・基于决策属性支持度的知识约简方法[F ]・东北大学学报(自然科学版),"##","$(!!):!#"’G !#")・(/5A H ,3:0I ,J 5@?I J;.@A K <E >?EC E >:L =2A @5M M C A 5L DN 5B E >A @>E L 2B 2A @5==C 2N :=EB :M M A C =>E ?C E E [F ];/"%(+01"23"(&4’0)&’(+5+*6’()*&.(30&%(0178*’+8’),"##","$(!!):!#"’G !#");)[$]O 5K <5P H ;+A :?D B E =B [F ];,+&’(+0&*"+01/"%(+01"2!"#$%&’(0+-,+2"(#0&*"+78*’+8’),!*)",!!(’):$&!G $’%;[&]F E <A @E PF ;+A :?DB E =BC E >:L =2A @A Q5==C 2N :=E B5@>=D E 2C >A R 52@B Q A C @E :C 5<@E =K A C P B [F ];!"#$%&*"+01,+&’11*9’+8’,!**’,!!("):$$*G $&(;[’]黎明,张化光・基于粗糙集的神经网络建模方法研究[F ]・自动化学报,"##",")(!):"(G $$・(12S ,H D 5@?,T ;+E B E 5C L DA @=D E R E =D A >A Q@E :C 5<@E =K A C PR A >E <2@?N 5B E >A @C A :?DB E =B=D E A C 6[F ];:8&0:%&"#0&*807*+*80,"##",")(!):"(G $$;)[%]O 5K <5PH ;+A :?D B E =5M M C A 5L D =AP @A K <E >?E -N 5B E >>E L 2B 2A @B :M M A C =[F ];;%("$’0+/"%(+01"2<$’(0&*"+01=’)’0(84,!**(,**(%):&)G ’(;[(]U D 2E @UU ;V C A :?D B E =5M M C A 5L D =A 5==C 2N :=E ?E @E C 5<2W 5=2A @2@>5=5R 2@2@?[F ];/"%(+01"2,+2"(#0&*"+78*’+8’),!**),!#((&):!%*G !(%;[)].C 6B W P 2E K 2L W S;+A :?D B E =5M M C A 5L D =A 2@L A R M<E =E 2@Q A C R 5=2A @B 6B =E R B [F ];,+2"(#0&*"+78*’+8’),!**),!!"("):$*G &*;[*]郝丽娜,王伟,吴光宇,等・粗糙集-神经网络故障诊断方法研究[F ]・东北大学学报(自然科学版),"##$,"&($):"’"G "’’・(,5A 1X ,J 5@?J ,J :TY ,’&01;+E B E 5C L D A @C A :?D BE =-@E :C 5<@E =K A C P Q 5:<=>25?@A B 2B R E =D A >[F ];/"%(+01"23"(&4’0)&’(+5+*6’()*&.(30&%(0178*’+8’),"##$,"&($):"’"G "’’;)[!#]9:2@<5@F +;Z @>:L =2A @A Q>E L 2B 2A @=C E E B [F ];>084*+’?’0(+*+9,!*)%,!(!):)!G !#%;[!!]9:2@<5@F+;42R M <2Q 62@?>E L 2B 2A @=C E E B [F ];,+&’(+0&*"+01/"%(+01"2>0+@>084*+’7&%-*’),!*)(,"((!):""!G "$&;Z @=E <<2?E @=75:<=I 25?@A B 2B S A >E <05B E >A @+A :?D4E =B5@>I E L 2B 2A @/C E E/D E A C 6A :3BC *+9,D :E ’@84%+,A :3BF *0"@-"+9(4L D A A <A Q S E L D 5@2L 5<8@?2@E E C 2@?[V :=A R 5=2A @,X A C =D E 5B =EC @\@2]E C B 2=6,4DE @65@?!!###&,U D 2@5;U A C C E B MA @>E @=:J V X T92@?,8-R 52<:K 5@?^2@?@E :!B A D :;L A R )!"#$%&’$:+A :?D B E =B 5@>>E L 2B 2A @=C E E =DE A C 65C E 2@=C A >:L E >2@L A R M <2L 5=E >2@=E <<2?E @=Q 5:<=>25?@A B 2B B 6B =E R (U Z 7I 4);VC A :?D ->E L 2B 2A @Q 5:<=>25?@A B 2BR A >E <2B =D :B >E ]E <A M E >=A E @B :C E >25?@A B 2B M C E L 2B 2A @5@>B M E E >:M =D E 2R M <E R E @=5=2A @A Q U Z 7I 4;/D ER A >E <L 5@E _=C 5L =C :<E B >2C E L =<6Q C A RC E >:L E >>E L 2B 2A @=5N <E ;+A :?D B E =B =D E A C 65B 5@E KR 5=D E R 5=2L 5<=A A <2B :B E >=A >E 5<K 2=D 2@E _5L =5@>:@L E C =52@P @A K <E >?E Q A C M 5==E C @C E L A ?@2=2A @;/D E =5C ?E =2BR 52@<6=A C E R A ]E C E >:@>5@=2@Q A C R 5=2A @5@>B E E P Q A C C E >:L E >>E L 2B 2A @=5N <E B ;V B 5^:2L P <6<E 5C @2@?=D E A C 65@>L <5B B 2Q 2L 5=2A @=A A <,>E L 2B 2A @=C E E 2B :B E >=A E _=C 5L =C :<E B >2C E L =<6Q C A R C E >:L E >>E L 2B 2A @=5N <E B A5B =A5L ^:2C E B 5=2B Q 5L =A C 6C E B :<=;V @E _5R M <E 2B ?2]E @=AB D A K D A K=A5M M <6=D E 2@=E <<2?E @=Q 5:<=>25?@A B 2B =A +,-./0]5L ::R R E =5<<:C ?2L 5<B 6B =E R ;/D EE Q Q E L =2]E @E B BA Q=D E5<?A C 2=D R2B=D E C E Q A C E M C A ]E >=D C A :?D=D E E _E R M<2Q 2L 5=2A @;()*+,%-#:C A :?D B E =B ;C E >:L =2A @;>E L 2B 2A @=C E E ;C :<E ;Q 5:<=>25?@A B 2B (=’8’*6’-:$(*1’,"##&)$)第!期王庆等:智能故障诊断的粗糙决策模型万方数据。

基于粗糙集理论的应用型本科院校英语教师科研水平评价研究

基于粗糙集理论的应用型本科院校英语教师科研水平评价研究

的表达 ,表达可能是有层次分别的,也可能是无序 的某种性质. 而定性就是 比较模糊的,比较不精确的, 粗集理论的研究则需要一个定量的准确的数据库. 因此,就有了把定性的信息转变为定量数据表的问题 , 这就 是离散 归 一化处 理 . 离散 归一 化 的方 法应 满足 归一 化后 的空 间维数 尽量 小 和归一 化后 信息 丢失尽 量 而 少这 两个特 点 .

机制 , 使得该方法与其它处理不确定性问题的理论有很强的互补性 ,因此对问题的处理 比较客观【 引 . 为 了更 好地 介绍 粗集 理论 的应 用 ,这里 有必 要 先具体 解 释一 下几 个重要 的基本 概念 . 信 息 系统及 研究 论域 信 息 系统 的基本 成 分是研 究 对象 的集 合 , 于 这些 对象 的知 识是 通过 指定 对象 关 的属性 和 它们 的属性 值来 描述 的 . 般来 说 , 个信 息 系统 可 以表示 为 四元 组 .S=f( R V, ,其 中 一 一 U, , F) 为论域 ,是对象 的非空有限集合 ,既研究对象 的集合 ;R是属性 的非空有 限集合 , 就是条件詹 l ; 是 生
尹 付 ,尹 川 2
(. 工 学院 外 国语 学 院 ,江 苏 常 州 23 0 ; 1常州 10 2
2四 川理 工 学院 自动化 与 电子信 息 工程 学 院 ,四川 自贡 6 3 0 ) . 4 0 0 摘 要 :粗糙 集理论是 一 种新 型 的处理模 糊 和 不确 定数据 的数 学工具 ,将 粗糙 集理论 运 用于应
收稿 日期 :2 1 - .5 0 00 1 6
作 者简 介 :尹付(9 3 ) 16 一 ,男,安徽和 县 人, 常州 工学 院外 国语 学院 副教授 ,上海 外 国语大 学在 读博 士,研 究方 向为 : 语教 学法 ,认知语 言 学 英
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

粗糙集理论浅析 粗糙集理论,是继概率论、模糊集、证据理论之后的又一个处理不确定性的数学工具。作为一种较新的软计算方法,粗糙集近年来越来越受到重视,其有效性已在许多科学与工程领域的成功应用中得到证实,是当前国际上人工智能理论及其应用领域中的研究热点之一。在很多实际系统中均不同程度地存在着不确定性因素,采集到的数据常常包含着噪声,不精确甚至不完整 。

一、 引言 粗糙集作为一种处理不精确、不确定与不完全数据的新的数学理论, 最初是由波兰数学家Z. Paw lak于1982年提出的。由于最初关于粗糙集理论的研究大部分是用波兰语发表的, 因此当时没有引起国际计算机学界和数学界的重视, 研究地域也仅局限在东欧一些国家, 直到20世纪80年代末才逐渐引起各国学者的注意。近几年来, 由于它在机器学习与知识发现、数据挖掘、决策支持与分析等方面的广泛应用, 研究逐渐趋热。1992年, 第一届关于粗糙集理论国际学术会议在波兰召开。1995年,A CM Com 2m unication 将其列为新浮现的计算机科学的研究课题。1998年, 国际信息科学杂志( Infor2m ation Sciences) 还为粗糙集理论的研究出了一期专辑。 粗糙集理论是建立在分类机制的基础上的, 它将分类理解为在特定空间上的等价关系, 而等价关系构成了对该空间的划分。粗糙集理论将知识理解为对数据的划分, 每一被划分的集合称为概念。粗糙集理论的主要思想是利用已知的知识库, 将不精确或不确定的知识用已知的知识库中的知识来(近似) 刻画。该理论与其他处理不确定和不精确问题理论的最显著的区别是它无需提供问题所需处理的数据集合之外的任何先验信息, 所以对问题的不确定性的描述或处理可以说是比较客观的, 由于这个理论未能包含处理不精确或不确定原始数据的机制, 所以这个理论与概率论, 模糊数学和证据理论等其他处理不确 定或不精确问题的理论有很强的互补性。

二、 基本概念 粗糙集是一种较有前途的处理不确定性的方法,相信今后将会在更多的领域中得到应用. 但是,粗糙集理论还处在继续发展之中,正如粗糙集理论的创立人Z. Paw lak 所指出的那样,尚有一些理论上的问题需要解决,诸如用于不精确推理的粗糙逻辑(Rough logic) 方法,粗糙集理论与非标准分析(Nonstandard analysis) 和非参数化统计(Nonparametric statistics)等之间的关系等等. 将粗糙集与其它软计算方法(如模糊集,人工神经网络,遗传算法等) 相综合,发挥出各自的优点,可望设计出具有较高的机器智商(M IQ) 的混合智能系统(Hybrid Intelligent System),这是一个值得努力的方向。

三、 粗糙集理论中的知识表示 “知识”这个概念在不同的范畴内有多种不同的含义。在粗糙集理论中,“知识”被认为是一种分类能力。人们的行为是基于分辨现实的或抽象的对象的能力,如在远古时代,人们为了生存必须能分辨出什么可以食用,什么不可以食用;医生给病人诊断,必须辨别出患者得的是哪一种病。这些根据事物的特征差别将其分门别类的能力均可以看作是某种“知识”。

四、 不可分辨关系与基本集 分类过程中,相差不大的个体被归于同一类,它们的关系就是不可分辨关系(indiscernibility relation). 假定只用两种黑白颜色把空间中的物体分割两类,{黑色物体},{白色物体},那么同为黑色的两个物体就是不可分辨的,因为描述它们特征属性的信息相同,都是黑色. 如果再引入方,圆的属性,又可以将物体进一步分割为四类: {黑色方物体},{黑色圆物体},{白色方物体},{白色圆物体}. 这时,如果两个同为黑色方物体,则它们还是不可分辨的. 不可分辨关系是一种等效关系(equivalence relationship),两个白色圆物体间的不可分辨关系可以理解为它们在白,圆两种属性下存在等效关系. 基本集(elementary set) 定义为由论域中相互间不可分辨的对象组成的集合,是组成论域知识的颗粒. 不可分辨关系这一概念在粗糙集理论中十分重要,它深刻地揭示出知识的颗粒状结构,是定义其它概念的基础. 知识可认为是一族 等效关系,它将论域分割成一系列的等效类.

五、 粗糙集的计算方法 软计算(sof t compu t ing) 的概念是由模糊集创始人Zadeh[ 9 ]提出的. 软计算中的主要工具包括粗糙集,模糊逻辑(FL),神经网络(NN),概率推理(PR),信度网络(Belief Networks),遗 传算法(GA) 与其它进化优化算法,混沌(Chaos) 理论等. 传统的计算方法即所谓的硬计算(hard computing),使用精确,固定和不变的算法来表达和解决问题. 而软计算的指导原则是利用所允许的不精确性,不确定性和部分真实性以得到易于处理,鲁棒性强和成本较低的解决方案,以便更好地与现实系统相协调.。

六、 粗糙集理论的特点 粗糙集方法的简单实用性是令人惊奇的,它能在创立后的不长时间内得到迅速应用是因为具有以下特点: (1) 它能处理各种数据,包括不完整(incomplete) 的数据以及拥有众多变量的数据; (2) 它能处理数据的不精确性和模棱两可(ambiguity),包括确定性和非确定性的情况; (3) 它能求得知识的最小表达(reduct) 和知识的各种不同颗(granularity) 层次; (4) 它能从数据中揭示出概念简单,易于操作的模式(pattern) ; (5) 它能产生精确而又易于检查和证实的规则,特别适于智能控制中规则的自动生成. 七、 粗糙集理论的应用 RS理论的生命力在于它具有较强的实用性,从诞生到现在虽然只有十几年的时 间,但已经在许多领域取得了令人鼓舞的成果. 1)股票数据分析.应用RS方法分析了十年间股票的历史数据,研究了股票 价格与经济指数之间的依赖关系,获得的预测规则得到了华尔街证券交易专家的认可. 2)模式识别.应用RS方法研究了手写字符识别问题,提取出了特征属性. 3)地震预报.研究了地震前的地质和气象数据与里氏地震级别的依赖关系. 4)冲突分析.应用RS方法建立了反映以色列、巴勒斯坦、约旦、埃及、叙 利亚和沙特阿拉伯等六国关于中东和平问题各自立场的谈判模型. 5)医疗诊断.RS方法根据以往的病例归纳出诊断规则,用来指导新的病例.现有的人工预测早产的准确率只有17%~38%,应用粗糙集理论则可提高到68%~90%. 6)专家系统(ES).RS抽取规则的特点,为构造ES知识库提供了一条崭新的途径 7)人工神经元网络(ANN).训练时间过于漫长的固有缺点是制约ANN实用化的因素 之一.应用RS化简神经网络训练样本数据集,在保留重要信息的前提下消除了 多余的数据,使训练速度提高了4.77倍,获得了较好的效果.将RS与ANN结 合起来,充分利用RS处理不确定性的特长以增强ANN的信息处理能力. 8)决策分析. RS的决策规则是在分析以往经验数据的基础上得到的.RS允许 决策对象中存在一些不太明确、不太完整的属性,弥补了常规决策方法的不足.希腊工业发展银行ETEVA应用RS理论协助制订信贷政策,是RS多准测决策方法的一个成功范例. 9)从数据库中挖掘信息 现代社会中,随着信息产业的迅速发展,大量来自金融,医疗,科研等不同领域的信息被存储在数据库中. 这些浩如烟海的数据间隐含着许多有价值的但鲜为人知的相关性,例如股票的价格和一些经济指数有什么关系; 手术前病人的病理指标可能与手术是否成功存在某种联系; 满足何种条件的夜空会出现彗星等天文现象等等. 由于数据库的庞大,人工处理这些数据几乎是不可能的,于是出现了一个新的研究方向—数据库中的知识发现(Knowledge Discovery in Databases,KDD),也叫做数据库(信息) 发掘(Mining),它是目前国际上人工智能领域中研究较为活跃的分支. 粗糙集是其中的一种重要的研究方法,它采用的信息表与关系数据库中的关系数据模型很相似,这样就便于将基于粗糙集的算法嵌入数据库管理系统中. 粗糙集引入核(core),化简(reduct) 等有力的概念与方法,从数据中导出用IF THEN 规则形式描述的知识,这些精练的知识更便于存储和使用.美国医学工作者应用粗糙集理论对大量的病历进行分析,发现黑人妇女患乳腺癌后的死亡率比白人妇女高. 到目前为止,早产的预测在医学上还是比较困难的. 现有的人工预测方法准确率只有17à - 58à,而应用粗糙集理论则可将准确率提高到68à - 90à. 八、参考文献 张琦,韩祯祥,文福拴.一种基于粗糙集方法的电力系统故障诊断/警报处理的新 方法.中国电力,1998,31(4):32-38 王珏,苗夺谦,周育键.关于Rough Set理论与应用的综述.模式识别与人工智能,1996,9(4):337-344 曾黄麟.粗集理论及其应用.重庆:重庆大学出版社,1998 Ewa Orlowska(ed.).Incomplete information-rough set analysis.New York:PhysicaVerlag,1998 苗夺谦, 王珏. 粗糙集理论中知识粗糙性与信息熵关系的讨论[J ]. 模式识别与人工智能, 1998,11: 34- 40. 苗夺谦, 王珏. 粗糙集理论中概念与运算的信息表示[J ]. 软件学报, 1999, 10: 113- 116. 李莉. 基于可变精度粗集模型的增量式归纳学习[J ]. 计算机科学, 1999, 26: 55- 58. 张文修, 梁怡. 不确定推理原理[M ]. 西安交通大学出版社, 1996. 施恩伟. 粗糙集中不可分辨关系的某些性质[J ]. 科学通报(英文辑), 1990, 35: 338- 341. 张文修, 吴志伟. 基于随机集的粗糙集模型(É )[J ]1西安交通大学学报, 2000, 34(12): 15—191

相关文档
最新文档