邻域粗糙集中不确定性的熵度量方法

合集下载

粗糙集和粗糙分类的模糊信息测度

粗糙集和粗糙分类的模糊信息测度

粗糙集和粗糙分类的模糊信息测度黄卫华【摘要】定义了模糊集上的熵、σ-熵和模糊集的模糊性测度,以及模糊分类的模糊性测度,验证了一个模糊集与它的补集有相同的模糊度,且近似空间中精确集和精确类的模糊度均为零.定理表明该信息熵是模糊熵,可以度量粗糙集的不确定性和模糊性.【期刊名称】《廊坊师范学院学报(自然科学版)》【年(卷),期】2016(016)002【总页数】3页(P5-7)【关键词】近似空间;模糊熵;模糊类;信息测度【作者】黄卫华【作者单位】文山学院,云南文山 663000;山西大学,山西太原030006【正文语种】中文【中图分类】TP18熵的概念最早起源于经典力学,是用来度量系统的无序程度的。

美国数学家ShannonC.E.利用熵的称谓,定义了用于量化一个离散型随机变量的随机性大小的度量,即随机熵。

如今,熵被广泛应用于不确定性度量[1-5]。

De Luca和Ter mini介绍了模糊集熵的公理化结构,并提出了Shannon概念熵[6]。

Liu系统地给出了熵的公理化定义,以及模糊集的距离测量和相似测量,并讨论了这几种测量的基本关系[7]。

梁吉业等提出了一种基于信息增益具有补特征的信息熵, 给出相应的条件熵和互信息,并指出这个熵也是一种模糊熵,可以用来度量粗糙集和粗糙分类的模糊性[8]。

钱宇华等则在非完备信息系统中引入组合熵的概念,其信息增益函数具有可能知识含量的特性, 并用于度量非完备信息系统的不确定性[9]。

定义1[10] 设K=(U,R)是一个近似空间,U/R={X1,X2,…,Xm}表示R的所有等价类构成的集合,[x]R表示包含元素x∈U的R等价类。

定义2[10] 设K=(U,R)是一个近似空间,对于每一个X⊆U,R是U上的一个等价关系,定义两个子集:分别称它们为X的R上近似级和R下近似集。

定义3[9] 设K=(U,R)是一个近似空间,U是一个非空有限论域,U/R={X1,X2,…,Xm}是U上的一个等价关系,粗糙集的互补信息熵定义为其中是Xi的补集,表示Xi在论域U中的概率。

不同知识粒度下粗糙集的不确定性研究

不同知识粒度下粗糙集的不确定性研究

下 , 属 性 的 角 度 , 出 了 分 层 递 阶 的 知 识 空 间 链 , 现在 分 层 递 阶 的知 识 粒 度 下 部 分 文 献 中 定 义 的粗 糙 集 的粗 糙 从 给 发 熵 和模 糊 度 随知 识 粒度 的 变 化 规 律 不 一 定 符 合 人 们 的 认 识 规 律 . 信 息 熵 的 角度 提 出 了一 种 粗 糙 集 不 确 定 性 的 模 从
王国胤” 张清华”
成都 重庆 603) 10 1 406) 0 0 5 ( 南交通大学信息科学与技术学院 西 ( 庆 邮 电大 学 计 算 机 科 学 与 技 术 研 究 所 重
摘要Βιβλιοθήκη 粗 糙 集 的 不 确 定性 度 量 方 法 , 目前 主要 包 括 粗 糙 集 的 粗 糙 度 、 糙 熵 、 糊 度 和 模 糊 熵 . 不 同 知 识 粒 度 粗 模 在
糊 度 度 量 方 法 , 明 了这 种 模 糊 度 随知 识 粒 度 的减 小 而 单 调 递 减 , 补 了现 有 粗 糙 熵 和 模 糊 度 度 量 粗 糙 集 不 确 定 证 弥
性 的 不足 . 后 , 析 了 在 不 同 知 识 粒 度 下 粗 糙 度 和 模 糊 度 的变 化 关 系 . 最 分 关键 词 粗 糙 度 ; 糙 熵 ; 糊度 ; 识 粒 度 ; 空 间 粗 模 知 商
中 田 法分 类 号 TP 8 I
Unc r a nt f Ro g e s i f e e n wldg a l r te e t i y o u h S t n Dif r ntK o e e Gr nu a ii s
W ANG oYi ' Gu — n ∞ Z ANG n — a H Qig Hu t
A s at R u n s , o g n rp , uz es a dfzye t p r jr to sfr au — bt c r o g e s r u he to y fzi s , n uz nr yae n o ma h d s r o me o me

粗糙集的不确定性度量准则_胡军

粗糙集的不确定性度量准则_胡军
可以证明, / M0 是一个偏序关系. 知识的偏序 关系从知识粒度的角度为比较知识 的含量提供方
法, 即知识越细, 知识含量越丰富, 知识的不确定性
越小. 并且, 若 R 为恒等关系 X, 即
U / X = {X X = { u }, u I U },
知 识 最 细; 若 R 为 全 域 关 系 D, 即
U / D= {X X = U}, 知识最粗. 定义 2[ 2 ] 设 ( U, R ) 为 Paw lak近似空间, 对于
任 意 集合X A U, 也称 为 U中 的一 个概 念, 有 下列
定义:
R (X ) = { x I U [ x ] R H X X ª } = G { [ x ] R I U R [ x ] R H X X ª }, ( 1)
上述研究为粗糙集的不确定性度量提供方法, 但是这些不确定性的度量方法中有些定义在某种情 况下并不合理, 即不符合认知规律. 比如, 王国胤等 指出粗糙集的不确定性度量在正域或负域的知识粒 进行细分时, 其值应该不变, 但粗糙熵却严格递减; 另外, 随着知识粒度的减小, 可能存在粗糙集的线性 模糊度不变或者二次模糊度反而增加的问题 . [ 15] 除 此之外, 我们还发现当粗糙集的下近似为空时, 粗糙 集的粗糙度与粗糙集的上近似无关. 那么, 不确定性 度量必须满足哪些条件. 满足什么条件的不确定性 度量是合理有效的. 如何设计合理有效的不确定性 度量方法. 针对这些问题, 本文从直观的认知角度, 给出粗糙集不确定性度量的基本准则和扩展准则, 并基于此对已有的不确定性度量进行分析, 为已有 的不确定性度量的合理性 ( 或不合理性 ) 提供理论 说明, 也为设计新的不确定性度量方法提供依据.
K ey W ords Uncertainty, Roughness, Rough Entropy, Fuzziness, Fuzzy Entropy, Rough Set

粗糙集 信息熵

粗糙集 信息熵

粗糙集信息熵粗糙集与信息熵是数据分析和机器学习中两个重要的概念。

粗糙集理论是一种对数据进行不确定性处理的方法,而信息熵是用来衡量数据中的不确定性和信息量的指标。

本文将介绍粗糙集和信息熵的概念、原理及其在数据分析和机器学习中的应用。

粗糙集是巾帼集合理论中的一种基于粗糙关系的数据处理方法。

巾帼集合理论是由波兰数学家帕夫尔·彼得·波尔茨花博士在20世纪80年代提出的。

它是基于粗糙关系的数学模型,用来处理数据中的不确定性和不完备性。

粗糙集理论认为,一个对象的属性值可能存在不确定性,即不同属性值的对象可能属于同一个类别,或者相同属性值的对象可能属于不同的类别。

因此,通过粗糙集的方法,可以通过对不同属性的划分来处理数据中的不确定性和不完备性。

信息熵是信息论中的一个概念,用来度量一个随机变量所包含的信息量。

信息熵的值越大,表示随机变量的不确定性越高,信息量越大。

信息熵的计算公式为:H(X) = -ΣP(xi)log2P(xi)其中,H(X)表示随机变量X的信息熵,P(xi)表示随机变量X取值为xi的概率。

粗糙集和信息熵在数据分析和机器学习中有广泛的应用。

首先,粗糙集可以用来处理数据中的不确定性和不完备性。

通过粗糙集的方法,可以将数据划分成不同的等价类,从而减少数据中的不确定性。

这对于数据挖掘和决策支持系统等领域非常有用。

其次,信息熵可以用来衡量数据中的不确定性和信息量。

在数据分析中,可以利用信息熵来评估数据的纯度和不确定性。

例如,在决策树算法中,可以使用信息熵来选择最佳的划分属性,从而构建一个更加准确和可解释的决策树模型。

此外,粗糙集和信息熵还可以结合使用,提高数据挖掘和机器学习的性能。

例如,可以将粗糙集的方法用于对数据进行处理和划分,然后使用信息熵来评估划分的纯度和不确定性。

这种结合可以使数据分析和机器学习算法更加准确和可靠。

综上所述,粗糙集和信息熵是数据分析和机器学习中的重要概念。

粗糙集用来处理数据中的不确定性和不完备性,而信息熵用来衡量数据中的不确定性和信息量。

基于粗糙集的不确定知识表示方法

基于粗糙集的不确定知识表示方法

基于粗糙集的不确定知识表示方法基于粗糙集的不确定知识表示方法介绍如下:
粗糙集(RS)理论是一种刻画不完整性和不确定性的数学工具,能有效地分析和处理不精确、不一致和不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。

优点:
1.它能处理各种数据,包括不完整的数据以及拥有众多变量的数据;
2.它能处理数据的不精确性和模棱两可,包括确定性和非确定性的情况;
3.它能求得知识的最小表达式和知识的各种不同颗粒层次;
4.它能从数据中揭示概念简单,易于操作的模式;
5.它能产生精确而易于检查和证实的规则,特别适于智能控制中规则的自动生成。

基本概念:
粗糙集理论是一种研究不精确,不确定性知识的数学工具。

粗糙集理论的知识表达方式一般采用信息表或称为信息系统的形式,它可以表现为四元有序组K=(U,A,V,P)。

其中U为对象的全体,即论域;A是属性全体;V是属性的值域;P为一个信息函数,反映了对象X在K中的完全信息。

粗糙集的思想:
一种类别对应一个概念(类别可以用集合表示,概念可以用规
则描述),知识由概念组成;如果某个知识含有不精确概念,则该知识不精确。

粗糙集对不精确概念的描述方法是通过下近似和上近似概念来描述。

信息熵在粗糙集理论中的应用_梁吉业

信息熵在粗糙集理论中的应用_梁吉业

山西大学学报(自然科学版)25(3):281~284,2002Journal of Shanx i U niv ersit y(Nat.Sci.Ed.) 文章编号:0253-2395(2002)03-0281-04信息熵在粗糙集理论中的应用梁吉业1,孟晓伟2(1.山西大学计算机科学系,山西太原030006;2.山西省招生考试管理中心,山西太原030012)摘 要:信息熵在粗糙集理论中有着重要的应用,它可用来度量知识的不确定性、属性关联的重要性及粗糙集的不确定性等。

文章综述并分析这些度量。

关键词:粗糙集理论;信息熵;度量;数据分析中图分类号:T P18 文献标识码:A 粗糙集理论是八十年代初由波兰科学家Z.P awlak首先提出的一个分析数据的数学理论[1]。

由于该理论能够分析处理不精确、不一致和不完备信息,因此作为一种具有极大潜力和有效的知识获取工具受到各领域广泛关注,并已在机器学习、模式识别、决策分析、过程控制、数据库知识发现、专家系统等广泛领域得到成功应用[2~7]。

本文主要介绍信息熵在粗糙集理论中的应用,综述并分析这些度量,指出需进一步研究的几个问题。

1 基本概念1.1 信息系统四元组S=(U,A,V,f)是一个信息系统,其中U:对象的非空有限集合;A:属性的非空有限集合,A中的属性又可分为两V a,V a是属性a的值域;f:U×A→V是一个信息函数,个不相交的子集,即条件属性集C和决策属性集D,A=C∪D;V=∪a∈A它为每个对象的每个属性赋予一个信息值,即P a∈A,x∈U,f(x,a)∈V a。

信息系统S=(U,A,V,f)简记为S=(U,A)。

1.2 不可区分关系令P A A,定义由属性集P决定的不可区分关系I N D(P)为:I N D(P)={(x,y)∈U×UûP a∈P,f(x,a)=f(y,a)}.如果(x,y)∈I N D(P),则称x和y是P不可区分的。

基于知识含量的粗糙集不确定性度量

算 的 简便 性 。 关键 词 粗糙 集 , 不确 定性 , 识 含 量 测 度 , 似 精 度 , 糙 度 知 近 粗
An Unc ra nt e s r orRo g S t s d n e t i y M a u e f u h e sBa e o Kno e e Ca a iy wldg p c t
L U i n S a Qu n I J Qi HI i a - K —
( e at n f t t t sa dM ah ma i ,S a d n ia c si t , ia 5 0 4 D p rme to ai i n t e t s h n o g F n n eI t u e Jn n 2 0 1 ) S sc c n t ( c o l f t e t sa dS se S in e , h n o g Unv ri , ia 5 1 0 S h o h ma i n y tm e c s S a d n ie s y Jn n 2 0 0 ) o Ma c c t
n w n e t i t e s r . e u c ran y m a u e
Ke wo d Ro g e s Un e t i t , o e g a a iy me s r , c r c Ro g n s y rs u h s t , c r an y Kn wld e c p c t a u e Ac u a y, u h e s
o h e u c ran ym e s r r u t e ic s e . I h n ,a x mpes o h ain lya dsmpii f h ft en w n etit au ea ef rh rds u s d nt ee d n e a l h wst er t ai n i l t o e o t cy t

一种度量粗集粗糙性的新方法

一种度量粗集粗糙性的新方法何圣姿;黎琼【摘要】结合考虑二元关系产生的知识模块粒度大小及集合X边界的知识粒度对X的粗糙性的影响,利用知识的粗糙熵及粗集的边界熵给出度量粗集粗糙性的新方法—集合的粗糙熵。

%Using the knowledge′s rough entropy and the rough set′s boundary entropy,the new definition of set X′s rough entropy is given by considering the granularity of knowledge modules(caused by binary relations) and the granularity of the boundary of X.【期刊名称】《江西科学》【年(卷),期】2012(030)002【总页数】3页(P130-132)【关键词】粗糙集;粒度;边界熵;粗糙熵【作者】何圣姿;黎琼【作者单位】东华理工大学行知分院数计系,江西崇仁344200;东华理工大学行知分院数计系,江西崇仁344200【正文语种】中文【中图分类】O144.5知识的不确定性度量是粗糙集理论的重要问题之一。

目前已有很多专家、学者探讨了知识粗糙性、粗集粗糙性与信息熵之间的关系。

文献[1]通过分析各种粗集粗糙性度量方法的不足,利用粗集边界的知识粗糙性和粗集本身的粗糙度很好地刻画了粗集粗糙性。

现在文献[1]的基础上重新定义粗集边界熵并分析其性质,进而给出一种更为合理的粗集粗糙性的度量方法。

定义 1[2]:设 S=(U,A)是一个信息系统,R⊆A,U/R={X1,…,Xn},则知识R 的粗糙熵为Er(R)表示知识的不确定性的大小、信息量的大小[3]、划分的粒度的大小。

定义2:设S=(U,A)是一个信息系统,X⊆U,R⊆A,U/R={X1,…,Xn},BR(X)=X)-R(X)为 X 的 R 边界[4],BR(X)/R={B1,…,Bm},则BR(X)R⊆U/R。

粗糙集理论与方法

粗糙集理论与方法
粗糙集理论与方法是一种用于处理不确定性和不完全信息的数学方法。

该方法最早由波兰科学家Zdzislaw Pawlak于1982年提出,其基本思想是基于约简和分割的思想对样本空间进行建模和分析。

粗糙集理论主要包括以下几个关键概念和步骤:
1. 近似集:粗糙集理论认为,一个对象可能属于多个不同的概念或类别,且我们不能确定其准确的分类。

因此,利用近似集的概念,我们可以将对象分成精确区域和不确定区域。

精确区域是指可以准确分类的对象,而不确定区域是指不能确定分类的对象。

2. 上近似和下近似:在粗糙集理论中,上近似是指包含所有精确分类对象的集合,而下近似是指包含所有不确定分类对象的集合。

上近似和下近似的交集被称为约简。

3. 属性重要性:对于给定的属性,粗糙集理论可以通过属性重要性来判断其对分类结果的贡献程度。

属性重要性可以通过信息熵、信息增益等指标来度量。

4. 属性约简:属性约简是粗糙集理论中的一个重要步骤,它的目的是通过删除某些不重要的属性来减少样本空间的复杂性,同时保持样本分类的准确性。

属性约简可以通过贪婪算法、遗传算法等进行求解。

粗糙集理论与方法在数据挖掘、决策分析、模式识别等领域具有广泛应用。

它可以处理不完整、不确定、模糊等问题,帮助人们对复杂的数据进行分析和决策。

基于边界熵的S-粗集不确定性度量


摘 要 : 对 S一粗 集 中 元 素 的 动 态特 性 , 出 了 内 、 边 界 和 外 边 界 嫡 的 概 念 , 传 统 的 粗 糙 度 与 外 边 界 熵 结 针 给 外 将
合 进来 , 出 了一 种 新 的 S一 集 不 确 定 性 的度 量 方 法 , 论 了这 一 度 量 的特 性 , 通 过 实 例 说 明 这 一 新 的度 提 粗 讨 并 量 方法 的合 理性 与简 便 性 。
定 性 的一个 主要原 因就是 来 自给定 近 似空 间 的粗 糙 集 的 边界 , 当边 界 为 空集 时知 识 是完 全 确 定 的 , 边 界越 大知识 就越 粗糙或 越模 糊 , 难得 到确定 的规 则 。针 对这 种粗 集的不 确定性 , 越 文献 [ ]给 出了一 6 种基 于等价 和二元关 系 的粗集 粗糙 性度量 方法 , 文献 [ ]引人 了基于 知识含 量 的粗糙集 不确定 性度 量 , 7
关键词 : S一粗集 ; 确 定 性 ; 界 熵 ; 糙度 ; 糙 熵 不 边 粗 粗
中 图 分 类 号 : 19 0 5 文 献标 识 码 : A
U 刖 肓
s 一粗集 ¨ 3是研 究系统 动态 近似 特性 、 I 知识挖 掘 和 知识 发 现 的一 个新 的理论 工 具 , 它是 P wa al k粗 集 的一 般形式 。S 粗 集在 上定 义 了元 素迁 移族 F, XCU变成 具 有单 向或双 向 流动特 性 的集 合 一 使 和 一 , 改变 了集合 的静态 特性 。集合 的膨胀 和萎 缩 , 必 引起 边 界域 的变 化 。而粗 糙 集不 确 势
( , )( 。 I R F 。X ) ’
其 中f 表示集合 的基数 。 Xf
关于 S 一粗集 的详 细 内容请参 考文献 [ 3 。 1— ]
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Uncertainty Measures Using Entropy and Neighborhood Rough Sets������
CHEN Yuming1,2+, ZENG Zhiqiang1, TIAN Cuihua1
1. College of Computer and Information Engineering, Xiamen University of Technology, Xiamen, Fujian 361024, China 2. State International S&T Cooperation Base of Networked Supporting Software, Jiangxi Normal University, Nanchang 330027, China + Corresponding author: E-mail: cym0620@ CHEN Yuming, ZENG Zhiqiang, TIAN Cuihua. Uncertainty measures using entropy and neighborhood rough sets. Journal of Frontiers of Computer Science and Technology, 2016, 10(12): 1793-1800. Abstract: In view of the fact that the uncertainty measures of classical rough set theory are difficult to be suitable for neighborhood rough set model, this paper proposes an uncertainty measurement method based on information entropy and neighborhood rough sets. By the definitions of neighborhood relation, each object in the universe is assigned with a neighborhood subset, called neighborhood granule. Some uncertainty measures of neighborhood granule are defined, including approximate accuracy, information entropy and weighted information entropy in the neighborhood system. Furthermore, this paper presents the axiomatic concept of measure, and proves that the three measures are axiomatic uncertainty measures. This paper also gives the maximum and minimum of these measures and proves their monotonicities. Theoretical analysis and experiments show that the information entropy measure in the neighborhood system is better than the approximate accuracy measure.
E-mail: fcst@ http://www.ceaj.orБайду номын сангаас Tel: +86-10-89056056
邻域粗糙集中不确定性的熵度量方法*
陈玉明 1,2+, 曾志强 1, 田翠华 1
1. 厦门理工学院 计算机与信息工程学院, 福建 厦门 361024 2. 江西师范大学 国家网络化支撑软件国际科技合作基地, 南昌 330027
* The National Natural Science Foundation of China under Grant No. 61573297 (国家自然科学基金); the Natural Science Foundation of Fujian Province under Grant Nos. 2015J01277, 2016J01324 ( 福建省自然科学基金); the Project of Department of Education of Fujian Province under Gant Nos. JA09217, JB13152 (福建省教育厅项目); the Program for New Century Excellent Talents in Fujian Province (福建省高校新世纪优秀人才支持计划). Received 2016-04, Accepted 2016-06. CNKI 网络优先出版: 2016-06-27, /kcms/detail/11.5602.TP.20160627.0929.002.html
ISSN 1673-9418 CODEN JKYTA8 Journal of Frontiers of Computer Science and Technology 1673-9418/2016/10(12)-1793-08 doi: 10.3778/j.issn.1673-9418.1605037
1794
Journal of Frontiers of Computer Science and Technology 计算机科学与探索
2016, 10(12)
Key words: neighborhood rough sets; neighborhood information entropy; uncertainty measure; information system; approximation accuracy 摘 要: 针对传统粗糙集理论中不确定度量方法难以适用于邻域粗糙集模型的问题, 引入信息熵的度量方法,
相关文档
最新文档