集值信息系统及其属性约简_管延勇
集值决策信息系统的知识约简与属性特征

Kewods S tv l e e iin if r t n s se , o e g e u t n, s e iit tie , t b tsc a a tr y r e-au d cs no ma i y tm s Atr u e h rce— d o o d d o n i a i
caatr t s f iee ttp fatiue nst aud dcs n i omai ytm r tde ,n h u g n h rcei i f rn y eo tr tsi e vle eio n r t n sse aesu i a d tejd me t sc o d b — i f o d
t e r ms a o tt e a e o t i e .Th s i n e tr d c in i i to u e n ic n it n e- a u e i in i f 丌I — h o e b u h m r b an d e a s m n e u t S n r d c d i n o s se ts tv l e d c s n o l g o d o a t n s s e i h s p p r a d i i s o h t t e i c n it n y t m a e t r e n o a g n r l e o ss e t a — i y t m t i a e , n t s h wn t a h n o ss e ts se c n b u o n n d it e eai z c n itn p d
r ms a d t e d s e n b l y ma rc s o n wl g e u t n i e - a u d d c s n i f r t n s s e a e g v n Th a n h ic r i i t t e fk o e e r i i d d c i n s tv l e e ii n o ma i y tm r i e . o o o e
信息系统中基于证据理论的属性约简【文献综述】

文献综述信息与计算科学信息系统中基于证据理论的属性约简粗糙集理论[1,2,3]是波兰数学家Pawlak[4]于1982年提出的用于数据分析的理论. 由于该理论能够处理模糊和不确定性信息, 因此作为一种有效的知识获取工具受到了人工智能研究者的关注. 目前粗糙集理论已被成功应用在机器学习与知识发现、过程控制、数据挖掘、决策分析、模式识别等领域, 成为信息科学的研究热点之一.粗糙集理论是一种处理模糊和不确定性知识的数学工具. 粗糙集属性约简是一种有效的特征选择方法, 被广泛应用于知识库约简和特征选择. 近年来, 一些关于字符识别的文献使用粗糙集属性约简方法, 删除冗余属性, 搜索分辨力高的属性集合, 然后利用约简的属性集构成分类器. 这样可以降低分类器维度, 并且保持分类能力. 字符样本的属性一般是连续的数值型属性, 受噪声影响大. 基于等价关系的粗糙集处理数值属性数据时一般要经过离散化过程. 根据信息论, 离散化过程必然会引入信息损失. 另外, 等价关系粗糙集属性约简仅考虑属性集合在不同类样本上的差异性, 一些在同类异类对象之间变化频繁、易受干扰的特征也会被选择, 这些特征会降低分类器的性能. 为了克服经典粗糙集理论处理数值属性对象的不合理性, 一些文献将经典等价关系粗糙集理论扩展到模糊粗糙集、相似关系和邻域关系粗糙集.D-S证据理论是由Dempster于1967年提出,他首先提出了上、下界概率[5]的定义, 后由Shafer[6]于1976年加以推广和发展, 使之称为符合有限离散领域中推理的形式, 并使之系统化、理论化, 形成了一种不确定性推理的理论, 即D-S理论. 证据理论讨论一个识别框架Θ,它是关于命题的相互独立的可能答案或假设的一个有限集合. 按传统方法可以把Θ的幂集表示为2Θ. 它是Θ的所有子集的集合, D-S理论证据对这个识别框架Θ进行运算, 并提供计算Θ中所有幂集元素的逻辑, 然后使用这些计算结果完成对命题的高和低的不确定性表示.证据理论是一种重要的不确定推理方法, 近年来该理论有了很大发展, 并逐渐得到了国际学术界的承认, 正受到不同领域的学者越来越多的关注. 由于证据理论在表达和处理不确定性信息方面的优势, 已有学者将其应用于产品可靠性评估时主观可靠性信息的综合处理工作之中. 然而, 在很多时候, 专家由于自身的局限性只能给出一些模糊评价信息, 如“该产品可靠度非常高”等等. 为了灵活运用此类模糊主观信息, 需要把证据理论向模糊集合推广.D-S 理论中, 最基本的函数是概率分配函数, 它体现了D-S 理论对于不确定性的量度, 即信任的分配方式. 它通过辨别框架Θ、信任函数Bel 和似然函数Pl 表示知识和处知识, 并用事实表示所有外部输入数据、判断性知识的条件部分和结论部分的命题. 对每一个事实A , 用()()A Bel A , Pl A ⎡⎤⎣⎦表示对A 的信任程度, 并可根据辨别框的基本概率分配函数直接计算得到A 的信任程度, 从而完成对不确定性知识的处理.由于模糊集在处理带有模糊的不确定性方面的问题时, 其优势明显, 许多学者提出将证据理论与模糊集相结合, 利用二者的优点来表示和处理不精确的和模糊的信息. Zadeh [7]是较早将D-S 证据理论推广到模糊集的学者之一, 随后, Yager [8]等人也以不同的方式将D-S 证据理论推广到模糊集上. 在模糊证据理论中, 识别框架Θ上证据的焦元为模糊集合. 此种情况下, Yager 等学者将信度函数重新定义为()()()Bel B I A Bm A =⊂∑%%%% 式中()I A B ⊂%%表示集合B %包含A %的程度, 简称包含度. 对于模糊焦元A %和B %, 设0A %和0B %分别为A %和B %的强0截集. 则当A B ⊂%%时, 必有00A B ⊂%%, 反之, 当00A B ⊂%%时, 则不一定有A B ⊂%%. “包含度”一般采用了取大和取小算子, 所以集合间的包含程度由一些“特殊点”所决定, 从而导致了信度函数对某些焦元的显著变化不敏感. 在有些情况下, 识别框架为连续无限集合. 证据理论通过利用信度函数(Belief Function, Bel)和似真度函数(Plausibility Function, Pl)[6]来描述命题的不确定性.一般地讲, 一个信息系统的属性不是唯一的, 人们希望找到具有最少属性的约简, 即最小约简. 然而, 要找到一个信息系统的最小约简是一个NP-hard 问题. 不过, 在实际应用中, 要求得到相对属性约简就可以了. 许多研究人员己提出了属性约简算法. 利用可辨识属性矩阵, 确定了信息系统的核心属性和去掉绝对不必要属性, 并给出一个由可辨识属性矩阵求信息系统的一个约简的简便算法. 本文首先定义了模糊集、信息系统和证据理论的定义, 然后谈论了信息系统和决策表中的约简之间的关系.参考文献[1]王国胤. Rough集理论与知识获取[M]. 西安: 西安交通大学出版社, 2001.[2]张文修, 吴伟志. 粗糙集理论介绍和研究综述[J]. 模糊系统与数学, 2000, 15(4): 1~12.[3]王彪, 段禅伦, 吴昊, 宋永刚. 粗糙集与模糊集的研究及应用[M]. 北京: 电子工业出版社. 2008.[4]Pawlak Z. Rough sets [J]. International Journal of Computer Sciences, 1982, 11: 341~356.[5]Dempster A P. Upper and lower probabilities induced by a multivalued mapping [J], Annalsof Mathematical Statistics, 1967, 38: 325~339.[6]Shafer G. A Mathematical Theory of Evidence [M], Princeton University Press, Princeton,1976.[7]Zadeh L A. Fuzzy sets and systems. Proc. Symp. on Systems Theory, New York: PolytechnicInstitute of Brooklyn, 1965: 29~37.[8]Yager R R. On the measure of fuzziness and negation. Part I: Membership in the UnitInterval, Internat. J. General Systems, 1979, 5: 189~200.。
随机信息系统属性重要性的等价刻画及其约简

( 漳 州师范学院 数学与信息科学系 , 福建 漳州 3 6 3 0 0 0 )
摘
要: 在基于等价关 系的随机信息系统 中, 文章以证据理论 中的信任测度 和似 然测度为基本工具 , 给 出了核
心属性 、 不必要属性及相对 必要属性的一些等价刻 画 , 研究 了随机 目标信息 系统 的属 性约简问题 , 并利用实例 说明 了约简方法 的有效性 。 关键词 : 随机信 息系统 ; 核 心属性 ; 不必要 属性 ; 相对必要属性 ; 属性约简
F ANG Li a n - h u a . L I Ke - d i a n
( De p t .o f Ma t h e ma t i c s a nd I n f o r ma t i o n S c i e n c e,Zh a n g z h o u No r ma l Uni v e r s i t y,Zh a n g z h o u 3 6 3 00 0,Ch i na )
第3 6卷 第 2 期
2 0 1 3年 2月
合肥 工 业 大 学 学报 ( 自然科 学版)
J OURNAL 0F HEF EI UNI VERS I TY oF TE CHNOLOGY
Vo 1 . 3 6 No . 2 F e b .2 0 1 3
随机信 息 系统属性重要性 的等价 刻画及其 约简
De mp s t e r 工 作 的基 础 上正 式 提 出 了证 据理 论 , 因
但却有着某种相容性和很强的互补性。近年来 , 将粗糙集理论与证据理论相结合 , 研究 随机信息 系 统 的知识 发 现 问题 成 为 一 个 有 活 力 的研 究 方 向, 并且 取得 了一 定 的研究 成 果_ 3 ] 。文 献 E l o - I 利 用粗糙集理论研究 了信息系统中属性重要性 的等 价刻 画 , 文献 E l 1 ] 利 用 证 据 理论 研 究 了随 机 目标 信息系统的约简问题 , 其 中辨识矩 阵是 以单一元 素为 比较 对象 , 计算 量过 大 。
基于博弈论的决策信息系统的属性约简与智能体操作策略模型 (1)

问题重述:随着科技的发展,社会的进步,智能体的出现也为学科的研究打开了一个新的局面。
本题针对智能体的决策提出了问题,考虑到不同对象,不同的属性对智能体的影响,如何在不影响公平的情况下,科学地排除一些属性因素,得到属性约简的若干模式,通过这些模式对数据进行系统的约简。
同时考虑到删减的属性个数越多越好的情况下,如何给出相对应的数学模型和算法,并通过附件所给数据进行求解验证。
进一步,当各种属性重要程度不一的时或者在属性取值范围D 是②,③,④时讨论数学模型以及算法的拓展性。
并且,若考虑到智能体的私下操作,该如何改进模型,才能更好的为智能体提供技术支持。
最后,针对生活学习,从实际出发,进行对模型的讨论分析。
3.}Y A ⋯,y ,代i 体所做所有可能的决策构成的矩阵。
8 . 效用函数(),i i E a f ,表示对于智能体所做的决策所带来的结果。
9 .用*123-{}i Y A a a a a =⋯,,,,表示第i 个智能体所做的实际选择。
问题分析:在这个题目中,我们考虑的对象是智能体,所谓智能体,即那些能够思考、推理和决策的人或机器人。
通过解决此问题,我们可以得到评估所有对象的一个更优化的方案,从而为解决实际问题提供方便。
为了简单起见,我们把题目中的智能体考虑成人类,这样易于我们更好地与实际相联系。
首先,类似与题目所给的评价成绩方法,评价智能体的体系或者方法也是将与智能体对应的属性的值求和,同时所求得的和越大则评价的对象越好,联系实际会很容易发现,这个问题与我们的奖学金评选有很大的相似性,即绩点或是平均分越高,该学生在学习上越优秀。
对于问题一来说,由于对象的属性太多,难以快捷方便地对对象做出评价,于是,我们想通过简化我们的评估体系,那么将哪些因素(在题目中叫做属性)去掉使其不影响评估的结果,并且这样的操作是公平的,提出具体的算法和方案是第一问需要解决的,于是我们运用数学中的博弈论思想,首先找到了博弈论模型对其进行分析。
基于集对分析的多值信息系统粗集模型及其约简

定义 1 给定两个集合 A和 日, _ o 并设这两个 集合组成集对 H=( , ) 在某个具体的问题背景 AB ,
下, 集对 H有 n个特性 , 中 , s 为集对 H 中 其 有 个 A和 所共 有 ; 为 A和 相 对立 个 为 A 和 P个 厂
收稿 日期 :06— 3—7 20 0 1 基金项 目: 国家 自然科学基金 (0 7 02 资助项 目 6442) 作者简介 : 王 燕 (9 1) 女 , 18 . , 硕士生; 指导教师 : 莫智文( 93 ) 男 , 16 一 , 教授
维普资讯
20 07年 5月
第3 0卷
第 3期
四川师范大学学报 ( 自然科 学版) Ju a o i unN r l nvr t( aua Sine orl f c a o i sy N t l cec ) n Sh ma U e i r
( l) 音+ , ( = 争+ 2 y 1 )
简记 为 口= ( Y =0+6 , ,) +
维普资讯
第3 期
上
,
王
燕等 : 于集对分析 的多值信息 系统粗集模型及其 约简 基
卫
,
39 1
Ⅱ
:
6:f
,
c
:
6 ( = { :: )n D ≠ } : ) D, ( S , 式中 ( ): 基数 . , ≤J ,xl 示 的 1 . l  ̄r 表
中图分类号 : 19 C 3 0 5 ; 94 文献标 识码 : A 文章编号 :0 18 9 ( 07 0 -3 80 10 —3 5 2 0 )30 1-3
0 引 言
粗糙集理论是 2 0世纪 8 0年代 由波兰学者 z . Pwa 提 出的 一 种处 理 含 糊 和 不精 确 问题 的 新 alk1 L
集值信息系统基于优势关系下的知识约简

集值信息系统基于优势关系下的知识约简
陈子春;刘鹏惠;秦克云
【期刊名称】《计算机科学》
【年(卷),期】2009(36)12
【摘要】在集值信息系统中,把所有属性看成是一种准则,然后利用属性集值的取值分布定义了两种不同的优势关系,它们都是经典信息系统上优势关系的推广.针对这两种优势关系,给出了集值信息系统的知识约简与对象的相对约简的判定,定义了基于区分矩阵的区分函数,并利用布尔推理方法得到了这两种优势关系下的知识约简与对象的相对约简的具体操作方法.
【总页数】4页(P176-178,193)
【作者】陈子春;刘鹏惠;秦克云
【作者单位】西南交通大学数学学院,成都,610039;西华大学数学与计算机学院,成都,610013;西华大学数学与计算机学院,成都,610013;西南交通大学数学学院,成都,610039
【正文语种】中文
【中图分类】TPL8
【相关文献】
1.集值信息系统基于变精度相容关系的知识约简 [J], 陈子春;秦克云
2.优势关系下的集值序值信息系统 [J], 林耀进;李进金;林梦雷
3.可变精度优势关系下的析取集值有序信息系统 [J], 杨青山;王国胤;张清华;马希
骜
4.区间值不协调信息系统基于变精度优势关系的知识约简算法 [J], 汪凌
5.改进优势关系下的集值信息系统 [J], 岳美汐
因版权原因,仅展示原文概要,查看原文内容请购买。
信息系统中的值约简算法研究

( )f a0 hnd =l 1 i( ,)te ; ( )f b 0 hnd =l 2 i ( ,)te ;
收稿 日期 : 1 一 5 1 2 l 0 —5 0 作者简介 : 晶(97 边 17——)- , , "长春大学计算机科 学技术学院讲师, 士研 究生 , 究方向: 算机软件教学与研究 k 硕 研 计
第2 5卷第 3期
21 0 1年 6月
白 城 师 范 学 院 学 报
Ju a fB ih n oma o ee o r lo ac e g N r lC l g n l
Vo . 5. . 12 No 3
J n 2 1 u e,0 1
信 息 系统 中的值 约简 算 法研 究
O l
1 O
2 改进 后的值 约简算法
在前面介绍的值约简算法中, 当某些记录的一些属性被删除时 , 只考虑了剩余信息系统中的重 复记 录, 并提出了两种方法. 如果剩余信息表中记录之间存在不一致 , 就要保留这条记录的被删除属性 , 但如果 剩余信息表中不存在不一致 , 属性是可以被删除的. 改进后的算法改善了这个问题 , 因此最终 的约简结果 将 会被 进 一步简化 . 综上所述, 我们可以将删除一些记录后 的结果分为三种类型进行讨论 : () 1 如果删除一些记录的相同条件属 性就会导致 新信息系统 中出现决策不一致 , 这种情况表 明被删 除 的属 性是 核心属 性 , 应该 被删 除 , 不 应该 恢 复它 的原属 性值 . () 2 如果删除一些记录的相同条件属性 , 信息系统中出现 了重复记录但没有 出现决策不一致 , 这种情 况表明该属性值的删除不会影响记录的决策 , 因此该属性可以被删除并在表中用“, 标志. . c ” () 3 如果删 除一 些记 录 的相 同条 件 属性 , 信息 系统 中没有 决策 不 一致 和重 复 记 录 出现 , 种 情况 表 明 这 获取到的信息不能判断出该属性值的删除是否会影响记录的决断 , 这时我们可以将属性值标记为“ ”然 ?, 后 再 决定 下一 步如何 根据 其 它信息 处理 它 . 通 过 讨论 , 我们 可 以得到 如下改 进 的值 约 简算法 : 第 一 步 : 属性 约简表 中扫 描所 有 记录 的各 列属 性值 . 在 如果删 除记 录属性 后会 导致 信息 系统 出现决 策 不一致 , 就应该保 留该记录的原有属性值 ; 如果系统产生新信息时虽然出现重复记录但没有 出现决策不一 致, 将该记录的属性值标记为“ ”对于其它记录, ; 将记录得属性值标志为“ ” ?. 第 二 步 : 于第 一步 中获得 的新 信息 系统 , 除可 能 重 复 的记 录并 检查 每 个 包 含 “ ” 记 的记 录. 对 删 ?标 如 果只有未被标记的属性, 我们可 以将“ ” ? 改为“ ” 否则将“ ” , ? 改为它 的原属性值. 如果一些记录的所有 条件属性都被标记了, 我们可以将它们标记为“ ” ? 的属性项改为原始属性值. 第三步: 删除所有可能会导致重复记录出现 的属性标记为“ ” 的记录 , 使其它记录与特定记 录的属 性值 以及两个属性值相 同的其它属性值相一致. 我们应该删除带有较少“ ” 的记录.
基于集覆盖理论的覆盖信息系统属性约简方法

基于集覆盖理论的覆盖信息系统属性约简方法
徐晔;许晴媛;李进金
【期刊名称】《郑州大学学报(理学版)》
【年(卷),期】2024(56)1
【摘要】针对覆盖信息系统属性约简问题,提出基于集覆盖理论的覆盖信息系统属性约简方法。
首先,构造覆盖信息系统的相关矩阵,通过相关矩阵诱导出覆盖信息系统的集覆盖模型,并探讨了覆盖信息系统与其诱导的集覆盖模型之间的联系,发现集覆盖模型的一个极小覆盖恰是原覆盖信息系统的一个属性约简集,从而可以将求解覆盖信息系统的属性约简问题转化为求解对应集覆盖模型的极小集覆盖问题。
其次,利用集覆盖启发式算法(set covering heuristic algorithm,SCHA)在解决集覆盖问题上具有更高的精度和更好的性能,给出了基于SCHA的覆盖信息系统属性约简的求解步骤及算法。
最后,通过实例验证了所提方法的可行性和有效性。
【总页数】8页(P60-67)
【作者】徐晔;许晴媛;李进金
【作者单位】闽南师范大学计算机学院;闽南师范大学数据科学与智能应用福建省高校重点实验室;闽南师范大学数学与统计学院;闽南师范大学福建省粒计算及其应用重点实验室
【正文语种】中文
【中图分类】TP182
【相关文献】
1.基于集合覆盖的不完备信息系统属性约简方法
2.基于信息最大覆盖率蚁群算法的Rough集属性优化约简
3.基于覆盖粗糙集理论中的约简与求核
4.基于图的覆盖决策信息系统属性约简新算法
5.基于分离优势覆盖集的Pythagorean模糊决策信息系统的属性约简
因版权原因,仅展示原文概要,查看原文内容请购买。