不确定性信息系统中的知识表达与约简
基于优势关系下不协调目标信息系统的知识约简

一
不确定性和模糊知识 的软计算工 具 , 已被 成功Байду номын сангаас地应用 于人 它 工智能 、 数据挖掘 、 式识别 与之 能信 息处 理等 领域 l。 , 模 _ 。 并 2] 。 。
越来越引起了国际学术界的关注 。其在保持信 息系统分类能 力不变的前提下 , 通过知识 约简 , 出问题 的分类 能力或决策 导
Kn wld eRe u to s i n o ss e tI f r a i n S s e a e n Do i a c l t n o e g d c in n I c n it n n o m t y t ms B s d o m n n e Rea i s o o
维普资讯
计算 机科学 2 0 Vo. 3 Q 2 0 6 13 N.
基 于 优 势 关 系下 不 协 调 目标 信 息 系 统 的 知 识 约简 * )
徐 伟华 张 文修 ( 安交 通大 学理 学 院信 息 与系 统科 学研 究所 西安 7 0 4 ) 西 1 0 9
1  ̄ - J' l-
’
而提供了知识约简的具体操作方法b
粗糙集理论l 是近年来 发展起 来 的一种处 理不 精确 性 、 1 ]
2 基于优势关系的 目标信息 系统
知识表示中的不确定性_李德毅

学术论文
中国工程科学 Engineering Science
Oct 12000 Vol12 No110
知识表示中的不确定性
李德毅
(中国电子系统工程研究所 , 北京 100840)
[ 摘要 ] 知识表示一直是人工智能研究中的一个瓶颈 , 其难点在于知识中隐含有不确定性 , 即模糊性和随机
1) 产生一个期望值为 ( En x , En y) , 均方差为 ( He x , He y) 的二维正态随机熵 ( E′n x , E′n y) ;
2) 产生一个期望值为 ( Ex , Ey ) , 均方差为 ( E′n x , E′n y) 的二维正态随机数 ( x , y) ;
3) 计算
z = exp 4) 令 ( x ,
计算 , 每一次的随机熵 E′n 不同 , 导致云滴的离散 性 , 包含云边缘的不分明和云厚度的不均匀 ; 根据 算法第 3 步计算 , 任何时候都会有 0 < z ≤1 。我们
可以认为函数 :
z = exp -
(
x - Ex) 2 2 En x2
+
(
y - Ey) 2 2 Eny2
是云的数学期望曲线 。如果已经知道若干云滴 , 可
以计算出它们所代表的正态云的三个数字特征 : 期
望值 Ex , 、熵 En 和超熵 He , 称之为反向云发生 器 , 也可以构造带条件的正态云发生器 。还可以利
用类似方法构造其他分布的云发生器 , 如泊松云 、
Г云等 。
如果用二维正向正态云发生器来生成不同数量
的云滴 , 可以大致还原 3 位射手的水平 。图 4 中分
第 10 期
基于不完备决策信息系统的知识约简算法

科
学
技
术
与
工
程
Vo 1 .1 3 No .1 5 Ma y 201 3
1 6 7 1 — 1 8 1 5 ( 2 01 3) 1 5 — 4 4 1 4 — 0 4
S c i e n c e T e c h n o l o g y a n d E n g i n e e r i n g
关键词 不完备决策信息 系统 中 图法分类号 T P 3 0 1 ;
知识约简 文献标志码
知识获取 A
粗糙集
粗糙 集 理 论是 波 兰科 学家 P a w l a k提 出 的 一种
究 上 。但在 扩 展模 型 和 算 法 效 率 方 面 有 待 进 一 步
研究。
处 理模糊 和不 确 定 性 数 据 的分 析 工 具 卫 J , 近年 来 它 已广 泛应用 于人 工 智 能 、 故 障诊 断 和智 能 控 制 等 诸 多领 域 j 。知 识约 简是粗 糙集理 论研 究 的重要 内容 。而 由于 现 实 世 界 的决 策 信 息 系统 往 往 存 在 信 息 获取方 面 的缺 陷 , 如 数 据采 集 成 本过 高 或 技术
2 0 1 3年 3月 5 E t 收到 国家 自然 科 学 基 金 项 目( 6 1 1 6 3 0 1 2) 、
属性 。 的值域 , : U×( C U D ) 一 是一个信息映射
函数 , 且 p 对 V 0∈ C U D, ∈ U, 有 定义 2
,
方法 对非完 备数据 进 行 填 充 , 对 非 完 备 数据 进 行 数 据填 充后 , 可把不 完备 决 策 信 息 系统 转 化 为完 备 决 策系 统 ; 然后 再利 用 经典 的粗糙 集 理 论 中的知 识 约 简算 法进行 不完备 决 策 信 息 系统 进 行数 据 分 析 ; 但
智能决策理论与方法解析PPT课件精选全文

Confidence | A B | | A|
2024年9月23日3时49分
第16页/共52页
知识发现—基本概念 • 分类(等价关系,判别):按类标签(为数据库中的某属性集,一般仅包含一个属性)对数据库中的对象 进行分类,具有相同标签值或标签值在指定区间内的对象属于同类。分类规则是判断某个对象属于某 类的充分条件即对象具有某类的属性时则表示该对象属于该类。其规则形式一般为IF LogicExp Then A类 Else B类。主要方法:逻辑回归、判别分析、决策树、ANN、粗糙集、SVM等。
• 解决问题的主要理论方法:人工智能与不确定性理论
2024年9月23日3时49分
第1页/共52页
智能决策理论与方法
1、智能决策理论的形成背景 2、知识发现 3、机器学习 4、不确定性理论
2024年9月23日3时49分
第2页/共52页
智能决策理论与方法—形成背景
• 人类面临越来越复杂的决策任务和决策环境:
• 针对可建立精确数学模型的决策问题,由于问题的复杂性,如组合爆炸、参数过多等而无法获得问题 的解析解,需要借助AI中的智能搜索算法获得问题的数值解;
• 针对无法建立精确数学模型的不确定性决策问题、半结构化或非结构化决策问题,需要借助AI方法建 立相应的决策模型并获得问题的近似解。
2024年9月23日3时49分
mm
profit
age
20
30
40
50
2024年9月23日3时49分
0
回归模型 0
第20页/共52页
neural liner
500
100 mins
0
知识发现—基本概念
• 数据挖掘方法
Data Mining
不一致信息系统的属性约简方法研究

集 合X与 Y的笛 卡 儿 乘 积 的任 意一 个 子 集 .就 是 X
可理解的、 可运 用 的知识 回 。因 此 。 属性 约 简过 程 中 , 到Y 的 一个 关 系 在 上 ()等 价关 系 : 1 当关 系 R 足 自反 性 、 称 性 、 传 满 对 和 人 们 面临如 何 处理 数 据信 息 不 确定 性 问题 .从 复 杂 的
【 摘 要 】针 对 不一 致信 息 系统 寻找 解 决方 法 , : 并证 明算 法 的有 效 性 。使 用 转化 算 法 , 不一 致 决 策表 将
转换 为一 致 决策表 . 文使 用三 种方 法转化 , 本 并对 三种 方 法进 行 分析 和 比较 。理论 上证 明 了算 法 的有 效性 ,
T T
信 息 系 统 的属 性 约简 问题
1 理 论 基 础 、 11 本 概 念 .基
I ND ( l A
[ I(o x NA ]D )
定 义 3上下 近 似 集 合 上 近似 集 合 和下 近似 集 合 是
粗糙 集 分析 数 据 的两个 基 本概 念 。设X为论 域U的一 个
目前 .很 多 学 者们 已经 提 出 了一 些 有 效 的属 性 约 = , ‘ 或者 u[] u P x 。 = 简 算 法 fM . 这 些算 法 都存 在 一定 问 题 。应 用 于完 备 4 但 j 定 义2不 可 分辨 关 系 信 息系 统S < ,, ,> = UQ V p 。对 于 决 策 系 统 的约 简算 法 .在 完 备性 和效 率 方 面都 没 有 很 每 个 属 性 子 集 AcB. 义 一 个 不 可 分 辨 的二 元 关 系 定 好 的解 决方 案 ; 用 于不 一致 信 息 系统 的约 简算 法 , 应 基 I ( =(y( )U UV ∈ px) (9 N A {,l, ∈ x : A (q= j ) D ) ) x q , ,} , 本 上 是 基 于可 辨识 属 性矩 阵 ,其 时 问复 杂 度较 高 。 因 I D( 是 一个 等 价关 系 。 由这 种 等价 关 系 导 出的对 U N A) 而 .为 了从 复 杂 的不 一致 信 息 系统 中获 得 符合 实 际 需 .其 中包 含 样 本 x 等 价 类 记 为 的 要 的不 确定 性 命题 规则 .必 需从 更 多 方 面研 究 不 一 致 的 划 分 记 为 —
不协调优势目标信息系统的启发式约简算法

不协调优势目标信息系统的启发式约简算法不协调优势目标信息系统的启发式约简算法在信息系统领域,不协调优势目标信息系统是一个重要且复杂的研究课题。
由于信息系统中存在大量的冗余和重复信息,如何对信息系统进行有效的约简,以提高系统的效率和性能,一直是学术界和工业界共同关注的焦点。
而启发式约简算法,则是在此背景下应运而生的一种重要方法。
启发式约简算法是一种基于启发式思想,结合信息系统本身特点和问题需求,利用简单、快速的算法对系统信息进行约简的方法。
这种算法往往能够在保证系统关键信息的前提下,大大减少系统信息的冗余部分,从而提高系统的效率和性能。
在实际应用中,启发式约简算法已经被广泛应用于数据挖掘、模式识别、智能决策等领域,并取得了显著的成效。
下面,我将从深度和广度两个方面,对不协调优势目标信息系统的启发式约简算法进行全面评估,并撰写一篇有价值的文章,以便更深入地理解这一主题。
一、深度探讨1. 启发式约简算法的原理和方法启发式约简算法主要基于对信息系统的特征和相互关系进行分析和挖掘,通过设定一定的约简规则和启发式函数,对系统信息进行迭代和优化,最终得到约简后的系统信息。
常见的启发式约简算法包括基于遗传算法、模拟退火算法、粒子群算法等。
这些算法通过不断调整约简规则和参数,能够有效地降低系统信息的复杂度,提高系统的可解释性和执行效率。
2. 不协调优势目标信息系统的特点和需求不协调优势目标信息系统是一种多目标决策系统,其中存在着不同目标之间的矛盾和不协调现象。
对于这类信息系统,启发式约简算法需要考虑多目标的特点,能够兼顾系统各个目标之间的关联性和权衡性,以实现系统信息的全面约简。
3. 启发式约简算法在不协调优势目标信息系统中的应用在不协调优势目标信息系统中,启发式约简算法能够有效地对系统信息进行全面、深入的约简,从而减少系统的冗余和重复信息,提高系统的效率和性能。
通过合理设置启发式规则和参数,可以使系统在约简后仍然能够保持其多目标决策的特性,实现系统信息的精练和优化。
经典粗糙集理论

粗糙集可以用于提取数据中的决策规则,这些规则可以作为神经网络的 训练样本。通过训练,神经网络可以学习到决策规则,并用于分类或预 测。
边界区域
近似集合中的不确定性区 域,即既不属于正域也不 属于负域的元素集合。
粗糙集的度量
精确度
描述了集合中元素被近似集合 包含的程度,即属于近似集合
的元素比例。
覆盖度
描述了近似集合能够覆盖的元 素数量,即近似集合的大小。
粗糙度
描述了集合被近似程度,是精 确度和覆盖度的综合反映。
知识的不确定性
描述了知识表达系统中属性值 的不确定性程度,与粗糙度相
经典粗糙集理论
目录
• 粗糙集理论概述 • 粗糙集的基本概念 • 粗糙集的运算与性质 • 粗糙集的决策分析 • 粗糙集与其他方法的结合 • 经典粗糙集理论案例研究
01 粗糙集理论概述
定义与特点
定义
粗糙集理论是一种处理不确定性和模 糊性的数学工具,通过集合近似的方 式描述知识的不完全性和不确定性。
粗糙集理论中的属性约简可以用于简化神经网络的输入特征,降低输入 维度,提高分类或预测的准确率。
粗糙集与遗传算法
01
遗传算法是一种全局优化算法,能够通过模拟自然界的进化过程来寻找最优解 。将粗糙集与遗传算法结合,可以利用粗糙集对数据的分类能力,结合遗传算 法的全局搜索能力,寻找最优的分类规则或决策规则。
02
粗糙集可以用于生成初始的分类规则或决策规则,然后利用遗传算法对这些规 则进行优化,通过选择、交叉、变异等操作,寻找最优的规则组合。
不确定性知识发现的粗糙集理论与方法

经自然科学奖推荐项目公示内容1、项目名称:不确定性知识发现的粗糙集理论与方法2、推荐单位:重庆市科学技术委员会3、项目简介:知识发现与数据挖掘(KDD)概念由 U . Fayyad 教授 1989 年提出。
第一届 K DD 国际会议 1995 年召开后,国际上掀起了知识发现研究热潮。
近年来云计算、物联网、 社交网络等迅猛发展,数据急剧增长,大数据的出现进一步使知识发现研究成为科技界、工业界、金融界等社会各界关注的焦点。
数据已从简单的处理对象转变成为基础性资源。
如何从数据中高效发现有价值的知识,成为世界各国竞争的战略性问题之一。
其中,不确定性知识发现的难度大、价值高,从知识发现研究开始就成为了一个关键瓶颈问题。
项目第一完成人早在上世纪九十年代就开始在国内开展粗糙集研究,利用在西安交大和西南交大作兼职教授的机会,组织两校吴伟志、米据生、李天瑞等一大批青年博士开展粗糙集不确定性知识发现研究,形成一支稳定精干的青年研究队伍。
在科技部、教育部、基金委等部委14 项科研项目持续资助下, 过十多年不懈攻关, 在不确定性知识发现的粗糙集基础理论和模型算法上取得重要突破,并在解决流程工业控制、遥感图像处理、生物信息处理等应用领域的关键问题中发挥了重要作用,部分成果获重庆市自然科学一等奖。
本项目的关键科学发现点为:①首次发现粗糙集代数描述形式与信息熵描述形式之间呈包含关系,修正了学术界长期公认的二者之间等价这一经典结论,建立了不确定性知识的粗糙集近似逼近理论,为不确定性知识发现中的知识表达、特征度量、特征选择奠定了理论基础。
②创建不确定性知识表达的多粒度粗糙集模型,刻画了人脑多粒度认知机理,揭示了知识粒度的演化规律,实现了复杂问题的多粒度求解,突破了传统数据挖掘仅能获取单粒度知识的局限。
③首次建立不确定性知识近似逼近中特征选择的充分性判据和必要性判据,实现了最优特征选择这一NP-hard 问题的粗糙集近似求解。
④创建数据特征驱动的知识发现模型,通过不确定性知识的特征度量,实现了多源异构、海量动态数据的渐进式高效知识发现。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
不确定性信息系统中的知识表达与约简
概念是认知的基本单位,在学习、记忆和推理等认知过程中发挥着重要作用.形式概念分析是表达形式化概念的一种重要理论模型,可以反映概念之间的层次关系,已被广泛应用于软件工程、知识发现、信息检索等领域.经典概念格是建立在完备离散数据的基础上的.但是现实世界的数据往往具有不确定性,如何从不完备、不精确、不一致的数据中获取人们需要的知识,是广大学者一直关注的问题.知识约简是概念格理论研究的一个重要问题.通过知识约简,可以降低概念格的计算复杂度,简化概念格的结构,有利于重要知识的发现.本文主要研究了不确定性信息系统中的知识表达与约简,主要成果包括:1.基于三支决策理论构造了不完备形式背景的三支近似概念格,提出了该模型下的两种属性约简方法.三支近似概念格同时利用包含法和排除法从两个角度表达不确定性概念,便于人们全面地理解不确定性知识.通过将不完备形式背景转化为完备形式背景,揭示了三支近似概念格与经典概念格之间的联系.为简化三支近似概念的表达,提出了两种三支近似概念格的属性约简方法,其中一种基于辨识矩阵和辨识函数,另一种基于△-不可约属性.2.提出了一种基于对象-概念辨识矩阵(OC辨识矩阵)的属性约简方法.通过辨识矩阵计算概念格的属性约简是一种经典方法,被广泛用于各种概念格模型.传统辨识矩阵需要两两比较概念格中的概念,计算复杂度为
O(nl2),其中n表示形式背景中的属性个数,l表示概念格大小.OC辨识矩阵仅需要比较每个对象和不包含该对象的概念,计算复杂度为O(mnl),其中m表示形式背景中的对象个数.一般情况下,m远远小于l,所以OC辨识矩阵的计算复杂度大大降低.结合概念格的偏序关系,构造了简化OC辨识矩阵,仅需比较每个对象和不包含该对象的最大概念,进一步简化了OC辨识矩阵.实验结果表明,本文提出
的方法对多个具有经典外延的概念格模型(包括经典概念格、三支近似概念格、变精度概念格等)有效.3.提出了一种经典生成模糊概念格模型下的基于辨识矩阵的属性约简方法.经典生成模糊概念格是由经典属性子集生成的模糊概念格,具有概念格相对较小、每个概念都比较重要、几乎不依赖模糊逻辑连接等特点,是一种重要的模糊概念格模型.在该模型下,本文提出了基于辨识矩阵和辨识函数的属性约简方法.根据不同属性在构造经典生成模糊概念格时起到的不同作用,将所有属性分为绝对必要属性,相对必要属性和绝对不必要属性,并分析了每类属性的特征.最后,将本文提出的方法应用于变精度概念格模型中的知识约简,完善了变精度概念格的知识约简方法,并通过实例验证了本文方法的有效性.4.提出了一种基于概念格的不协调信息系统中的值约简方法.在计算值约简时面临着两个主要问题.一是在传统值约简计算方法中通常需要先进行属性约简,而这样有可能得不到最优值约简;二是在概率粗糙集模型中,阈值的引入使得决策域(正域、非负域)关于属性子集不满足单调性,在计算属性约简和值约简的时候需要检查所有的属性子集,但是在经典粗糙集模型中,并不存在这一问题.为了解决这两个问题,在经典粗糙集模型中,提出了一种基于概念格的启发式值约简算法FCAVR,该算法不需要进行属性约简而直接获得值约简,简化了计算步骤.在特殊的概率粗糙集模型——决策粗糙集模型中,本文提出了一种将不协调决策表转化成协调决策表的方法,进而将不协调决策表的值约简问题转化成了协调决策表的值约简问题,从而可以用现有算法计算不协调决策表的值约简.实验结果表明,相较于传统算法,FCAVR得到规则集更加简洁.。