知识表示中的不确定性_李德毅

合集下载

云理论——精选推荐

云理论——精选推荐

云模型理论综述云模型理论是李德毅院士及其领导的研究小组所提出的一种全新的理论,它的出现主要用于解决现实系统定性概念与定量数值之间的不确定性转换问题。

目前在很多研究领域用语言表述一个事实时会面临两类问题:模糊性(边界的亦此亦必性)和随机性(发生的概率),当对客观世界给出定性概念后,需要经历将定性概念转化为可以用数字进行定量分析的过程,而在此转化过程中,必然涉及到模糊性和随机性的问题。

传统的模糊性理论作为处理模糊性问题的主要工具,用隶属度来刻画模糊事物的亦此亦彼性,但是这种利用一个精确隶属度函数来描述模糊集的方法,其已经将模糊概念强行纳入确定数据的讨论中,则以此为基础而引申出的叙述和分析都变的不再模糊,这也就是传统的模糊性理论的不彻底性问题。

传统的随机数学是解决模糊概念和定性概念之间的概率性问题的方法,当一个定性概念转化为定量概念后,每个转化后的数据只是依据一定概率存在,但是概念所代表的模糊区间却无法确定。

而云理论则很好地将两者特性结合。

一、云理论的原理和特征云理论的主要特点在于将概念的模糊性和随机性特征结合在一起,解决了非线性与不确定性的问题。

云理论解决概念模糊性和随机性特征的原理如下:其假设一个精确数值量组成的集合{}U x =,称为论域。

T 是与U 相联系的语言值。

U 中的元素x 对于T 所表达的定性概念的隶属度()T C x (或称x 与T 的相容度)是一个具有稳定性的随机数,隶属度在论域上的分布成为隶属云,简称云。

隶属度()T C x 在[0,1]中取值,云是从论域U 到区间[0,1]的映射,即()T C x :[0,1]U −−→ 1、 由于()T C x 是一个随机分布,所以x U ∈到区间[0,1]的映射是一对多的转换,同时由于x 对于T 的隶属度是一个概率分布而非固定值,从而产生的云是一条具有一定厚度的云体,而不是一条清晰的隶属曲线。

2、 云由许多云滴组成,一个云滴是定性概念在定量数据上的一次实现,单个云滴无法表达什么,并且在不同时刻产生的云的细节也可能不尽相同,但是具有整体形状的云却能够反映概念的基本特征。

工业和信息化部副部长怀进鹏 推动创新融合 支撑转型升级

工业和信息化部副部长怀进鹏 推动创新融合 支撑转型升级

24月9日,由工业和信息化部、深圳市人民政府主办,中国电子信息产业发展研究院、中国电子报社协办的新一代信息技术产业发展高峰论坛在深圳会展中心举行。

中国工程院院士李德毅在发言中指出,大数据作为网络时代的一种客观存在,是网络时代人类社会的重要资产,尽管目前对于大数据的认知存在挑战,但聚类将会成为大数据认知的突破口。

大数据用传统工具难以认知李德毅表示,大数据标志着一个新时代的到来,这个时代的特征不只是追求丰富的物质资源,也不只是无所不在的互联网带来的方便的多样化信息服务,同时还包含区别于物质的数据资源的价值发现和价值转换,以及由大数据带来的精神和文化方面的崭新现象。

李德毅进一步指出,大数据来源于人类的测量、记录和分析世界的渴望和无尽的追求。

随着信息技术,尤其是传感器、通信、计算机和互联网技术的迅猛发展和广泛应用,人类获取数据的手段越来越多,速度大大加快、成本急剧降低,层次和尺度更为精细,揭示自然现象和社会现象更加深刻,人联网和物联网又使得人人物物都成为数据源,这样一来,大数据将成为网络时代人类社会的重要资产。

在李德毅看来,大数据本身既不是科学,也不是技术。

它反映的是网络时代的一种客观存在,各行各业的大数据,规模从TB 到PB 到EB 到ZB,都是以3个数量级的阶梯迅速增长,是用传统工具难以认知的、具有更大挑战的数据。

在数据密集型的网络时代,任何传统的“学科”或“行业”的公理、原理和定理组合而成的语境,遇到“互联网+”的挑战,这样一来,“学科”和“行业”拓展成为交叉学科或者“四不像”行业,是“大数据,小模型、小定律、交叉学科”的时代,模型和程序要围绕数据转。

李德毅认为,大数据时代数据量巨大、价值密度低,实时在线,多源异构、混杂敏捷、呈现复杂多样的数据集合,需要跨媒体关联,难以在单机计算架构上聚类,必须依托云计算,进行并行/分布式处理。

聚类成为发现大数据价值第一步李德毅在演讲中指出,尽管大数据在认知上具有挑战性,但是聚类将会成为大数据认知的突破口。

云模型

云模型

云模型云模型(Cloud model)是我国学者李德毅教授提出的定性和定量转换模型。

随着不确定性研究的深入,越来越多的科学家相信,不确定性是这个世界的魅力所在,只有不确定性本身才是确定的。

在众多的不确定性中,随机性和模糊性是最基本的。

针对概率论和模糊数学在处理不确定性方面的不足,1995年我国工程院院士李德毅教授在概率论和模糊数学的基础上提出了云的概念,并研究了模糊性和随机性及两者之间的关联性。

自李德毅院士等人提出云模型至今短短的十多年,其已成功的应用到数据挖掘、决策分析、智能控制、图像处理等众多领域。

定义在随机数学和模糊数学的基础上,提出用"云模型"来统一刻画语言值中大量存在的随机性、模糊性以及两者之间的关联性,把云模型作为用语言值描述的某个定性概念与其数值表示之间的不确定性转换模型.以云模型表示自然语言中的基元——语言值,用云的数字特征——期望Ex,熵En和超熵He表示语言值的数学性质.“熵”这一概念最初是作为描述热力学的一个状态参量,以后又被引入统计物理学、信息论、复杂系统等,用以度量不确定的程度.在云模型中,熵代表一个定性概念的可度量粒度,熵越大粒度越大,可以用于粒度计算;同时,熵还表示在论域空间可以被定性概念接受的取值范围,即模糊度,是定性概念亦此亦彼性的度量.云模型中的超熵是不确定性状态变化的度量,即熵的熵.云模型既反映代表定性概念值的样本出现的随机性,又反映了隶属程度的不确定性,揭示了模糊性和随机性之间的关联.相关系数期望Ex是云在论域空间分布的期望,是最能够代表定性概念的点,或者说是这个概念量化的最典型样本;熵En代表定性概念的可度量粒度,熵越大,通常概念越宏观,也是定性概念不确定性的度量,由概念的随机性和模糊性共同决定.一方面, En是定性概念随机性的度量,反映了能够代表这个定性概念的云滴的离散程度;另一方面,又是定性概念亦此亦彼性的度量,反映了在论域空间可被概念接受的云滴的取值范围;超熵He是熵的不确定性度量,即熵的熵,由熵的随机性和模糊性共同决定。

不确定性人工智能论文

不确定性人工智能论文

Vol.15, No.11 1000-9825/2004/15(11)1583©2004 Journal of Software 软件学报不确定性人工智能∗李德毅1+, 刘常昱2, 杜¿Í¹ÛÊÀ½çÆÕ±é´æÔڵIJ»È·¶¨ÐÔÖÐ,随机性和模糊性是最重要的两种形式.研究了随机性和模糊性之间的关联性,统一用熵作为客观事物和主观认知中不确定状态的度量,用超熵来度量不确定状态的变化,并利用熵和超熵进一步研究了混沌),男,江苏泰县人,博士生导师,中国工程院院士,主要研究领域为人工智能,指挥自动化;刘常昱(1973(1971),男,硕士生,主要研究领域为人工智能.1584 Journal of Software软件学报 2004,15(11) 定性人工智能找到了一种简单处理能力和思维能力.关键词: 熵;超熵;混沌;分形;复杂网络;幂律分布中图法分类号: TP18 文献标识码: A这个世界是确定的还是不确定的?无论在科学界还是哲学界,这都是一个长期争论的重要问题.爱因斯坦说:“上帝不会和我们掷色子”,而玻尔则认为“我们不能断言上帝该做些什么”.以牛顿理论为代表的确定性科学,创造了给世界以精确描绘的方法,将整个宇宙看作是钟表式的动力学系统,处于确定有序的运动之中.只要知道初始条件,就可以决定未来的一切[1].从牛顿到拉普拉斯再到爱因斯坦,描绘的都是一幅幅完全确定的科学世界图景.确定性论者也并非拒绝一切不确定性,但是他们认为产生不确定的原因是对初始条件的测量误差,或者人类自身认知的局限性和知识的不完备,而并非事物的本来面貌.确定性科学的影响曾经如此强大,以至于在相当长的一段时间内限制了人们认识宇宙的方式和视野,虽然生活在到处都有复杂混乱现象的现实世界里,科学家们看到的却只是钟表式的机械世界,科学的任务只是阐明这架钟表的结构和运行规律,而将不确定性看作是无足轻重的,并将其排除在近代科学的研究对象范围之外.也有科学家对确定论提出质疑.麦克斯韦认为这个世界的真正逻辑是概率演算,玻尔兹曼则把随机性观点引入物理学,建立了统计力学.对确定论造成更大冲击的是量子力学的出现.海森堡的测不准原理表明,获得严格精确的初值在原理上是不可能的.这意味着,不确定性是客观世界中的一种真实存在,是存在于宇宙间的基本要素,与人类是否无知没有关系.客观世界中的绝大部分现象都是不确定的,所谓确定的数学经济学心理学复杂性科学和不确定性人工智能才得到了蓬勃发展.当然,不确定性和确定性并非完全对立,在一定程度上可以相互转化.例如,某一层次的不确定性可能是更高层次上的确定性,种种不确定性中还可能隐藏着某些确定的规律等.人工智能学家的任务,就是寻找并且能够形式化地表示不确定性中的规律性,至少是某种程度的规律性,从而使机器能够模拟人类认识客观世界政治经济学是否有用图灵奖获得者赫尔曼•西蒙,从认知科学和行为科学出发,认为“不可避免的是,如果经济学家要与不确定性打交道,就必须理解人类行为面临的不确定性”.科学进入21世纪,不确定性问题的研究工作受到越来越多的关注,但是不确定性的内涵并没有得到公认的模糊性不稳定性和不一致性这5个方面,其中随机性和模糊性又是最基本的.1.1 随机性和随机数学随机性又称偶然性,是指因为事件发生的条件不充分,使得条件与结果之间没有决定性的因果关系,在事件的出现与否上表现出的不确定性质,可以用随机数学作为工具进行研究.在现实世界中,科学家至今没有解释清楚宇宙是怎样形成的.地球的形成和人类的出现有很大的偶然性.地球至少经历了6次生物大规模灭绝,最著名的是6千万年前的恐龙灭绝.如果没有那次灾变,今天的地球是不是恐龙世界?人类是否还能是今天的模样?不仅仅是地球,包括太阳李德毅等:不确定性人工智能1585物种的演变,都含有许许多多偶然的因素.在现实生活中,你有祖父那样的鼻子,你的姐姐有叔父那样的眼睛,你们看着虽然相似,但又不相同,这是生命遗传中的变异.同一物种具有类似的特征,但差异也很明显,在细节上绝不相同.这是由于生物基因中的遗传特征在复制传递的过程中发生了随机的突变,导致新的细胞或个体和它们的祖先有了一些不同,这是当今计算机生物识别的基础.在物种进化中,正是由于随机变异,物种才能不断适应自然,在自然选择中优胜劣汰.随机性真正为人类所认识,要归功于前苏联数学家柯尔莫哥洛夫.他在测度论基础上,于1933年在其一文中,首次提出并建立了概率论的公理化方法,使得人们可以用数学的方法研究随机性,将“随机性”用“概率”予以量化表示.借助于随机变量的分布函数,人们可以研究随机现象的全部统计特征[3].以贝叶斯公式为基础的贝叶斯理论,在人工智能中一直是处理不确定性的重要工具.贝叶斯网用图形模式表示随机变量间的依赖关系,提供一种框架结构来表示因果信息.贝叶斯网可以表达各个节点间的条件独立关系.人们可以直观地从贝叶斯网中得出属性间的条件独立以及依赖关系.另外,贝叶斯网还给出了事件的联合概率分布,根据网络结构以及条件概率表可以得到每个基本事件的概率.贝叶斯理论利用先验知识和样本数据来获得对未知样本的估计,而概率是先验信息和样本数据信息在贝叶斯理论中的表现形式.这样,贝叶斯理论使得不确定知识表示和推理在逻辑上非常清晰并且易于理解.此外,在基于概率的不确定性知识表示研究方面,Shortliff等人提出了带可信度的不确定推理,之后,Dempster和Shafer又提出证据理论,引入信任函数和似然函数来描述命题的不确定性.证据理论满足比概率论弱的公理,又称为广义概率论.当先验知识很难获得时,证据理论可以区分不确定和不知道的差异,比概率论更合适.而当先验概率已知时,证据理论就变成了概率论.1.2 模糊性和模糊数学模糊性又称非明晰性.它的出现是由于概念本身模糊,一个对象是否符合这个概念难以确定,在质上没有明确含义,在量上没有明确界限.这种边界不清的性质,不是由人的主观认识造成的,而是事物的一种客观属性.概念外延的不确定性质,可以用模糊数学作为工具来研究.天空中变幻莫测的云彩突然的一场大雾,每个人都熟悉这类现象,但是却无法准确地描述它们的形状.这是因为这类现象没有明确的边界,外观形状不规则极其复杂突变的界限,这也是一种模糊性.1965年,美国学者L.A. Zadeh创建了模糊集合论,提出了模糊信息的处理方法.模糊集合论的贡献在于引入了集合中元素对该集合的“隶属度”,从而将经典集合论里的特征函数取值范围由二值{0,1}推广到区间[0,1],将经典二值逻辑推广至多值逻辑,使得模糊性可以用[0,1]上的区间来度量[4].由Pawlak提出的粗糙集理论[5],Gau 和Buehrer提出的Vague集理论[6],都是对模糊集的扩充.粗糙集通过上下边界,Vague集通过对模糊对象赋予真模糊规则模糊语义网1586 Journal of Software软件学报 2004,15(11)本趋于无穷等等.模糊理论利用隶属函数精确刻画模糊现象的亦此亦彼性,却忽略了隶属函数本身的不确定性.这两种理论可以分别处理随机性和模糊性,没有考虑二者之间的关联性.更何况,研究客观世界和主观世界中的不确定性也并非总是要从这样的角度切入.实际上,随机性和模糊性常常是连在一起的,难以区分和独立存在,作为人类思维和认知载体的语言,表现得尤为明显.近十几年来,我们在随机数学和模糊数学的基础上,提出用云模型来统一刻画语言值中大量存在的随机性信息论社会科学中大量的随机现象都服从正态分布,正态云模型及其普遍适用性[10]受到了人们的普遍关注.当然,不确定性还包含不完全性分形和复杂网络在不确定现象中,混沌准确的预报也是不可能的.亚马逊河热带雨林中的一只蝴蝶搧动了两下翅膀,可能两周之后会引发美国德克萨斯州的一场龙卷风,这个有趣的“蝴蝶效应”反映的是混沌现象初始条件的微小差别能引起结果的巨大差异.这一效应在自然界和人类社会中无数次出现,正所谓“失之毫厘,差以千里”[11~13].混沌理论研究如何从貌似无序而实际有序决策和情绪,不可能用静态的数学模型来描绘人类的精神和思想.人类思维是一个多尺度系统,神经元联系着各种微观尺度与宏观尺度,这与流体力学中的湍流十分相似.利用混沌学还可以进一步探索动态联想记忆,并应用到模式识别等领域.例如,利用混沌理论进行非线性预测和决策,利用混沌现象对初始值的敏感依赖性,构成模式识别系统等. 从20世纪90年代开始,人们进一步将混沌和神经网络结合起来,提出多种混沌神经网络模型,探索应用混沌理论的各种信息处理方法,例如,在神经元模型中引入神经元的不应性,研究神经元模型的混沌响应不定性时间衰减常数等参数的性质,以及这些参数和神经网络混沌响应的关系等等.实验结果李德毅等:不确定性人工智能1587表明,这种由混沌神经网络模型绘出的图形和脑电图极为相似[14].2.2 分形20世纪70年代,Mandelbort把分形引入自然科学.一个启发性的问题是“英国的海岸线有多长”,答案是,长度随着尺度的不同而不同.许多自然现象,离开尺度来谈就毫无意义.同样,人工智能中的数据挖掘和知识发现,如果离开发现尺度来谈也没有意义.科学家们目前沿着“宏观的更宏观四通八达的江海河川地表的形状树状云彩人类社会中存在大量的复杂不规则现象和无尺度的不确定现象,如湍流金融市场的价格波动等.这类无尺度无序,但是通过对大量现实数据的分析,科学家们发现价格变化存在无尺度粗略的估计[15].分形图像压缩是分形理论的一个成功应用,基于局部函数迭代系统的分形图像压缩技术可以得到很高的压缩比和不错的压缩效果.2.3 复杂网络具有小世界效应和无尺度特性的复杂网络近年来备受人们关注.大量的真实网络,如因特网电力网食物链混沌现象.混沌宏观与微观分形和复杂网络近20年来的发展,为研究人类复杂的不确定行为提供了新的理论.人是一个能够感知处理视觉嗅觉温度觉思维不确定的信息.人们正试图构建具有复杂网络特性的认知模型,模仿以神经元为基本组成单元的中枢神经系统.近年来,人们也试图将神经网络模型进化算法等与混沌混沌和复杂网络理论探索人的心智和思维机理的研究刚刚起步,但是已受到越来越多的学者的重视.1588 Journal of Software软件学报 2004,15(11) 3 人类认知过程的不确定性如果从存在论和认识论两个角度理解不确定性,以上讲的主要是存在论意义上的不确定性,下面从认识论意义上讨论人自身认知过程中的不确定性.人类的认知,实质上是客观世界的一种映像.客观世界的不确定性,决定了人类主观认知过程的不确定性.3.1 感知的不确定性以视觉为例,人睁开眼睛就能看见这个五彩缤纷的世界.人从外界感知的信息中大约有80%是通过视觉得到的.所谓“眼见为实”,真的如此吗?以图1为例,有人看到的是一个少女,而有些人看到的则是一个老妇人.这是因为视觉对图像的不同部位注意程度有差异,注意整体还是注意局部,使得人们对相同的事物看到不同的结果.只注意到头发和衣领间的局部,可把它看成少女的侧面;而如果将少女的下巴部位看成是鼻子,少女的项链部位看成是嘴,就变成了一幅老妇人的画像.这就是视觉的不确定性.视觉还会有错觉.对于图2,人们会认为小圆内部的圆比大圆内部的圆要大,而实际上它们一样大.背景的干扰使得人们产生了错觉.眼睛还会因为光照色彩Fig.1 Uncertainty in visual perception 图1 视觉感知的不确定性Fig.2 An optical perception illusion 图2 视觉感知的错觉图3(a)和图3(b)是两个左右对称的人脸像,有人会觉得图3(a)开心,图3(b)不开心;而在有些人看来则恰恰相反.这是感知不确定性的又一个例子.事实上,与光学平面镜被动地映射出的客观世界不同,眼睛感知的视觉信息常常是模棱两可的.外部世界经过视觉神经的过滤和选择,并且根据个体人的经验知识对这些信息做出不同的解释.包括视觉在内的所有感知觉都是主动的过程,因而带有一定的主观性和不确定性.其实,我们对这个世界的感知基本上都是不确定的,对同一对象,不同的人有不同感受.感知常常是建立在主体先前的活动和经验的基础上的,主体的自我意识经验知识兴趣价值观念等等无不渗透与影响着人们对客观世界的感受.因此,面对同一个感知对象,由于个人认知结构的不同,对感知对象的认识与理解也会出现差异,从而出现不确定性[18,19].(a)(b)Fig.3 Happy or unhappy?图3 开心还是不开心?人在不同尺度上的感知也具有不确定性.从广阔的银河系外的空间看地球,地球自身的大小被忽略,是一个0维的点.在太阳系中,比如乘航天飞机看地球,地球是三维的球体,而在飞机上看地球是球面,或者是平面,倘若站在旷野上环顾左右,则又是另一番景色.人类智能可以从极不相同的粒度或者尺度上观察和分析同一问题,而且还能很快地从一个粒度世界跳到另一个粒度世界,往返自如,这也是人类不确定性智能的魅力所在.李德毅等:不确定性人工智能15893.2 记忆的不确定性记忆是人类智能的另一个基本方面,对于人类的学习和解决问题能力的培养十分重要.我们大脑中能够储存许多有用的知识和信息,为我们的心理发展社会活动提供必要的认知基础.但是记忆常常是不准确的,随着时间的推移,记忆中事物的面貌模模糊糊的印象,但却能长时间地保持记忆,并且在需要的时候仍然能把记忆中的有用信息提取出来[19].不少学者从事心象方面的研究,试图用心象来解释记忆的特性,我们在文献[20]中提出,用数据场来模拟人类的认知过程,用数据场的影响因子sigma来解释记忆随时间而模糊的现象.图4反映了人脸的记忆淡忘过程.Sigma=0Sigma=0.02Sigma=0.04Sigma=0.06Sigma=0.1Fig.4 Fading of a face from memory图4 人脸的记忆淡忘过程3.3 思维的不确定性人类的思维有精确的一面,更有不确定的一面,尤其是涉及联想顿悟等形象思维时,更没有确切的规律可言.人类习惯于用自然语言进行思维,思维的结果往往是可能如何直觉的创造的形象思维来认识客观世界,几乎不可能像计算机一样做精确的运算或者严密的逻辑推理,和计算机相比,人脑并不具备快速灵活的高级智能.可以说,在人类思维活动中,不确定的形象思维占据了绝大部分,与确定的更到位心理和认知活动.因此,无论研究人类智能还是人工智能,应该从研究自然语言开始;研究不确定性人类智能和不确定性人工智能,也应该从研究自然语言的不确定性开始.十多年来,我们以自然语言值为切入点,建立定性和定量转换模型云模型[7,8,10],其基本原因就在于此.自然语言带有模糊性是显而易见的.人类感觉器官感受的客观事物往往是连续的,例如温度气味热”“丑”等描述人类感官的词语,“一堆”“两点左右”等描述数量的词语,还有在日常生活中使用频率很高的“很”“也许”“差不多”¶þ¼¶À©Õ¹×Ö¿â¾Í·´Ó³ÁËÕâÒ»ÌØÐÔ.1590 Journal of Software 软件学报 2004,15(11)自然语言中的不确定性,本质上来源于人脑思维的不确定性.这非但没有妨碍反而更加便利了人们的使用和交流.人脑的思维过程从来不是纯数学的更严密的符号语言,与自然语言相比,它们过分地机械化和理想化了,缺少随机混沌严密的符号语言“计算”,而直接利用自然语言来“思考”,这才是人工智能的方向.这也许就是Zadeh 呼吁的“computing with words”的方向. 5 不确定性的计算机模拟认识到不确定性在宇宙间广泛存在,确定性只是在某一个尺度上表现,是人类认识世界的重大进步.它提醒我们:不确定性是理解人类智能和机器智能之间巨大差别的关键所在.不确定性人工智能,必须超越不确定本身而寻求不确定中的基本规律性,寻求表示并处理不确定性的理论和方法,使机器能够模拟主客观世界的不确定性,使定性的人类思维可以用带有不确定性的定量方法去研究,最终使机器具有更高的智能,在不同尺度上模拟和代替人脑的思维活动.不确定人工智能要以机器为载体,模仿人类智能,必须找到人脑的定性分析和机器的定量处理之间建立联系的方法.这个任务首先要由形式化来担当.5.1 随机性模糊性及其关联性的描述和计算机模拟.图5(a)是3位射手的射击记录,统计方法用二维正态分布来反映弹着点在靶上的分布,前提是每次射击相互独立,并且不考虑天气心理等)的影响,弹着点在靶标上只是近似呈正态分布,(a)(b)(c)李德毅等:不确定性人工智能1591 模云型用超熵来反映偏离正态分布的程度,如天气模糊性以及二者之间的关联性.5.2 分形不确定性的计算机模拟花草树木的形状常常都有分形性质,随着计算机图形学的发展,人们可以越来越方便地模拟生物的各种形态.分形最基本的性质是它的自相似性.这一性质为分形图形的计算机模拟提供了理论基础,通过简单的迭代,结合确定算法或者随机算法,可以生成复杂多变的植物形态.有许多生成分形图形的算法,如L系统随机插值模型等等.云模型可以与分形迭代相结合,把不确定性思想融入分形迭代算法中,可以更直观地反映生物进化过程中的变异性.设分形树按照规则R产生:1. 以长度为L的线段为初始树干,从L顶部出发,左偏α°,生成长度为L*sl(0≤sl≤1)的左树枝1,右偏β°,生成长度为L*sr(0≤sr≤1)的右树枝2.2. 从左树枝1的顶部出发,左偏(α+α)°,生成长度为L*sl*sl的左树枝3,右偏(β+β)°,生成长度为L*sr*sr的右树枝4;从右树枝2顶部出发,左偏(α+α)°,生成长度为L*sl*sl的左树枝5,右偏(β+β)°,生成长度为L*sr*sr 的右树枝6.3. 重复2,叠代至M次结束,由2(M+1)−1条线段构成一个二叉树形状,称为分形树.例如,规则R中参数取α=β=40°,sl=sr=0.7,M=11,生成的分形树如图6中的期望树所示.Expectation tree V ariation 1 V ariation 2V ariation 3V ariation 4V ariation 5Fig.6 Simulate random variations by cloud-transfer parameters sets图6 对参数集进行云变换模拟随机变异如果以图6中的期望树为云模型的期望,对参数集Ex={α=β=40°,sl=sr=0.7}进行云变换,生成5个云滴,即图6中的5棵变异树.如果以图7中的期望树为云模型的期望,对规则R进行云变换,生成5个云滴,即图7中的5棵变异树.其中两次云变换的数字特征均为En={0.05,0.05,0.1,0.1},He={0.001,0.001,0.01,0.01}.按此方法,无论对分形参数集还是对分形规则集做云变换,都能够产生成千上万的变异树.1592 Journal of Software软件学报 2004,15(11) Expectation tree V ariation 1 V ariation 2V ariation 3V ariation 4V ariation 5Fig.7Simulate random variations by cloud-transfer rules sets图7 对规则集进行云变换模拟随机变异云分形的思想能够很好地表示不确定性知识中的联系与差异.在具体的应用背景下,云的期望数据集有不同含义,可以是地形地貌特征种族遗传特征等等.与一般随机分形不同,云分形产生的随机数据集是期望的变异,熵反映了变异程度的大小,超熵则衡量了所有数据集分布偏离某一标准分布的程度.期望数据集和扩展规则集结合起来,可以得到不同的算法,产生不同的图形,反映植物遗传网络拓扑变异中的关联性和不确定性.5.3 网络拓扑不确定性的计算机模拟网络的拓扑结构存在许多不确定因素,实际中的许多网络都是随机某段链路中断等;交通路线发生交通事故,或者因天气原因中断交通等等,都会造成网络拓扑的变化.网络拓扑可以用邻接矩阵来表示,将邻接矩阵作为云模型的期望数据集,对其进行云变换,可以模拟网络拓扑结构的随机变化.图8中的第1幅是某省通信网的网络拓扑简单示意图,将其邻接矩阵作为期望拓扑,再对期望拓扑进行云变化,即得到各种和期望网络拓扑既相似又不同的网络拓扑云滴.如果考虑网络的带宽和流量,那么除了对网络的邻接矩阵进行随机变化以外,通过建立带宽或者流量数据集,并以此数据集为期望进行随机变化,可以得到有带宽表示的网络拓扑.图9是网络拓扑及流量的随机模拟图.这样,通过网络拓扑结构的生成和模拟,可以表示现实网络拓扑结构和负载的动态变化.Expectation topology V ariation 1 V ariation 2V ariation 3V ariation 4V ariation 5Fig.8 Random simulation of the communication network topology图8 通信网络拓扑的随机模拟李德毅等:不确定性人工智能1593Expectation network V ariation 1 Variation 2V ariation 3V ariation 4V ariation 5Fig.9 Random simulation of the communication network topology and traffic图9 通信网络拓扑及流量的随机模拟6 结语人工智能在模拟人类的确定性智能逻辑思维方面,已经取得很大成就.但是,在人类不确定性智能的模拟方面始终没有太大的进展,而在模拟人类形象思维方面尚处在探讨阶段.因此,不确定性人工智能是人工智能中的研究热点,也是人工智能中的重大前沿课题[22,23].人脑的神奇就在于它的形象思维能力,在于它解决处理不确定性问题的能力.大脑并不是靠“规则”或者“定理”解决不确定性问题,更不是靠精确的数理分析和计算来处理不确定现象,很多对计算机而言十分困难的问题,对大脑来说却简单思维情感等奥秘远未揭开,脑科学和认知科学完全模拟人类的智能和情感还为时过早,期待脑科学物理学脑科学认知学处理能力和思维能力.References:[1] Newton I; Wang KD, Trans. Philosophiae Naturalis Principia Mathematica. Wuhan: Wuhan Press, 1992 (in Chinese).[2] Handy C. Beyond Certainty: The Changing World of Organization. Pennsylvania: Harvard Business School Publishing, 1998.[3] Wang ZK. Applications of the Probability. Beijing: Beijing Normal University Press, 1995 (in Chinese).[4] Li HX, Wang PZ. Fuzzy Sets. Beijing: National Defence Industry Press, 1994 (in Chinese).[5] Pawlak Z. Rough sets. Int’l Journal of Computer and Information Sciences, 1982,11(5):341~356.[6] Gau WL, Buehrer DJ. Vague sets. IEEE Trans. on Systems, Man and Cybernetics, 1993,23(2):610~614.[7] Li DY, Meng HJ, Shi XM. Membership clouds and membership cloud generators. Computers Research and Development, 1995,32(6):16~21 (in Chinese with English abstract).[8] Li DY. Uncertainty in knowledge representation. Engineering Science, 2000,2(10):73~79 (in Chinese with English abstract).[9] Qiu WH. Management Support and Applied Entropy. Beijing: China Machine Press, 2002 (in Chinese).[10] Li DY, Liu CY. Study on the universality of the normal cloud model. Engineering Science, 2004,6(8):28~34 (in Chinese withEnglish abstract).万方数据。

多源时空数据融合的大坝性状多维云评价模型

多源时空数据融合的大坝性状多维云评价模型

DOI:10.3969/j.issn.1672-2469. 2020. 07.025多源时空数据融合的大坝性状多维云评价模型李萌,罗天文,徐锐,赵朝彬,李意(贵州省水利水电勘测设计研究院,贵阳贵州550002)摘要:文章以某拦河闸坝工程为例,运用基于多维正态云模型的大坝性状综合评价方法,实现大坝监测数据和评 语等级定性与定量之间的转化,以监测数据云所产生的云滴为输入,通过多维云规则发生器逐层开展多属性评估 并确定大坝综合性状等级。

分析表明此方法具有可行性。

关键词:大坝性状;综合评价;多源时空数据融合;多维云模型中图分类号:TV698.2 文献标识码:A文章编号:1672-2469(2020)07-0118-06水库大坝是保障国民经济的重要基础设施,由于建设规模大、工作条件特殊复杂,运行过程中存 在潜在的重大安全风险,一旦失事将威胁上下游人 民生命财产安全。

目前,大坝运行性状综合评价研 究受到众多学者的关注[1-],其中以监测资料为基 础利用现代数学理论和系统工程方法将多种监测效 应量联系起来已取得一定的成效。

何金平[5]等在 _ -S证据理论的基础上引人证据融合系数建立了高 拱坝多效应量融合模型;施玉群[6]等结合信息熵和 聚类分析方法实现了大坝健康状态定量诊断/刘 晗[7]等利用理想点法测定评价对象的安全度值提出 了混凝土坝长期运行安全评价模型。

以上研究成果从不同角度丰富了大坝性状综合 评价的理论体系,然而考虑到影响大坝性状的因素 较多,评价过程中同时存在模糊性与随机性,因此 寻求更加合理有效的评价手段,对准确掌握大坝真 实性状、预示工程险情具有重要意义。

云模型是李德毅院士[8]等在传统模糊数学和统 计数学的基础上,利用特定构造算法,建立的一种 定性概念与其定量表达之间的不确定性转换模型,由于它在揭示模糊性和随机性间内在关联上具有一 定的优越性,现已在大坝性状综合评价相关研究中 得到较为广泛的应用。

知识表示中的不确定性

知识表示中的不确定性

作者: 李德毅
作者机构: 中国电子系统工程研究所,北京100840
出版物刊名: 中国工程科学
页码: 73-79页
主题词: 知识表示 定性概念 不确定性 云模型 数字特征 人工智能 生成算法 云滴
摘要:知识表示一直是人工智能研究中的一个瓶颈,其难点在于知识中隐含有不确定性,即模糊性和随机性。

文意提出用云模型3个数字特征(期望值,熵,超熵)来描述一个定性概念,用熵来关联模糊性和随机性。

代表定性概念的云的某一次定量值,被称为云滴,要以用它对此概念的贡献度来衡量,许许多多云滴构成云,实现实性和定量之间的随时转换,反映了知识表示中的不确定性。

论文以此对我国农历24个节气进行了新的最化解释。

云方法已经用于数据开采、智能控制、跳频电台和大系统效能评估中,取得明显的效果。

基于云模型的改进R=P×C风险评价法

基于云模型的改进R=P×C风险评价法

基于云模型的改进R=P×C风险评价法吴贤国;翟海周;张立茂;覃亚伟;王彦红【摘要】由于工程的复杂性以及施工过程中的不确定性,准确评价工程风险的难度在不断增大.R=P×C风险定级法是一种能够综合考虑风险事件概率和后果的风险评估方法,但在评估过程中难以处理工程领域普遍存在的不确定性问题.本文提出了基于云模型的改进R=P×C风险评价方法.该方法通过云模型对评估中P和C存在的不确定性因素进行模拟分析;结合专家群决策对定性概念的模糊性和随机性进行有效集成,实现定性和定量相互间的转换;利用云模型的不确定性推理技术,统筹考虑风险事件本身及推理过程的不确定性,最终确定风险评价等级R的云模型;并运用到武汉地铁盾构施工风险评价中取得良好效果,可为同类复杂工程安全管理提供决策参考.【期刊名称】《土木工程与管理学报》【年(卷),期】2014(031)001【总页数】6页(P37-42)【关键词】云模型;R=P×C;不确定性推理;风险评价【作者】吴贤国;翟海周;张立茂;覃亚伟;王彦红【作者单位】华中科技大学土木工程与力学学院,湖北武汉430074;华中科技大学土木工程与力学学院,湖北武汉430074;华中科技大学土木工程与力学学院,湖北武汉430074;华中科技大学土木工程与力学学院,湖北武汉430074;河南广播电视大学,河南郑州450008【正文语种】中文【中图分类】U455.1工程安全风险评价对于有效控制风险,防止风险事件发生具有重要的意义。

但是由于工程施工过程和外部环境中不可避免地存在大量的模糊性与随机性等不确定性因素,工程施工中的不确定性和复杂性大大增加了工程中风险准确评价的难度,因此,研究如何做好在不确定条件下复杂工程的风险评价是一个重要的课题。

目前在工程领域针对风险评价的研究取得了较多研究成果,如李俊松等[1]利用可靠度理论实现对基坑失稳风险的评价,汪明武等[2]利用联系数和三角模糊数随机模拟对围岩稳定性风险实现综合,王凤山等[3]利用可拓理论对地下工程围岩稳定性风险进行了评价,宫志群等[4]对地铁盾构区间隧道施工风险进行了分析及评价。

云模型简介

云模型简介

第三章云模型简介在人类认知以及进行决策过程中,语言文字是一种强有力的思维工具,它是人类智能和其他生物智能的根本区别。

人脑进行思维不是纯粹地应用数学知识,而是靠自然语言特别是客观事物在人脑中的反映而形成的概念。

以概念为基础的语言、理论、模型是人类描述和理解世界的方法。

自然语言中,常常通过语言值,也就是词来表示概念。

而语言值、词或概念与数学和物理的符号的最大区别就是其中包含太多的不确定性。

在人工智能领域,不确定性的研究方法有很多,主要有概率理论,模糊理论,证据理论和粗糙集理论;对于确定性系统的不确定性的研究还有混沌和分形的方法。

这些方法从不同的视角研究了不确定性,优点是:有切入点明确、边界条件约束清楚、能够对问题进行深入研究等,但是在研究中常常将不确定性分成模糊性和随机性分开进行研究,然而两者之间有很强的关联性,往往不能完全的分开。

随机性是指有明确定义但是不一定出现的事件中所包含的不确定性。

例如在投掷硬币试验中,硬币落地时要么有国徽的一面向上,要么标有分值的一面向上,结果是明确的可以预知的,但是每次试验结果是随机的。

概率论和数理统计是研究和揭示这种随机现象的一门学科,至今已有几百年的研究历史.模糊性是另一种不确定性,是已经出现的但是很难精确定义的事件中所包含的不确定性。

在日常工作和生活中存在着许多模糊概念,如“胖子”“年轻人”“收入较高”等。

为处理这些模糊概念,引入了模糊集的概念[41],使用隶属度来刻画模糊事物彼此间的程度。

隶属度函数常用的确定方法有模糊统计法、例证法专家经验法等,这些方法确定隶属度函数的过程是确定的,本质上说是客观的,但每个人对于同一个模糊概念的认识理解存在差异,因此有很强的主观性,而且一旦隶属度函数确定之后,得到的概念、定理等包含着严密的数学思维,其不具有任何模糊性。

针对上述问题李德毅院士在传统的概率统计理论和模糊理论的基础上提出了定性定量不确定性转换模型——云模型,实现定性概念和定量值之间的不确定性转换。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

则对样本空间中的部分元素来说 , 它们属于射中的 程度可能不同 , 用 0 和 1 之间的数值来反映这种中 介过渡性[4 ] 。模糊学就是研究和揭示模糊现象的 规律性的一门学科 。射中与射不中可以用弹着点对 目标靶的隶属度表示 。将目标从靶心开始分为十个 等级表示击中目标的程度 , 依次为 10 环 、9 环 、 …、1 环 , 跑靶为 0 环 , 对应的隶属度分别为 1 , 019 , …, 011 , 0 , 其 对 应 的 二 维 隶 属 函 数 见 图 2a , 用弹着点在靶纸上所处环数作为射击的成绩 。 射手的总体水平 , 还可以借助统计学 , 采用公式
计算 , 每一次的随机熵 E′n 不同 , 导致云滴的离散 性 , 包含云边缘的不分明和云厚度的不均匀 ; 根据 算法第 3 步计算 , 任何时候都会有 0 < z ≤1 。我们
可以认为函数 :
z = exp -
(
x - Ex) 2 2 En x2
+
(
y - Ey) 2 2 Eny2
是云的数学期望曲线 。如果已经知道若干云滴 , 可
[ 收稿日期 ] 2000 - 05 - 19 ; 修回日期 2000 - 07 - 04 [ 基金项目 ] “八六三”高技术资助项目 (863 - 309 - ZT06 - 07 - 02) 和 “九七三”高技术资助项目 ( G1998030508 - 40) [ 作者简介 ] 李德毅 (1944 - ) , 男 , 江苏泰县人 , 中国工程院院士 , 北京电子系统工程研究所研究员 , 博士生导师
图 2 二维隶属函数和二维云模型比较 Fig12 comparison of 2D membership f unction and 2D cloud model
不确定性有两种 : 随机性和模糊性 。统计学和 模糊学用各自的方法认识客观世界 , 形成不同的评 价结果 。
通常 , 人们更习惯于用自然语言值而不是精确 数值来评价射手水平 。为此 , 云理论研究者提出云 方法 。射手射中或射不中带有随机性 , 射中的程度
(
x 2
- Ex) 2 E′n x 2
+
(
y - Ey) 2 2 E′n y2
y , z) 为一个云滴 , 它是该云表
示的语言值在数量上的一次具体实现 , 其中 ( x ,
y) 为定性概念在数域中这一次对应的点的位置 ,
z 为 ( x , y) 属于这个语言值的程度的量度 ;
5) 重复步骤 1 到步骤 4 , 直到产生满足要求数
模糊学家认为 , 中与不中的是相对的 , 取决于 弹着点离靶心的距离 , 难以明确一个边界对中与不 中进行精确的划分 , 这种亦此亦彼的事件中所包含 的不确定性 , 称为模糊性[2 ,3 ] 。如果样本空间 s = ( e) 中的元素 e 代表不同的弹着点 , 把 “肯定射 中”用数字 1 表示 , “肯定不中”用数字 0 表示 ,
性 。文章提出用云模型 3 个数字特征 (期望值 , 熵 , 超熵) 来描述一个定性概念 , 用熵来关联模糊性和随机性 。 代表定性概念的云的某一次定量值 , 被称为云滴 , 可以用它对此概念的贡献度来衡量 , 许许多多云滴构成云 , 实现定性和定量之间的随时转换 , 反映了知识表示中的不确定性 。论文以此对我国农历 24 个节气进行了新的量 化解释 。云方法已经用于数据开采 、智能控制 、跳频电台和大系统效能评估中 , 取得明显的效果 。
[ 关键词 ] 知识表示 ; 定性概念 ; 不确定性 ; 云模型 ; 数字特征
1 从一个例子谈起
云是对不确定问题的一种描述方法 。刚开始接 触云时 , 对云模型难以有深刻的认识 , 人们往往会 拿它和统计学方法或模糊学方法相比较 , 将云模型 简单地看作为随机加模糊 、模糊加随机 、二次模糊
或二次随机等 。为了消除这些疑惑 , 下面从一个射 击的例子谈起 。
74
中国工程科学
第2卷
( e) , e 为样本空间的事件 , 对于试验的结果 , 引 入变量 x , 其值分别规定为 0 和 1 。对应于样本空 间的每个独立事件 , 变量 x 取不同的值 , 因而 x 可以作成是定义在样本空间上的函数 。X ( e) 为 随机变量 。在大量重复试验时 , 变量的取值具有统 计规律性 。概率论和数理统计就是研究和揭示随机 现象的统计规律性的一门学科[1 ] 。用中与不中来 衡量每一次射击结果 , 统计射手射击若干次后中靶 的次数 (频数) 来反映射手的总体水平 。例如 , 射 手甲经过 10 次射击 , 9 次上靶 , 一次跑靶 , 则射 手的击中概率为 0. 9 , 按照百分制计总成绩 , 可 为 90 分 , 射手乙和丙的十次射击全部上靶 , 成绩 都为 100 分 。因此 , 射手乙和丙的水平相当 , 都优 于甲 。
给定云的三个数字特征 : 期望值 Ex 、熵 En 和超熵 He , 可以通过一维正态云发生器的算法生
成云滴[5 ] 。
给定二维正态云的数字特征 : 期望值 ( Ex , Ey) 、熵 ( En x , En y ) 和超熵 ( He x . He y ) , 可以
通过以下二维正态云发生器的算法生成云滴 :
又带有模糊性 , 每次射击的弹着点可以看作是一个 云滴 , 射击若干次后形成的云团的整体特征反映了 射手总体水平 。用定性的语言来描述这些云团 , 例 如对上述三位射手的射击情况 , 可认为 “射手甲略 偏右上且不够稳定 , 射手乙略偏右下但较稳定 , 丙 的射点靠近靶心但不稳定”。云方法提出用 3 个数
以计算出它们所代表的正态云的三个数字特征 : 期
望值 Ex , 、熵 En 和超熵 He , 称之为反向云发生 器 , 也可以构造带条件的正态云发生器 。还可以利
用类似方法构造其他分布的云发生器 , 如泊松云 、
Г云等 。
Байду номын сангаас
如果用二维正向正态云发生器来生成不同数量
的云滴 , 可以大致还原 3 位射手的水平 。图 4 中分
2000 年 10 月 第 2 卷第 10 期
学术论文
中国工程科学 Engineering Science
Oct 12000 Vol12 No110
知识表示中的不确定性
李德毅
(中国电子系统工程研究所 , 北京 100840)
[ 摘要 ] 知识表示一直是人工智能研究中的一个瓶颈 , 其难点在于知识中隐含有不确定性 , 即模糊性和随机
n
S CO R E = ρ w i计算总成绩 , 其中 n 为射击次数 , i=1
w i 为第 i 次击中的环数 。因为射手甲的射击记录 为 : 5/ 0/ 7/ 6/ 6/ 6/ 6/ 5/ 7/ 5 , 乙的射击记录 为 : 5/ 9/ 7/ 8/ 6/ 6/ 3/ 9/ 5/ 7 , 丙的射击记录 为 : 9/ 9/ 5/ 7/ 9/ 8/ 2/ 4/ 9/ 6 。借助统计学的 模糊学方法给出他们的总成绩分别为 53 分 、65 分 和 68 分 , 射手丙的成绩最优 , 射手乙的成绩优于 甲 。这里的 53 分 、65 分以及 68 分与统计学家所 给的 90 分 、100 分是不同的概念 。
1) 产生一个期望值为 ( En x , En y) , 均方差为 ( He x , He y) 的二维正态随机熵 ( E′n x , E′n y) ;
2) 产生一个期望值为 ( Ex , Ey ) , 均方差为 ( E′n x , E′n y) 的二维正态随机数 ( x , y) ;
3) 计算
z = exp 4) 令 ( x ,
2 可还原性 ———云滴的生成算法
云是用自然语言值表示的某个定性概念与其定 量表示之间的不确定性转换模型 。云由许多云滴组 成 , 每一个云滴就是这个定性概念在数域空间中的 一次具体实现 , 这种实现带有不确定性 , 设 A 是 一个集合 A = { a } , 称为语言域 。关于语言域 A 中的语言值 a , 是指其映射到数域空间 X 的任意 点 x 都存在一个有稳定倾向的数μA ( x ) , 叫做 x 对 a 的确定程度 。云的数字特征用期望值 Ex , 熵 En , 超熵 He 三个数值表征 , 它把语言值中的模糊性和 随机性关联到一起 , 构成定性和定量相互间的映 射 , 作为知识表示的基础 。其中 Ex 可以认为是所 有云滴在数域中的重心位置 , 反映了最能够代表这 个定性概念在数域的坐标 。 En 是定性概念亦此亦 彼性的度量 , 反映了在数域中可被语言值接受的数 域范围 , 即模糊度 ; 同时还反映了在数域中的这些 点能够代表这个语言值的概率 。 He 是熵 En 的离 散程度 , 即熵的熵 , 反映了每个数值代表这个语言 值确定度的凝聚性 , 也反映云滴的凝聚程度 。
第 10 期
李德毅 : 知识表示中的不确定性
75
字特征 (期望值 , 熵 , 超熵) 来描述整个云团 , 实 现定性和定量之间的转换 。由于多方面的随机因素 (天气 、心理等等) 的影响 , 射手很难每一次都击 中靶心 , 其多次射击的弹着点在靶纸上呈近似正态 分布 。因此 , 用二维正态云模型 ( Ex1 , Ex2 ; En1 , En2 ; He1 , He2) (如图 2b) 来描述总的射击情况 : 期望值 ( Ex1 , Ex2) 是所有云滴 (弹着点) 在靶纸 上的平均点的坐标 , 反映了射手对准心的把握 , 是
专家 统计学家 模糊学家
表 1 对射手射击情况的不同评价结果 Tab1e 1 Estimation result s for t he t hree shooters
射手甲
射手乙
射手丙
90
100
100
53
65
68
总评 乙同丙 , 甲最差 甲最差 , 丙最优
云理论 研究者
期望 (0108 , 011) , 偏右上 ; 熵 ( 0145 , 013 ) , 超 熵 ( 0105 , 0107) , 较离散 , 不稳定
相关文档
最新文档