浅谈粒度计算

合集下载

浅谈粒度计算

浅谈粒度计算

浅谈粒度计算摘要:粒度计就是新近兴起得人工智能研究领域得一个方向,本文简单介绍粒度计算得要紧三个方法,以及之间得关系.关键词:粒度计算、模糊逻辑、商空间理论、粗糙集理论.一.引言人们在考虑咨询题时,或者是先从总体进行观看,然后再逐步深入地研究各个部分得情况;或先从各个方面对同一咨询题进行不同侧面得了解,然后对它们进行综合;或是上面两种方法得组合,即时而从各侧面对事物进行了解,然后进行综合观看,时而综合观看后,对不甚了解得部分再进行观看……总之,依照需要从不同侧面、不同角度反复对事物进行了解、分析、综合、推理最后得出事物本质得性质和结论人工智能研究者对人类这种能力进行了深入地研究,并建立了各种形式化得模型本文要介绍得粒度计算,确实是对上述咨询题得研究得一个方面人工智能最要紧得目得是,为人类得某些智能行为建立适当得形式化模型,以便利用计算机能再显人得智能得部分功能.什么是人类得最要紧得智能,或者讲智能得最重要表现形式是什么.各家有不同得看法,如simon等认为人得智能表现为,对咨询题求解目标得搜索(search)能力.比如学生在证明一道平面几何题目时,进行考虑,“聪慧得小孩”能非常快地寻到证明该结论得有关得定理性质,并非常快地应用上去,从而就得到证明.wwwM“数学能力差得学笨赡芏椅餮埃也坏胶鲜实亩ɡ砗托灾剩评慈迫ィ艿貌坏街っ鞯囊欤籔awlak[p1]则认为人得智能表现为对事物(事件、行为、感知等)得分类(classification)能力.如平常我们讲某大夫本领大,确实是这位大夫能从病人得症状中,正确地诊断出病人是患什么病(分类能力!分出患什么病来)等等.我们认为“人类智能得公认特点,确实是人们能从极不相同得粒度(granularity)上观看和分析同一咨询题.人们不仅能在不同粒度得世界上进行咨询题求解,而且能够非常快地从一个粒度世界跳到另一个粒度得世界,往返自如,毫无困难.这种处理不同世界得能力,正是人类咨询题求解得强有力得表现”[zh1].还有非常多不同得理解,人们正是从这些不同得理解分不建立各自得模型和相关得理论和方法.粒度计算目前国际上有三个要紧得模型和方法,下面简单进行介绍.二三种不同得模型下面简单介绍有关“粒度计算”得三个不同得模型和方法.什么是粒度,顾名思义,确实是取不同大小得对象.也确实是讲,将原来“粗粒度”得大对象分割为若干“细粒度”得小对象,或者把若干小对象合并成一个大得粗粒度对象,进行研究.最近zadeh在[za1]-[za3]中,讨论模糊信息粒度理论时,提出人类认知得三个要紧概念,即粒度(granulation)、组织(organization)、因果(causation)(粒度包括将全体分解为部分,组织包括从部分集成为全体,因果包括因果得关联).并进一步提出粒度计算.他认为,粒度计就是一把大伞它覆盖了所有有关粒度得理论、方法论、技术和工具得研究.指出:“粗略地讲,粒度计就是模糊信息粒度理论得超集,而粗糙集理论和区间计就是粒度数学得子集”.zadeh 得工作激起了学术界对粒度计算研究得兴趣,yyyao和他得合作者对粒度计算进行了一系列得研究[y1]-[y3]并将它应用于数据挖掘等领域,其工作得要点是用决策逻辑语言(dl-语言)来描述集合得粒度(用满足公式f元素得集合,来定义等价类m(f)),建立概念之间得if-then关系与粒度集合之间得包含关系得联系,并提出利用由所有划分构成得格,来求解一致分类咨询题.这些研究为知识挖掘提供了一些新得方法和角度.按zadeh粒度计算得定义,我们提出得商空间理论和pawlak得粗糙集理论都属于“粒度计算”范畴.目前有关粒度计算得理论与方法,要紧有三个.一是zadeh得“词计算理论”(theory of works computing),一是pawlak得“粗糙集理论”(theory of rough set),另一个是我们提出得“商空间理论”(theory of quotient space).下面简单介绍三者得内容:1 词计算理论:zadeh认为人类在进行考虑、推断、推理时要紧是用语言进行得,而语言是一个非常粗得“粒度”,如我们讲“九寨沟得风景非常美”,其中“非常美”那个词就比较“庞统”,也确实是讲其粒度非常粗,如何利用语言进行推理推断,这确实是要进行“词计算”,早在二十世纪六十年代zadeh提出模糊集理论,确实是“词计算”得雏型.沿zadeh得模糊集论得方向,用模糊数学得方法进行有关粒度计算得方法和理论得研究,就构成“粒度计算”得一个特别重要得方法和方向.这也是人们比较熟悉得一个方法.2 粗糙集理论:波兰学者pawlak[p1]在二十世纪八十年代,提出得粗糙集理论,他提出一个假设:人得智能(知识)确实是一种分类得能力,那个假设可能不是非常完备,但却特别精练.在此基础上提出,概念能够用论域中得子集来表示,因此在论域中给定一组子集族,或讲给定一个划分(所谓划分,是指将x分成两两不相交得子集之并).从数学上明白,给定x上得一个划分,等价于在x上给定一个等价关系r.pawlak称之为在论域上给定了一个知识基(x,r).然后讨论一个一般得概念x(x中得一个子集),如何用知识基中得知识来表示,确实是用知识基中得集合得并来表示.对那些无法用(x,r)中得集合得并来表示得集合,他借用拓扑中得内核和闭包得概念,引入r-下近似r-(x)(相当于x得内核)和r-上近似r-(x)(相当于x得闭包),当r-(x)¹r-(x)时,就称x为粗糙集从而创立了“粗糙集理论”.目前粗糙集理论已被广泛应用于各个领域,专门是数据挖掘领域,并获得成功.3基于商空间得粒度计算我们认为概念能够用子集来表示,不同粒度得概念就体现为不同粒度得子集,一簇概念就构成空间得一个划分----商空间(知识基),不同得概念簇就构成不同得商空间故粒度计算,确实是研究在给定知识基上得各种子集合之间得关系和转换以及对同一咨询题,取不同得适当得粒度,从对不同得粒度得研究中,综合猎取对原咨询题得了解这种对粒度得理解与模糊集对粒度得理解不完全一样下面简单介绍基于商空间得粒度计算.31商空间模型下得推理模型商空间得模型用一个三元组来表示,即(x,f,t),其中x是论域,f是属性集,t是x上得拓扑结构当我们取粗粒度时,即给定一个等价关系r (或讲一个划分),因此我们讲得到一个对应于r 得商集记为[x],它对应于得三元组为([x],[f],[t]),称之为对应于r得商空间商空间理论确实是研究各商空间之间得关系、各商空间得合成、综合、分解和在商空间中得推理.在那个模型下,可建立对应得推理模型,并有如下得性质a 商空间模型中推理得“保假原理”(或“无解保持原理”)b 商空间模型中推理合成得“保真原理”所谓“保假原理”是指若一命题在粗粒度空间中是假得,则该命题在比它细得商空间中一定也无解.所谓“保真原理”,是指,若命题在两个较粗粒度得商空间中是确实,则(在一定条件下),在其合成得商空间中对应得咨询题也是确实.这两个原理在商空间模型得推理中起到非常重要得作用,如若我们要对一个咨询题进行求解,当咨询题十分复杂时,常先进行初步分析,即取一个较粗粒度商空间,将咨询题化成在该空间上得对应得咨询题,然后进行求解,若得出该咨询题在粗粒度空间中是无解,则由“保假原理”,马上得原咨询题是无解得.因为粗粒度得空间规模小,故计算量也少,如此我们就能够以非常少得计算量得出所要得结果,达到“事半功倍”得目得.同样利用“保真原理”也可达到落低求解得复杂性目得,设在两个较粗空间x1、x2上进行求解,得出对应得咨询题有解利用“保真原理”可得,在其合成得空间x3上咨询题也有解.设x1、x2得规模分不为s1、s2.因为一般情况下,x3得规模最大可达到s1s2.因此将原来要求解规模为s1s2空间中得咨询题,化成求解规模分不为s1、s2得两个空间中得咨询题.马上复杂性从“相乘”落为“相加”.四.商空间理论、粗糙集理论和模糊集理论之间得关系41在模型上三者基本上描述人类能按不同粒度来处理事物得能力得模型商空间理论、粗糙集理论认为概念能够用子集来表示,不同粒度得概念能够用不同大小得子集来表示,所有这些表示能够用等价关系来描述.词计算理论认为概念是用“词”来表示,而描述“词”得有效得方法确实是模糊集理论. 42研究得对象商空间理论、粗糙集理论、词计算理论都将所讨论得对象得集合构成论域,但讨论对象之间得关系时,却各有不同.粗糙集理论得原型可能是由关系数据库抽象而得得,故其模型为(x,f)(其中x是论域,f是属性集),即通过元素得不同属性值,来描述元素之间得关系,并用元素按不同属性进行得分类来表示不同得概念粒度.商空间理论得原型是分层递阶方法,故其模型为(x,f,t)(其中x是论域,f是属性集,t是x 上得拓扑结构)即除了元素得属性外,还引入元素之间得关系t(用拓扑来描述),从那个意义上来讲,粗糙集理论是商空间理论得一个简单得特例.所以各自研究得着重点和侧重点不同.当给定一个等价关系时,粗糙集理论认为是给定一个知识基,然后讨论任给得一个概念(集合)在那个知识基上如何被表示为知识基上集合之并,以及之间得关系.粗糙集理论要紧利用集合得基数(元素个数)之间得关系,来描述概念之间得隶属关系,如此在一定程度上与模糊集概念联系起来.另外,粗糙集理论还讨论如何利用属性来最简单地表示所对应得知识基,这确实是所谓“简约”咨询题.但因模型缺乏描述元素之间得相互关系得手段,故非常难提取有结构论域中有关结构所提供得信息.所以结构在一定意义下也能够看成是元素得某种属性,但这种属性是多元属性(要用多元函数来表达),一般不能表示为f(x),而要用f(x,y,)表示,如距离要用d(x,y)表示商空间理论着重点不同,它不是只针对给定得商空间(知识基)来讨论知识得表达咨询题,而是在所有可能得商空间中,寻出最合适得商空间,利用从不同商空间(从不同角度)观看同一咨询题,以便得到对咨询题不同角度得理解,最终综合成对咨询题总得理解(解)它得求解过程是在“由所有商空间组成得半序格”中运动转换得过程故可看成是宏观得粒度计算而粗糙集理论是在给定得商空间中得运动,故可看成是微观得粒度计算词计算理论与商空间理论、粗糙集理论稍为不同,它要紧研究(从粒度计算得观点来看它)如何描述由词界定得不同粒度得对象,它更擅长描述由形容词、副词表达得不同粒度得概念,如特别好、非常好、好、非常不错、还好,…等等因为这些词有程度不同得差不,故在一定意义下,词计算理论也给出了描述元素之间得关系,但只限于由属性得强弱程度不同所形成得关系从理论上讲,将商空间理论、粗糙集理论看成是“精确”得粒度计算,那么都可在其模型上引入模糊得概念,得模糊得商空间理论,和模糊得粗糙集理论在[zh2]中我们证明:模糊得等价关系,等价于在某个商空间上得归一等腰距离.即,可将它化成有结构得商空间.因此这三者都可统一地用多尺度得商空间理论来表示如设商空间理论中原来得结构是一距离d1(x,y),那个d1是元素在空间”位置”关系得描述, 而由模糊概念引入得距离d2,能够看成是元素之间得属性关系得描述属性是对元素个体性质得描述,而尺度是对元素之间关系得描述(所以也可看成是多元属性)若属性值是取值于一个良序集上时,多可用模糊集来描述将三者有机地结合起来,对进展粒度计算将有重大意义.43 结构得重要性最后阐述在粒度计算中结构得重要性,在咨询题求解时,人们多从一组前提动身,盼望由它通过一系列得推导,得到结论.若将每个步骤用箭头相连,则得到由前提到目标得一条有向路.或更一般,咨询题求解可看成是在某有结构得空间中,求一条由前提到目标得有向路(或一条路径),因此当空间得结构是拓扑空间时,关于咨询题求解得解得存在性咨询题,就等价于在空间中回答“前提与目标是否处在同一线连通成份中”.而求解咨询题,确实是在有解情况下,求从前提到目标得一条有向路径.利用商空间中粗空间对细空间得“保假性”,(即:若咨询题在粗空间中无解,则在比它细得空间一定也无解)通过合理得分层递阶,可大大落低咨询题求解得复杂性.我们对常遇到得结构如:半序结构、距离结构以及一般拓扑结构,其对应得商空间得构成及不同商空间得综合都给出有效得构造性得算法.对什么情况下分层递能够落低计算复杂性,能落低多少等,我们在[z1]中也进行了详细地论述.在[zh3]中还把统计推断方法引入商空间模型,为多层信息综合、不确定推理、定性推理等,建立数学模型和相应算法,有效落低了计算复杂性.有结构得模型在实际咨询题求解中是经常遇到得,如地理信息中其地理位置之间得关系确实是一个距离结构;在数据仓库中各数据之间得关系可用半序来描述,它也是一种结构;又在路径规划中对象所处空间得位置关系,确实是一种距离得结构;在数据挖掘中得规则发觉,所有得规则全体按其包含关系就构成半序结构等等.在这些有结构得对象中进行咨询题求解利用基于商空间理论得粒度计算将是非常有效得.商空间得方法与目前流行得“粗糙集”方法相同之处在于:基本上利用等价类来描述“粒度”,基本上用“粒度”来描述概念.但讨论得着重点有所不同,我们得着重点是研究不同粒度世界之间得互相转换、互相依存得关系,是描述空间关系学得理论;而目前得粒度计算(如粗糙集理论等)要紧是研究粒度得表示、刻划和粒度与概念之间得依存关系.更要紧得不同在于:我们得理论是在论域元素之间存在有拓扑关系得情况下进行研究得,即论域是一个拓扑空间,而现在得粗糙集理论,其论域只是简单得点集,元素之间没有拓扑关系(只是商集理论,而不是商空间理论),故它们讨论得是无结构得特别情况.另外,粗糙集是在给定得知识基上求解对应得咨询题,如求集合得r-上近似和r-下近似,我们是在(x,t)中讨论各商空间之间得关系,求相应得(各种意义下)上近似空间和下近似空间.从那个角度看,能够讲粗糙集是微观得粒度计算,商空间理论是宏观得粒度计算.这两个理论基本上建立在等价关系之上,所有能够将两者结合起来.zadeh 所讨论得粒度计算与pawlak和我们所讨论得粒度咨询题又有些不同,他要紧是讨论粒度得表示咨询题,他们认为人类是用语言进行各种考虑和推理得,不同得词就表示不同得粒度,那么如何表示它们呢?一般来讲用“语言”、“词(word)”来表示得概念,牵涉到“词计算”咨询题.而词计算,现在最流行得方法是“模糊数学”得方法,因此他得出得结论是:模糊数学应是粒度计算得要紧工具之一.依zadeh得看法,pawlak和我们讨论得粒度是“清楚得粒度”,而他自己讨论得是“模糊粒度”.如何将模糊集得方法引入商空间理论中来,这可从几方面着手进行,一是在论域x上引入模糊集;二是在结构t上引入模糊拓扑结构;三是对我们得核心概念等价关系,引入模糊概念.以上简单介绍了商空间理论、词计算理论、粗糙集等粒度计算方法之间得关系.能够看出这三个不同得粒度计算理论,从考虑咨询题得动身点和解决咨询题得任务,都不尽相同,各有千秋.然而三者都有一个共同得特点,那确实是都考虑到人类智能中,有从不同粒度考虑咨询题得这一特点.如何将三者得优点结合起来,形成更强有力得粒度计算得方法和理论,是今后一个重要得研究课题.一个明显可进行得研究是:将商空间理论与粗糙集方法相结合,或讲将粗糙集方法引入商空间理论中来,或讲在商空间理论中同时讨论微观得粒度计算咨询题,将微观和宏观得粒度计算统一起来,构成一个更加完整得粒度计算理论和方法,将会更有效得.参考文献[p1] z pawlak, rough sets theoretical aspects of reasoning about data, kluwer academic publishers, dordrecht, boston, london, 1991[y1] y y yao, granular computing: basic issues and possible solutions proc of fifth joint conference on information sciences, voli, atlantic city, new jersey, usa, 2000:186-189[y2] yy yao, and x li, comparison of rough-set and interval-srt models for uncertain reasoning, fundamental informatics, 27,1996:289-298[y3] yy yao and ning zhong, granular computing using information table, in ty lin, yy yao, and l a zadeh (editors) data miming, rough sets and granular computing, physica-verlag, 2000:102-124 [za1] l a zadeh, fuzzy logic=computing with words, ieee transactions on fuzzy systems, 4, 1996:103-111[za2] l a zadeh, towards a theory of fuzzy information granulation and its centrality in human reasoning and fuzzy logic, fuzzy sets and systems, 19, 1997:111-127[za3] l a zadeh, announcement of grc, 1997, csureginaca/~yyao/grc/[zh1] 张钹,张铃《咨询题求解得理论及应用》,清华大学出版社,1990)(英文版bo zhang and ling zhang, theory and application of problem solving, north-holland, elsevier science publishers bv 1992)[zh2] 张铃张钹模糊商空间理论(模糊粒度计算方法)“软件学报”,14(4)2003:770-776 [zh3] zhang ling,zhang bo,statistical genetic algorithm, chinese journal of software vol8,no5:335-344(张铃,张钹,统计遗传算法《软件学报》8(5),1997:335-344.。

粒度分析原理

粒度分析原理

粒度分析原理
粒度分析是一种常用的材料表征方法,通过对材料颗粒的大小
分布进行研究,可以揭示材料的颗粒结构特征,为材料的性能和应
用提供重要参考。

粒度分析原理是基于颗粒在不同尺度下的分布情况,通过一系列实验和数据处理方法,得出材料颗粒的大小分布规律,为材料科学研究和工程应用提供重要依据。

首先,粒度分析原理基于颗粒的尺度效应。

在材料中,颗粒的
尺度效应是指颗粒在微观尺度下的特性和行为。

颗粒的大小分布对
材料的性能和行为有重要影响,因此需要进行粒度分析来揭示颗粒
在不同尺度下的分布规律。

其次,粒度分析原理基于颗粒的形态特征。

颗粒的形态特征包
括颗粒的形状、表面特性等,这些特征对材料的性能和应用具有重
要影响。

通过粒度分析,可以得出颗粒的形态特征参数,为材料的
设计和改进提供科学依据。

另外,粒度分析原理还基于颗粒的分布规律。

颗粒在材料中的
分布规律对材料的性能和行为有重要影响,通过粒度分析可以得出
颗粒在不同尺度下的分布规律,为材料的制备和加工提供重要参考。

总之,粒度分析原理是基于颗粒的尺度效应、形态特征和分布规律,通过一系列实验和数据处理方法,揭示材料颗粒的大小分布规律,为材料科学研究和工程应用提供重要依据。

粒度分析在材料科学、化工、土木工程等领域具有重要应用,对于揭示材料的微观结构特征、改进材料的性能和应用具有重要意义。

综上所述,粒度分析原理是一种重要的材料表征方法,通过揭示材料颗粒的大小分布规律,为材料科学研究和工程应用提供重要依据。

粒度分析在材料领域具有广泛的应用前景,对于推动材料科学的发展和促进工程技术的进步具有重要意义。

流程梳理颗粒度计算公式

流程梳理颗粒度计算公式

流程梳理颗粒度计算公式颗粒度计算公式流程梳理。

颗粒度是指物质的粒子大小或颗粒的大小分布。

在工程和科学领域中,颗粒度的计算对于材料的性质和应用具有重要意义。

颗粒度计算公式是用来确定材料颗粒大小的数学表达式,通过这些公式可以得出材料的颗粒大小分布情况,从而为工程设计和科学研究提供重要参考。

颗粒度计算公式的梳理包括了颗粒度的定义、常用的颗粒度计算公式以及计算流程。

本文将从这三个方面对颗粒度计算公式进行详细的梳理,希望能够对读者有所帮助。

一、颗粒度的定义。

颗粒度是描述材料颗粒大小和分布的参数,通常用来表示材料颗粒的粗细程度。

在工程和科学领域中,颗粒度对于材料的性质和应用具有重要的影响。

颗粒度可以通过颗粒度分析仪器进行测试和测量,也可以通过计算公式进行估算和预测。

二、常用的颗粒度计算公式。

1. 平均颗粒直径计算公式。

在颗粒度分析中,常用的一个参数是平均颗粒直径。

平均颗粒直径可以通过颗粒度分布曲线来计算,也可以通过以下公式进行估算:D = Σ(ni di^2)/Σni。

其中,D表示平均颗粒直径,ni表示第i个颗粒级别的颗粒数,di表示第i个颗粒级别的颗粒直径。

2. 颗粒度分布计算公式。

颗粒度分布是描述材料颗粒大小分布情况的参数,通常通过颗粒度分布曲线来表示。

颗粒度分布可以通过以下公式进行计算:n(x) = kx^m。

其中,n(x)表示颗粒直径为x的颗粒数,k和m为常数。

3. 最大颗粒直径计算公式。

最大颗粒直径是描述材料中最大颗粒的大小,可以通过以下公式进行计算:Dmax = Σ(ni di)/Σni。

其中,Dmax表示最大颗粒直径,ni表示第i个颗粒级别的颗粒数,di表示第i 个颗粒级别的颗粒直径。

三、颗粒度计算公式的流程梳理。

1. 收集颗粒度数据。

首先需要收集材料的颗粒度数据,包括颗粒分布情况和颗粒直径数据。

可以通过颗粒度分析仪器进行测试,也可以通过实验和观察进行数据收集。

2. 计算平均颗粒直径。

根据收集到的颗粒度数据,可以使用平均颗粒直径计算公式进行计算,得出材料的平均颗粒直径。

云计算的核心技术——粒度计算

云计算的核心技术——粒度计算
三、粒度计算的实例-----MapReduce 1、MapReduce是基于多粒度和变粒度的分布式处理技术, MapReduce模式的思想是将要执行的问题拆解Map(映射)和Reduce (化简)的方式,先通过Map程序将数据切割成不相关的区块, 分配(调度)给大量计算机处理到达分布运算的效果,再通过 Reduce程序将结果汇整,输出开发者需要的结果。 MapReduce的软件实现是指定一个Map(映射)函数,把键值对 (key/value)映射成新的键值对(key/value),形成一系列中 间形式的key/value对,然后把它们传Reduce(化简)函数,把具 有相同中间形式key的value合并在一起。Map和Reduce函数具有一 定的关联。 Map(k1,v1)->list(k2,v2) Reduce(k2,list(v2))->list(v2) 其中v1,v2可以是简单数据,也可以是一组数据,对应不同的 映射函数规则。在Map过程中将数据并行,即把数据用映射规则分 开,而Reduce则把分开的数据用化简函数规则合在一起,也就是 说Map是一个分的过程,Reduce则对应着合,从而达到多粒度和变 粒度的计算。MapReduce应用广泛,包括简单计算任务,海量输入 数据,集群计算环境等。 2、Google云计算执行过程 MapReducede运行环境有两种不同类型的节点组成:Master和 Worker。Worker负责数据处理,Master负责任务调度及不同节点 之间的数据共享。具体执行流程如图1。 (1)利用MapReduce提供的库将输入数据切分为M份,每份的 大为16~64MB,然后在计算机集群上启动程序。 (2)Master节点的程序负责为所有Worker节点分配子任务,
2、云计算的服务是非常个性化的,是多粒度和可变粒度 的。

粒度计算的理论, 模型与方法

粒度计算的理论, 模型与方法

第43卷 第5期2004年10月复旦学报(自然科学版)Journal of Fudan University(Natural Science)Vol.43No.5Oct.2004 文章编号:042727104(2004)0520837205Ξ粒度计算的理论、模型与方法李道国1,2,苗夺谦1,张红云1(1.同济大学计算机科学与工程系,上海 200092;2.太原理工大学阳泉学院,阳泉 045001)摘 要:粒度计算(Granular Computing,GrC)是信息处理的一种新的概念和计算范式,覆盖了所有有关粒度的理论、方法、技术和工具的研究.它是词计算理论、粗糙集理论、商空间理论、区间计算等的超集,也是软计算科学的一个分支.它已成为模糊的、不完整的、不精确的及海量的信息处理的重要工具和人工智能研究领域的热点之一.另着重介绍了粒度计算的研究现状、基本问题、主要模型与方法,并提出了进一步的研究方向.关键词:粒度计算;词计算理论;粗糙集理论;商空间理论中图分类号:TP393 文献标识码:A1 粒度计算的研究现状粒度计算是信息处理的一种新的概念和计算范式,覆盖了所有有关粒度的理论、方法、技术和工具的研究1,现已成为人工智能领域研究的热点之一.20世纪60年代,美国著名数学家Zadeh提出模糊集合论,在此基础上,于1979年首次提出并讨论了模糊信息粒度化问题,推动了模糊逻辑理论及其应用的发展,但在当时未引起足够的重视.接着,Zadeh在1996年提出“词计算理论”2,标志着模糊粒度化理论的诞生.其旨在解决利用自然语言,进行模糊推理和判断,以实现模糊智能控制.随后,美国多特蒙德大学的Helmut Thiele教授于1998年发表了“词计算理论的语义模型”3,促进了词计算理论的发展.词计算理论对因特网上的海量信息资源的高效利用有着深远的影响.基于Zadeh的模糊集论,进行粒度计算理论和方法的研究,已成为“粒度计算”的重要研究方向之一.波兰学者Pawlak于1982年提出了粗糙集理论4.由于粗糙集理论具有很强的定性分析能力,能够有效地表达不确定的或不精确的知识,善于从数据中获取知识,并能利用不确定、不完整的经验知识进行推理等,因此在知识获取、机器学习、规则生成、决策分析、智能控制等领域获得了广泛应用,特别是在数据挖掘领域,获得了巨大成功,业已成为粒度计算研究领域的主要方向之一.加拿大Regina大学教授Y.Y. Yao在研究粗糙集理论的基础上,提出了基于邻域系统的粒度计算模型5,并成功应用于知识发现领域.粒度计算作为专门的术语,首次出现在Zadeh的文献6中.后来,T.Y.Lin、Y.Y.Yao和Zadeh又在文献7中着重描述了粒度计算的重要性,这激发了人们对它的研究兴趣.随后,大量的关于粒度计算研究的文献相继发表,而且在国际上形成了专门的研究群体,定期召开关于粒度计算的国际研讨会.在国内,张钹院士和张铃教授提出了基于商空间的粒度计算模型8.其利用子集来表示概念,不同粒度的概念就体现为不同粒度的子集,一簇概念就构成空间的一个划分———商空间(知识基),不同的概念簇就构成不同的商空间.而粒度计算问题,也就等价于研究在给定知识基上的各种子集合之间的关系和转换.对同一问题,可以采取不同的粒度,通过对不同的粒度的分析,综合获取对原问题的求解.在此基础上,张铃、张钹于2003年提出了模糊商空间理论9.总的来看,粒度计算的研究在国内属于起步阶段,尚Ξ收稿日期:2004205212基金项目:国家自然科学基金资助项目(60175016)作者简介:李道国(1965—),男,副教授,博士生;苗夺谦(1964—),男,教授,博士生导师.838复旦学报(自然科学版) 第43卷未引起广泛关注.但我们相信,不久的将来会有越来越多的学者加入到该领域的研究中来.2 粒度计算的基本问题粒度计算的基本问题包括两个主要的方面,一个是如何构建信息粒度,另一个是如何利用粒度去计算.前者处理粒度的形成、粗细、表示和语义解释,而后者处理怎样利用粒度去求解问题.信息粒度的形成、表示、粗细、语义解释;信息粒子的大小;信息粒度粗细与求解有效度的关系;信息粒度的运算法则;信息粒度之间及其与外部环境的关系等,这些内容构成一个粒度世界.粒度世界是否构造得合理极大地影响着问题求解的效率.定义1 (粒度)设给定论域U和U上的一个关系R∶U P(U),]U=∪G i,则称每一个G i为一i∈τ个信息粒子,{G i}i∈τ是论域的一种粒度.其中,P(U)表示论域U的幂集;R可代表等价关系、不可区分关系、功能相近关系、相似关系、相等关系、约束、相容关系、复合关系、模糊关系、属性、投影、结构关系和一般的函数等.当Πi,j∈τ,i≠j]G i∩G j= ,则称{G i}i∈τ是论域的无重叠粒度划分,简记为{G i}i∈τ=[U;当ϖi,j∈τ,i≠j]G i∩G j≠ ,则称{G i}i∈τ是论域的一种覆盖,简记为{G i}i∈τ=<U>.定义2 (粒子的大小)设U是给定的一个论域,粒度划分U=∪G i,则称粒子G的大小为d(G)=i∈τCard(G)=|G|=∫G d x.注意:当论域为离散情形时,积分表示信息粒子G所含个体的总个数,也可能是可列个;当论域为连续状态时,积分表示信息粒子G长度的度量值,也可能是无穷大或不可数;当G为模糊信息粒子时,公式中的G表示集合{x|μG(x)>0,Πx∈U}.定义3 (信息粒度粗细)设 是论域上关系的全体,且R1,R2∈ ,若对Πx,y∈U,x R1y]x R2y,则称R1比R2细,简记为R2<R1.一个关系代表一种分类,因此,也可表示粒度粗细.设R0<R1<R2<…<R end,表示一个嵌套关系簇,其中R0代表论域本身是一个等价类,即最粗的划分;R end代表Πx,y∈U,x R end yΖx=y,即最细的划分;其他的表示中间层次的划分.注意:同一论域的粒度之间存在不能比较粗细的情形.我们知道,信息粒度的粗细影响着计算复杂度和问题的求解效度.在问题求解过程中,同一个粒度世界或不同粒度世界所要求描述的信息含量和相互变换决定了信息粒度的粗细优化.粒度计算的目的就是在误差允许的范围内,尽量找到计算复杂度最小的足够满意的可行近似解.因此,可以认为粒度计算是降低计算复杂度的有效工具.总之,如何在问题求解时选择恰当的粒度层次,以使求解效度达到最佳,这是粒度计算的一个关键内容之一.3 粒度计算的主要模型与方法3.1 基于模糊集合论的词计算模型Zadeh认为人类在进行思考、判断、推理时主要是用语言进行的,而语言是一个很粗的粒度,如何利用语言进行推理判断,这就是要进行“词计算”.狭义的模糊词计算理论是指利用通常意义下的数学概念和运算,诸如,加、减、乘、除等构造的带有不确定或模糊值的词计算的数学体系.它借助模糊逻辑概念和经典的群、环、域代数结构,构造出以词为定义域的类似结构.例如,模糊数及其运算2.尽管这种数值型模糊粒度的理论体系,在模糊控制、图像识别、语言处理、故障诊断、信息检索、人工智能等领域获得了较大的成功.但是由于自身存在的不足限制了它的应用范围.广义的模糊词计算理论统指用词进行推理、用词构建原型系统和用词编程.总之,基于词计算理论的推理、决策和识别方式是最贴近人类的思维形式来求解问题,它对复杂的系统的信息处理有着广阔的应用前景.3.2 基于粗糙集理论的粒度计算模型基于知识代表分类的能力的观点,Pawlak创立了粗糙集理论.粗糙集理论的核心思想是给定一个论域U (有限的非空集合),及论域U 上的一个等价关系R ΑU ×U ,称序对(U ,R )是一个近似空间或知识库.在近似空间中,等价关系将论域U 分割成两两互不相交的等价类,每一个等价类对应一个粒子,等价关系的实质是从论域U 到论域U 的幂集2U 上的一个映射R ∶U 2U ,同时称商集U/R ={x ]R |Πx ∈U}是近似空间的一组知识基,也代表了论域的一种粒度.这样对于论域上的任何一个子集X (近似空间的一个概念)就可以用它的上、下近似算子来刻画,其中,(1)apr (X )=R (X )={x |x ∈X ,x ]R ΑX }为X 的下近似,表示论域中完全肯定隶属于X 的元素组成的集合,即代表X 包含的最大内核;(2)apr (X )= R (X )={x |x ∈U ,x ]R ∩X ≠ }为X 的上近似,表示论域中所有肯定和有可能隶属于X 的元素组成的集合,即代表包含X 的最小闭包.在粗糙集理论中,一个对象是否隶属于某一集合(概念),不是该元素的客观性质,而是取决于我们对它的了解程度,同样,集合的相等和包含也没有绝对的意义,也是取决于我们对所研究的问题中的集合的了解程度,这更符合人类的认知过程.而且对一些特殊类型的信息系统,例如数据挖掘等,Pawlak 的粗糙集理论获得了巨大成功.但它同样存在着“瓶颈”问题,诸如,(1)知识表示依赖于论域上的关系;(2)缺少有效处理现实问题的代数运算体系;(3)缺乏基本粒度的语义解释;(4)缺乏描述粒度之间结构信息的方法等.3.3 基于商空间的粒度计算模型张钹院士和张铃教授在研究问题求解时,独立地提出了商空间理论.该模型是用一个三元组(U ,F ,T )来描述一个问题,其中U 表示论域,F 是属性集,T 是U 上的拓扑结构.在该模型中,论域的一种粒度化就等同于给定一个等价关系R 或一个划分,于是得到一个对应于R 的商集[U ,对应的三元组为([U ,F ,T ]),称之为对应于R 的商空间.商空间理论就是研究各商空间之间的关系、合成、综合、分解和推理.它的最重要的性质是同态原则,即保真原理(或保假原理).当面对一个复杂问题时,常先将问题化成在一个较粗粒度商空间对应的问题进行初步分析,若得出该问题在粗粒度空间中是无解,则由“保假原理”,立即得原问题是无解的.这样我们就可以以很少的计算量得出所要的结果,达到“事半功倍”的目的.同样利用“保真原理”也可达到降低求解的复杂性目的.在此基础上建立了“粒度世界模型”以及一整套理论和相应的算法,并将其应用于启发式搜索、路径规划等方面,取得一定成效.他们又将模糊集合论引入商空间,利用模糊等价关系实现了商空间模型的推广,这必将有助于粒度计算的发展,能够更好地反映人类处理不确定问题的若干特点,诸如信息的确定与不确定、概念的清晰与模糊等都是相对的,都与问题的粒度有关.因此,构造合理的分层递阶的粒度结构,可以高效地求解问题和处理信息.另一方面,商空间理论同样缺少实现粒度与粒度之间、粒度与粒度世界之间、粒度世界与粒度世界之间转换的手段和技术方法.如果能够探索出有效的技术和方法来解决这个问题,将会拓宽商空间的应用范围,极大丰富粒度计算的理论.另外,基于模糊集合论产生的Shadowed Sets 7,用三元组(0,1,0,1)描述一个模糊集合,将模糊性局限在影集中,优越于隶属函数的表示方法,减少了运算过程中有用信息的损失,缩短了模糊集与粗糙集的概念和算法的距离,使它更有效地求解一些特殊类型的问题.区间理论、定性分析理论、量化理论和证据理论都是粒度计算的一种工具,对它们的研究也不可忽视.经典的分组、聚类和分类方法在许多应用领域获得了不少成功,形成了比较完善的理论体系,对粒度计算有着重要的指导意义和借鉴价值.4 模型之间的关系分析对三种主要模型的比较分析,有益于我们深刻理解它们之间的联系与区别,有益于我们找到它们的融合点,实现构建统一的更加有效的处理复杂和模糊的信息系统的理论平台.模糊集和粗糙集理论都能够处理不确定和不精确的问题.然而它们的侧重点不同,模糊集合论中的对象x 的隶属度不依赖于论域中的其他对象,一般是由专家直接给出,因此带有很强的主观性且缺乏精度的概念;而粗糙集理论中对象的隶属函数值却依赖于知识库,它可以从所需处理的数据中直接得到,所938第5期 李道国等:粒度计算的理论、模型与方法048复旦学报(自然科学版) 第43卷以用它来反映知识的模糊性是比较客观的.同时二者也存在着联系,因为近似空间中的任何一个子集A (概念)实际上都对应于一个模糊集μA,其上下近似分别等价于该模糊集的核和支撑,即:R(A)= core(μA)={x|μA(x)=1}, R(A)=supp(μA)={x|μA(x)>0}.由此可见,下近似是μA的12截集,上近似是μA的强02截集.总之,模糊集合论与粗糙集理论有很强的互补性,这两个理论优化、整合去处理知识的不确定性和不完全性已显示出更强的功能.例如,Shadowed Sets是在模糊集合的框架体系上发展起来的,但处理信息的方法却类似于粗糙集,在一些领域的应用显示出了优势.还有许多的模糊粗糙集混合模型解决了一些单一模型无法解决的实际问题.这说明,理论的融合是求解复杂问题的一种有效途径.商空间理论与粗糙集理论都是利用等价类来描述“粒度”,再用“粒度”来描述概念.但是,讨论的出发点有所不同.商空间理论的着重点是研究不同粒度世界之间的互相转换、互相依存的关系,是描述空间关系学说的理论,而粗糙集理论主要是研究粒度的表示、刻画和粒度与概念之间的依存关系;商空间理论是在论域元素之间存在有拓扑关系的前提下进行研究的,即论域是一个拓扑空间,而粗糙集理论的论域只是对象的点集,元素之间拓扑关系不在考虑之内,这些差异对问题求解都有一定的影响.模糊集合论的粒度计算模型与商空间理论讨论的粒度问题也不尽相同.模糊集合论模型主要讨论粒度的表示问题,即当人类进行各种思考和推理时,都离不开粒度.粒度一般就是用语言、词来表示,这就涉及到“词计算”问题.对于词计算,目前主要是基于模糊集合论的方法.商空间模型主要论述的是,当一个问题很复杂时,人们常从比较“粗”的粒度层次出发来考察问题,一步步细化,直到问题得到确定解答.从商空间的观点看,三者之间表面上完全不同,但本质上有着紧密的联系.粗糙集理论相当于无拓扑结构的商空间理论,模糊粒度计算理论与商空间理论有许多等价之处.所以,商空间理论是粒度计算的重要工具之一.5 结论这些主要模型纵向的扩展和横向的融合是推动粒度计算发展的先决条件.因此,进一步的研究在于: (1)如何借鉴模糊数及其运算的成功经验,构建出有效的非数值型词计算的语义描述、推理机制、代数结构,以实现因特网上的海量信息资源的高效利用;(2)如何从等价关系的泛化、知识表示的拓广、代数结构的延伸三个方面推广粗糙集理论;(3)探索商空间理论中不同粒度层次的转换技术与方法,实现与模糊集及粗糙集的粒度计算模型的结合;(4)构造出基于粒度计算的求解问题的高效算法,寻找理论模型融合的技术和方法,最终实现构建统一的、更加有效的、能够处理复杂的和模糊的信息的粒度计算的理论平台.总之,粒度计算从实际出发,用可行的满意近似解替代精确解,改变了传统的计算观念,使信息的处理更科学、合理、经济和易于操作.它必将会成为信息处理的一种高效实用的技术和方法,在人工智能、问题求解、知识发现、图像压缩、神经网络、语义Web服务等众多领域有广阔的应用前景,而且随着信息科学和数字技术的飞速发展,它必将发挥越来越重要的作用. 参考文献:1 Y ao Y Y.Granular computing:Basic issues and possible solutions A.In:Paul P,ed.Proceedin gs of the5th Joint Conference on Information Sciences A:Elsevier Publishin g Company,2000.1862189.2 Zadeh L A.Fuzzy logic=Computing with words J.I EEE T ransactions on Fuzzy S ystems,1996,2:1032111.3 Thiele Helmut.On semantic models for investigating computing with words A.In:Jain L C,ed.Proceedin gs of the Second International Conference on Knowled ge Based Intelligent Electronic Systems(KES’98)C.USA:Institution of Electrical and Electronic Engineers Inc,1998.32298.4 Pawlak Z.Rough sets J.International Journal of Com puter and Inf orm ation Seience,1982,11:3412356.5 Y ao Y Y.Granular computing using neighborhood systems A.In:Ro y R,ed.Advances in soft com puting: Engineering design and manufacturing M.London:S pringer2Verlag Company,1999.5392553.6 Zadeh L A.The key roles of information granulation and fuzzy logic in human reasoning A .In :H yatt R ,ed.Proceedings of the Fifth IEEE International Conference on Fuzz y Systems ,FUZZ ———IEEE ’96C.G erman y :Physica 2Verlag GmbH Heidelberg ,1996.1002106.7 Zadeh L A.S ome reflections on information granulation and its centrility in granular computing ,computing withwords ,the computational theory of perceptions and precisiated natural language A .In :Lin T Y ,ed.Data Min 2ing ,Rough Sets and Granular Com puting M .G erman y :Physica 2Verlag GmbH Heidelberg ,2002.1102153.8 张 铃,张 钹.问题求解理论及应用M .北京:清华大学出版社,1990.9 张 铃,张 钹.模糊商空间理论(模糊粒度计算方法)J .软件学报,2003,14(4):7702776.The Theory Models and Approaches of G ranular ComputingLI Dao 2guo 1,2,MI AO Duo 2qian 1,ZH ANG H ong 2yun 1(1.Depart ment of Com puter Science and Technology ,Tongji U niversity ,S hanghai 200092,China ;2.Yangquan College of Tai Y uan U niversity of Technology ,S hanxi ,Yangquan 045001,China )Abstract :Granular computing is an emerging conceptual and computing paradigm of information processing.J ust as a great umbrella ,it may be regarded as a label of theories ,methodologies ,techniques ,and tools that make use of granules ,i. e.,groups ,classes ,or clusters of a universe.“GrC ”is a superset of the theory of fuzzy information granulation ,rough set theory ,the theory of quotient space and interval computing etc ,which is a branch of soft com puting science.It plays a important role in information processing for fuzzy ,uncertainty ,partial truth and unnumbered and becomes one of the main study stream in A I.It lays stress on the introduction of the research status ,the basic problems and main approaches of GrC.Finally ,the further investigation objects are proposed.K eyw ords :granular computing ;fuzzy sets ;rough sets ;the theory of quotient space~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(上接第836页)Possibilistic Entropy ClusteringWANGLei ,J I H ong 2bing ,G AO X in 2bo(School of Elect ronic Engineering ,Xidian U niversity ,Xi ’an 710071,China )Abstract :It deals with clustering analysis within the framework of possibilistic entropy theory.First ,the possibilistic entropy is defined with brief discussion.Then the Possibilistic Entro py Clustering (PEC )algorithm is developed ,which takes into account both global effect and local effect of entropy based clustering and is of clear physical meaning and well 2defined mathematical features.Besides ,it can automatically control the resolution parameter during the clus 2tering proceeds and overcome the sensitivity to noise and outliers.Simulation ex periments show that even when the clusters vary significantly in size and shape ,and the data set is contaminated by heavy noise ,this novel algorithm can provides efficient and accurate estimation of the cluster centers.K eyw ords :possibilistic entropy ;unsupervised learning ;clustering ;automatically controlled parameter 148第5期 李道国等:粒度计算的理论、模型与方法。

粒度参数计算方法对比

粒度参数计算方法对比

1.粒度参数计算方法:
图解法(福克):用沉积物概率累计曲线上一些特定百分比处的粗细
特征来计算。

该法提出时还没有激光粒度测试技术不能完全地含有沉积
物粒度特征。

矩法(Mc):沉积物各个粒级所含的组分比例计算。

含有各粒级信息,粒度信息丰富完整,反映粒度信息有更明显的优势。

2.沉积物粒度反映沉积环境:
物源特征、搬运距离、沉积水动力3.粒度论文写作工具:
Excel:公式计算
Surfer10:粒度参数等值线作图Grapher7:概率曲线分类
SPSS: 聚类分析
4.聚类分析结果:
图解法较之于矩法类别少且清楚。

粒度分析原理与应用

粒度分析原理与应用

粒度分析原理与应用粒度分析是一种用于衡量和描述材料或颗粒的大小分布的方法。

它广泛应用于物料科学、环境科学、地质学、化学工程等领域。

粒度分析的原理是基于不同颗粒的尺寸导致其在特定条件下的沉降速度不同,通过测量颗粒的沉降速度来推断颗粒的大小。

本文将介绍粒度分析的基本原理和应用。

粒度分析的基本原理是根据斯托克斯定律,颗粒在流体中的沉降速度与颗粒大小成正比。

斯托克斯定律的公式为:V=K(D-d)g/η,其中V是颗粒的沉降速度,K是介质的粘度,D是颗粒的直径,d是介质的密度,g是重力加速度,η是介质的动力粘度。

通过测量颗粒的沉降速度,可以根据斯托克斯公式推算出颗粒的大小。

粒度分析主要有两种方法:筛分法和沉降法。

筛分法是将颗粒按照一定的尺寸范围,通过筛网进行筛分,根据颗粒在不同筛孔大小的筛网上的通过情况来确定颗粒的大小分布。

沉降法是将颗粒悬浮在液体中,测量颗粒的沉降速度,然后根据斯托克斯公式计算颗粒的大小分布。

粒度分析的应用通常需要一套完整的仪器设备。

现代粒度分析仪器主要包括激光粒度仪、蒸发法粒度仪、遮光法粒度仪等。

激光粒度仪通过激光原理来测量颗粒的沉降速度,具有高精度、快速测量等优点;蒸发法粒度仪通过测量颗粒悬浮液在一定时间内蒸发的速度来推算颗粒的大小;遮光法粒度仪则通过测量颗粒悬浮液在一定时间内遮光的程度来推算颗粒的大小。

这些仪器不仅可以测量颗粒的大小,还可以测量颗粒的形状、表面积等相关参数。

总的来说,粒度分析是一种重要的实验方法,可以用于研究材料、环境、地质、化学等领域中颗粒的大小分布。

通过粒度分析,可以获得材料或颗粒重要的物理参数,为科学研究和工程设计提供基础数据。

随着仪器设备的日益先进和科学方法的不断发展,粒度分析在各个领域的应用将会越来越广泛和重要。

粒度估算法问题回答

粒度估算法问题回答

粒度估算法
粒度估算法是一种用于图像处理和计算机视觉领域的算法,它可以将
图像中的物体分解成不同的粒度层次,从而实现对物体的更精细的分
析和处理。

粒度估算法的应用范围非常广泛,包括图像分割、目标检测、图像识别等领域。

粒度估算法的基本原理是将图像中的物体分解成不同的粒度层次,每
一层次都包含不同的物体信息。

这些层次可以通过不同的方法来生成,例如基于像素的分割、基于区域的分割、基于边缘的分割等。

在生成
这些层次的过程中,需要考虑到不同的因素,例如物体的大小、形状、颜色等。

粒度估算法的优点在于它可以提供更加精细的物体信息,从而实现更
加准确的图像分析和处理。

例如,在目标检测中,粒度估算法可以将
物体分解成不同的层次,从而实现对物体的更加精细的检测和识别。

在图像识别中,粒度估算法可以提供更加准确的特征信息,从而实现
更加准确的识别结果。

然而,粒度估算法也存在一些挑战和限制。

首先,粒度估算法需要大
量的计算资源和时间,因此在实际应用中需要考虑到计算效率的问题。

其次,粒度估算法对图像质量和噪声的敏感性较高,因此需要对图像
进行预处理和优化。

最后,粒度估算法的应用范围和效果也受到算法
本身的限制,因此需要根据具体的应用场景进行选择和优化。

总之,粒度估算法是一种非常重要的图像处理和计算机视觉算法,它
可以提供更加精细的物体信息,从而实现更加准确的图像分析和处理。

在实际应用中,需要根据具体的应用场景进行选择和优化,以实现最
佳的效果和性能。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

浅谈粒度计算
摘要:粒度计算是新近兴起的人工智能研究领域的一个方向,本文简单介绍粒度计算的主要三个方法,以及之间的关系。

关键词:粒度计算、模糊逻辑、商空间理论、粗糙集理论。

;一.引言人们在思考问题时,或者是先从总体进行观察,然后再逐步深入地研究各个部分的情况;或先从各个方面对同一问题进行不同侧面的了解,然后对它们进行综合;或是上面两种方法的组合,即时而从各侧面对事物进行了解,然后进行综合观察,时而综合观察后,对不甚了解的部分再进行观察……总之,根据需要从不同侧面、不同角度反复对事物进行了解、分析、综合、推理.最后得出事物本质的性质和结论. ; 人工智能研究者对人类这种能力进行了深入地研究,并建立了各种形式化的模型.本文要介绍的粒度计算,就是对上述问题的研究的一个方面. ; 人工智能最主要的目的是,为人类的某些智能行为建立适当的形式化模型,以便利用计算机能再显人的智能的部分功能。

什么是人类的最主要的智能,或者说智能的最重要表现形式是什么。

各家有不同的看法,如Simon等认为人的智能表现为,对问题求解目标的搜索(Search)能力。

比如学生在证明一道平面几何题目时,进行思考,“聪明的小孩”能很快地找到证明该结论的有关的定理性质,并很快地应用上去,从而就得到证明。

“数学能力差的学笨赡芏椅餮埃
也坏胶鲜实亩ɡ砗托灾剩评慈迫ィ艿貌坏街っ鞯囊欤籔awlak[P1]则认为人的智能表现为对事物(事件、行为、感知等)的分类(Classification)能力。

如平时我们说某医生本事大,就是这位医
生能从病人的症状中,正确地诊断出病人是患什么病(分类能力!分出患什么病来)等等。

我们认为“人类智能的公认特点,就是人们能从极不相同的粒度(Granularity)上观察和分析同一问题。

人们不仅能在不同粒度的世界上进行问题求解,而且能够很快地从一个粒度世界跳到另一个粒度的世界,往返自如,毫无困难。

这种处理不同世界的能力,正是人类问题求解的强有力的表现”[ZH1]。

还有很多不同的理解,人们正是从这些不同的理解分别建立各自的模型和相关的理论和方法。

粒度计算目前国际上有三个主要的模型和方法,下面简单进行介绍。

;二. 三种不同的模型; 下面简单介绍有关“粒度计算”的三个不同的模型和方法。

什么是粒度,顾名思义,就是取不同大小的对象。

也就是说,将原来“粗粒度”的大对象分割为若干“细粒度”的小对象,或者把若干小对象合并成一个大的粗粒度对象,进行研究。

; 最近Zadeh在[ZA1]-[ZA3]中,讨论模糊信息粒度理论时,提出人类认知的三个主要概念,即粒度(granulation)、组织(organization)、因果(causation)(粒度包括将全体分解为部分,组织包括从部分集成为全体,因果包括因果的关联)。

并进一步提出粒度计算。

他认为,粒度计算是一把大伞它覆盖了所有有关粒度的理论、方法论、技术和工具的研究。

指出:“粗略地说,粒度计算是模糊信息粒度理论的超集,而粗糙集理论和区间计算是粒度数学的子集”。

Zadeh 的工作激起了学术界对粒度计算研究的兴趣,Y.Y.Yao和他的合作者对粒度计算进行了一系列的研究[Y1]-[Y3]并将它应用于数据挖掘等领域,其工作的要点是用决策逻辑语言(DL-语言)来描述集合的粒度(用满足公式f元素
的集合,来定义等价类m(f)),建立概念之间的IF-THEN关系与粒度集合之间的包含关系的联系,并提出利用由所有划分构成的格,来求解一致分类问题。

这些研究为知识挖掘提供了一些新的方法和角度。

; 按Zadeh粒度计算的定义,我们提出的商空间理论和Pawlak的粗糙集理论都属于“粒度计算”范畴。

目前有关粒度计算的理论与方法,主要有三个。

一是Zadeh的“词计算理论”(Theory of Works Computing),一是Pawlak的“粗糙集理论”(Theory of Rough Set),另一个是我们提出的“商空间理论”(Theory of Quotient Space)。

下面简单介绍三者的内容:1. ; 词计算理论:; Zadeh认为人类在进行思考、判断、推理时主要是用语言进行的,而语言是一个很粗的“粒度”,如我们说“九寨沟的风景很美”,其中“很美”这个词就比较“庞统”,也就是说其粒度很粗,如何利用语言进行推理判断,这就是要进行“词计算”,早在二十世纪六十年代Zadeh提出模糊集理论,就是“词计算”的雏型。

沿Zadeh的模糊集论的方向,用模糊数学的方法进行有关粒度计算的方法和理论的研究,就构成“粒度计算”的一个非常重要的方法和方向。

这也是人们比较熟悉的一个方法。

2. 粗糙集理论:; 波兰学者Pawlak[P1]在二十世纪八十年代,提出的粗糙集理论,他提出一个假设:人的智能(知识)就是一种分类的能力,这个假设可能不是很完备,但却非常精练。

在此基础上提出,概念可以用论域中的子集来表示,于是在论域中给定一组子集族,或说给定一个划分(所谓划分,是指将X分成两两不相交的子集之并)。

从数学上知道,给定X上的一个划分,等价于在X上给定一个等价关系R。

Pawlak称之为在论域上给
定了一个知识基(X,R)。

然后讨论一个一般的概念x(X中的一个子集),如何用知识基中的知识来表示,就是用知识基中的集合的并来表示。

对那些无法用(X,R)中的集合的并来表示的集合,他借用拓扑中的内核和闭包的概念,引入R-下近似R-(x)(相当于x的内核)和R-上近似R-(x)(相当于x的闭包),当R-(x)&sup1;R-(x)时,就称x为粗糙集.从而创立了“粗糙集理论”。

目前粗糙集理论已被广泛应用于各个领域,特别是数据挖掘领域,并获得成功。

3.基于商空间的粒度计算. ; 我们认为概念可以用子集来表示,不同粒度的概念就体现为不同粒度的子集,一簇概念就构成空间的一个划分----商空间(知识基),不同的概念簇就构成不同的商空间. 故粒度计算,就是研究在给定知识基上的各种子集合之间的关系和转换.以及对同一问题,取不同的适当的粒度,从对不同的粒度的研究中,综合获取对原问题的了解.这种对粒度的理解与模糊集对粒度的理解不完全一样.下面简单介绍基于商空间的粒度计算。

3.1商空间模型下的推理模型商空间的模型用一个三元组来表示,即(X,F,T),其中X是论域,F是属性集,T是X上的拓扑结构.当我们取粗粒度时,即给定一个等价关系R (或说一个划分),于是我们说得到一个对应于R的商集记为[X],它对应于的三元组为([X],[F],[T]),称之为对应于R的商空间.商空间理论就是研究各商空间之间的关系、各商空间的合成、综合、分解和在商空间中的推理。

在这个模型下,可建立对应的推理模型,并有如下的性质.A. 商空间模型中推理的“保假原理”(或“无解保持原理”).B. ; 商空间模型中推理合成的“保真原理”.所谓“保假原理”是指若一命题在粗粒度空间中是假的,则该命题在比
它细的商空间中一定也无解。

所谓“保真原理”,是指,若命题在两个较粗粒度的商空间中是真的,则(在一定条件下),在其合成的商空间中对应的问题也是真的。

; 这两个原理在商空间模型的推理中起到很重要的作用,如若我们要对一个问题进行求解,当问题十分复杂时,常先进行初步分析,即取一个较粗粒度商空间,将问题化成在该空间上的对应的问题,然后进行求解,若得出该问题在粗粒度空间中是无解,则由“保假原理”,立即得原问题是无解的。

因为粗粒度的空间规模小,故计算量也少,这样我们就可以以很少的计算量得出所要的结果,达到“事半功倍”的目的。

同样利用“保真原理”也可达到降低求解的复杂性目的,设在两个较粗空间X1、X2上进行求解,得出对应的问题有解.利用“保真原理”可得,在其合成的空间X3上问题也有解。

设X1、X2的规模分别为s1、s2。

因为一般情况下,X3的规模最大可达到s1s2。

于是将原来要求解规模为s1s2空间中的问题,化成求解规模分别为s1、s2的两个空间中的问题。

即将复杂性从“相乘”降为“相加”。

;四.商空间理论、粗糙集理论和模糊集理论之间的关系4.1在模型上三者都是描述人类能按不同粒度来处理事物的能力的模型.商空间理论、粗糙集理论认为概念可以用子集来表示,不同粒度的概念可以用不同大小的子集来表示,所有这些表示可以用等价关系来描述。

词计算理论认为概念是用“词”来表示,而描述“词”的有效的方法就是模糊集理论。

相关文档
最新文档