粗糙集理论介绍和研究综述

粗糙集理论

粗糙集理论与应用研究综述王国胤1Yiyu Yao2 于洪1,2 (1重庆邮电大学计算机科学与技术研究所重庆400065) (2Department of Computer Science, University of Regina, Regina, Canada S4S 0A2) {wanggy, yuhong}@https://www.360docs.net/doc/d215074168.html,, yyao@cs.uregina.ca 摘要本文在阐释粗糙集理论基本体系结构的基础上，从多个角度探讨粗糙集模型的研究思路，分析粗糙集理论与模糊集、证据理论、粒计算、形式概念分析、知识空间等其他理论之间的联系，介绍国内外关于粗糙集理论研究的主要方向和发展状况，讨论当前粗糙集理论研究的热点研究领域，以及将来需要重点研究的主要问题。关键词粗糙集，模糊集，粒计算，形式概念分析，知识空间，智能信息处理 A Survey on Rough Set Theory and Its Application Wang Guo-Yin1Yao Yi-Yu2 Yu Hong1,2 1 Institute of Computer Science and Technology, Chongqing University of Posts and Telecommunications, Chongqing, 400065 2 Department of Computer Science, University of Regina, Regina, Saskatchewan, Canada, S4S 0A2 Abstract This paper introduces the basic ideas and framework of rough set theory and the different views of knowledge representation in rough set theory, and then discusses the relations between the rough set theory and the other theories, such as fuzzy set, evidence theory, granular computing, formal concept analyzing, knowledge space, etc. Furthermore, the paper reviews the recent studies for this theory and a survey on its applications is also given. The future development trend of rough set theory is also discussed. Keywords rough set, fuzzy set, granular computing, formal concept analyzing, knowledge space, intelligent information processing 1 引言智能信息处理是当前信息科学理论和应用研究中的一个热点领域。由于计算机科学与技术的发展，特别是计算机网络的发展，每日每时为人们提供了大量的信息，信息量的不断增长，对信息分析工具的要求也越来越高，人们希望自动地从数据中获取其潜在的知识。特别是近20年间，知识发现（规则提取、数据挖掘、机器学习）受到人工智能学界的广泛重视，知识发现的各种不同方法应运而生。粗糙集（Rough Set，有时也称Rough集、粗集）理论是Pawlak教授于1982年提出的一种能够定量分析处理不精确、不一致、不完整信息与知识的数学工具[1]。粗糙集理论最初的原型来源于比较简单的信息模型，它的基本思想是通过关系数据库分类归纳形成概念和规则，通过等价关系的分类以及分类对于目标的近似实现知识发现。由于粗糙集理论思想新颖、方法独特，粗糙集理论已成为一种重要的智能信息处理技术[2-4]，该理论已经在机器学习与知识发现、数据挖掘、决策支持与分析等方面得到广泛应用。目前，有三个有关粗糙集的系列国际会议，即：RSCTC、RSFDGrC和RSKT。中国学者在这方面也取得了很大的成果，从2001年开始每年召开中国粗糙集与软计算学术会议；RSFDGRC2003、IEEE GrC2005、RSKT2006、IFKT2008、RSKT2008、IEEE GrC2008等一系列国际学术会议在中国召开。粗糙集理论与应用的核心基础是从近似空间导出的一对近似算子，即上近似算子和下近似算子（又称上、下近似集）。经典Pawlak模型中的不分明关系是一种等价关系，要求很高，限制了粗糙集模型的应用。因此，如何推广定义近似算子成为了粗糙集理论研究的一个重点。目前，常见的关于推广粗糙集理论的研究方法有两种，即：构造化方法和公理化方法。构造化方法是以论域上的二元关系、划分、覆盖、邻域系统、布尔子代数等作为基本要素，进而定义粗糙近似算子，从而导出粗糙集代数系统。公理化方法的基本要素是一对满足某些公理的一元集合算子，近似算子的某些公理能保证有一些特殊类型的二元关系的存在；反过来, 由二元关系通过构造性方法导出的近似算子一定满足某些公理。事实上，有两种形式来描述粗糙集，一个是从集

技术创新理论研究趋势综述

技术创新理论研究趋势综述【摘要】技术创新是新技术的产生和商业化应用。本文根据技术创新理论研究的趋势，将其研究划分为三个阶段即单个企业创新行为、创新企业与企业的合作关系、创新企业与国家关系的研究阶段，并将各阶段的研究进行了综述。【关键词】技术创新理论;演变趋势;综述 1.技术创新的概念界定美籍奥地利经济学家约瑟夫.熊彼特（J.A.Schumpeter，1912）的《经济发展理论》的出版，首次提出了“创新”这一概念，他认为:“所谓创新，是把一种从来没有过的生产要素和生产条件的‘新组合’(a new combination)引入生产体系。”其内涵包括：(1)引入新产品；(2)引入新工艺；(3)开辟新市场；(4)控制原材料新的供应来源；(5)实现工业的新组织。熊彼特的创新概念既包括了技术性变化的创新，又包括了非技术性变化的创新，其创新理论开辟了技术创新理论的先河。下表列举了以往研究者对“技术创新”的概念界定（见表1）。表1 以往研究者的“技术创新”的概念界定列举 2.技术创新理论研究的发展阶段 20世纪熊彼特最早提出了技术创新理论，从此，拉开了技术创新研究的序幕。根据相关研究文献，从时间上可把技术创新理论研究划分为三个阶段。 2.1第一代技术创新理论第一代技术创新理论研究阶段为单个企业创新行为研究阶段。20世纪50年代初到60年代，在世界新技术革命浪潮的推动下，技术创新研究迅速发展，逐步突破新古典经济学的限制与束缚，形成对技术创新起源、效应和内部结构与过程等方面的专门研究。但研究主要停留在对单个企业创新行为的研究上，如熊彼特于1934-1944强调企业家的作用（见图1）。此后，技术创新理论形成了以技术创新和市场创新为研究对象、组织变革和组织形式为研究对象的两个分支。该时期并未形成完整的理论框架。图1 熊彼特的企业家创新模型（Mark Dodgson,Roy Rothwell，2000） 2.2第二代技术创新理论第二代技术创新理论研究阶段为创新企业与企业的合作关系研究阶段。时间为20世纪70年代初至80年代初，该阶段研究强调创新企业与企业的合作关系

集合代数与粗糙集之间的关系研究【文献综述】

文献综述信息与计算科学集合代数与粗糙集之间的关系研究粗糙集理论是波兰数学家Pawlak于1982年提出的用于数据分析的理论. 由于该理论能够处理模糊和不确定性信息, 因此作为一种有效的知识获取工具受到了人工智能研究者的关注. 目前粗糙集理论已被成功应用在机器学习与知识发现、过程控制、数据挖掘、决策分析、模式识别等领域, 成为信息科学的研究热点之一. 1965年, 美国加利福尼亚大学控制论专家扎德(L. A. Zadeh)教授在《信息与控制》杂志上发表了一篇开创性论文<模糊集合>, 这标志着模糊数学的诞生. L. A. Zadeh教授多年来致力于“计算机”与“大系统”的矛盾研究, 集中思考了计算机为什么不能象人脑那样进行灵活的思维与判断问题. 计算机为什么不能象人脑思维那样处理模糊信息呢? 其原因在于传统的数学. 例如精确数学, 是建立在经典集合论的基础之上, 一个研究的对象对于某个给定的经典集合的关系要么是属于, 要么是不属于, 二者必居其一. [2]19世纪, 由于英国数学家布尔(Bool)等人的研究, 这种基于二值逻辑的绝对思维方法抽象后成为布尔代数, 它的出现促使数理逻辑成为一门很有适用价值的学科, 同时也成为计算机科学的基础. 但是, 1923年, 大哲学家罗素(Russell)就在其著名论文<论模糊性>中提出“整个语言或多或少是模糊的”及“所有二值逻辑都习惯上假定使用精确符号. 因此它仅适用于虚幻的存在. 而不适用于现实生活. 逻辑比其他学科使我们更接近天堂”[1]时认识到二值逻辑的不足. 二值逻辑无法解决一些逻辑悖论, 如著名的罗素(Russell)“理发师悖论”、“秃头悖论”、“克利特岛人说谎悖论”等等悖论问题. 这就是目前计算机不能象人脑思维那样灵活、敏捷地处理模糊信息的重要原因. 为克服这一障碍, L. A. Zadeh教授提出了“模糊集合论”. 在此基础上, 现在已形成一个模糊数学体系. 1960年柏克莱加州大学电子工程系扎德(L. A. Zadeh)教授, 提出“模糊”的概念. 1965年发表关于模糊集合理论的论文. 1966年马里诺斯(P. N. Marinos)发表关于模糊逻辑的研究报告. 以后, 扎德(L. A. Zadeh)又提出关于模糊语言变量的概念. 1974年扎德(L. A. Zadeh)进行有关模糊逻辑推理的研究. 1978年, 国际上第一本以模糊数学为主题的学术刊物《Fuzzy Sets

创新理论基础概述

创新理论一、经济发展阶段分析美国著名战略管理学家麦克尔·波特在研究国家竞争力时曾经提出，国家的发展可以分为生产要素驱动、投资驱动、创新驱动和财富驱动4个阶段。一个国家在这4个不同的阶段里，其社会、经济的发展和国家竞争力的提高受到不同因素的影响，每一个阶段形成核心竞争力的关键因素不一样，同时在不同阶段国家制定的发展战略也不同。运用波特的理论对高新区进行分析，其各阶段具有不同的特点并且核心竞争力也不同。 1.要素群集阶段。我国高新区作为一种人为创造的独特的经济发展区域，最初主要依靠优惠政策的“外力”驱动，吸引人才、技术、资本等要素纷纷涌入，区内难以有真正意义上的企业，生产要素也很难得到优化配置，土地及自然资源低效率使用，从而使得高新区处于低附加价值产出的状况。此时高新区发展和增值手段主要是“贸易链”，即通过与区内外、国内外的贸易交换获取附加值。我国一些发展水平偏低的高新区目前尚处于这一阶段。 2.产业主导阶段。在这一阶段中，高新区内一些真正意义上的企业出现了。它们把各种生产要素重新进行整合，形成稳定的主导产业和具有上、中、下游结构特征的产业链，具有较好的产业支撑与配套条件；高新区因此也具有较高附加价值的产出和较强的经济实力，高新区发展动力由前一阶段的外力为主转向外力内力并举，即政府政策

推动和企业市场竞争力驱动双重作用。但是，这一阶段的高新区R ＆D主要依靠外部研究机构和研究型大学，高新区内R＆D机构不多，企业R＆D能力较弱。此时人们对高新区的增值手段主要是“产业链”。我国目前大多数发展较好的高新区基本上处于这一阶段，标志着“一次创业”基本完成。 3.创新突破阶段。随着高新区内主导产业的发展质量及其持续竞争力的提高，区内产业及其骨干企业的R＆D能力大大加强，各类R ＆D中心由区外大批转移到区内。各类创新活动（主要为技术创新和制度创新）对高新区的发展质量和发展水平起到决定性作用；大量风险资本的进入、原创性创新的涌现、“创新文化”的形成、高速的经济增长率、大量高附加价值的产出和高新区的国际化及绿色环保化趋势成为创新突破阶段的显著特点，其增殖手段主要是“创新链”。高新区对地区可持续发展的影响力和对地区乃至全国的巨大贡献十分显著。目前我国的高新区还难以完全进入这一阶段。从国外经验看，也只有美国的硅谷等少数科技园区可以认为是处于这一阶段。从我国的实际情况看，“二次创业”实质上是高新区从“产业主导”阶段向“创新突破”阶段的转换。 4.财富凝聚阶段。随着高新区的进一步发展，高新区内聚集着高价值的“财富级”的有形与无形品牌，拥有一大批高素质的“财富级”人才资源，运作着具有高增值能力和高回报率的巨额金融资本，从而形成了高新区新一轮发展的崭新“要素”。这种“三高”要素既是高新区巨大的物质财富，也是巨大的精神财富。高新区成为人们创业和工作的“事业发展中心”，同时还是人们心中向往的“生活乐园”。在

粗糙集理论及其应用综述

控制理论与应用 CONTROL THEORY & APPLICATIONS 1999年第16卷第2期 Vol.16　No.2 1999 粗糙集理论及其应用综述* 韩祯祥　张琦　文福拴摘要：粗糙集理论是一种较新的软计算方法，可以有效地分析和处理不完备信息.该理论近年日益受到国际学术届的重视，已经在模式识别、机器学习、决策支持、过程控制、预测建模等许多科学与工程领域得到成功的应用.本文介绍了粗糙集理论的基本概念，对其在各领域的应用情况进行了综述. 关键词：粗糙集；不确定性；数据分析；软计算；粗糙控制 A Survey on Rough Set Theory and Its Application Han Zhenxiang,　Zhang Qi　and　Wen Fushuan (Department of Electrical Engineering, Zhejiang University.Hangzhou,310 027,P.R.China) Abstract: Rough set theory is a relatively new soft comput ingtool to deal with vagueness and uncertainty.It has received much attention of the researchers around the world.Rough set theory has been applied to many area s successfully including pattern recognition,machine learning,decision support, process control and predictive modeling.This paper introduces the basic concepts of rough set.A survey on its applicatoins is also given. Key words: rough set; uncertainty; data analysis; soft computing; rough control 1　引言(Introduction) 粗糙集(Rougn Set,RS)理论是一种刻划不完整性和不确定性的数学工具，能有效地分析和处理不精确、不一致、不完整等各种不完备信息，并从中发现隐含的知识，揭示潜在的规律［1］.RS理论是由波兰学者Pawlak Z在1982年［2］提出的.1991年Pawlak Z出版了专著［3］，系统全面地阐述了RS理论，奠定了严密的数学基础.该书与1992年出版的RS理论应用专集［4］较好地总结了这一时期RS理论与实践的研究成果，促进了它的进一步发展，现已成为学习和应用RS理论的重要文献.从1992年至今，每年都召开以RS 为主题的国际会议，推动了RS理论的拓展和应用.国际上成立了粗糙集学术研究会，参加的成员来自波兰、美国、加拿大、日本、挪威、俄罗斯、乌克兰和印度等国家.目前RS理论已成为人工智能领域中一个较新的学术热点，引起了越来越多的科研人员的关注. 2　粗糙集理论的基本概念(Basic concepts of rough set theory) 2.1　知识与不可分辨关系(Knowledge and indiscern ibility relation) 在RS理论中，“知识”被认为一种将现实或抽象的对象进行分类的能力［3］.假定

基于优势关系下的模糊粗糙集模型

https://www.360docs.net/doc/d215074168.html, Fuzzy Rough Sets Based on Dominance Relations Xiaoyan Zhang Department of Mathematics and Information Science Guangdong Ocean University Zhanjiang, P. R. China 524088 datongzhangxiaoyan@https://www.360docs.net/doc/d215074168.html, Abstract This model for fuzzy rough sets is one of the most important parts in rough set theory. Moreover, it is based on an equivalence relation (indiscernibility relation). However, many systems are not only concerned with fuzzy sets, but also based on a dominance relation because of various factors in practice. To acquire knowledge from the systems, construction of model for fuzzy rough sets based on dominance relations is very necessary. The main aim to this paper is to study this issue. Concepts of the lower and the upper approximations of fuzzy rough sets based on dominance relations are proposed. Furthermore, model for fuzzy rough sets based on dominance relations is constructed, and some properties are discussed. Keywords: Rough sets; Dominance relations; fuzzy sets. 1Introduction The rough set theory [10,11], proposed by Pawlak in the early 1980s, is an extension of set theory for the study of intelligent systems. It can serve as a new mathematical tool to soft computing, and deal with inexact, uncertain or vague information. Moreover, this theory has been applied successfully in discovering hidden patterns in data, recognizing partial or total dependencies in systems, removing redundant knowledge, and many others [7,12,13,15,16]. Since its introduction, the theory has received wide attention on the research areas in both of the real-life applications and the theory itself. Theory of fuzzy sets initiated by Zedeh [9] also provides useful ways of describing and modeling vagueness in ill-defined environment. Naturally, Doubois and Prade [8] combined fuzzy sets and rough sets. Attempts to combine these two theories lead to some new notions [1,5,7], and some progresses were made [2,3,4,5,6,14]. The combination involves many types of approximations and the construction of fuzzy rough sets give a good model for solving this problem [5]. However, most of systems are not only concerned with fuzzy data, but also based on a dominance relation because of various factors. In order to obtain the succinct knowledge from the systems, construction of model for fuzzy rough sets based on dominance relations is needed. The main aim of the paper is to discuss the issue. In present paper, a dominance relation is introduced and instead of the equivalence relation (discernibility relation) in the standard fuzzy rough set theory. The lower and the upper approximation of a fuzzy rough set based on dominance relations are proposed. Thus a model for fuzzy rough sets based on dominance relations is constructed, and some properties are studied. Finally, we conclude the paper and look ahead the further research.

开放式创新理论研究综述

开放式创新理论研究综述内容摘要:本文基于Henry Chesbrough的开放式创新概念,从创新资源角度,企业研发模式、知识产权管理角度,支持环境角度,案例角度对开放式创新理论研究进行述评。最后总结现有研究存在的问题,并提出了研究展望。关键词:开放式创新理论研究创新资源在20世纪的绝大多数时间内,企业基于“成功的创新需要控制”的理念,认为创新活动应该严格的控制在企业内部,R&D(内部研发)是公司非常有价值的战略资产,企业通过建立自己的实验室或研发中心,在企业内部进行研发、生产、销售,并进一步提供售后服务和财务金融支持,以此获得产品在市场上的垄断地位,从而得到超额的边际利润。该创新模式被哈佛商学院的Henry Chesbrough称为“封闭式创新”。该模式的特点是研发创意、产品开发设计、产品生产与市场化、售后服务等都内嵌于企业自身系统中完成,这种范式被许多大型企业成功验证。然而,进入21世纪,全球创新形势发生了很大的变化,这使得原来成功运行的封闭式创新模式遭遇新的挑战,逐渐由“封闭式创新转向更开放的创新”。本文基于Henry Chesbrough提出的开放式创新概念,通过对现有文献的梳理,从四个角度介绍开放式创新的最新研究成果,提出基于开放式创新理论及我国创新实际的研究展望。开放式创新的内涵 Henry Chesbrough在《开放式创新—进行技术创新并从中赢利的新规则》一书中正式提出开放式创新(Open Innovation)的概念。他认为企业或组织在进行创新的过程中,可以利用内部和外部两条市场通道将企业内、外有价值的创新资源集中起来创造价值,同时建立相应的内部机制分享所创造价值的一部分。企业内部的创意可以通过外部渠道实现市场化,同样,外部的技术也可以被企业接受、采用。在开放式创新模式下,企业的技术创新是一个开放的、非线性的活动过程,创新可以跨越企业的传统边界,不再完全依靠自身的力量。开放的本质是外部创新资源的获取和利用,强调企业对内外创新资源的有效整合。引起创新模式由封闭式创新转变为开放式创新的主要侵蚀因素包括在信息化和全球化背景下知识性员工数量的骤增和高度的流动性、风险投资的蓬勃发展、产品生命周期的迅速缩短、知识在产品价值网络中的广泛分布、外部创新资源的可用性、学术机构研究能力和研究质量的提高以及不断增强的外部供应商的

粗糙集综述word版

粗糙集论文题目粗糙集综述 1 粗糙集属性约简 1.1 经典粗糙集属性约简对于经典粗糙集我们可以用上下近似来描述。给定知识库()R U K ,=，对于每个子集U X ?和一个等价关系()K ind R ∈，定义两个上下近似： {}{}. |/,|/ U U φ≠?∈=?∈=X Y R U Y X R X Y R U Y X R 另外上下近似还可以用以下的等式表达： []{}[]{}. |,| U U φ≠?∈=?∈=X x U x X R X x U x X R R R 当利用区分矩阵来表达知识时有许多优点，特别是他能很容易计算约简和核。约简是满足能区别由整个属性集区别的所有对象的属性极小子集。如果A 包含B 是满足B 交区别对象x 和y 的所有属性集合的极小子集不为空，且区别对象x 和y 的所有属性集合的极小子集不为空，则B 是A 的一个约简。核是区分矩阵中所有单个元素组成的集合。对于决策表,C 为条件属性集，D 为决策属性集，决策表S 的区分矩阵是一个n n ?矩阵，其任一元素为 },x ),(),(|{),(a *）（且y a y f a x f C a y x ω≠∈= 对于满足),(,,x y x U y ω∈ )(y )(x D pos D pos C C ?∈且, 或者

)(y )(x D pos D pos C C ∈?且，或者 ).(),()(,D ind y x D pos y x C ?∈且如果φφ≠?≠??),(,),(C C C **''y x a y x a 满足条件的极小子集（关于包含），则'C 是C 的D 约简（相对约简）. D 核（相对核）是决策表S 的区分矩阵中所有单个元素组成的集合，即 }.,},{),(a |{)(core *U y x a y x C a C D ∈=∈=其中 1.2 变精度粗糙集属性约简变精度粗糙集是粗糙集的扩充，它是在基本粗糙集模型的基础上引入 )5.00(<≤ββ，即允许一定程度的错误分类率存在。这一方面完善了近似空间的概念，另一方面也有利于粗糙集理论从认为不相关的数据中发现相关数据。当β=0时，经典粗糙集模型是变精度粗糙集模型的一个特例。 X 和Y 表示有限论域U 的非空子集，且Y ?X 。令 ???>>?=0,|X |0,0,|X | |,X |/|Y X |1-Y)c(X, 多数包含关系定义为ββ ≤??),(Y Y X c X 。约简是保持和决策属性Q 的依赖性相同的最小条件属性子集。通过近似以来的定义来引入近似约简概念。条件属性集P 关于据测属性集Q 的β约简是P 的一个子集),,(βQ P red ，且满足： ),),,,((),,()1(ββγβγQ Q P red Q P =. 不成立。都将是中去掉任何一个属性，从)1(),,()2(βQ P red 引入)5.00(<≤ββ参数后，扩充了基本粗糙集理论，更好体现了数据分析中的数据相关性，从而为获取近似决策规则奠定了基础。

技术创新理论发展综述

西方技术创新理论发展综述摘要: 技术创新是企业获取竞争优势的最主要来源, 技术创新管理是近年来发展迅速、综合性强的新兴学科。自从熊彼特第一个系统完整地描述创新理论以来, 国外技术创新研究已经历了半个多世纪。目前, 西方技术创新理论的研究和发展已形成了四大理论学派: 新古典学派、新熊彼特学派、制度创新学派和国家创新系统学派。阐述了技术创新理论的产生, 并综述了目前西方技术创新理论发展的这四大理论流派。关键词: 技术创新; 创新理论一、技术创新理论的提出技术创新理论的首次由熊彼特(Joseph ASchumpeter)的《经济发展理论》系统的提出，“创新”就是“一种新的生产函数的建立，即实现生产要素和生产条件的一种从未有过的新结合，并将其引入生产体系。创新一般包含5 个方面的内容：(1)制造新的产品：制造出尚未为消费者所知晓的新产品； (2)采用新的生产方法：采用在该产业部门实际上尚未知晓的生产方法；(3)开辟新的市场：开辟国家和那些特定的产业部门尚未进入过的市场；(4)获得新的供应商：获得原材料或半成品的新的供应来源；(5)形成新的组织形式：创造或者打破原有垄断的新组织形式。创新并不仅仅是某项单纯的技术或工艺发明，而是一种不停运转的机制，只有引入生产实际中的发现与发明，并对原有生产体系产生震荡效应，才是创新。二、技术创新理论的发展由于西方经济学家认为熊彼特的学说具有社会主义倾向, 同时受到同时期的“凯恩斯革命”的理论影响, 在相当长的时期中, 创新经济学理论一直受到西方国家的冷遇, 未能引起理论界的关注。20 世纪50 年代以后, 以微电子技术为核心的世界新一轮科技革命的兴起, 许多国家的经济出现了长达近 20 年的高速增长“黄金期”, 这一现象已不能用传统经济学理论中资本、劳动力等要素简单地加以解释。由此, 西方经济学理论界重新对熊彼特的创新经济学理论进行认识, 开始对技术进步与经济增长的关系产生了兴趣, 从而使技术创新理论得以发展。目前, 西方技术创新理论的研究和发展已形成了新古典学派、新熊彼特学派、制度创新学派和国家创新系统学派等四大理论学派。 2.1 技术创新的新古典学派技术创新的新古典学派关于技术创新的研究建立在“市场失灵”的基础上。这一流派主要围绕两个方面进行研究。其一是分解技术创新对于现代经济增长的贡献率; 其二是将技术创新纳入经济增长模型。他们的共同特点是都把技术创新视为同资本、劳动力和自然资源一样的经济增长要素。此学派以索洛 (S.C.Solow)等人为代表, 认为技术创新是经济增长的内生变量, 是经济增长的

粗糙集理论介绍(对于初学者来说,很经典的滴)

粗糙集理论介绍面对日益增长的数据库，人们将如何从这些浩瀚的数据中找出有用的知识？我们如何将所学到的知识去粗取精？什么是对事物的粗线条描述什么是细线条描述？粗糙集合论回答了上面的这些问题。要想了解粗糙集合论的思想，我们先要了解一下什么叫做知识？假设有8个积木构成了一个集合A，我们记：A={x1,x2,x3,x4,x5,x6,x7,x8}，每个积木块都有颜色属性，按照颜色的不同，我们能够把这堆积木分成R1={红，黄，兰}三个大类，那么所有红颜色的积木构成集合X1={x1,x2,x6}，黄颜色的积木构成集合X2={x3,x4}，兰颜色的积木是：X3={x5,x7,x8}。按照颜色这个属性我们就把积木集合A进行了一个划分(所谓A的划分就是指对于A中的任意一个元素必然属于且仅属于一个分类），那么我们就说颜色属性就是一种知识。在这个例子中我们不难看到，一种对集合A的划分就对应着关于A中元素的一个知识，假如还有其他的属性，比如还有形状R2={三角,方块,圆形}，大小R3={大,中,小}，这样加上R1属性对A构成的划分分别为：A/R1={X1,X2,X3}={{x1,x2,x6},{x3,x4},{x5,x7,x8}} （颜色分类）A/R2={Y1,Y2,Y3}={{x1,x2},{x5,x8},{x3,x4,x6,x7}} （形状分类）A/R3={Z1,Z2,Z3}={{x1,x2,x5},{x6,x8},{x3,x4,x7}} （大小分类）上面这些所有的分类合在一起就形成了一个基本的知识库。那么这个基本知识库能表示什么概念呢？除了红的{x1,x2,x6}、大的{x1,x2,x5}、三角形的{x1,x2}这样的概念以外还可以表达例如大的且是三角形的{x1,x2,x5}∩{x1,x2}={x1,x2}，大三角{x1,x2,x5}∩{x1,x2}={x1,x2}，兰色的小的圆形({x5,x7,x8}∩{x3,x4,x7}∩{x3,x4,x6,x7}={x7}，兰色的或者中的积木{x5,x7,x8}∪{x6,x8}={x5,x6,x7,x8}。而类似这样的概念可以通过求交运算得到，比如X1与Y1的交就表示红色的三角。所有的这些能够用交、并表示的概念以及加上上面的三个基本知识(A/R1,A/R2.A/R3)一起就构成了一个知识系统记为R=R1∩R2∩R3，它所决定的所有知识是A/R={{x1,x2},{x3},{x4},{x5},{x6},{x7},{x8}}以及A/R中集合的并。下面考虑近似这个概念。假设给定了一个A上的子集合X={x2,x5,x7}，那么用我们的知识库中的知识应该怎样描述它呢？红色的三角？****的大圆？都不是，无论是单属性知识还是由几个知识进行交、并运算合成的知识，都不能得到这个新的集合X，于是我们只好用我们已有的知识去近似它。也就是在所有的现有知识里面找出跟他最像的两个一个作为下近似，一个作为上近似。于是我们选择了“兰色的大方块或者兰色的小圆形”这个概念：{x5,x7}作为X的下近似。选择“三角形或者兰色的”{x1,x2,x5,x7,x8}作为它的上近似，值得注意的是，下近似集是在那些所有的包含于X的知识库中的集合中求并得到的，而上近似则是将那些包含X的知识库中的集合求并得到的。一般的，我们可以用下面的图来表示上、下近似的概念。这其中曲线围的区域是X的区域，蓝色的内部方框是内部参考消息，是下近似，绿的是边界加上蓝色的部分就是上近似集。其中各个小方块可以被看成是论域上的知识系统所构成的所有划分。整个粗集理论的核心就是上面说的有关知识、集合的划分、近似集合等等概念。下面我们讨论一下关于粗糙集在数据库中数据挖掘的应用问题。考虑一个数据库中的二维表如下：元素颜色形状大小稳定性 x1 红三角大稳定 x2 红三角大稳定 x3 黄圆小不稳定 x4 黄圆小不稳定 x5 兰方块大稳定 x6 红圆中不稳定 x7 兰圆小不稳定 x8 兰方块中不稳定可以看出，这个表就是上面的那个例子的二维表格体现，而最后一列是我们的决策属性，也就是说评价什么样的积木稳定。这个表中的每一行表示了类似这样的信息：红色的大三角积木稳定，****的小圆形不稳定等等。我们可以把所有的记录看成是论域A={x1,x2,x3,x4,x5,x6,x7,x8}，任意一个列表示一个属性构成了对论域的元素上的一个划分，在划分的每一个类中都具有相同的属性。而属性可以分成两大类，一类叫做条件属性：颜色、形状、大小都是，另一类叫做决策属性：最后一列的是否稳定？下面我们考虑，对于决策属性来说是否所有的条件属性都是有用的呢？考虑所有决策属性是“稳定”的集合

《粗糙集理论与方法》读书笔记

《粗糙集理论与方法》读书笔记智能信息处理是当前信息科学理论和应用研究中的一个热点领域。由于计算机科学与技术的发展，特别是计算机网络的发展，每日每时为人们提供了大量的信息，信息量的不断增长，对信息分析工具的要求也越来越高，人们希望自动地从数据中获取其潜在的知识。特别是近20年间，知识发现（规则提取、数据挖掘、机器学习）受到人工智能学界的广泛重视，知识发现的各种不同方法应运而生。 1 粗糙集概述粗糙集（Rough Set，有时也称Rough集、粗集）理论是Pawlak 教授于1982年提出的一种能够定量分析处理不精确、不一致、不完整信息与知识的数学工具粗糙集理论最初的原型来源于比较简单的信息模型，它的基本思想是通过关系数据库分类归纳形成概念和规则，通过等价关系的分类以及分类对于目标的近似实现知识发现。由于粗糙集理论思想新颖、方法独特，粗糙集理论已成为一种重要的智能信息处理技术，该理论已经在机器学习与知识发现、数据挖掘、决策支持与分析等方面得到广泛应用。目前，有三个有关粗糙集的系列国际会议，即：RSCTC、RSFDGrC和RSKT。中国学者在这方面也取得了很大的成果，从2001年开始每年召开中国粗糙集与软计算学术会议；RSFDGRC2003、IEEE GrC2005、RSKT2006、IFKT2008、RSKT2008、IEEE GrC2008等一系列国际学术会议在中国召开。粗糙集理论与应用的核心基础是从近似空间导出的一对近似算子，即上近似算子和下近似算子（又称上、下近似集）。经典Pawlak

模型中的不分明关系是一种等价关系，要求很高，限制了粗糙集模型的应用。因此，如何推广定义近似算子成为了粗糙集理论研究的一个重点。目前，常见的关于推广粗糙集理论的研究方法有两种，即：构造化方法和公理化方法。构造化方法是以论域上的二元关系、划分、覆盖、邻域系统、布尔子代数等作为基本要素，进而定义粗糙近似算子，从而导出粗糙集代数系统。公理化方法的基本要素是一对满足某些公理的一元集合算子，近似算子的某些公理能保证有一些特殊类型的二元关系的存在；反过来, 由二元关系通过构造性方法导出的近似算子一定满足某些公理。事实上，有两种形式来描述粗糙集，一个是从集合的观点来进行，一个是从算子的观点来进行。那么，从不同观点采用不同的研究方法就得到粗糙集的各种扩展模型。扩展模型的研究以及基于其上的应用研究已经成为新的研究热点。粗糙集理论与其他处理不确定和不精确问题理论的最显著的区别是它无需提供问题所需处理的数据集合之外的任何先验信息, 所以对问题的不确定性的描述或处理可以说是比较客观的, 由于这个理论未能包含处理不精确或不确定原始数据的机制, 所以这个理论与概率论, 模糊数学和证据理论等其他处理不确定或不精确问题的理论有很强的互补性。因此，研究粗糙集理论和其他理论的关系也是粗糙集理论研究的重点之一。如果我们将研究对象看成是现象，那么我们可以将这些现象分

粗糙集与其他软计算理论结合情况进行综述研究

粗糙集与其他软计算理论结合情况进行综述研究摘要:最近几年,对于粗糙集的研究越来越多,尤其是粗糙集与其他软计算理论相结合的研究更为突出,取得了很多有意义的研究成果。因此,将此方面目前的主要研究情况进行一个总结,主要介绍了目前粗糙集与模糊集、神经网络、证据理论等一些其他软计算理论之间的结合研究情况,并对这方面未来的发展提出了自己的一些观点。关键词:粗糙集; 软计算; 模糊集; 粗糙模糊集; 模糊粗糙集 Survey on com bination of rough sets and other soft computing theories TANG Jian-guo??1,2, William ZHU?1,SHE Kun?1, CHEN Wen??1,3 (1.School of Computer Science & Engineering, University of Electronic Science & Technology of China, Chengdu 611731, China;2.School of Computer Science & Engineering, Xinjiang University of Finance & Economics, Urumqi 830012, China;3.Dept. of Computer Science, Fuzhou Polytechnic, Fuzhou 350108, China)?Abstract:In recent years, there are m ore and more research on rough sets.Especially,the com binations of rough sets and other soft computing theories have becam e more prominent,and have made a lot of m eaningful research results. In view of this, this paper gave a summary of the current status of these m ajor researchs.It focused on the com bination of rough sets and other soft computing theories such as fuzzy sets,neural net,evidence theory,and so on. In the end, it put forward the own viewpoint of the future development in this area. Key words:rough sets; soft com puting; fuzzy sets; rough-fuzzy sets; fuzzy-rough sets 0 引言随着计算机技术和网络技术的迅速发展与广泛应用,人类社会进入了信息爆炸的时代,如何处理并有效利用这些信息已经成为世界各国学者研究的热点问题。软计算就是在这种需求背景下出现的一种新技术。软计算最初是由模糊集理论的创始人Zadeh[1]在1994年提出的,它是一种通过对不确定、不精确及不完全真值的数据进行容错处理从而取得低代价、易控制处理以及鲁棒性高的方法的集合。目前,软计算的理论与方法主要包括神经网络、模糊集、粗糙集、遗传算法、证据理论等。粗糙集是在最近几年发展较快的一门理论,它是一种用于分析和处理不确定、不精确问题的数学理论,是由波兰数学家Pawlak[2]在1982年提出的。它的基本思想是通过论域上的等价关系将论域划分成若干个等价类,然后利用这些知识对所需处理的不精确或不确定的事物进行

关于区域创新体系理论综述

论文关键词：区域创新体系概念界定结构运行机制论文摘要：介绍了国内外学者对区域创新体系概念的不同的界定和区域创新体系的创类型，分析了区域新体系的构成要素与基本结构，说明区域创新体系的运行机制是区域创新体系的主要方面，也是创新体系区别于其他体系的本质特征。 1 区域创新体系的概念和内涵 1.1 国外学者对区域创新体系概念的界定区域创新体系英文表述为Regional Innovation Systems（简称RIS）。英国卡迪夫大学的库克（Philip Nicholas Cooke，1992）教授首先提出了“区域创新体系”的概念，他将RIS定义为“主要是由在地理上相互分工与关联的生产企业、研究机构和高等教育机构等构成的区域性组织系统，该系统支持并产生创新”。瑞典的Asheim和Isaksen（2002）认为，区域创新体系是由支持组织围绕两类主要行动者及其相互作用组成的区域集群。第一类主要行动者是域内产业集群及其支持产业的公司；第二类主要行动者是制度基础结构，包括科技机构、高等院校、技术中介机构、职业培训组织、产业协会、金融机构等，它们具有支持区域创新的重要能力。荷兰乌德勒支大学的Jan G. Lambooy（2002）认为，区域创新体系是由区域生产中的合作者组成的互动的、动态的结构，这些体系能使区域经济各主体充分发挥和扩展其才能，它们也能引导那些致力于建立认知能力（如学习、研究等）和构筑企业间网络的政府和组织。加拿大的Doloreux（2002、2003）认为，区域创新体系是相互作用的私人与公共利益体、正规机构和其他组织的集合，其功能是按照组织和制度的安排以及人际关系促进知识的生产、利用和传播。 1.2 国内学者对区域创新体系概念的界定目前，国内学术界对区域创新体系定义存在众多分歧，主要表现在以下五个方面：（1）对区域创新体系中“区域”的理解不同。有学者认为是经济区域（陈浩，2006；李虹，2004），有学者认为是行政区域，更多学者认为是技术区域（张斌等，2004；陈德宁等，2004；方旋等，2000）；（2）对区域创新体系定义的角度不同。大多数学者是从区域创新体系的构成要素及组织结构去定义，但也有学者是从区域创新体系的运行方式（温新民等，2002）、目的（陈德宁等，2004；李虹，2004；王子龙等，2003；顾新，2001）去定义，还有学者是从区域创新体系的功能和作用定义（陈琪等，2007；梁凯2005；邱红等，2002）；（3）对区域创新体系的构成要素认识不同。一般认为区域创新系统是由企业、大学和科研机构、政府、中介机构等创新主体构成（冯之浚，1999；胡志坚等1999），但对主体数量的认识不一（梁凯，2005；周亚庆等，2001；张斌等，2004）；还有观点认为区域创新系统的构成要素不仅包括不同的主体要素（创新的机构和组织），而且还包括非主体要素（创新所需要的物质条件）（陈浩，2006；李虹，2004；刘友金等，2001），以及其他新要素（包括新要素组合）（冯根尧，2006；邱红等，2002）；（4）对区域创新体系功能的认识不同。一般认为RIS的主要功能是技术创新（周亚庆等，2001；温新民等，2002，），但也有观点认为RIS的功能包括知识创新、知识扩散和知识应用（中国科技发展战略研究小组，2001），还有观点认为RIS的功能应包括制度创新（梁凯，2005）等；（5）对区域创新体系的性质认识不同。有的人认为区域创新体系是一个技术体系、复合系统（刘友金、黄鲁成，2001）、社会系统等（陈光等，1999；潘德均，2001），它的性质是一个系统；也有人认为区域创新体系是制度、政策网络（陈浩，2006；刘友金等，2001），制度、组织网络（中国科技发展战略研究小组，2001；方旋等，2000），制度、机构网络（柳卸林，2003；潘德均，2001），关系集合（王核成、宁熙，2001）等，它的性质是一种关系；还有人认为区域创新体系是一个状态空间整体等，它的性质是一种空间结构（温新民等，2002）。[!--empirenews.page--] 2 区域创新体系的类型关于区域创新体系的类型，国外学者已经从不同角度做了一些研究。Ashceim和Isakson（1997）根据社会的根植性把区域创新体系分为区域性的国家创新系统和根植于特定区域的创新系统。Cooke（1998）从“治理结构”（governance structure）和“商业创新”（business innovation）两个关键维度将区域创新系统分为六种类型。首先，基于治理结构，可以将RIS分成基层式（grassroots）、网络式（network）和统制式（dirigiste）三类；其次，基于商业活动模式，