数据挖掘与商业智能

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据挖掘技术与信息管理

摘要:随着网络、数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多。数据挖掘就是从大量的实际应用数据中提取隐含信息和知识,它利用了数据库、人工智能和数理统计等多方面的技术,是一类深层次的数据分析方法。

一、数据挖掘与信息管理

现代信息管理的发展趋势之一是从信息的载体形式管理向内容的知识管理深化。长期以来,图书情报部门工作主要是对信息的载体进行管理,以提供信息的外在特征服务为主。随着大量的信息资源的增多,人们对信息的利用要求已经不止满足一般文献的检索和原件的获取,而且还要对信息内容进行深入的分析,因为仅一般的查询和检索不能帮助用户获得结论性的认识,而且信息资源不能得到充分的利用。

近年来,数据库技术得到了迅速的发展,许多领域都建立大量的数据库,并通过网络形式提供有关的服务。数据库大量的数据中隐藏着许多有价值的信息,是不可多得的知识信息源,而目前的数据库系统一般只限于一些基本的数据查询操作,通过数据库管理系统只能对数据“粗加工”,不能从这些数据中归纳出隐含的带有结论性的知识,使得这些有用知识不为人知,无法利用,实际上是对数据库信息资源的一种浪费。因此,对数据的进一步加工和内容分析显得越来越重要。在这样的背景下,数据仓库、数据挖掘和知识发现等技术应用而生。数据挖掘和知识发现是数据库技术的深层次的应用,它能从大量数据中抽取出具有一定规律的知识,深层次的开发可以进一步提高信息资源的使用价值,充分利用信息资源,提高使用效益。数据挖掘和知识发现为给决策分析带来了新的途径,能更好地解决日益复杂多变的决策环境问题,进一步提高了决策的准确性和可靠性,为科学决策提供了基础。数据挖掘和知识发现是知识管理的需要,信息是巨大的社会财富,知识发现可以更为全面地获取信息并深入地对信息进行分析,认识有关的规律,产生最大限度的升华,不断形成新的知识,从而转化为生产力,提高竟争能力。

数据是信息和知识的源泉。但是,拥有大量的数据与拥有许多有用的信息完全是两回事。过去几年中,从数据库中发现知识这一领域发展的很快。广阔的市场和研究利益促使这一领域的飞速发展。计算机技术和数据收集技术的进步使人们可以从更加广泛的范围和几年前不可想象的速度收集和存储信息。收集数据是为了得到信息,然而大量的数据本身并不意味信息。尽管现代的数据库技术使我们很容易存储大量的数据流,但现在还没有一种成熟的技术帮助我们分析、理解并使数据以可理解的信息表示出来。在过去,我们常用的信息获取方法是由知识工程师把专家经验知识经过分析、筛选、比较、综合、再提取出信息和规则。然而,由于知识工程师所拥有知识的有局限性,所以对于获得信息的可信度就应该打个折扣。目前,传统的知识获取技术面对巨型数据仓库无能为力,数据挖掘技术就应运而生。

数据的迅速增加与数据分析方法的滞后之间的矛盾越来越突出,人们希望在对已有的大量数据分析的基础上进行科学研究、商业决策或者企业管理,但是目前所拥有的数据分析工具很难对数据进行深层次的处理,使得人们只能望“数”兴叹。数据挖掘正是为了解决传统分析方法的不足,并针对大规模数据的分析处理而出现的。数据挖掘通过在大量数据的基础上对各种学习算法的训练,得到数据对象间的关系模式,这些模式反映了数据的内在特性,是对数据包含信息的更高层次的抽象。目前,在需要处理大数据量的科研领域中,数据挖掘受到越来越多的关注,同时,在实际问题中,大量成功运用数据挖掘的实例说明了数据挖掘对科学研究具有很大的促进作用。数据挖掘可以帮助人们对大规模数据进行高效的分析处理,以节约时间,将更多的精力投入到更高层的研究中,从而提高科研工作的效率。

二、信息管理

信息管理是人类综合采用技术的、经济的、政策的、法律的和人文的方法和手段对信息流(包括非正规信息流和正规信息流)进行控制,以提高信息利用效率、最大限度地实现信息效用价值为目的的一种活动。

信息是事物的存在状态和运动属性的表现形式。“事物”泛指人类社会、思维活动和自然界一切可能的对象。“存在方式”指事物的内部结构和外部联系。

“运动”泛指一切意义上的变化,包括机械的、物理的、化学的、生物的、思维的和社会的运动。“运动状态”是指事物在时间可空间上变化所展示的特征、态势和规律。

信息一般经由两种方式从信息产生者向信息利用者传递。一种是由信息产生者直接流向信息利用者,称为非正规信息流;另一种是信息在信息系统的控制下流向信息利用者,称为正规信息流。

所谓信息管理,是指对人类社会信息活动的各种相关因素(主要是人,信息,技术和机构)进行科学的计划,组织,控制和协调,以实现信息资源的合理开发与有效利用的过程。它既包括微观上对信息内容的管理——信息的组织,检索,加工,服务等,又包括宏观上对信息机构和信息系统的管理。

通过制定完善的信息管理制度,采用现代化的信息技术,保证信息系统有效运转的工作过程。既有静态管理,又有动态管理,但更重要的是动态管理。它不仅仅要保证信息资料的完整状态,而且还要保证信息系统在“信息输入一信息输出”的循环中正常运行。

信息管理是人类为了收集,处理和利用信息而进行的社会活动。它是科学技术的发展,社会环境的变迁,人类思想的进步所造成的必然结果和必然趋势。(1)信息资源

它是信息生产者、信息、信息技术的有机体。信息管理的根本目的是控制信息流向,实现信息的效用与价值。但是,信息并不都是资源,要使其成为资源并实现其效用和价值,就必须借助“人”的智力和信息技术等手段。因此,“人”是控制信息资源、协调信息活动的主体,是主体要素,而信息的收集、存储、传递、处理和利用等信息活动过程都离不开信息技术的支持。没有信息技术的强有力作用,要实现有效的信息管理是不可能的。由于信息活动本质上是为了生产、传递和利用信息资源,信息资源是信息活动的对象与结果之一。信息生产者、信息、信息技术三个要素形成一个有机整体——信息资源,是构成任何一个信息系统的基本要素,是信息管理的研究对象之一。

(2)信息活动

它是指人类社会围绕信息资源的形成、传递和利用而开展的管理活动与服务活动。信息资源的形成阶段以信息的产生、记录、收集、传递、存储、处理等活

相关文档
最新文档