主数据管理一些概念

主数据管理一些概念
主数据管理一些概念

什么是主数据管理(Master Data Management ,MDM)

主数据是指在整个企业围各个系统(操作/事务型应用系统以及分析型系统)间要共享的数据,比如,可以是与客户(customers), 供应商(suppliers), (accounts)以及组织单位(organizational units)相关的数据。主数据通常需要在整个企业围保持一致性(consistent)、完整性(complete)、可控性(controlled),为了达成这一目标,就需要进行主数据管理(Master Data Management ,MDM)。需要注意的是,主数据不是企业所有的业务数据,只是有必要在各个系统间共享的数据才是主数据,比如大部分的交易数据、帐单数据等都不是主数据,而像描述核心业务实体的数据,而像客户、供应商、、组织单位、员工、合作伙伴、位置信息等都是主数据。主数据是企业能够跨业务重复使用的高价值的数据。这些主数据在进行主数据管理之前经常存在于多个异构或同构的系统中。

主数据管理(Master Data Management ,MDM)是指一组约束和方法用来保证一个企业主题域和系统相关数据和跨主题域和系统的相关数据的实时性、含义和质量。这是从深层次来说来说明主数据管理(MDM)的深度和复杂性,简单的说,主数据管理(MDM)保证你的系统协调和重用通用、正确的业务数据(主数据)。通常,我们会把主数据管理作为应用流程的补充,通过从各个操作/事务型应用以及分析型应用中分离出主要的信息,使其成为一个集中的、独立于企业中各种其他应用核心资源,从而使得企业的核心信息得以重用并确保各个操作/事务型应用以及分析型应用间的核心数据的一致性。通过主数据管理,改变企业数据利用的现状,从而更好地为企业信息集成做好铺垫。

主数据管理(MDM)可以帮助我们创建并维护整个企业主数据的单一视图(Single View),保证单一视图的准确性、一致性以及完整性,从而提供数据质量,统一商业实体的定义,简化改进商业流程并提供业务的响应速度。从变化的频率来看,主数据和日常交易数据不一样,变化相对缓慢,另外,主数据由于跨各个系统,所以对数据的一致性、实时性以及版本控制要求很高。

主数据管理其实在很早之前就一直存在,只不过现在随着业务发展以及监管的需要,对主数据的实时性、准确性、一致性有了更高的要求,才被业界广泛接受,各个厂商相应的推出了一系列的主数据管理集成与基础套件以及特定领域的解决方案。近年来最明显的变化是,客户在以前的时候经常问的问题是:“主数据管理是什么?”,而现在客户经常问的问题演变成了:“我们的业务的确存在一些问题,主数据管理正好可以解决这个问题,我们怎么开始?”。与以前相比,客户对主数据管理(MDM)的认识有了巨大的进步,并开始尝试用主数据管理(MDM)解

决他们在整个企业围进行跨业务、跨主题域时遇上的各种挑战和问题:比如税务行业,税务局在按纳税人在一些分析统计时,就发现关于纳税人的基本信息分布在核心征收管理系统、发票管理系统、个人所得税系统、增值税管理系统等多达几十个系统中,使得统计分析变得困难起来,在比如在医疗设备公司,由于没有按照供应商进行产品层次的分类,各个产品的描述也很不一样,使得产品目录的维护十分困难。随着业务的发展,对各行各业来说,生成并维护一个统一的主数据系统变的十分迫切和必要,特别是对一些跨国公司,如何在不同的地区(各个国家和地区)的业务系统之间维护关于客户、产品目录、供应商等信息的单一视图更是重要。

需要注意的是,主数据(Master Data)和元数据(Meta Data)是两个完全不同的概念。元数据是指表示数据的相关信息,比如数据定义等,而主数据是指实例数据,比如产品目录信息等。比如,某省地税开发了一套征收管理软件,以市为单位部署了17套,每套征收管理软件中的元数据都是一样的,但是主数据还是需要进行管理的。主数据管理和传统数据仓库解决方案不是一个概念,数据仓库会将各个业务系统的数据集中在一起在进行业务的分析,而主数据管理系统不会把所有数据都管理起来,只是把需要在各个系统间共享的主数据进行采集和发布。相对于传统数据仓库解决方案的单向集成,主数据管理正注重将主数据的变化同步发布到各个关联的业务系统中(主数据管理数据是双向的)。

主数据管理问题存在的根源

对于大多数的企业都存在主数据管理的问题,个人以为这是由于业务发展的渐进性以及IT 技术发展的渐进性造成的,正是由于这种渐进性,各大企业的业务系统从经历了从无到有,从简单到复杂,从而形成了一个又一个的业务竖井。从根本上来说,不可能只使用一个业务系统就能覆盖企业的所有业务,即便对一些国际大型的公司提供的套件来说也是一个不可能完成的任务(即便对套件来说,经常也存在一个跨国企业在不同的国家或地区部署多个实例的现象,也就是没有集中部署该套件,而是在很多地方分散部署了该套件)。对企业来说,业务系统的构建更多是以项目为中心,从下而上的构建系统,而不是至上而下的构建系统,必然缺乏整个企业围的统一规划,从而使得一些需要在各个业务中共享的数据(主数据)被分散到了各个业务系统进行分别管理。分散管理的主数据由于没有不具备一致性、准确性、完整性,使得各个企业普遍存在着产品管理不力、供应商管理不力、订单管理不力等现象。解决这一问题的根本方法就是引入主数据管理(MDM),主数据不光指需要共享的数据,更包含需要共享的业务规则和策略。

主数据管理(MDM)的成熟度

根据主数据管理实施的复杂程度,参照Jill Dyche, Evan Levy的观点大体可以把主数据管理可以分为五个层次,从低到高反映了主数据管理(MDM)的不同成熟度。下面我们简单介绍一下这五个层次:

Level 0 :没有实施任何主数据管理(MDM)

在Level 0的情况下,意味着企业的各个应用之间没有任何的数据共享,整个企业没有数据定义元素存在。比如,一个公司销售很多产品,对这些产品的生产和销售由多个独立的系统来处理,各个系统独立处理产品数据并拥有自己独立的产品列表,各个系统之间不共享产品数据。在Level 0, 每个独立的应用负责管理和维护自己的关键数据(比如产品列表、客户信息等),各个系统间不共享这些信息,这些数据是不连通的。

Level 1 :提供列表

不管公司大还是小,列表管理是我们常用的一种方式。在公司部,会通过手工的方式维护一个逻辑或物理的列表。当各个异构的系统和用户需要某些数据的时候,就可以索取该列表了。对于这个列表的维护,包括数据添加、删除、更新以及冲突处理,都是由各个部门的工作人员通过一系列的讨论和会议进行处理的。业务规则(Business Rules)是用来反映价值的一致性,当业务规则发生改变或者出现类似的情况时,这样高度手工管理的流程容易发生错误。由于列表管理是通过手工管理的,其列表维护的质量取决于谁参加了变更管理流程,一旦某人缺席,将会影响列表的维护。

MDM Level 1比MDM Level 0的不同就是,各个部门虽然还是独立维护各自的关键数据,但会通过列表管理维护一个松散的主数据列表,能够向其他各个部门提供其需要的数据。在MDM Level 1中,数据变更决定以及数据变更操作都是由人来决定的,因此,只有人完成数据变更决定后才会变更数据。在实际情况中,虽然数据变更流程有严格的规定,但是由于缺乏集中的、基于规则的数据管理,当数据量比较大时,数据维护的成本会变的很高,效率也会很低。当主数据,比如客户信息、产品目录信息等数量比较少时,列表管理的方式是可行的,但是当产品目录或客户列表出现爆炸式增长以后,列表管理的变更流程将变得困难起来。MD M Level 1 依赖于人的协作。如果产品经理需要更新过后的产品价格列表,那需要联系ERP系统所有者,让其发送给她。在企业围实现客户或产品列表就如同维护不同部门之间人们的关系

一样。如果客户或产品存在层次或分组,列表将很难提供,并且通常在Level 1因为过于复杂难以被管理。

Level 2 :同等访问(通过接口的方式,各个系统与主数据主机之间直接互联) MDM Level 2与MDM Level 1相比,引入了对主数据的(自动)管理。通过建立数据标准,定义对存储在中央知识库(Central Repository)中详细数据的访问和共享,为各个系统间共享使用数据提供了严密的支持。中央知识库(Central Repository)通常会被称为“主数据主机(Master Data Host)”。这个知识库可以是一个数据库或者一个应用系统,通过在线的方式支持数据的访问和共享。

创建、读取、更新和删除(CRUD)是处理基本功能的典型编程术语。即便在MDM中,CR UD处理也是基本功能。你的数据库如果仅仅支持CRUD处理并不意味着你实现了MDM。M DM Level 2引入了“同等访问”(peer-based access),也就是说一个应用可以调用另一个应用来更新或刷新需要的数据。当CRUD处理规则定义完成后,MDM Level 2 需要客户或“同等”应用格式化请求(和数据),以便和MDM知识库保持一致。MDM知识库提供集中的数据存储和供应(provisioning)。在这个阶段,规则管理、数据质量和变更管理必须在企业围作为附加功能定制构建。

比如,一个数据库或一个打包应用(比如一个销售自动化系统)对外部应用提供数据访问功能。当一个外部应用(比如呼叫中心应用)需要增加一个客户,这个外部应用将提交一个事务,请求数据所有者增加一个客户条目。主数据主机(Master Data Host)将增加数据并告知外部应用。CRUD处理方式比纸上办公有了很大提高,其是基于会话的数据管理。在MDM Level 1,数据变更是基于手工的方式。在MDM Level 2,数据变更是自动完成的—通过由具体技术实现的标准流程,允许多应用系统修改数据。MDM Level 2可以支持不同的应用使用和变更单一、共享的数据知识库。MDM Level 2 需要每个同等应用理解基本的业务规则以便访问主列表、与主列表进行交互。因此,每个同等应用必须正确恰当地创建、增加、更新和删除数据。授权应用有责任坚持数据管理原则和约束。

Level 3 :集中总线处理

与MDM Level 2相比,MDM Level 3打破了各个独立应用的组织边界,使用各个系统都能接受的数据标准统立和维护主数据(MDM Level 2的主数据主机上存储的数据还是按照各个系统分开存储的,没有真正的整合在一起)。

集中处理意味着为MDM构建了一个通用的、基于目标构建的平台。大多数公司发现MD M正在挑战他们现有的IT架构:他们拥有太多的独立平台处理主数据。MDM Level 3 集中数据访问、控制跨不同应用和系统使用数据。这极大的降低了应用数据访问的复杂性,大大简化了面向数据规则的管理,使MDM比一个分散环境具有更多的功能和特点。企业主数据面临一致性的挑战。数据在不同的地方存在,数据所代表的含义也是不同的,数据的规则各个系统之间也是不一样的。集中MDM处理-通过一个公共的平台作为一个总线(HUB)-说明一个共识,从多个系统整合主题域数据,意味着使用集中、标准化的方法转换异构操作数据,不管其在源系统中是什么样子,都会被整合起来。在MDM Level 3,公司对主题域容采用集中管理方式。这意味着应用系统,作为消费者或使用主数据,拥有一个共识就是数据是主题数据容的映像,打破了各个独立应用的组织边界。MDM Level 3支持分布主参考数据的存在。

MDM的核心之一就是保证所有系统都能接受数据表示的唯一公认方法。这有点类似于语言翻译,通过其他语言的翻译,英语已经称为一个全球性的语言。在MDM Level 3,一个公司可以让任意两个系统共享数据和说对方的语言。MDM Level 3还降低了等同访问的复杂性。"消费"应用不再需要支持系统定位和操作逻辑。任何与源系统数据相关的分布式细节都会被M DM总线集中处理。在MDM Level 3自动数据标准意味着:建立目标数据值表示和通过必要的步骤提供精确的主数据值捕获。在所有的分类中从MDM Level 3开始第一次支持一致性的企业数据视图。数据质量规则在这里进行数据清洗和错误纠正。

Level 4 :业务规则和政策支持

一旦数据从多个数据源整合在一起,主题域视图超越单独的应用并表现为一个企业视图,你将获得事实的单一版本。当事实的单一版本已经能够提供出来时,来自业务主管和执行人员的必然反应经常是:“证明它”。MDM Level 4可以保证主数据反映一个公司业务规则和流程,并证实其正确性。MDM Level 4通过引入主数据来支持规则,并对MDM总线以及其它外部系统进行完整性检查。由于多数公司相对比较复杂,影响业务数据访问和操作的规则以及策略(r ules and policies)相对也比较复杂。假定任何一个单一系统可以包含并管理与主参考数据相关

的各种类型的规则是不切实际的。因此,如果一个MDM总线真正打算提供企业围数据的精确性,工作流和流程整合的支持是必不可少的。

举例来说,在一个HMO,需要多个应用来支持一个病人的护理。一个单一的访问(visit)可能包括入院、房间和床位分配、监控设备、化验、身体检查以及其他程序等。一旦一个病人准备离开医院,出院流程需要确保和这个病人相关的所有活动、资源都被结清。MDM技术在召集多个应用系统一起保证病人辨识方面是十分有效的,处理是正确的。虽然病人辨识很重要,业务规则整合同样重要。临床系统依靠一系列的业务流程和数据规则来辨别所有显著的病人详细资料。这包括返回所有基于房间的资源(监护设备、床位等)以得到有用的详细目录,当病人要出院时分解其所有的费用。MDM保证当John Smith出院时,正确的房间和设备放入到该J ohn Smith的详细目录中,而不是其他的John Smith(正在另一个楼层做身体治疗)。

MDM系统必须不仅支持基于规则的整合,还要能够整合外部的工作流。这些规则可能包括通过总线与临床系统交互或等待另一个系统或者人(有权限做出改变的人)审批。通过一个M DM总线,规则定义可以不仅局限在逻辑上,还可以依赖于其他系统的输入。当然,协调和审计数据意味着可以回退其他系统(或业务流程)来保证数据变化经过严格的审批,这样错误可以被发现并且事务在需要的时候可以被回滚。MDM Level 4提出对规则和策略扩展性的支持。通过总线以一个灵活可持续的方式支持任何面向业务的规则集合这很重要。

比如,如果一个商店经理更新一个产品的价格,总线系统需要能够和一个可信系统(比如,商品管理系统)进行协商以便使规则生效。详细规则将支持另一个系统中存在产品价格的变更—总线需要能够理解能够处理和批准变更的权限系统或方法。这些规则可能涉及到复杂性或隐私限制,禁止它们直接在总线上存在。在MDM Level 4,一个企业可以支持一套步骤或任务,在一个特殊的创建、读取、更新和删除任务被允许之前这些步骤或任务必须遵守。工作流自动化经常用来支持发生在总线上的事件或活动的授权。但是变更管理远远不仅仅是工作流:它可以包括基于逻辑的流程和基于人的决策。变更管理的存在可以支持动态业务,允许变更。举例说明,在911之前,任何人都可以在美国国的航空公司运载货物。没有规定以外的其他某种形式的鉴定和付款方式。911之后,美国联邦航空协会(FAA)指导建立了一个更加全面的规定,指示一个人是否被允许运载货物。在这个特殊的例子中,要求各个系统都部署FAA对托运人的要不现实的。部署一个规则管理系统,为所有的系统(包括MDM总线)集中托运人批准规则,更加容易实现(也更现实)。集中数据定义和标准化在MDM Level 2就已经引入,与MDM

Level 4的集中规则管理相比,相对简单。业务流程越复杂、业务流程越多,对总线的需求就越多,以便对针对共同数据的跨职能、异构规则进行更好的支持。重要的是MDM Level 4支持集中规则管理,但是规则本身和相关的处理是可以分开的。换句话说,MDM总线需要保证规则是集中应用的,即便这个规则是在总线外居住的。

Level 5 :企业数据集中

在MDM Level 5 ,总线和相关的主数据被集成到独立的应用中。主数据和应用数据之间没有明显的分隔。他们是一体的。当主数据记录详细资料被修改后,所有应用的相关数据元素都将被更新。这意味着所有的消费应用和源系统访问的是相同的数据实例。这本质上是一个闭环的MDM:所有的应用系统通过统一管理的主数据集成在一起。在这个级别,所有在系统看起来都是事实的同一个版本。操作应用系统和MDM容是同步的,所以当变更发生时,操作应用系统都将更新。在那些熟悉的MDM架构风格中,持久总线架构,当一个总线更新所有的操作应用系统将体现这种变更,形成改变的直接操作视图。在注册环境中,当数据数据更新时,总线将通过Web服务连接相关系统应用事务更新。因此,MDM Level 5提供一个集成的,同步的架构,当一个有权限的系统更新一个数据值时,公司所有的系统将反映这个变更。系统更新完数据值后不要单选其他系统中相应值的更新:MDM将使这种更新变的透明。

从MDM Level 4到MDM Level 5意味着MDM功能性不是在一个应用被特殊设计或编码的。这还意味着主数据传播和供应不需要源系统专门的开发或支持。所有的应用清楚的知道他们并不拥有或控制主数据。他们仅仅使用数据来支持他们自己的功能和流程。由于MDM总线和支持的IT基础架构,所有的应用可以访问主参考数据。一个公司在完成MDM Level 5后将使他们所有的应用连在一起—既包括操作的也包括分析的—所有访问主数据是透明的。举例说明,当一个客户更新她的状态—不要管注册该变更的系统—数据变更将被广播到所有的应用平台(因此一致起来)。MDM Level 5是把数据概念作为一种service来实现。MDM Level 5保证了一个一致的主数据主题域企业映像。定义“客户”和其他应用接受客户主数据业务规则变化实际上是一回事。MDM Level 5移走了主数据的最后一个障碍:统一采用数据定义、授权使用和变更传播。

如何构建一个主数据管理(MDM)的解决方案

在开始构建主数据管理(MDM)解决方案之前,首先需要明确我们当前的数据管理现状是什么样子的,而我们的目标是什么,具体可以参照上一小节:主数据管理(MDM)的成熟度。

第二步,需要确定我们的每个主数据域的围(这也是前期需求分析的一部分)。常见的主题域有:

Party :可以反映任何合法的实体, 无论是个体还是组织。

Product :既包括物理存在的货物,也可以是任何服务。

Account :包括期限和条件,以及相关的各种关系。

Location :既可以独立存在,也常常与其他主数据域共存。

第三步,进行数据管理系统的设计,在设计时要注意以下几点:

数据采集和发布是否实时,最小的响应时间是多少。

数据转换规则能否让客户定制,而不是硬编码。

如果根据数据质量标准清理主数据域中的主数据。

权限控制。

主数据的历史版本控制以及变更监控控制(当主数据变化时,要能记录该变化,另外还要对主数据形成层次并记录其不同的版本值)。

第四步,开发部署测试。

信息管理概论作业1-答案

作业1 姓名:学号:工作站: 一、填空题: 1.古代封建社会的信息资源主要以以文献信息资源为主,古代信息管理时期的信息管理对象以以纸制手抄本、印刷本为主,此时的信息管理重心集中于以藏为主,倡导的信息管理方式是:四部分类法。 2.联合国教科文组织认定的图书馆四项职能是:保存人类文化遗产、社会信息流整序、传递情报、启发民智的文化教育。 3、马费成的四阶段说:传统管理阶段:以图书馆文献信息源管理 为核心;技术管理阶段:以信息流的控制为核心;资源管理阶段:以信息资源管理为核心;知识管理阶段:以知识的创造、学习、应用、理解和协商为核心。 4、信息管理思想的发展过程中,尤以国外学者为代表,信息过程说的代表人物是:泰 勒(R.S.Taylor)内容是围绕信息的收集与整理、信息的传递、信息过程的成本、信息过程的效果。国内比较尤代表的学者卢泰宏教授提出了三维结构理论,将信息管理的基本问题归纳为五个问题域,分别是存、理、传、找、用。 5、知识管理的三要素是:组织、人、信息技术。 6、知识管理技术如按过程分类,它包括生产、共享、应用和创新 二、名词解释 1、信息:从本体论层次和认识论层次进行回答,本体论层次的信息定义、认识论层次的信息定义 见书本47页 2、知识:知识分为显性知识和隐性知识,见书本28页第三段。 3、信息管理:借助于现代信息技术,充分运用经济、人文等手段,对社会中存在的各种类型的 信息资源及信息活动加以管理,以求最大限度地发挥它的作用,实现它的价值,并带来效益。 管理包括对信息资源进行规划、组织、配置、传递、利用、反馈和评估;信息管理不但是一种管理的思想,也是一种管理的技术手段,在某种程度上说,它还是一个系统。P25 4、知识管理:知识管理是协助企业组织和个人(people),围绕各种来源的知识内容(knowledge),

大数据结构的基本概念

实用标准文档 文案大全第1章数据结构基础 结构之美无处不在: 说到结构,任何一件事物都有自己的结构,就如可以看得见且触摸得到的课桌、椅子,还有看不见却也存在的化学中的分子、原子。可见,一件事物只要存在,就一定会有自己的结构。一幅画的生成,作家在挥毫泼墨之前,首先要在数尺素绢之上做结构上的统筹规划、谋篇布局。一件衣服的制作,如果在制作之前没有对衣服的袖、领、肩、襟、身等各个部位周密筹划,形成一个合理的结构系统,便无法缝制出合体的衣服。还有教育管理系统的结构、通用技术的学科结构和课堂教学结构等。试想一下,管理大量数据是否也需要用到数据结构呢? 本章知识要点: 数据结构的基本概念 数据类型和抽象数据类型 算法和算法分析 1.1 数据结构的基本概念 计算机科学是一门研究数据表示和数据处理的科学。数据是计算机化的信息,它是计算机可以直接处理的最基本和最重要的对象。无论是进行科学计算,还是数据处理、过程控制、对文件的存储和检索以及数据库技术等计算机应用,都是对数据进行加工处理的过程。因此,要设计出一个结构良好而且效率较高的程序,必须研究数据的特性、数据间的相互关系及其对应的存储表示,并利用这些特性和关系设计出相应的算法和程序。 计算机在发展的初期,其应用围是数值计算,所处理的数据都是整型、实型和布尔型等简单数据,以此为加工、处理对象的程序设计称为数值型程序设计。随着计算技术的发展,计算机逐渐进入到商业、制造业等其他领域,广泛地应用于数据处理和过程控制中。与此相对应,计算机所处理的数据也不再是简单的数值,而是字符串、图形、图像、语音和视频等复杂的数据。这些复杂的数据不仅量大,而且具有一定的结构。例如,一幅图像是一个由简单数值组成的矩阵,一个图形中的几何坐标可以组成表。此外,语言编译过程

管理信息系统的基本概念

第一讲管理信息系统的基本概念 一、信息二、系统三、信息系统四、管理信息系统 一、信息(Information) 1.数据是用人们可以识别的符号记录下来的客观实体属性的值。 数据记录需要载体。载体不同,记录数据的形式也可能不同。 2. 信息:信息是经过加工对某个目的有用的数据。 3.信息的性质: 1)事实性(真伪性):符合事实的信息为“真信息”,不符合事实的信息为“伪信息”。 2)实效性:随着时间的推移信息的效用逐渐减小,直至全部消失。 3)不完全性:由于人的能力所限,人们不可能得到关于客观事实的全部信息。再说,人们也不必要去了解关于客观事实的全部信息。 4)等级性:对应不同的管理层次,管理信息分为:作业级、战术级和战略级三个等级。 5)变换性:根据不同的载体可以将信息变换成不同的形式。 6)价值性:信息是经过加工得到的,是劳动创造的,是一种资源,因而是有价值的。 7)共享性:信息可被多人共同拥有和使用。 8)异步性:①滞后性:加工信息需要一定的时间; ②超前性:可根据历史数据预测未来。 9)再加工性:经过加工得到的信息可以被再次加工产生满足更高层次需要的新信息。4.信息的度量:信息量——消除人们对某事物认识的不确定性的多少。 1)一个事件发生一次所产生的信息量 注:若以e为底,单位为nat ;若以10为底,单位为hart 。 2)某一时期,多个事件发生多次所产生的平均信息量(信息熵) 二、系统 1.系统的定义:系统是由若干个(至少2个)相互联系、相互作用的组成部分(元素)为完成某个(些)共同的目的而结合在一起的有机的整体。 2.系统的特征 1)整体性2)相关性3)目的性4)环境适应性 3.系统的生命期 三、信息系统 1.为什么要建立信息系统 企业的“四流” 2.什么是信息系统 信息系统是一个由人、硬件、软件和数据资源组成的,以及时、正确地收集、加工、存储、传递和提供信息,实现组织中各项活动的管理、调节和控制为目的的人造系统。 3.信息系统的发展 1)电子数据处理(Electronic Data Processing,EDP)阶段 ①单项数据处理阶段(20世纪50年代中期——60年代中期) 特征:用计算机简单代替手工劳动。 ②综合数据处理阶段 (20世纪60年代中期——70年代初期)

信息管理概论作业答案精编版

信息管理概论作业答案文件编码(008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256)

《信息管理概论》四次作业参考答案 第一次作业 第一章、信息管理的产生与发展 第一章、信息管理的产生与发展 一、填空题 1、纵观人类信息管理活动所采用的手段与方法,信息管理活动的发展分为三个时期分别是:()、()和 ()。 2、以( )结束为标志,信息管理活动进入了现代信息管理时期。 3、从信息管理的起源角度,有三个领域认为信息管理起源于它们的工作,分别是( )、( ) 和 ( ) 三个领域。 4、从对信息管理理解的不同层面角度,信息管理具有两方面的特征,一方面是技术特征,另一方面是( )特征,它们共同构成了信息管理的内涵与特色。 5、联合国科教文组织认定的图书馆四项职能是:()、 ()、()、()。 6、人们对信息管理的认识与把握至少表达出五种不同的含义,分别有 ()、信息媒体管理、()、()、信息产业或行业队伍管理。 7、一般认为,信息管理思想的发展历史可分为四个阶段,分别是:()阶段,()阶段,()阶段,()阶段。 8、知识管理的发展始终围绕着()、()和()这三个要素。 9、全信息的三要素分别为()、()、()、 10、联合国经合组织(OECD)将知识分为四种类型,即()、()、()、()。 一、填空题 1、古代信息管理活动时期、近代信息管理活动时期、现代信息管理活动时期 2、第二次世界大战 3、图书馆领域、工商企业管理领域、政府行政管理领域 4、管理理念 5、保存人类文化遗产,社会信息流整序,传递情报,启发民智的文化教育 6、信息内容管理,信息媒体管理,计算机信息管理,管理信息系统,信息产业或行业的队伍管理。

信息管理系统相关概念的区别与联系

信息管理系统相关概念的区别与联系 ●ERP是Enterprise Resource Planning(企业资源计划)的简称,ERP是针对 物资资源管理(物流)、人力资源管理(人流)、财务资源管理(财流)、信息资源管理(信息流)集成一体化的企业管理软件。它将包含客户/服务架构,使用图形用户接口,应用开放系统制作。除了已有的标准功能,它还包括其它特性,如品质、过程运作管理、以及调整报告等。 ●MIS系统通常用于系统决策,例如,可以利用MIS系统找出目前迫切需要解决 的问题,并将信息及时反馈给上层管理人员,使他们了解当前工作发展的进展或不足。 ●SCM(Supply Chain Management)系统即供应链管理系统。所谓供应链,是 围绕核心企业,通过对信息流、物流、资金流的控制,从采购原材料开始,制成中间产品以及最终产品,最后由销售网络把产品送到消费者手中的将供应商、制造商、分销商、零售商、直到最终用户连成一个整体的功能网链结构模式。它是一个范围更广的企业结构模式,它包含所有加盟的节点企业。 它不仅是一条连接供应商到用户的物料链、信息链、资金链,而且是一条增值链,物料在供应链上因加工、包装、运输等过程而增加其价值,给相关企业都带来收益 ●客户关系管理系统(crm)是利用信息科学技术,实现市场营销、销售、服 务等活动自动化,是企业能更高效地为客户提供满意、周到的服务,以提高客户满意度、忠诚度为目的的一种管理经营方式。客户关系管理既是一种管理理念,又是一种软件技术。 ●区别与联系 1.供应链管理系统(SCM)已经同企业资源管理系统(ERP)和客户关系管理系统 (CRM)一起成为企业业务管理信息化的重点。 2.Sap和Siebel是企业管理及电子商务方面的系列软件,主要有客户关系管 理,企业信息管理,企业绩效管理,企业资源规划,管理和遵从,人力资本管理,产品生命周期管理,服务与资产管理,供应链管理等功能。 3.Mis系统这个概念的范围最大,是通过计算机技术协助完成政府,企业的管 理及相关的业务活动。 4.ERP主要指企业资源计划,通过对企业的各个部门的信息搜集和管理,为企 业下一步的策略提供科学可靠的依据。 5.SCM是供应链管理系统,CRM是客户关系管理系统,这两个可以属于ERP中 的一部分。它们实在ERP的基础上细化。

RH436-1数据管理、存储及集群技术概述

数据管理、存储及集群技术概述 一、数据 1.数据的分类 1.1.用户数据:用户数据的保护比系统数据更具有挑战性,用户数据的丢失或泄露则是致命的,比如银行业务λ 1.2.系统数据:系统数据丢失了并不会造成企业真正的损失λ 1.3.应用数据:应用数据在企业中是最不能轻视的,大量攻击都是通过系统上应用的漏洞来开展的λ 2.数据可用性 2.1.哪些数据必需保证高可用λ 2.2.注意数据的生命周期:分类存储(打包归档还是直接存储)λ 2.3.数据的访问方法和频率:是只读的还是可读写的?是应用程序的数据,还是可以直接访问的数据?是一个网络配置文件,还是为为了安全的配置?λ 2.4.应用程序的“data starved”数据饥饿:不应该是数据跟不上来,而应该是程序跟不上λ 2.5.所有的一切都要防止单点故障(SPOF:single points of failur)λ 3.规划设计 3.1. 数据越少要求越小λ 3.2. 减小复杂性λ 3.3. 增加灵活性λ 3.4. 保证数据的完整性λ 二、集群 集群是有一组计算机来共同完成一件比较复杂的事情。 1.集群的目标 1.1. HPC(High Performance):高性能集群,追求性能,大型的运算,λ 1.2. HA(High Availability):高可用,追求稳定,主要是为了防止单点故障,为了实现的是24小时不间断的工作,并不要求有多快λ 1.3. LBC(Load Balancing):负载均衡集群,基本不用(现大多数利用硬件LBC设备)λ 2.redhat的cluster products 2.1. RHCS(Redhat cluster suite):红帽集群套件,在RHEL5的AP版自带的λ 2.2. GFS(Global File system):全局文件系统,GFS支持并发写入。是一个集群级的文件系统。λ 2.3. CLVM (Clusterd logical volume manager):集群级的逻辑卷,的LVM 只是单机版的逻辑卷,在一个节点做了LVM,只能在这个节点看到。若果使用的是CLVM,做的LVM则可以在整个集群中看到。λ 2.4. Piranha:LVS 基础上设计的一套负载均衡高可用解决方案,LVS是基于IP 的负载均衡技术,由负载调度器和服务访问节点组成。λ 3.集群的基本拓扑

信息管理概论真题及答案

信息管理概论 试题 第 1 页 共 9 页 河南广播电视大学2007—2008学年度第二学期期末考试 信息管理概论 试题 (开卷) 2008 年7月 一、填空题(每小题2分,共20分) 1.人们通常对信息管理的认识与把握至少表达出五种不同的含义:______,信息媒体管理,计算机信息管理,管理信息系统,信息产业或行业的队伍管理。 2.________是信息管理思想发展到一定的历史时期所出现的一个新的阶段。 3.从人们认识信息的层次上还可以把信息的诸多定义划分为三个层面:一是在日常生活层面上,二是在科学或科学认识层面上,三是在________上。 4.________是由一组控制计算机系统并对其进行管理的程序组成。它是计算机系统的控制和管理核心,其任务是控制、管理计算机的各种资源和工作流程,组织、协调计算机的运行,为其他系统软件和应用软件提供服务和支持。 5.BBS (Bulletin Board System )就是__________。 6.信息采集要遵循一定的原则:一是_________;二是针对性原则;三是及时性原则;四是系统性原则;五是预见性原则;六是计划性原则。 7.元数据结构从功能上来说可分为________、句法结构和语义结构。 8.如果从科学的正式交流渠道与非正式交流渠道的思想出发,网络信息资源可以分为__________和不稳定的信息资源两类。

信息管理概论 试题 第 2 页 共 9 页 9._______包括结构分析(SA )、结构化设计(SD )和结构化程序设计(SP )。 10.初期的决策支持系统的框架结构一般由模型库、数据库以及__________等三个部件组成,20世纪80年代,DSS 增加了知识库和方法库。 二、名词解释题(每小题5分,共10分) 1.现代信息管理 2.模式 三、简答题(每小题15分,共30分) 1.为什么在知识经济社会里,呼唤着知识管理的出现?

大数据基本概念及技术

大数据是当前很热的一个词。这几年来,云计算、继而大数据,成了整个社会的热点,不管什么,都要带上“大数据”三个字才显得时髦。大数据究竟是什么东西?有哪些相关技术?对普通人的生活会有怎样的影响?我们来一步步弄清这些问题。 一、基本概念 在讲什么是大数据之前,我们首先需要厘清几个基本概念。 1.数据 关于数据的定义,大概没有一个权威版本。为方便,此处使用一个简单的工作定义:数据是可以获取和存储的信息。 直观而言,表达某种客观事实的数值是最容易被人们识别的数据(因为那是“数”)。但实际上,人类的一切语言文字、图形图画、音像记录,所有感官可以察觉的事物,只要能被记下来,能够查询到,就都是数据(data)。

不过数值是所有数据中最容易被处理的一种,许多和数据相关的概念,例如下面的数据可视化和数据分析,最早是立足于数值数据的。 传统意义上的数据一词,尤其是相对于今天的“大数据”的“小数据”,主要指的就是数值数据,甚至在很多情况下专指统计数值数据。这些数值数据用来描述某种客观事物的属性。 2.数据可视化 对应英语的data visulization(或可译为数据展示),指通过图表将若干数字以直观的方式呈现给读者。比如非常常见的饼图、柱状图、走势图、热点图、K线等等,目前以二维展示为主,不过越来越多的三维图像和动态图也被用来展示数据。 3.数据分析 这一概念狭义上,指统计分析,即通过统计学手段,从数据中精炼对现实的描述。例如:针对以关系型数据库中以table形式存储的数据,按照某些指定的列进行分组,然后计算不同组的均值、方差、分布等。再以可视化的方式讲这些计算结果呈现出来。目前很多文章中提及的数据分析,其实是包括数据可视化的。

大数据概念

大数据概念 大数据(big data),指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产[1] 在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》[2] 中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety (多样)、Value(价值)、Veracity(真实性)。 应用学科:计算机,信息科学,统计学 适用领域范围: BI,工业4.0,云计算,物联网,互联网+, 人工智能 大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。 从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。 随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。《著云台》的分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘电网、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。 意义 现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大数据就是这个高科技时代的产物。阿里巴巴创办人马云来台演讲中就提到,未来的时代将不是IT时代,而是DT的时代,DT就是Data Technology数据科技,显示大数据对于阿里巴巴集团来说举足轻重。 有人把数据比喻为蕴藏能量的煤矿。煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,而露天煤矿、深山煤矿的挖掘成本又不一样。与此类似,大数据并不在“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要。对于很多行业而言,如何利用这些大规模数据是成为赢得竞争的关键。 大数据的价值体现在以下几个方面: 1)对大量消费者提供产品或服务的企业可以利用大数据进行精准营销 2) 做小而美模式的中长尾企业可以利用大数据做服务转型 3) 面临互联网压力之下必须转型的传统企业需要与时俱进充分利用大数据的价值不过,“大数据”在经济发展中的巨大意义并不代表其能取代一切对于社会问题的理性思考,科学发展的逻辑不能被湮没在海量数据中。著名经济学家路德维希·冯·米塞斯曾提醒过:“就今日言,有很多人忙碌于资料之无益累积,以致对问题之说明与解决,丧失了其对特殊的经济意义的了解。”这确实是需要警惕的。在这个快速发展的智能硬件时代,困扰应用开发者的一个重要问题就是如何在功率、覆盖范围、传输速率和成本之间找到那个微妙的平衡点。

信息管理与信息系统概论复习题及参考答案15题

1. 简述信息、知识、数据三者的区别和联系。 在数据的基础上形成信息,在信息的基础上形成知识。数据是信息的起源,信息是知识的原料,知识是信息加工提炼的结晶。他们是一种递进的关系。知识是信息的特例,是信息的高级形式,是对有用的信息加工的结果,是系统化的、有序化的信息。 2. 什么是信息化信息化在层次上分为哪几类 信息化是人类历史发展现阶段的一项任务,它是社会发展的一个过程。信息化就是在现代信息技术广泛普及的基础上,社会和经济的各个方面发生深刻的变革,在功能和效率上大幅度地提高,从而达到人类社会的新的文明水平的过程。 信息化包含五个层次:产品信息化、企业信息化、产业信息化、国民经济信息化和社会生活信息化。 3. 什么是信息资源 广义的信息资源既包括信息内容本身,又包括有关提供信息的设施、设备、组织、人员和资金等,也就是信息资源及与它有关的各种资源的总和。狭义的信息资源就是信息内容本身所构成的信息有序化集合,是广义的信息资源的基础和主要构成。 4. 什么是信息科学 信息科学是人类有关信息的各种知识和技术的总和。它包括人们对于信息的概念,信息的处理方法,信息在经济和社会生活中的作用等有关问题的认识,以及由此产生的方法和技术。信息科学包括:信息技术,信息管理,信息经济,信息社会学和信息法学,信息的基础理论。 5. 信息化建设的核心任务是什么 信息化建设的核心建设任务是一个稳定可靠的信息管理系统、建立新的信息管理体制、建设新型管理队伍以及提高信息资源管理和利用水平。 6. 信息处理的主要技术包括哪些技术 信息处理的主要技术包括计算机技、现代通信技术、遥感遥测技术、数据采集技术、现代印刷技术和现代办公室使用的各种技术。 7. 整体观念的要点是什么 所谓整体观念,即认为宇宙,以及各种层次上的复杂系统是不可分割的整体,只有把握全局,才能真正认识与掌握它。科学的整体观认为:分解只是人类认识复杂事物的方法之一,当我们把一个复杂事物分解为它的各个组成部分的时候,这些部分就已经失去了作为整体的一个部分的一系列关键属性。在部分演化为整体的时候,已经有新的质的产生,有某些功能或属性在量上的增加。 8. 演化观念的要点是什么 所谓演化观念,即认为宇宙或复杂系统的当前状态是长期演化的结果,只有把它作为一种进化过程的产物,才能理解和掌握它。 9. 层次观念的要点是什么 层次观念,即认为宇宙及复杂系统都是分层次的,层次之间互相联系又互相区别,构成了整个宇宙或复杂系统。首先,层次之间的区别不只是量的区别,而是质的区别。第二个要点就是层次之间既有联系又有区别的辩证关系。 10. 活体观念的要点是什么 活体观念,即认为事物的运动、发展和变化,任何系统的发展和演化,都是由其内在的、本质的属性所推动的,而不是外力强加的。 11. 什么是系统工程它与系统科学的关系是什么 系统工程是系统科学的一个部分,它是系统科学的整体观念、演化观念、活体观念

大数据概述及基本概念

考试:大数据概述及基本概念 试卷年份:2015年 题量:10题 答题时间:分钟 总分:100分 合格线:60分 1 【单选】下列不属于商业大数据类型的是() A. 传统企业数据 B. 机器和传感器数据 C. 社交数据 D. 电子商务数据 A B C D 正确答案:D 2 【单选】信息技术是指有关信息的收集、识别、提取、变换、存贮、传递、处理、检索、检测、分析和利用等的技术。凡涉及到这些过程和技术的工作部门,都可称作()部门 A. 技术 B. 研究 C. 信息 D. 管理 A B C D 正确答案:C 3 【单选】数据本身所承载的信息内容是指() A. 内容维度 B. 关系维度 C. 时空维度 D. 维度的交叉综合 A B

C D 正确答案:A 4 【多选】大数据平台的三个重要的技术部分有() A. 数据交易技术 B. 数据交互技术 C. 数据存储技术 D. 数据处理技术 A B C D 正确答案:A B D 5 【多选】互连网上出现的海量信息可以划分为三种,分别为() A. 结构化信息 B. 非结构化信息 C. 半结构化信息 D. 特殊化信息 A B C D 正确答案:A B C 6 【多选】“大数据”的特点是() A. 数据体量大 B. 数据类别大 C. 数据处理速度快 D. 数据真实性高 A B C D 正确答案:A B C D 7 【判断】结构化数据是指不方便用数据库二维逻辑表来表现的数据()

A. 正确 B. 错误 正确 错误 正确答案:错误 8 【判断】数据存储是大数据平台的根本。没有了存储平台,数据也就没有了载体() A. 正确 B. 错误 正确 错误 正确答案:正确 9 【判断】可视化是给机器看的,数据挖掘就是给人看的() A. 正确 B. 错误 正确 错误 正确答案:错误 10 【判断】全球数据的90%产生于过去2年内() A. 正确 B. 错误 正确 错误 正确答案:正确

Excel数据管理与图表分析 公式概述

Excel 数据管理与图表分析 公式概述 在Excel 中,公式是一种可以自动完成计算的工具。通常情况下,公式由常数、变量、函数、名称以及运算符组成的一个表达式。 1.公式的结构 公式的结构主要有两种,一种为以等号开头,即在一个空白单元格中输入一个等号,Excel 就默认为用户输入了一个公式(公式一般都是以等号“=”开头)。在等号之后需要输入计算元素(操作数)。其中,各操作数之间均以运算符进行分隔,如图2-1所示为一个典型公式的语法结构: 图2-1 公式的结构 提 示 该公式的含义为:首先计算B1至E5单元格区域中的数据之和,即B1+C1+D1+E 1+B2+C2+D2+E2+B3+C3+D3+E3+B4+C4+D4+E4+B5+C5+D5+E5;然后,将B1单元格中的数值加上12;最后,将第一次计算的结果除以第二次计算的结果。 另一种方法是尊重Excel 以前Lotus 1-2-3 的用户操作习惯,允许用户使用以@符号作为公式的起始符号,然后,后面紧跟函数,其语法结构如图2-2所示。 图2-2 公式结构 提 示 Lotus 1-2-3是1983年Lotus 公司(该公司现已被IBM 公司收购)推出的1-2-3电 子表格系统,可以称得上是个人计算机软件的杰出代表。 这两个公式在结构上,除了开头的符号不同外,另外以@符号开头的公式必须后面紧随函数,而前一种结构则无此要求。下面来介绍一下这两种结构中的各元素的功能: ● 等号或@符号 为了区分公式与字符型的常数,Excel 规定公式的最前面必须加一个“=”等号或者“@”符号,然后再输入计算的各元素。 ● 单元格引用 通过指定单元格地址,来引用某个单元格或者单元格区域中的数据进行计算。 ● 运算符 包括一些符号,例如“+”加号和“*”乘号。 数字常量 等号 单元格引用 加法运算符 函数 除法运算符 @符号 函数

大数据的定义及基本特征

大数据的定义及基本特征 无论是2001年梅塔集团分析师道格〃莱尼提出的大数据技术萌芽,还是2008年IBM公司的史密斯首次以“BIG DATA”的名词初步定义了大数据的含义,时至今日,科学届对大数据还没有给出一个完整准确的定义,不同领域的科学家们都从不同的视角诠释了大数据的基本含义。但是,纵观大数据发展的前世今生,以及今后的发展趋势,大数据的含义可以归结为: 大数据是人类认知世界的技术理念,是在信息技术支撑下,利用全新的数据分析处理方法,在海量、复杂、散乱的数据集合中提取有价值信息的技术处理过程,其核心就是对数据进行智能化的信息挖掘,并发挥其作用。 有人说世界的本质就是数据,在当今充满数字化数据的时代,数据处理变得更加容易、更加快速,人们能够在瞬间处理成千上万的海量数据,为了在数据中理解信息内容,发现信息与信息之间的关系,人类从没有像今天这样对数据有那么深刻的认识,实际上,我们应该重新认识数据的特征:(1)海量的数据规模(Volume)。具有当前任何一种单体设备难以直接存储、管理和使用的数据量,大数据中所说的“大”也包括数据的全面性。 (2)快速的数据流转和动态的数据变化(Velocity)。数据会随着时间和环境发生变化。

(3)多样的数据类型(Variety)。刻画特定事物特征或规律的数据是以多种形式存在的。 (4)巨大的数据价值(Value)。数据就是资源,许多看似杂乱无章的数据,其潜在蕴含着巨大的价值,数据的价值是由不同的应用目的而体现。 (5)智能化数据挖掘(Intelligence)。无论数据有多少,还是以何种形式呈现,人类要想从数据中发现事物的真相,必须应用全新的方法分析数据,以得到有价值的信息。

大数据的概念

大数据的概念、算法及应用 一、大数据基本概念 大数据Big Data是指大小超出了常用的软件工具在运行时间内可以承受的收集,管理和处理数据能力的数据集;大数据是目前存储模式与能力、计算模式与能力不能满足存储与处理现有数据集规模产生的相对概念。 大数据的预处理 主要完成对已接收数据的辨析、抽取、清洗等操作。 (1)抽取:因获取的数据可能具有多种结构和类型,数据抽取过程可以帮助我们将这些复杂的数据转化为单一的或者便于处理的构型,以达到快速分析处理的目的。 (2)清洗:对于大数据,并不全是有价值的,有些数据并不是我们所关心的内容,而另一些数据则是完全错误的干扰项,因此要对数据通过过滤“去噪”从而提取出有效数据。 大数据带来的数学问题 在数学上来看,计算机中存在不断变大的数据集,不存在绝对的大数据,计算机中的所有数据集都是有限集合。 ?大数据采样——把大数据变小、找到与算法相适应的极小样本集、采样对算法误差的影响 ?大数据表示——表示决定存储、表示影响算法效率 ?大数据不一致问题——导致算法失效和无解、如何消解不一致 ?大数据中的超高维问题——超高维导致数据稀疏、算法复杂度增加 ?大数据中的不确定维问题——多维度数据并存、按任务定维难 ?大数据中的不适定性问题——高维导致问题的解太多难以抉择 大数据的特征 ?稠密与稀疏共存:局部稠密与全局稀疏 ?冗余与缺失并在:大量冗余与局部缺失 ?显式与隐式均有:大量显式与丰富隐式 ?静态与动态忽现:动态演进与静态关联 ?多元与异质共处:多元多变与异质异性 ?量大与可用矛盾:量大低值与可用稀少 目前大数据的外延 大数据规模大小是一个不断演化的指标: 当前任务处理的单一的数据集,从数十TB到十几PB级的数据规模(TB?PB?EB?ZB) 处理大数据的可等待的合理时间依赖任务的目标: 地震数据预测要求在几分钟内才有效、气象数据应该在小时级别、失联飞机数据处理要在7天之内、数据挖掘一般要求在12小时内 回到顶部 二、大数据悖论 大数据已被定义为科学探索的第四范式。继几千年前的实验科学、数百年前的理论科学和数十年前的计算科学之后,当今的数据爆炸孕育了数据密集型科学,将理论、实验和计算仿真等范式统一起来。大数据已被誉为“非竞争性”生产要素。大数据具有“取之不尽,用之不竭”的特性,在不断的再利用、重组和扩展中持续释放其潜在价值,在广泛的公开、共享中不断创造着新的财富。根源在于,大数据的价值在于预测未知领域、非特定因素的未来趋势,在于破解长期的、普遍的社会难题。而目前的大数据技术和应用,依然局限于历史和实时数据的关联分析,局限于满足短线的、特定的市场需求。解决悖论的过程,恰恰是理论和方法

信息系统的概念

1.2.1信息系统的概念 信息系统是与信息加工,信息传递,信息存储以及信息利用等有关的系统。任何 一类信息系统都是由信源、信道和信宿(通信终端)三者构成。先前的信息系统 并不涉及计算机等现代技术,但是,现代通信与计算机技术的发展,使信息系统 的处理能力得到很多的提高。现在各种信息系统中已经离不开现代通信与计算机 技术,我们现在所说的信息系统一般均指人、机共存的系统。信息系统一般包括 数据处理系统,管理信息系统、决策支持系统和办公自动化系统。 数据处理系统是由设备、方法、过程,以及人所组成并完成特定的数据处理功能的系统。它包括对数据进行收集、存储、传输或变换等过程,如数据的识 别、复制、比较、分类、压缩、变形及计算等。 管理信息系统是收集、存储和分析信息,并向组织中的管理人员提供有用信息的系统。它的特是面向管理工作,提供管理所需要的各种信息。按照管理信息 系统所面向的管理组织和存取数据的方式,可以分为文件系统和数据库系统。按 其处理作业方式,可以分为批处理和实时处理系统。按其各部分之间的联系方式,可以分集中式和分布式两种类型。 决策支持系统是把数据处理的功能和各种模型等决策工具结合起来,以帮助决策的电子计算机信息处理系统.它能够在复杂的迅速变化的外部环境中,给各级 管理人员或决策者提供有关的信息资料,并协助决策者制定和分析决策。决策支 持系统使用的电子计算机技术是数据库、模型库以及可能进行实时处理的计算机 网络系统。 办公自动化系统是由计算机、办公自动化软件、通信网络、工作站等设备组成使办公过程实现自动化的系统。办公自动化软件具有办公、信息管理以及决策 支持等功能。通信网络:可以是简单的字符终端或图形终端,也可以是数据、文 字、图像、语音相结合的多功能的工作站:可以是简单的字符终端或图形终端,也可以是数据、文字、图像、语音相结合的工作站,一个比较完整的办公自动化 系统含有信息采集、信息加工、信息传输、信息保存 4 个基本环节,其核心任 务是向它的各层次的办公人员提供所需的信息,所以该系统综合体现了人、机、信息资源三者之间的关系。 他通过资源管理提高计算机系统的效率。操作系统是计算机系统的资源管理者,它含有对系统软件、硬件资源实施管理的一组程序。其首要作用就是通过 cpu管理、存储管理、设备管理和文件管理,对各种资源进行合理的分配,增大 资源的共享和利用程度,最大限度地提高计算机系统的工作效率,增强计算机系 统处理工作的能力。 改善人机界限面,想用户提供友好的工作环境。操作系统不仅是计算机硬件和各种软件之间的接口,而且是用户与计算机之间的接口。试想如果不安装操作 系统,用户将要面对01代码和以一些难懂的机器指令,通过按钮或开关来操作 计算机,这样既笨拙又费时间。安装操作系统后我以为,中国历史上最激动人心 的工程不是长城,而是都江堰. 长成当然也是非常伟大,不管孟姜女们如何痛苦流涕,站远了看,这个苦难的民族竟用人力在荒山茫漠间修了一条万里屏障,为我们生存的星球留下了一种 人类意志力的骄傲。长城到八达岭一带已经没有什么味道,而在甘肃,陕西、山 西、内蒙一带,劲历的寒风在水浒传又名、江湖豪客传、是施耐庵根据宋金时期 宋江起义故事改编而成的中国第一部长篇白话小说。这是一部描写农民斗争的伟 大史诗,在中国文学史上首开英雄传奇小说的先河,其思想艺术成就是前所未有

信息管理学答案

数据与信息的关系,并举例加以说明。 答:一般来说,原始数据在没有经过分析加工以前,其意义不容易看出与认识。为了得到有意义的、有用的信息,必须对其进行加工处理,就像低下的矿产资源需要开发一样,数据资源也需要开发才能知道它的正真价值。数据和信息的关系,可形象地解释为原料和成品的关系,数据是原料,信息是制成品。必须指出的是,数据与信息这两个概念的区别是相对的。在一些不很严格的场合或不易区分的情况下,人们将它们当作同义词,笼统的使用。因为原始数据可能会经过若干个加工处理过程,在这种情况下,前一个处理输出的信息,又会成为后一个处理的输入数据。总之,信息处理的主要目的就是为了产生对用户更加有用的新的信息。 2.论述信息在管理和决策中的作用。 答:信息是人类社会的宝贵资源,在管理、决策和控制中具有十分重要的作用。 所谓管理,就是在认识客观对象的基础上,合理地组织、使用已有的资源以实现某种目标的活动。一般认为,管理活动的主要职能是计划、组织、沟通、指挥、协调和控制,而这些管理职能的实现都以信息的获取、传递、处理和再生为基础。不难想象,离开了信息,制定计划就失去了应有的依据,组织管理就会变得混乱无序,沟通交流将成为无稽之谈,调度指挥只能是瞎说一气,协调不知该从何做起,控制会缺乏必要的前提。总之,离开了信息,任何管理活动都无法正常进行。 信息在管理中的作用之所以这么重要,不仅因为它本身就是一种重要的资源,而且还因为其它各种资源的合理配置与优化管理都需要借助信息才能实现。从这种意义上说,管理的核心就是信息,管理的过程就是一个信息过程,不同的管理职能实际上是按照某种主观信息对客观信息运动所进行的一种划分。因此,信息不仅是管理的基础,同时又是管理的出发点和归宿。 所谓决策就是在一定的环境和条件下确定实现某一任务或目标的最佳方案的一系列活动,是人们按自己的主观愿望和对客观世界的认识,制定实践的行动策略的过程,它是人们从认识世界到改造世界的中介环节。决策过程本质上是一个信息过程,是人们将拥有的客观信息经过创新思维转化为再生信息的过程。决策离不开信息,信息是决策的依据。信息是控制的灵魂。控制原本是工程技术对象系统中的一个概念,意为对对象系统的运作过程施以适当的监测调控措施,使其能排除环境的干扰,按要求的方式运作并达到设定的目标。在这个过程中,反馈信息起着决定性的作用。如今,控制这个概念连同它所体现的思想已经步入社会学和管理学领域,有了更大的用场。 控制在管理领域里的作用是,在确定管理目标,制定决策方案之后,控制则成为平衡目标与现状的砝码,成为走向预定目标的导航器。在执行预订方案的过程中,由于受内外多种因素的作用与影响,常常会出现偏离预定目标的现象。此时,需要依靠反馈信息确定偏离目标的程度,并及时采取相应的措施来纠正这种偏差。 3.论述信息资源的概念体系。 答:信息资源是信息与资源两个概念整合衍生出来的新概念。信息是普通存在的,但信息并非全都是资源,只有满足一定条件的信息才能称之为信息资源。作为资源的信息,也就是所谓“有用的信息”或“可以利用的信息”。换言之,信息资源也就是可以利用的信息的集合。信息资源作为用户可以控制和可以利用的信息集合,它既不同于传统的信息概念,也不同于

大数据的概念、特征及其应用

马建光等:大数据的概念、特征及其应用 (2013-09-05 16:15:35) 转载▼ 分类:学习资料 标签: 杂谈 大数据的概念、特征及其应用 马建光,姜巍 (国防科技大学人文与社会科学学院,湖南长沙410074) 源自:国防科技2013年4月 [摘要]随着互联网的飞速发展,特别是近年来随着社交网络、物联网、云计算以及多种传感器的广泛应用,以数量庞大,种类众多,时效性强为特征的非结构化数据不断涌现,数据的重要性愈发凸显,传统的数据存储、分析技术难以实时处理大量的非结构化信息,大数据的概念应运而生。如何获取、聚集、分析大数据成为广泛关注的热点问题。介绍大数据的概念与特点,分别讨论大数据的典型的特征,分析大数据要解决的相关性分析、实时处理等核心问题,最后讨论大数据可能要面临的多种挑战。 [关键词]大数据; 非结构化信息; 解决核心问题; 未来挑战 一、引言 自上古时代的结绳记事起,人类就开始用数据来表征自然和社会,伴随着科技和社会的发展进步,数据的数量不断增多,质量不断提高。工业革命以来,人类更加注重数据的作用,不同的行业先后确定了数据标准,并积累了大量的结构化数据,计算机和网络的兴起,大量数据分析、查询、处理技术的出现使得高效的处理大量的传统结构化数据成为可能。而近年来,随着互联网的快速发展,音频、文字、图片视频等半结构化、非结构化数据大量涌现,社交网络、物联网、云计算广泛应用,使得个人可以更加准确快捷的发布、获取数据。在科学研究、互联网应用、电子商务等诸多应用领域,数据规模、数据种类正在以极快的速度增长,大数据时代已悄然降临。 首先,全球数据量出现爆炸式增长,数据成了当今社会增长最快的资源之一。根据国际数据公司IDC 的监测统计[1],即使在遭遇金融危机的2009 年,全球信息量也比2008 年增长了62%,达到80 万PB ( 1PB 等于10亿GB) ,到2011 年全球数据总量已经达到1. 8ZB ( 1ZB 等于1 万亿GB,) ,并且以每两年翻一番的速度飞速增长,预计到2020 年全球数据量总量将达到40 ZB,10年间增长20 倍以上,到2020 年,地球上人均数据预计将达5247GB。在数据规模急剧增长的同时,数据类型也越来越复杂,包括结构化数据、半结构化数据、非结构化数据等多种类型,其中采用传统数据处理手段难以处理的非结构化数据已接近数据总量的75%。 如此增长迅速、庞大繁杂的数据资源,给传统的数据分析、处理技术带来了巨大的挑战。为了应对这样的新任务,与大数据相关的大数据技术、大数据工程、大数据科学和大数据应用等迅速成为信息科学领域的热点问题,得到了一些国家政府部门、经济领域以及科学领域有关专家的广泛关注。2012 年3 月22 日,奥巴马宣布美国政府五大部门投资2 亿美元启动“大数据研究和发展计划( Big Data Research and Development Initiative) ”[2],欲大力推

大数据概念

大数据概念 研究机构Gartner—大数据概念 "大数据"是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能 力的海量、高增长率和多样化的信息资产。从数据的类别上看,"大数据"指的是无 法使用传统流程或工具处理或分析的信息。它定义了那些超出正常处理范围和大小、迫使用户采用非传统处理方法的数据集。亚马逊网络服务(AWS)、大数据科学 家JohnRauser提到一个简单的定义:大数据就是任何超过了一台计算机处理能力的庞大数据量。研发小组对大数据的定义:"大数据是最大的宣传技术、是最时髦的技术,当这种现象出现时,定义就变得很混乱。" Kelly说:"大数据是可能不包含所有的信息,但我觉得大部分是正确的。对大数据的一部分认知在于,它是如此之大,分析它需要多个工作负载,这是AWS的定义。当你的技术达到极限时,也就是数 据的极限"。大数据不是关于如何定义,最重要的是如何使用。最大的挑战在于哪

些技术能更好的使用数据以及大数据的应用情况如何。这与传统的数据库相比,开 源的大数据分析工具的如Hadoop的崛起,这些非结构化的数据服务的价值在哪里。 大数据分析 大数据分析的使用者有大数据分析专家,同时还有普通用户,但是他们二者对于大数据分析最基本的要求就是可视化分析,因为可视化分析能够直观的呈现大数据特点,同时能够非常容易被读者所接受,就如同看图说话一样简单明了。 大数据分析的理论核心就是数据挖掘算法,各种数据挖掘的算法基于不同的数据类型和格式才能更加科学的呈现出数据本身具备的特点,也正是因为这些被全世界统计学家所公认的各种统计方法(可以称之为真理)才能深入数据内部,挖掘出公认的价值。另外一个方面也是因为有这些数据挖掘的算法才能更快速的处理大数据,如果一个算法得花上好几年才能得出结论,那大数据的价值也就无从说起了。 大数据分析最终要的应用领域之一就是预测性分析,从大数据中挖掘出特点,通过科学的建立模型,之后便可以通过模型带入新的数据,从而预测未来的数据。 大数据分析最终要的应用领域之一就是预测性分析,从大数据中挖掘出特点,通过科学的建立模型,之后便可以通过模型带入新的数据,从而预测未来的数据。 大数据分析离不开数据质量和数据管理,高质量的数据和有效的数据管理,无论是在学术研究还是在商业应用领域,都能够保证分析结果的真实和有价值。大数据分析的基础就是以上五个方面,当然更加深入大数据分析的话,还有很多很多更加有特点的、更加深入的、更加专业的大数据分析方法。 大数据技术

信息管理与信息系统基础知识-答案版

信息管理与信息系统基础知识答案版 一、单项选择题 1.在系统维护阶段最主要的工作是(B) A.硬件设备维护 B.应用软件维护 C.代码维护 D.系统软件维护 2.属于系统安全保护技术的是(C) A.负荷分布技术 B.设备冗余技术 C.数据加密技术 D.系统重组技术 3.改正开发期间错误的过程是(C) A.完善性维护 B.适应性维护 C.纠错性维护 D.预防性维护 4.最难检测的程序错误是(C) A.语法错误 B.系统错误 C.逻辑错误 D.数据错误 5.使用不合理的或错误的数据进行系统测试的目的是保证系统的(B) A.正确性 B.可靠性 C.可理解性 D.可维护性 6.系统测试的步骤是(A) A.单元测试、子系统测试、系统测试、验收测试 B.系统测试、子系统测试、单元测试、验收测试 C.验收测试、系统测试、子系统测试、单元测试 D.单元测试、系统测试、子系统测试、验收测试 7.系统设计报告应当作为新系统的(A) A.物理模型 B.逻辑模型 C.概念模型 D.参考模型 8.以下描述中符合“结构化设计”思想的是(A) A.系统模块分解要自顶向下逐步细化

B.系统模块分解要自底向上逐步抽象 C.对功能复杂的模块要尽量保持完整性 D.对功能简单的模块要尽量合并 9.对客户记录进行标记,符合条件的标为“T”,不符合条件的标为“F”,最适于采用的模块结构是(B) A.循环结构 B.选择结构 C.顺序结构 D.调用结构 10.模块的控制耦合是指(A) A.上下级模块之间传递控制信号 B.下级模块对上级模块传递控制信号 C.同级模块之间传递控制信号 D.上级模块对下级模块传递控制信号 11.“教师”实体和“课程”实体之间具有“讲授”关系;每位教师可以讲授1至4门课程,每门课程可由1至3位教师讲授;“教师”和“课程”之间的联系类型是(D) A.多对一 B.一对多 C.一对一 D.多对多 12.同时具有无逻辑含义和无法插入特点的代码类型是(C) A.表意码 B.成组码 C.顺序码 D.专用码 13.学生选课系统数据流程图中的“外部实体”可以是(D) A.学校、学生、教室 B.学生、课程、成绩 C.教师、职称、学生 D.学生、教师、教务处 14.数据流程图的两个显著特点是(D) A.逻辑性和继承性 B.可行性和抽象性 C.概括性和可行性 D.概括性和抽象性

相关文档
最新文档