数据、元数据、主数据概念解释
GIS名词解释解答题论述题《地理信息系统》

1、信息:信息是用文字、数字、符号、语言、图像等介质来表示事件、事物、现象等的内容、数量或特征,从而向人们(或系统)提供关于现实世界新的事实和知识,作为生产、建设、经营、管理、分析和决策的依据。
2、数据:通过数字化或直接记录下来的可以被鉴别的符号,是用以载荷信息的物理符号,在计算机化的地理信息系统中,数据的格式往往和具体的计算机系统有关,随载荷它的物理设备的形式而改变。
3、地理信息:是有关地理实体的性质、特征和运动状态的表征和一切有用的知识,它是对表达地理特征与地理现象之间关系的地理数据的解释。
4、地理信息系统(GIS , Geographic Information System)是在计算机硬、软件系统支持下,对现实世界(资源与环境)的研究和变迁的各类空间数据及描述这些空间数据特性的属性进行采集、储存、管理、运算、分析、显示和描述的技术系统5、元数据:一般认为是“关于数据的数据”6、空间数据用于确定具有自然特征或者人工建筑特征的地理实体的地理位置、属性及其便捷的信息。
7、数据结构即指数据组织的形式,是适合于计算机存储、管理和处理的数据逻辑结构。
8、栅格数据结构就是像元阵列,每个像元的行列号确定位置,用像元值表示空间对象的类型、等级等特征。
每个栅格单元只能存在一个值。
9、矢量数据结构是通过记录坐标的方式,尽可能地将点、线、面地理实体表现得精确无误。
其坐标空间假定为连续空间,不必象栅格数据结构那样进行量化处理。
10、DEM:即数字高程模型,是通过有限的地形高程数据实现对地形曲面的数字化模拟(即地表形态的数字化表示),它是对二维地理空间上具有连续变化特征地理现象的模型化表达和过程模拟。
11、DTM:即数字地面模型,是利用一个任意坐标系中大量选择的已知x、y、z的坐标点对连续地面的一个简单的统计表示,或者说,DTM就是地形表面形态属性信息的数字表达,是带有空间位置特征和地形属性特征的数字描述。
地形表面形态的属性信息一般包括高程、坡度、坡向等。
元数据、主数据等数据治理标准

元数据和主数据是数据治理中的重要概念,它们都有各自的标准。
1. 元数据:元数据是关于数据的数据,它描述了数据的含义、结构、属性、关系以及其它特征信息。
元数据管理包括规划、实施和控制活动,以便访问高质量的集成元数据,包括定义、模型、数据流、以及其他至关重要的信息。
2. 主数据:主数据是指满足跨部门业务协同需要的、反映核心业务实体状态属性的组织机构的基础信息。
主数据相对于交易数据而言,属性更加稳定,准确度要求更高,唯一识别。
主数据是企业关键业务实体的核心共享数据,例如组织、人员、客户、供应商、物料等。
此外,参考数据是用于描述或分类其他数据,或者将数据与企业外部信息联系起来的任何数据,例如货币代码、地区代码等。
主数据和参考数据管理是对企业核心共享数据的持续协调和维护,是关键业务实体真实信息以准确、及时、相关联的方式在各个系统之间得到持续使用。
在元数据和主数据的管理上,需要遵循相应的标准。
这些标准可以包括数据的定义、格式、质量、唯一性标识符等。
此外,还需要制定相应的政策和程序来确保数据的准确性、
一致性和安全性。
总的来说,数据治理是一个复杂的过程,需要综合考虑技术、业务和组织因素。
通过规划、实施和控制等活动,访问高质量的集成元数据和主数据,实现数据的资产价值获取、业务模式创新和经营风险控制。
地理信息系统(名词解释)

1、地理信息系统(geographic information system , 即gis )——一门集计算机科学、 信息学、地理学等多门科学为一体的新兴学科, 它是在计算机软件和硬件支持下, 运用系 统工程和信息科学的理论,科学管理和综合分析具有空间内涵的地理数据,以提供对规划 、管理、决策和研究所需信息的空间信息系统。
2.栅格——栅格结构是最简单最直接的空间数据结构, 是指将地球表面划分为大小均匀 紧密相邻的网格阵列, 每个网格作为一个象元或象素由行、列定义, 并包含一个代码表示 该象素的属性类型或量值, 或仅仅包括指向其属性记录的指针。
因此, 栅格结构是以规则 的阵列来表示空间地物或现象分布的数据组织,组织中的每个数据表示地物或现象的非几何属性特征。
特点:属性明显, 定位隐含, 即数据直接记录属性本身, 而所在的位置则根据行列号转换为相应的坐标,即定位是根据数据在数据集中的位置得到的,在栅格结构中,点用一个栅格单元表示;线状地物用沿线走向的一组相邻栅格单元表示,每个栅格单元最 多只有两个相邻单元在线上;面或区域用记有区域属性的相邻栅格单元的集合表示,每个 栅格单元可有多于两个的相邻单元同属一个区域。
3.矢量——它假定地理空间是连续, 通过记录坐标的方式尽可能精确地表示点、线、 多边形等地理实体, 坐标空间设为连续, 允许任意位置、长度和面积的精确定义。
对于点实体, 矢量结构中只记录其在特定坐标系下的坐标和属性代码;对于线实体, 用一系列坐标对的连线表示;多边形是指边界完全闭合的空间区域,用一系列坐标对的连线表示。
4. “拓扑”(topology)一词来源于希腊文,它的原意是 “形状的研究”。
拓扑学是 几何学的一个分支,它研究在拓扑变换下能够保持不变的几何属性——拓扑属性(拓扑属 性:一个点在一个弧段的端点, 一个点在一个区域的边界上;非拓扑属性:两点之间的距离, 弧段的长度, 区域的周长、面积) 。
名词解释

1.地理信息系统:地理信息系统的定义由两部组成。
一方面,地理信息系统是一门学科,是描述、存储、分析和输出空间信息的理论和方法的一门新兴的交叉学科;另一方面,地理信息系统是一个技术系统,是以地理空间数据库为基础,采用地理模型分析方法,适时提供多种空间的和动态的地理信息,为地理研究和地理决策服务的计算机技术系统2.地理空间数据:是指以地球表面空间位置为参照的描述自然、社会和人文经济景观的数据,可以是图形、图像、文字、表格和数字等形式。
3.拓扑属性:在拓扑变换下能够保持不变的几何属性,它描述了两个对象之间的关系,因此又称为拓扑关系。
4.场模型:是一种空间数据概念模型,适合用来描述具有一定空间内连续分布特点的对象。
根据应用的不同,场可以表现为二维或三维场。
5.空间数据模型:是关于现实世界中空间实体及其相互间联系的概念,他为描述空间数据的组织和设计空间数据库模式提供着基本方法。
6. 地图投影:转换三维地球表面到二维地图平面的数学处理方法称之为地图投影,它是一种透视投影。
7.高斯投影:由高斯拟定的,后经克吕格补充、完善,即等角横切椭圆柱投影。
设想一个椭圆柱横切于地球椭球某一经线(称“中央经线”),根据等角条件,用解析法将中央经线两侧一定经差范围内地球椭球体面上的经纬网投影到椭圆柱面上,并将此椭圆柱面展为平面所得到的一种等角投影。
8.公里网:大于1:10万的地形图上绘有高斯-克吕格投影平面直角坐标网,其方格为正方形,以公里为单位,故又称公里网。
公里网在地图上间隔,随地图比例尺大小不同而不同。
9.不确定性:是关于空间过程和特征不能准确确定的程度,是自然界各种空间现象自身固有的属性。
在内容上以真值为中心的一个范围,这个范围越大,数据的不确定性也就越大。
10:空间数据质量:所谓空间数据质量是指空间数据在表达实体空间位置,特征和时间所能达到的准确性,一致性,完整性和三者统一性的程度,以及数据适用于不同应用的能力.11.元数据: 是描述数据的数据,用于描述要素、数据集或数据集系列的内容、覆盖范围、质量、管理方式、数据的所有者、数据的提供方式等有关的信息。
地理信息系统试题集(考试资料)

一、名词解释第一章1.数据:就是通过数字化或直接记录下得可以被鉴别得符号,就是一种未经加工得原始资料。
2.信息:就是向人们或机器提供得关于现实世界各种事实得知识,就是数据、消息中所包含得意义,它不随载体物理形式得改变而改变。
3.地理信息系统:就是由两个部分组成得。
一方面,地理信息系统就是一门学科,就是描述、存储、分析与输出空间信息得理论与方法得一门新兴得交叉学科;另一方面,地理信息系统就是一个技术系统,就是以地理空间数据库为基础,采用地理模型分析方法,适时提供多种空间得与动态得地理信息,为地理研究与地理决策服务得计算机技术系统。
第二章4.对象模型:也称为要素模型,将研究得整个地理空间瞧成一个空域,地理现象与空间实体作为独立对象分布在该空域中。
5.场模型:也称域模型,就是把地理现象作为连续变量或体来瞧待,如大气污染度、地表温度、土壤湿度与地形地貌等。
第四章6.数据处理:就就是对采集得各种数据,按照不同得方式方法对数据形式进行编辑运算,清除数据冗余,弥补数据缺失,形成符合用户要求得数据文件格式。
7.空间内插:就是一种通过已知点数据推求同一区域其她未知点数据得计算方法。
8.空间外推:则就是通过已知区域数据,推求其她区域数据得方法。
9.元数据:就是关于数据得描述性数据信息,说明数据内容、质量、状况与其她有关特征得背景信息。
其目得就是促进数据集得高效利用,并为计算机辅助软件工程服务。
第五章10.数据库:就是以一定得组织形式存储在一起得互相有关联得数据集合。
11.数据模型:就就是表达实体与实体之间得联系方式,数据库中得数据结构、操作集合与完整性规则集合组成数据库得数据模型。
第六章12.空间数据得查询:一般定义为从空间数据库中找出所有满足属性条件与空间约束条件得地理对象。
13.缓冲区分析:就是GIS得基本空间操作功能之一,就是指在点、线、面实体得周围,自动建立得一定宽度得多边形。
14.叠置分析:就是将有关主题层数据层面进行叠加,产生新数据层面得操作,其结果综合了原来两层或多层要素所具有得属性。
什么叫做元数据

什么叫做元数据胡经国本文作者的话云计算具有很强的知识性和专业性。
对于业外读者来说,云计算可谓“博大精深”。
业外公众要学习云计算,有必要循序渐进地学习有关云计算的一系列基础知识。
本文作为《漫话云计算》系列文稿和学习云计算笔录之一,供云计算业外读者进一步学习和研究参考。
希望能够得到大家的指教和喜欢!下面是正文一、元数据基本概念1、元数据基本概念解读(1)元数据(Meta data),又叫做中介数据、中继数据,是指描述数据的数据(data about data,关于数据的数据),主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。
元数据算是一种电子式目录,为了达到编制目录的目的,必须描述并收藏数据的内容或特色,进而达到协助数据检索的目的。
元数据是关于数据的组织、数据域及其关系的信息。
简言之,元数据就是关于数据的数据(data about data)。
元数据(Meta Data)是关于数据仓库的数据,是指在数据仓库建设过程中所产生的有关数据源定义,目标定义,转换规则等相关的关键数据。
同时,元数据还包含关于数据含义的商业信息。
所有这些信息都应当妥善保存,并很好地管理,为数据仓库的发展和使用提供方便。
元数据是一种二进制信息,用以对存储在公共语言运行库中的可移植可执行文件——PE文件或存储在内存中的程序进行描述。
将您的代码编译为PE文件时,便会将元数据插入到该文件的一部分中;而将代码转换为Microsoft中间语言(MSIL)并将其插入到该文件的另一部分中。
在模块或程序集中定义和引用的每个类型和成员,都将在元数据中进行说明。
当执行代码时,运行库将元数据加载到内存中,并引用它来发现有关代码的类型、成员、继承等信息。
链接:PE文件PE文件(Portable Executable File,可移植可执行文件),一种文件格式,用于编写可执行程序和链接在一起形成可执行程序的文件。
主数据基本概念

一、基本概念:1、主数据主数据是指在整个企业范围内各个系统(操作/事务型应用系统以及分析型系统)间要共享的、高价值的数据。
也称企业基准数据。
例如,物资、供应商、客户、财务、账户、员工、合作伙伴、组织单位等都是主数据。
主数据通常需要在整个企业范围内保持一致性、完整性、可控性。
需要注意的是:主数据不是企业内所有的业务数据,只是有必要在各个系统间共享的数据才是主数据。
是指企业内各个系统间需要共享的数据,它能描述核心业务实体,例如,客户、供应商、帐户、组织单位、员工、合作伙伴、位置信息等都是主数据。
企业内大部分的交易数据、帐单数据等都不是主数据。
主数据与记录业务活动,波动较大的交易数据、帐单数据相比变化缓慢。
主数据是企业内能够跨业务重复使用(即共享的)、高价值的数据。
这些主数据在进行主数据管理之前经常存在于多个异构或同构的系统中。
它按一定的规则被量化为可以记录一类信息的集合,成为可以被计算机系统处理、存储和交换的数据。
主数据必须存在并加以正确维护,在正规的关系数据模型中,才能保证被交易系统参照的完整性。
2、元数据元数据是关于数据的结构信息,或者可以简单说成是“数据的数据”。
如货款数据中单价与数量。
3、数据模型表示一类特定信息的数据形式构架,包括数据的结构部分、数据的操作部分和数据的约束条件。
4、实体指特定的业务对象,如物料、设备、员工。
每一类主数据为一个实体,如物资主数据为一个实体。
5、属性事物本身固有的不可缺少的性质,通常用抽象、分解、归纳后的事物特征表示。
如描述供应商时,供应商的公司名称、地址、联系电话等。
6、实体模型描述主数据有哪些属性组成以及如何组成的模型。
例如描述物资主数据由那些属性组成,这些属性如何分类、如何校验等信息。
7、实体模型摸版:描述实体模型下属性的模版信息。
8、实体模型摸版标准:描述实体模型下属性的不同标准引用情况,例如某一属性可按国标,美标定义不同的元属性构成。
9、实体模型元属性描述实体模型下属性的结构信息,或者可以简单说成是“属性的属性”。
关于主数据、元数据、交易数据的概念及典型应用

企业数据管理的内容和范畴通常包含交易数据、主数据以及元数据。
本文将主要针对主数据、元数据的相关概念以及应用跟大家做一个探讨。
(文章内容来自互联网,kuangfeng88588整理)1 主数据和主数据管理的概念企业主数据是用来描述企业核心业务实体的数据,比如客户、合作伙伴、员工、产品、物料单、账户等;它是具有高业务价值的、可以在企业内跨越各个业务部门被重复使用的数据,并且存在于多个异构的应用系统中。
企业主数据可以包括很多方面,除了常见的客户主数据之外,不同行业的客户还可能拥有其他各种类型的主数据,例如:对于电信行业客户而言,电信运营商提供的各种服务可以形成其产品主数据;对于航空业客户而言,航线、航班是其企业主数据的一种。
对于某一个企业的不同业务部门,其主数据也不同,例如市场销售部门关心客户信息,产品研发部门关心产品编号、产品分类等产品信息,人事部门关心员工机构,部门层次关系等信息。
1.1数据管理的范畴和主数据管理的概念企业数据管理的内容及范畴通常包括交易数据、主数据以及元数据。
∙交易数据:用于纪录业务事件,如客户的订单,投诉记录,客服申请等,它往往用于描述在某一个时间点上业务系统发生的行为。
∙主数据:主数据则定义企业核心业务对象,如客户、产品、地址等,与交易流水信息不同,主数据一旦被记录到数据库中,需要经常对其进行维护,从而确保其时效性和准确性;主数据还包括关系数据,用以描述主数据之间的关系,如客户与产品的关系、产品与地域的关系、客户与客户的关系、产品与产品的关系等。
∙元数据:即关于数据的数据,用以描述数据及其环境的结构化信息,便于查找、理解、使用和管理数据。
主数据管理是指一整套的用于生成和维护企业主数据的规范、技术和方案,以保证主数据的完整性、一致性和准确性。
1.2主数据管理的意义集成、共享、数据质量、数据治理是主数据管理的四大要素,主数据管理要做的就是从企业的多个业务系统中整合最核心的、最需要共享的数据(主数据),集中进行数据的清洗和丰富,并且以服务的方式把统一的、完整的、准确的、具有权威性的主数据分发给全企业范围内需要使用这些数据的操作型应用和分析型应用,包括各个业务系统、业务流程和决策支持系统等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据、元数据、主数据概念解释元数据、主数据是数据治理的核心。
元数据、技术元数据、业务元数据、操作元数据、主数据、参考数据、事务数据、业务数据、维度、度量、指标等概念层出不穷,如何理解其中复杂的关系成为困扰很多数字化人的问题之一。
按照数据的记录、管理和分析三个用途,对这些数据名词进行归类如下:
一、记录类数据
1.事务数据
事务是数据库的处理数据的一个单元,可以理解为一次数据库CRUD的操作。
事务数据就是记录下数据库操作的系
统日志数据,以及特定业务场景中,专门记录的业务操作事务记录的数据,比如用于安全审计的系统登录日志。
2.业务数据
业务数据就是为了完成业务流程而存储的业务操作类数据。
就是业务系统的绝大多数表和数据。
3.日志数据
早期的日志数据是属于事务数据中的。
现在大数据时代,用户访问数据变得越来越重要,所以单独分离出来。
二、管理类数据
1.元数据
元数据又称中介数据、中继数据,为描述数据的数据,主要是描述数据属性的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。
元数据算是一种电子式目录,为了达到编制目录的目的,必须在描述并收藏数据的内容或特色,进而达成协助数据检索的目的。
通俗来讲,只要能够用来描述某个数据的,都可以认为是元数据。
举个例子,如果你把一部电视剧看做数据,那么你在电视剧里面获取到的信息,比如角色名、剧情、主题曲、感情线、导演、演员等等,都可以被看做是这部电视剧的元数据。
对于企业而言,元数据是跟企业所使用的物理数据、业务流程、数据结构等有关的信息,描述了数据(如数据库、数据模型)、概念(如业务流程、应用系统、技术架构)以及它们之间的关系。
同理,现在我告诉一个数字:175,你除了对175这个数字有比较确定的量化意义之外,也无法理解175具体代表了什么含义。
但是如果是这样描述一下呢?
这样是不是就很清楚了?175的意思是:2020年统计的全国成年男性平均身高,该值的合理阈值是80-260cm,数据
目前存在MySQL中,访问连接是XXXX,由国家统计局的张三在2020年1月1日创建,数据目前是公开的,很安全,质量经过多重确认无误的。
在描述175这个数据,用了哪些描述项呢?单位、指标、统计时间、统计范围、合理阈值、数据库、表、字段、接口、创建人、创建时间、数据权限、质量等级等等。
这些都是在描述175这个数据。
我们把描述175这个数据的其他数据称之为“元数据”。
当然,为了管理方便,我们同样还能将上述元数据进行归类:
与业务规则、流程相关的描述性数据,我们称之为业务元数据;
与存储、访问等技术底层的描述性数据,我们称之为技术元数据;
与数据操作相关的描述性数据,我们称之为操作元数据;
与数据管理相关的描述性数据,我们称之为管理元数据
元数据可以解决什么核心问题?元数据是为了准确的
描述我们拥有的所有数据。
其核心的目的是降低人与数据之间的沟通成本。
描述的越准确,我们使用数据的成本就越低。
2.主数据
主数据(Master Data)就是关于业务实体的数据。
主数据是关键业务实体的最权威、最准确、价值最大的数据,用于建立交易闭环。
对于CRM客户管理系统来说,用户就是主数据;对于银行来说,卡bin码、开户行、账号、理财产品等都是主数据;对于生产企业,BOM表是主数据;对于二手房平台,房源信息是主数据。
贝壳的楼盘字典就是典型的主数据,他们从2008年开始建设,持续了12年,投入了5、6亿。
所以总结一下,主数据一共有以下种类:
与人相关的:用户、客户、公民、病人、供应商、学生等;
与物相关的:实体产品、虚拟产品(理财产品)、生产资料(BOM表)等;
与场相关的:地址库、楼盘字典、POI信息等;
与规则相关的:财务的账套等。
在传统IT企业,甲方公司的主数据可以立一个千万级的项目。
国内也有很多公司专门做主数据这个行当。
主数据的核心思想是全局唯一的标准数据。
因此,主数据一般会完成以下工作:
确定核心业务环节识别主数据定义和维护主数据匹配规则(代码规则、ID Mapping)建立及发布数据标准主数据的后续维护及更新。
3.参考数据
参考数据是增加数据可读性、可维护性以及后续应用的重要数据。
参考数据是对数据的解释,针对一些数据范围和取值的数据解释,让人们容易读取相关的数据。
比如,在一些数据里“性别”的这个字段,很可能是1代表男性、2代表女性。
在许多企业中有这样的约定俗成,而更多的参考数据可能记录在开发人员和运营人员的大脑当中。
但问题是一旦这些人离开,系统里面的数据就成了堆没有注释的天书。
参考数据约等同于数据字典。
正是由于这些数据字典局仅限于个别系统而没有统一标准,从一个侧面间接造就了大量的数据孤岛。
企业为了进行更有效率的数据整合、数据共享和数据分析应用,开始尝试对参考数据进行企业或者部层面的整合和管理,利用参考数据集记录系统尝试为范围内的IT 系统中的数据库提供统的参考数据。
4.元数据与主数据的区别
元数据是关于数据的数据,当人们描述现实世界的现象
时,就会产生抽象信息,这些抽象信息便可以看作是元数据,元数据主要用来描述数据的上下文信息。
通俗的来讲,假若图书馆的每本书中的内容是数据的话,那么找到每本书的索引则是元数据,元数据之所以有其它方法无法比拟的优势,就在于它可以帮助人们更好的理解数据,发现和描述数据的来龙去脉,可以帮他们形成清晰直观的数据流图,元数据是数据管控的基本手段。
主数据则定义企业核心业务对象,如客户、产品、地址等,与交易流水信息不同,主数据一旦被记录到数据库中,需要经常对其进行维护,从而确保其时效性和准确性;主数据还包括关系数据,用以描述主数据之间的关系,如客户与产品的关系、产品与地域的关系、客户与客户的关系、产品与产品的关系等。
主数据跟元数据的关系,举个例子的话就像是一本书,主数据就是书里边的正文,实际有用的数据,元数据就是书的目录,是索引,方便你找到主数据的。
一般而言,企业中这三类数据与其它数据的数据量、质量需求,更新频率、数据生命周期的关系大致如下图:。