数据仓库建设规划
数据仓库建设规划图文

数据仓库建设规划图文前言数据仓库是企业决策的基础,能够帮助企业把分散的数据整合到一起,降低数据的冗余度和不一致度,并保证决策者及时准确地获取到有关于企业业务运营的信息。
而数据仓库建设规划是实现数据仓库建设的前提和保障。
本文将会介绍数据仓库建设规划的概述,及其在数据仓库建设过程中的具体应用。
数据仓库建设规划概述数据仓库建设规划是指基于业务战略、IT战略和企业治理要求,论证和分析数据仓库建设的目标、范围、基础设施、资源和人员安排,并制定全面和长期的数据仓库建设计划。
其目的是为了实现数据资产的价值最大化和企业业务分析的高效率开展。
具体来说,数据仓库建设规划包括以下几个方面的内容:1.数据仓库技术路线:在数据仓库建设过程中,需要选择哪些技术工具和平台,以及如何实现数据仓库的集成、存储、处理、管理和交互。
2.数据仓库的目标和范围:需要明确数据仓库的主要业务需求、数据需求以及数据质量标准,以便为数据仓库的整体架构和实施过程提供全面规划。
3.数据仓库基础设施:包括硬件基础设施、数据库应用软件、网络等设备和工具及相应的安全机制。
4.数据仓库资源和人员安排:需要评估数据仓库建设所需的人员和资源并计划并安排相应的人力、物力和财务方面的资源。
数据仓库建设规划的应用数据仓库建设规划对数据仓库的建设和运营都具有重要的作用。
在数据仓库建设过程中,数据仓库建设规划可以帮助企业在设计、实施和维护数据仓库过程中,更加全面、科学、系统地规划和部署数据仓库,从而提高数据仓库的建设效率,提高数据质量,提升企业的运营效率及决策水平。
具体来说,数据仓库建设规划可以体现在以下几个方面:1.业务需求分析:对不同类型的业务需求进行分析,确立数据仓库构建的业务模型和应用领域范畴。
借助业务分析工具和方法,对业务流程进行挖掘、建模和优化,设计出符合企业需要且便于数据获取和分析的数据模型。
2.技术实现:结合现有的IT设施和企业计算机软件系统,根据不同业务和应用领域制定数据仓库架构,并选择合适的技术工具和开发平台,如Hadoop、Hive、Spark等,以及各种开发框架、编程语言和库。
人力资源管理数据仓库建设方案设计与实现

信 息 发 展 规 划 ,决 定 实 施 信 息 化
S 8 程 , 设 以 一・ 化 平 台 、 GI 6 建 体
大 , 大 部 分 增 量 数 据 来 源 于 系 统
-
八 大 业 务 应 用 及 六 大 保 障 体 系 为 核 心 的统 ~ 的 企 业 级信 息 系 统 。
此 外 . 人 力 资 源 管 理 中 的 组 织 数 据 、员 工 数 据 等 作 为 权 威 数 据 源 向其 他 业 务 系 统 进 行 传 输 , 为 _ 到 实 时 传 输 的 目 的 和 较 高 『达
的 数 据 传 输 速 度 , 可 以 直 接 从 审
pe o lSf 施 指 导 [ 】 京 : 文 ( t实 R.北 甲胃 中
0
t  ̄ 理 操 作 。 员 工 个 人 自 助 平 台 L L
年 P o l S f 8 3 版 本 已 实 施 的 e pe o . l 组 织 管 理 、 事 管 理 、 期 管 理 、 人 假 薪 资核 算 管 理 的 系 统 功 能方 案 ,
使 用 P o lSo e p e f HCM 0 版 本 标 l 9. 准 功 能 进 行 重 新 实 施 , 以 辅 助 集
团 公 司 总 部 、7 个 地 市 公 司 和 超 1 高 压 公 司 对 其 正 式 员 I 建 立 标 准
化 的人 力 资 源 管 理 平 台 。
稳 步推进 。 在 此 背 景 下 。 山 东 电 力 集 团
公 司 f 下 简 称 山 东 电 力 ) 全 省 以 在
范 同 内 , 采 用 同 步 实 施 的 加 速 建 设 方 式 进 行 成 熟 套 装 软 件 信 硬 件 配 置 方 案 e pe o t
数据仓库指标体系建设

数据仓库指标体系建设
数据仓库指标体系建设是指为了满足企业特定的业务目标和需求,从数据仓库中提取有意义的数据指标,并对这些指标进行管理、分析与运用的一套体系建设过程。
具体步骤如下:
1. 确定业务目标和需求:企业需要确定自身的业务目标和需求,以此为目标,设计出符合自身业务需求的数据仓库指标体系。
2. 确定数据来源:确定数据来源,包括内部各系统的数据和外部数据,如市场、竞争对手、用户等数据。
3. 确定指标分类:根据企业业务目标和需求,将数据指标分类,可以根据时间、区域、产品、客户等因素进行分类。
4. 定义指标:根据指标分类,设计出指标定义和计算公式,确保指标的准确性和可比性。
5. 确定指标权重:根据指标的重要性,确定指标的权重,以此来评估企业的绩效表现。
6. 建立数据模型:建立数据模型,用于支持指标计算和分析,以及提供数据报表和数据可视化等服务。
7. 设计指标评估体系:设计指标评估体系,用于评估企业整体绩效和各个业务部门的表现,以此来指导企业的决策。
8. 运用指标:利用指标体系中的指标,通过数据分析、数据挖掘等手段,对企业的业务进行分析和优化。
数据仓库分层建设的基本思路

数据仓库分层建设的基本思路
数据仓库分层建设的基本思路如下:
1. 数据源层:这是数据仓库的基础,包含了各种原始数据,来自不同的业务系统、数据库、文件等。
2. 数据存储层:数据经过抽取、转换和加载(ETL)过程后,被存储在这一层。
它可以是关系型数据库、列式存储、NoSQL 数据库或数据湖泊等。
3. 数据处理层:在这一层,对数据进行清洗、转换、脱敏、标准化等处理,以提高数据质量和可用性。
4. 数据集市层:根据不同的业务主题或部门需求,将处理后的数据组织成数据集市。
数据集市通常是针对特定主题或业务领域的数据集合。
5. 数据应用层:这是数据仓库的顶层,为用户提供各种数据分析和应用工具,如报表、仪表盘、数据挖掘、机器学习等。
6. 元数据管理层:元数据用于描述数据仓库中的数据、处理过程和数据模型等信息。
元数据管理层负责管理和维护元数据,确保数据的一致性和可追溯性。
7. 数据质量管理层:数据质量是数据仓库的关键要素之一。
这一层负责监控和管理数据质量,包括数据清洗、数据验证、数据监控等。
通过分层建设,数据仓库可以更好地组织和管理数据,提高数据的质量和可用性,满足不同用户的需求。
同时,分层结构也有利于数据仓库的扩展、维护和性能优化。
在实际建设过程中,可以根据具体业务需求和数据特点,对分层结构进行适当调整和优化。
数据仓库建设方案

第1章数据仓库建设1.1数据仓库总体架构专家系统接收增购项目车辆TCMS或其他子系统通过车地通信传输的实时或离线数据,经过一系列综合诊断分析,以各种报表图形或信息推送的形式向用户展示分析结果.针对诊断出的车辆故障将给出专家建议处理措施,为车辆的故障根因修复提供必要的支持.根据专家系统数据仓库建设目标,结合系统数据业务规范,包括数据采集频率、数据采集量等相关因素,设计专家系统数据仓库架构如下:数据仓库架构从层次结构上分为数据采集、数据存、数据分析、数据服务等几个方面的内容:数据采集:负责从各业务自系统中汇集信息数据,系统支撑Kafka、Storm、Flume 及传统的ETL采集工具。
数据存储:本系统提供Hdfs、Hbase及RDBMS相结合的存储模式,支持海量数据的分布式存储。
数据分析:数据仓库体系支持传统的OLAP分析及基于Spark常规机器学习算法。
数据服务总线:数据系统提供数据服务总线服务,实现对数据资源的统一管理和调度,并对外提供数据服务。
1.2数据采集专家系统数据仓库数据采集包括两个部分内容:外部数据汇集、内部各层数据的提取与加载。
外部数据汇集是指从TCMS、车载子系统等外部信息系统汇集数据到专家数据仓库的操作型存储层(ODS);内部各层数据的提取与加载是指数据仓库各存储层间的数据提取、转换与加载。
121外部数据汇集专家数据仓库数据源包括列车监控与检测系统(TCMS)、车载子系统等相关子系统,数据采集的内容分为实时数据采集和定时数据采集两大类,实时数据采集主要对于各项检测指标数据;非实时采集包括日检修数据等.根据项目信息汇集要求,列车指标信息采集具有采集数据量大,采集频率高的特点,考虑到系统后期的扩展,因此在数据数据采集方面,要求采集体系支持高吞吐量、高频率、海量数据采集,同时系统应该灵活可配置,可根据业务的需要进行灵活配置横向扩展.本方案在数据采集架构采用Flume+Kafka+Storm的组合架构,采用Flume和ETL 工具作为Kafka的Producer,采用Storm作为Kafka的Consumer,Storm可实现对海量数据的实时处理,及时对问题指标进行预警.具体采集系统技术结构图如下:1.2.1.1数据汇集架构功能Flume提供了从console(控制台)、RPC(Thrift—RPC)、text(文件)、tail (UNIXtail)、syslog(syslog日志系统,支持TCP和UDP等2种模式),exec(命令执行)等数据源上收集数据的能力。
《数据仓库建设指南》

《数据仓库建设指南》数据仓库建设指南随着企业信息化的趋势不断发展,数据化已经成为企业成长的必经之路。
数据成为了企业在竞争中的筹码,企业数据分析的能力也成为了企业成功的关键。
更多的企业意识到,要想在市场上占有一席之地,精细管理企业,就必须建立一个合理的数据仓库。
那么,数据仓库建设需要考虑哪些要素和步骤呢?本文将一一为您解析。
一、数据仓库简介数据仓库是一种长期积淀和管理数据的系统,它可以帮助企业集中存储和管理来自各种渠道的数据,为企业提供分析支持。
它可以将内部和外部的数据整合、加工之后建立一个统一的数据层用于分析,这样企业就可以在分析过程中减少对数据来源的依赖,加快数据分析过程。
二、数据仓库建设步骤1.规划和准备数据仓库建设是需要投入大量的时间和精力的,因此,首先需要确定需求,明确数据仓库的建设目标,并确保团队中所有成员都清楚地理解目标和业务需求。
同时,团队还需要了解企业的业务流程。
在规划和准备阶段,团队需要对企业业务进行分析和评估,确定数据仓库中需要的信息和数据以及其来源;需要制定数据建设计划,分步骤地完成数据仓库的各个环境的建设和测试,以确保其稳定性和数据可靠性。
2.设计在设计阶段,需要确定数据仓库的基本结构和架构等。
从不同的维度来考虑数据仓库的数据设计,面向业务时的数据设计包括事实表和维度表的设计,以及定义关系型数据模式。
面向数据仓库的设计要考虑数据的存储形式和数据的管理:如何利用索引快速查找数据,如何存储不同的数据格式或类型等。
3.实施实施是数据仓库建设中最为繁琐的环节,这个过程需要投入大量的人力和物力资源。
需要与各种数据源进行连接和整合,然后将这些数据存储到数据仓库中,来适应变化的数据分析需求。
在实施过程中,需要考虑数据清洗、转换和加工等过程。
数据清洗的目的是过滤掉不必要的数据,转换是将数据从一种格式转换为另一种;加工就是从原数据中提取关键信息。
4.测试和验证测试与验证是数据仓库建设过程中很重要的步骤,通过测试可以验证数据仓库所设计的模型和工具是否能够适应实际的业务需求,同时也可以提供一些有益的改进建议。
XX银行数据仓库建设项目方案

XX银行数据仓库建设项目方案1. 项目概述本文档旨在介绍XX银行数据仓库建设项目的方案和目标。
数据仓库是一个用于集成和管理银行的各类数据的中央存储库,可为决策支持和业务分析提供有价值的信息。
本项目的目标是构建一个稳定、高效、可扩展的数据仓库,以提高XX银行的决策能力和业务竞争力。
2. 项目背景XX银行作为一家领先的金融机构,面临着数据分散、决策效率低下的问题。
传统的数据集成和分析方法已经无法满足业务需求,因此需要建立一个数据仓库来解决这些问题。
数据仓库将集中存储和管理各类数据,并提供强大的分析工具和报表功能,以支持XX银行的战略决策和业务优化。
本项目的目标是构建一个可靠、高效的数据仓库系统,具体包括以下几个方面:•数据集成:从各个业务系统中提取、清洗和转换数据,确保数据质量和一致性。
•数据存储:设计和构建合适的数据存储结构,包括数据表、索引等,以支持复杂的数据查询和分析。
•数据分析:开发和部署适合XX银行业务需求的数据分析工具和算法,提供灵活和高效的数据查询和报表功能。
•数据安全:确保数据仓库的安全性,实施访问控制和数据加密等措施,防止未授权的访问和数据泄露。
4.1 需求分析阶段在这个阶段,项目团队将与XX银行的不同业务部门和利益相关方进行沟通和需求收集。
我们将详细了解业务需求和数据源,并建立数据仓库的数据模型和架构设计。
4.2 数据集成阶段在数据集成阶段,我们将根据需求分析阶段的结果,从各个业务系统中提取和转换数据。
我们将设计和实现合适的ETL(提取、转换和加载)过程,确保数据质量和一致性。
4.3 数据存储阶段在数据存储阶段,我们将设计和构建数据仓库的存储结构,包括数据表、索引和分区等。
我们将利用合适的数据库技术和管理工具,如关系数据库和NoSQL数据库,来存储和管理数据。
4.4 数据分析阶段在数据分析阶段,我们将开发和部署适合XX银行业务需求的数据分析工具和报表功能。
我们将使用先进的分析算法和可视化技术,帮助XX银行的管理层和业务部门进行决策分析和业务优化。
数据仓库概要设计

数据仓库概要设计数据仓库(Data Warehouse)是指把企业分散在不同数据库中的数据统一整合到一个数据库中进行存储和管理,并对这些数据进行分析和管理的一种数据库应用系统。
数据仓库的建设是企业信息化建设的重要组成部分,是企业对内部外部信息资源进行整合、挖掘和利用最有效的平台之一。
因此,进行数据仓库的概要设计是非常重要的一步。
1.数据仓库概述数据仓库,是一个能够存储大量历史数据的集合体,使得企业能够快速地进行数据分析、查询和决策。
数据仓库通常包括存储、管理和查询技术。
数据仓库的设计是基于自底向上的过程,通过收集各种应用中的数据来建立。
数据仓库的需求分析是设计的第一个步骤,通过需求分析可以把握到数据的来源、数据的主要特征、数据的处理方法、数据的处理效果等。
2.数据仓库的工作过程a.数据的收集数据收集的目的是获取各个分散在企业内部外部的数据源,并把这些数据源整合成数据集。
数据收集包括了跟踪源数据、数据的标准化、数据的清洗、数据的转换等。
b.数据的整合数据整合意味着将不同的数据源集成到一起,通常是通过ETL工具来实现。
ETL(Extract, Transform, Load)工具的主要功能是提取、转换和加载。
c.数据的存储数据仓库的存储方式一般有两种:关系型数据库和非关系型数据库。
d.数据的查询与分析数据仓库的用户可以通过BI工具(Business Intelligence)来进行数据的查询、分析和报表生成。
3.数据仓库的概要设计步骤a.数据仓库设计的第一步是需求分析,需求分析的目的是明确数据仓库的目标、范围和需求。
需求分析应该包括数据仓库的使用者、数据仓库所需数据的类型、数据的来源、数据的质量要求等。
b.数据仓库的概念设计是在需求分析的基础上,开始进行数据仓库的抽象模型的设计。
概念设计包括了数据仓库的模型设计、元数据的设计等。
c.数据仓库的逻辑设计是在概念设计的基础上,开始进行数据仓库的逻辑结构的设计。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应 用 模 式 四 : 数 据 挖 掘
第8页
• 应用模式和需求并不是一一对应的,一个业务需求的提出和解决可能需要多种应 用模式的综合应用
挽留客户示例
看看最近客 户流失率是 否有异常? 查查原 因?
挽留成 功!!
报表 灵活查询
应 用 模 式 综 合 应 用 场 景
他们有什么 特征?能不 能提前发现?
特点: • 确定性-信息所涉及的度量和维 度是确定的、权威的,一般由归 口业务部门对其进行明确定义。 • 普遍性-信息经常在部门内部乃 至全行的信息需求中多次出现; 简单、容易理解,对用户要求不 高。 • 跨系统-不依赖单一业务系统, 需要全局视图。
:
关注点: • 信息共享 • 统计口径 • 大用户量 • 主要元素 维度、指标设计 报表设计规范 控制总量 准入准出制度 数据要求:语义层的准备
项目背景
第22页
联机交易系统
核心业务系统:资产、负债、结算(同城/跨行/票据等)、分录账务、报表、客户账户管理、公共(角色/权限) 外汇系统:外币综合系统,账户、客户、负债业务、分录账务、报表 卡平台系统:ATM/CDM、POS、银联、兴业柜柜通、城商柜面通的渠道接入 MBFE支付系统:人行大小额支付前置 综合前置系统:代收类业务、网银接入、代付类业务的渠道接入 网银系统:外包方式,当前在自建 其它:财务系统、电话银行接入前置、网银接入前置、TIPS系统、指纹识别系统、电票系统 ... ...
同 业 案 例 三 :
应用 数据
报表应用 业务价值
汇总模型
报表平台
专题应用
基础模型
技术
ETL平台
数据管控平台
华 东 某 城 商 行 二 期 价 值
二期的能力: 应用:决策支持、数据分析支持能力;分行服务支持能力;客户主题分析 数据:全行数据交换能力;全行数据集成能力;数据管控能力 技术:BI应用门户;ETL处理中心;数据管控平台
Ad Hoc
Reports
Data Mining (Modeling)
Applications
数据挖掘 – 在灵活分 析的基础上,对某些 业务问题进行数据属 性的提炼和归纳,如 “评分模型”、“违 约模型”、”细分模 型”等。
数 据ቤተ መጻሕፍቲ ባይዱ仓 库 的 应 用 模 式
应用系统 – 支持复杂业务逻辑的应用系统,典型 的包括营销管理、利润贡献度、平衡计分卡等。
•
不确定性-过程不确定、方法不 确定、查询路径不确定、分析结 果不确定、表现形式也不确定。
关注点: • 需求、数据、效率的平衡 • 业务人员的参与和交互 • 提供知识共享的途径和办法 >分析模板 >用户培训 • 依赖条件 数据的了解 业务知识和经验 查询分析工具的运用 沟通、应变能力
第5页
应 用 固定报表是数据仓库信息共享的主要途径之一,是最重要的展现方式。部分常用的,模 能够提炼出共性的灵活查询可能会转化为固定报表 式 二
数据集市层
报表集市
协议
抽 取 ETL
团体 事件 帐务 产品 渠道 公用
历史 拉链
轻度 汇总
管理 驾驶舱
P O R T A l
指标 汇总 集市 汇总
银企对账
数据接口
数据 接口
总账
绩效
……
数据交换平台
核心 信贷 个贷 三存 基金 理财 国债 管会 人力 债券
数据管控
ETL平台
复杂 报表 多维 分析 即席 查询 仪表盘
特点: • 随机性-随时发生、可以由任何 部门发起。 • 时效性-应对突发需求的相应能 力,要求比较高。 • 开放性-可能是简单统计,或是 某种测算,或是某项明细数据查 询,也可能是某种复杂逻辑的处 理。 • 独特性-特定的目标,特有的度 量、专用的视角和算法。
应 用 模 式 一 : 灵 活 查 询
数据应用层
综合统计报表
专题集市
业务分析
集成信息服务
数据整合层
DW
数据集成
数据交换层
主机数据交换 通用文件传输 统一数据交换
基础环境层
历史数据管理
离线数据管理 统一调度监控平台
元数据管理
CRM
信贷
营销
风险
MA
反洗钱
各类MIS
同 业 案 例 二 : 某 区 域 银 行
数据应用层
ECIF
信贷集市
事件式营销
统一报表信息系统
统一卸数
集成信息服务
数据整合层
DW EDIP
数据交换层
数据交换平台
基础环境层
历史数据管理 离线数据管理 元数据管理 数据质量管理 数据标准管理 统一ETL平台 统一报表平台
ACRM
MA
风险
各类MIS
同 业 案 例 三 : 华 东 某 城 商 行
数据应用层
业务快报
操作型应用
专题集市应用
准实时数据服务
数据集成服务
历史数据服务
数据整合层
DW ODS
数据交换层
历史数据管理 准实时数据管理 元数据管理 数据质量管理 数据标准管理 统一ETL平台 统一报表平台
基础环境层
核心
信贷
个贷 三存 基金 理财 国债 管会 人力
同 业 案 例 三 :
P O R T A l
抽 取 ETL
银企对账 风险监控 CRM 数据 接口 反洗钱 非现场审计 1104
BI Office
部门报表
应用及数据延续
基础 数据 层 FDM 汇总 数据 层 ADM 数据集市层 报表集市
同 业 案 例 三 :
P O R T A l
协议
抽 取 ETL
团体 事件 帐务 产品 渠道
历史 拉链
轻度 汇总
管理 驾驶舱
指标 汇总 集市 汇总
客户数据集市
银企对账 数据 接口
国贸
总账 绩效
短信平台
与其他应用模式 关键点 关系
•部分常用的,能够提 炼出共性的灵活查询可 能会转化为固定报表; •浏览固定报表发现问 题,并进行问题的追踪 ; •探索性问题的获取,并 转化成Report需求; •分析型应用并不是一 堆报表的堆砌,而是将 固定报表和交互式报表 甚至数据挖掘的结果嵌 入流程中,体现一定的 管理逻辑 •报表的管理,建立 准入与退出机制; •数据共享管控 •建立有效的支持中 心,支持服务并推广 •培训和推广是要分 步骤分阶段分别推广 •建立业务解决方案 架构小组; •应用数据共享管控
南充市商业银行数据仓库建设规划
南充市商业银行科技部
概述
第1页
数据仓库的投产不同于传统的信息系统,它是萃取原始数据转 换成决策信息,进而衍生企业智慧的一段旅程,数据仓库系统的投 产是旅程的起点而非终点。数据仓库的价值体现在深度运用中,用 于持续改善的过程,而非一个短暂的项目。
建立成熟完备的BI环境进行业务支持是一个重要手段,应该建 立、健全一套完整的业务支持流程,针对不同特点的应用使用不同 的方式,提供不同种类的应用模式,从而提高对业务需求的响应速 度和质量。除了流程的规范,还应该完善EDW自身数据体系的建设, 同时加大用户的培训力度,用各种可能的方式和渠道推广数据仓库, 实现最大程度发挥信息平台业务价值的终极目标。
债券
国贸 总账 绩效
华 东 某 城 商 行 一 期 之 前 背 景
……
FTP
核心 信贷 个贷 三存 基金 理财 国债 管会 人力 债券 国贸 基础 数据 层 FDM 汇总 数据 层 ADM
ETL平台
复杂 报表 多维 分析 即席 查询 仪表盘
BI Office
部门报表
同 业 案 例 三 : 华 东 某 城 商 行 一 期 结 束 的 架 构
固 定 报 表
第6页
应 包括:分析型应用和操作型应用;而分析型应用绝不仅仅是固定报表随意的堆砌, 用 应用系统中特意设定的业务逻辑可以帮助用户逐步访问与分析一系列交互式的报表,模 并在特定的业务主题背景下采取经过优化的行动。 式 三 :
特点: • 逻辑整合—某种程度的业务逻辑 内嵌于此应用以便用户能够按照 一定的规则完成其任务。 关注点: • 自建还是购买 • 架构和部署 BI架构 数据架构 技术架构 • 主要元素 外观和感受 业务逻辑 报表和分析功能 数据模型 数据映射
数 据 仓 库 业 务 支 持 的 目 标
第2页
国际先进银行的企业级数据仓库系统实践表明,应用系统的开发离不开需求的成 熟和稳定,只有通过大量的灵活分析和数据挖掘的应用,才能形成成熟稳定的应 用需求,反之,应用系统在业务中的大量使用,又会促进分析人员更加深入、有 效的分析探索数据。 随机查询 – 具有IT和 业务两方面的知识和 技能,进行任意数据 探索和查询,回答各 种未预先定义的业务 问题。 固定报表 – 以固定 模式回答简单、常规 的业务管理、统计类 问题。
第7页
从大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的过程,主要基于人 工智能、机器学习、模式识别、统计学等技术,做出归纳性的推理,从中挖掘出潜 在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。 特点: • 全面性-挖掘模型使用的数据通 常都需要大量详细的历史数据支 持,大多需要跨业务领域进行综 合的关联分析。 • 专用性-大多数挖掘模型都是针 对某个特定领域的特定问题创建, 应用的范围和服务的对象都比较 特定。 • 抽象性-数据挖掘使用的统计技 术以及模型的产出结果都具有高 度的抽象性。 • 周期性-挖掘模型的创建是基于 建模时的训练和校验数据,一段 时间后可能需要根据性能对模型 进行回顾和调整。 关注点: • 业务人员的参与 >资质 >目标 >规则 • 架构 >仓内 >仓外 • 产出结果 >存储 >发布 >应用