BI基础概念培训.ppt
BI基础课程

BI基础课程- BI的定义:1、加特纳集团(Gartner Group)商业智能这一术语1996年由Gartner Group的Howard Dresner首次提出,它描述了一系列的概念和方法,通过应用基于事实的支持系统来辅助商业决策的制定。
商业智能技术提供使企业迅速分析数据的技术和方法,包括收集、管理和分析数据,将这些数据转化为有用的信息,然后分发到企业各处。
Ted Friedman 和Kevin H. Strange 认为:商业智能应该注重数据整合、数据质量、元数据管理、可测量性和互用性以及企业活动的监测。
2、国际数据公司(Internet Data Corporation, IDC)将商业智能定义为下列软件工具的集合:² 终端用户查询和报告工具。
专门用来支持初级用户的原始数据访问,不包括适用于专业人士的成品报告生成工具;² 联机分析处理(On-Line Analytical Processing, OLAP)工具。
提供多维数据管理环境,其典型的应用是对商业问题的建模与商业数据分析。
OLAP 也被称为多维分析;² 数据挖掘(Data Mining, DM)软件。
使用诸如神经网络、规则归纳等技术,用来发现数据之间的关系,做出基于数据的推断;² 数据集市(Data Mart)和数据仓库(Data Warehouse, DW)产品。
包括数据转换、管理和存取等方面的预配置软件,通常还包括一些业务模型,如财务分析模型;² 主管信息系统(Executive Information System, EIS)。
企业机构利用上述软件工具在统一的BI平台上建立所需的企业范围内的商业分析。
从系统的观点来看,商业智能的过程是从不同的数据源收集的数据中提取有用的数据,对数据进行清理以保证数据的正确性,将数据经转换、重构后存入数据仓库或数据集市(这时数据变为信息),然后寻找合适的查询和分析工具、数据挖掘工具、在线分析工具(OLAP)对信息进行处理(这时信息变为辅助决策的知识),最后将知识呈现于用户面前,转变为决策。
BI 基础培训

将BW的管理自动化
图形化的设计和监控
可以计划安排在后台 运行
雇佣
员工组 员工子组 雇佣状态 公司代码 服务年长 工龄
成本中心 主成本中心控制范围 主成本中心
InfoCube
付款 工资核算范围 支付等级范围 工资等级组 工资等级水平 支付等级类型
关键指标:反映状况的具体值
时间 日历年/月 日历年度/季度 日历年 日历月 季度
在SAP BW数据流中的转换
SAP BW中的处理链
人力资源
Table of employees
EMPLO COST_CENTER ...
InfoObject “0costcenter ”
成本中心
BW基本概念:InfoObject
Characteristics (特性)例如 “成本中心”, “客户名称”, “功能范围”
特殊类型的特性:
•
时间特性 与时间相关的特性“财务期间”, “日历年”, ...
OLTP 与 OLAP区别
特征 主要操作 分析的程度 每一交易的数据量 数据类型 数据的时限 对数据的更新 数据库设计 交易/用户数 响应时间 每交易访问的表数 处理类型
OLTP 更新 低 很小 明晰的 主要操作当前数据 频繁 复杂 多 快 若干 定义好的
OLAP 分析
高 很大 汇总的 当前和历史的 不频繁,只有新数据 简单
DSO (Data Store Object ) DSO由特性和关键指标组成,与 R3的数据库表结构相似,存放 的是明细数据,例如销售订单行 项目信息。其作用是集合、清洗 和存储业务数据。
BW基本概念:InfoCube(信息立方体)
Info Cube是具有数据对象和数据提供器功能的对象 包括2种类型的信息对象
BI培训

内容提纲
I. 商业智能介绍 II. 数据仓库的理论知识
数据仓库的定义 数据仓库的特点 数据仓库和数据库之间的区别 数据集市介绍 数据仓库实施详细步骤
III.商业智能项目模型的建立 IV. ETL介绍 V. 元数据介绍 VI. 数据质量分析 VII.联机分析处理(OLAP) VIII.总体架构和经典案例
企业战略
IT战略
业务架构
功能
组织
流程
绩效
IT架构
应用架构
数据架构
技术架构 治理架构
6
商业智能概述 商业智能的定义
通过对数据的收集、管理、分析及其转化,使数据成为可用的信息,从而获 得必要的洞察力和理解力,更好地辅助决策和指导行动。 人们把企业大量的业务数据转化成高价值的可以获取的信息和知识,并且在 恰当的时刻通过最恰当的方式把这些信息传递给恰当的人。
面向主题的、集成的、可变的、反映当前细节的数据集合。它主要用于
支持企业处理业务应用和存储面向主题的、即时性的集成数据, 为企业
决策者提供当前细节性的数据,通常作为数据仓库的过渡阶段。
ODS可以有两种形式:ODS 数据缓冲区和ODS统一信息视图区。
ODS数据缓冲区主要为业务源数据抽取到数据仓库中提供中间数据缓冲 的功能,与ODS统一信息视图区最大的区别就是数据抽取、清洗、转化、 加载的转换规则和数据存储的方式不同。ODS统一信息视图区是完全按照 主题的方式进行数据存储,提供用户快速的报表展示和数据实时查询的功 能。而ODS数据缓冲区的ETL规则一般只进行简单的汇总、计算或者从操作 型数据库中直接抽取而中间不进行任何转化。ODS统一信息视图区的数据 一般都是从ODS缓冲区中抽取过来的。
I. 商业智能介绍 II. 数据仓库的理论知识
BI相关知识简介PPT课件

01
02
03
确定业务需求
深入了解业务背景,明确 BI系统需要解决的具体问 题。
设定项目目标
根据业务需求,设定清晰、 可衡量的项目目标,如提 高决策效率、优化业务流 程等。
评估资源投入
对项目所需的人力、物力、 财力等资源进行评估,确 保项目的可行性。
选择合适工具和技术栈
工具选型
根据项目需求和目标,选 择适合的BI工具,如 Tableau、Power BI、 FineBI等。
营销效果评估与优化
利用BI工具进行数据挖掘和分析,帮 助企业识别不同市场细分并确定目标 市场。
运用BI技术对营销活动的结果进行量 化评估,发现有效和无效的策略,进 而优化未来的营销活动。
营销策略制定与执行
基于BI提供的数据洞察,制定个性化 的营销策略,并通过实时数据监控调 整策略执行。
客户关系管理
持。
02
数据仓库与数据挖掘技术
数据仓库概念及特点
数据仓库定义
数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持 管理决策。
面向主题
数据仓库中的数据是按照一定的主题域进行组织的。
集成性
数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总 和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业 的一致的全局信息。
技术栈选择
确定与所选BI工具相匹配 的技术栈,如数据库、数 据清洗、数据挖掘等。
兼容性考虑
确保所选工具和技术栈与 现有系统兼容,降低实施 难度和成本。
构建数据模型和指标体系
数据模型设计
根据业务需求,设计合理的数据 模型,包括数据结构、数据关系
BI基础概念

BI的价值 如何构建BI 数据仓库设计中的几个重要概念 维度建模
a
1
关键概念
• 操作型数据
如:某商场1瓶价格为88元的葡萄酒在被 购买的过程中,收银员实际收到100元, 找零12元。
特点:细节化,分散化
a
2
关键概念
• 决策型数据
如:该商场在1月9日上午一共卖出了多少 瓶葡萄酒?该商场的所有葡萄酒总销量在 一年中什么时候最高和最低?
a
14
数据仓库设计中的几个重要概 念
ODS( Operational Data Store,操作数据存储)
ODS反映当前数据值:这一点是指ODS中不会长期的保留数据,通常ODS保留的数 据的时限最长到一个月或三个月。而数据仓库可以保留五年、十年或更长的数据。
ODS中保留详细数据:这一点是说ODS中只保留原子数据,而不保留汇总数据。而 在数据仓库中原子数据和汇总数据都会进行保留。这和ODS可更新的特性相关,因 为随时可能将操作型系统的数据变化更新到ODS中,并且数据的迁移时间间隔会很 短,这都使汇总数据在ODS中的意义不大。
特点:综合化,集成化
a
3
企业对应用集成的需求
➢我要了解企业目前的运转情况!(实时 监控)
➢我要知道某地区近5年内的销售情况以制 定未来的发展策略!(决策支持)
➢我要知道哪些是值得发展的优质的顾客! (预测)
a
4
BI应用带来的关键效益
洞察力
获得对业务绩效,流程和客户的可
见性和洞察力
更好的进行决策和执行决策,以快
Inmon的这个定义与他对数据仓库的定义很像。其中前两个特性和数据仓库是一样 的,即都是面向主题的和集成的,而后三个特性和数据仓库相差较大。
BI基础概念培训PPT课件

详细描述
数据准备是BI实施的重要环节,包括数据整合和数据清洗。数据整合是将分散在各个业务系统的数据进行整合, 形成一个统一的数据源;数据清洗则是确保数据的准确性和完整性,为后续的数据分析和报表开发提供可靠的基 础。
平台搭建
总结词
选择与配置工具
详细描述
平台搭建是选择适合的BI工具并进行配置的过程。根据需求分析的结果,选择 合适的BI工具,并进行相应的配置和设置,以确保数据展示和分析的准确性和 效率。
数据挖掘
数据挖掘定义
数据挖掘是从大量数据中 提取有用信息的过程,这 些信息可以用于决策支持。
数据挖掘技术
数据挖掘涉及多种技术, 如关联规则挖掘、聚类分 析、分类和预测等。
数据挖掘应用
数据挖掘广泛应用于金融、 零售、医疗等领域,帮助 企业发现潜在商机和改进 运营。
数据可视化
数据可视化定义
数据可视化效果
Tableau、Power BI、QlikView等。
商务智能工具的功能
数据查询、报表生成、仪表板展示、数据挖掘等。
数据可化工具
数据可视化工具
01
通过图形、图表、图像等形式展示数据,帮助用户更好地理解
数据。
常用数据可视化工具
02
Excel、Python、D3.js等。
数据可视化工具的功能
03
数据可视化、数据交互、数据探索等。
BI基础概念培训PPT课件
目录
• BI概述 • BI技术基础 • BI工具介绍 • BI实施步骤 • BI案例分享
01 BI概述
BI定义
BI定义
BI(Business Intelligence)即商业智能,是一种运用了数据仓库、数据分析和数据挖掘技 术的解决方案,旨在帮助企业更好地理解其业务数据,做出科学决策,并提升运营效率。
BI概念以及数据仓库讲解PPT课件

数据仓库具备高效的数据处理能力,支持BI进行复杂的数据分析和 查询。
数据查询优化
数据仓库通过优化查询性能,使得BI工具能够快速响应用户的查询 请求。
BI与数据仓库的结合方式
报表展示
01
BI工具利用数据仓库中的数据进行报表生成和展示,提供直观
的视觉效果。
数据分析
02
BI工具对数据仓库中的数据进行深入分析,帮助用户发现潜在
数据仓库的特点
总结词
数据仓库具有数据集成性、稳定性、时变性等特点。
详细描述
数据仓库中的数据是经过清洗、整合和转换的,具有很高的数据质量。数据仓库 中的数据是稳定的,不会像操作型数据库那样频繁变动。此外,数据仓库中的数 据可以进行时间序列分析,反映数据的演变和趋势。
数据仓库的架构
总结词
数据仓库的架构包括数据源、ETL过程、数据存储和数据查询等部分。
BI概念以及数据仓库讲解PPT课件
目 录
• BI概念简介 • 数据仓库概述 • BI与数据仓库的关系 • BI在数据仓库中的应用 • 案例分析
01 BI概念简介
BI的定义
BI的定义
BI(Business Intelligence)即 商业智能,是一种运用了数据仓 库、在线分析和数据挖掘技术来 处理和分析数据的商业应用。
预测模型
基于数据挖掘结果,构建预测模型, 对未来趋势进行预测,为企业制定战 略和决策提供科学依据。
05 案例分析
某公司BI系统的建设
总结词:成功实施
详细描述:某公司在建设BI系统时,充分考虑了业务需求和技术实现,采用了先 进的数据仓库技术和数据分析工具,成功地构建了一个高效、稳定、易用的BI系 统,为公司的决策提供了有力支持。
BI介绍PPT(PPT66页)

参数1:枚举出“行业代码”、“注册类型” 参数2:当参数1选择“行业代码”时,参数2为“行业代码”维
当参数1选择“注册类型”时,参数2为“注册类型”维
62
权限管理
63
▪ 批量设置权限 ▪ 利用对象id ▪ 利用维属性和diminf函数
权限赋予
64
▪计划任务的“三只手”
67
BI@Report
Click to edit subtitle style
1
欢迎,欢迎
和我们共同进步的产品商 产品合作商 最终的使用人员 活跃的分析人员
2
IT技术人员
数据分析专家 数据分析专家
Nice to meet you
3
我们经常被困扰
海量数据束手无策
4
我们也为此困扰
职能部门各自为5政造成信息孤岛
用地图
56
▪ Dashboard ▪ 实现方式 ▪ 制作原理
Dashboard
57
钻取链接的加强运用
▪ 合理应用钻取参数(range) ▪ 图片放大 ▪ 附件钻取 ▪ 利用我们知识完成:
下钻时判断是否是叶子节点,如果是,跳转到另外一张报表
58
▪ 多系列统计图 ▪ 统计图的美化
3D 边框 表元颜色
26
浅尝BI报表
27
浮动——单级浮动
表头
固定 表元
浮动维单元 格(绿箭头)
浮动区域( 绿框)
分析区 (红框)
28
浮动——多级浮动
一个浮动包含
另一个 浮动
双重浮29动=两个浮动?
向右浮动
浮动——交叉浮动
向下浮动
交叉浮30动=双向浮动?
固定——无浮动
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
•
北京市管委IT状况
• 应急事件处理数据
•
• •
基础地理信息数据
视频监控数据 城管通平台数据
应急事件处理 数据
基础地 理信息 数据
视频监控数 据
城管通平台 数据
•
• •
井盖数据
市政设施数据 环卫信息数据
环卫信息数据 户外广告数 据
?
井盖数据
市政设施数 据
•
•
户外广告数据
… …
为什么我们需要商务智能?
为什么我们需要商务智能?
• 在过去的几十年里,各种机构已经花费了大量的财力和资 源去构建联机事务处理系统(OLTP)和资源计划系统(ERP)等各 种系统.不断累计的信息和存储在数据仓库中的数据达到了 令人惊讶的规模。 当这些系统极大地改善了信息的自动处理能力时,也造就 了很多“信息孤岛”(information silos)------大量只有很有限 的获取和分析能力的数据。一项IBM的调查表明,大部分机 构只利用了其存储信息的2%--4%。
市场份额主要由国际BI厂商占领
为什么我们需要商务智能?
• 我们在未来的三年中将会制造出比过去三十万年更多的数据资 料!!! ------加州大学信息管理学院 <<商业周刊>>统计,54%的人认为很难找到他们想得到的信息. 43%的人认为不知道这些内部的信息是否正确. 77%的人认为由于信息的缺乏,很多决定是不正确 的. 61%的人认为50%的决定是拍脑袋来的.
– 面向的是数据,不是过程 – 使用通用的分析方法和模型
• 不局限于特定的使用人
– Information worker、Knowledge Worker – 领导层和决策层 – 任何其他需要使用数据和报表的人
• 受行业发展冷热的影响不大
– IT行业发展的时候需要商务智能 – IT行业冬天的时候仍然需要商务智能
product_dim
25 123 Chai
time_dim
134 1/1/2000
事实表中的粒度就是维度表与事实表中相关联的最小 级别的数据
事实表
产品的销售数量, 成本,销售额,订单数
库存数, 入库数,出库数
度量值:业务数据
外键
外键约束
time_dim_key product_key customer_key order_date_key
商务智能系统如何辅助决策
• 通过数据的整合提供更加全面的信息 • 通过预先计算提供更快捷的速度 • 通过OLAP技术可以非常灵活的以多种形式 展现数据,以使管理者发现问题
• 通过数据挖掘模型(以历史数据为基础) 预测商务的未来走势,为管理者提供决策 支持
商务智能应用的范围
• 不局限于某一个行业或局限于具体的业务
Customer_Dim
CustomerKey CustomerID ...
雪花模型
• 在多维表中定义层次 • 节省存储空间 • 存取效率较低
维度表
事实表的组成
事实表 外键 度量值
customer_dim
201 ALFI Alfreds customer_key product_key time_key quantity_sales amount_sales 201 25 134 400 10,789
在维度中分不同的层次
• 定义层次结构的好处
– 允许用户从不同的层次展示数据 – 在分析中采用不同的路径进行钻取
• 举例:日期 分为,年-半年-季度-月- 日期
星型模型 Employee_Dim
EmployeeKey EmployeeID ...
Time_Dim
TimeKey TheDate ...
什么是商务智能(BI)?
• 商业智能能够辅助业务经营决策,既可以是操作层的,也 可以是战术层和战略层的决策。
• 商业智能是对商业信息的搜集、管理和分析过程,目的是 使企业的各级决策者获得知识或洞察力(insight),促使他 们做出对企业更有利的决策。
理解商务智能
• 目标:数据信息 • 过程: 转化为商务价值
• Cubes
– 综合维度和度量值的数据模型 – OLAP 数据的逻辑存储介质
• OLTP 系统的例子
– 订单系统 – 客户服务
l l
库存管理
财务
OLTP 与OLAP的区别
OLTP
• • • • • • • • • • 原始数据 细节性数据 当前值数据 可实时更新 一次处理的数据量小 面向应用,事务驱动 业务操作人员 支持日常操作 简单的事务 100MB-GB
• OLAP
• • • • • • • • • • 整理后的数据 综合性和提炼性数据 历史数据 周期性刷新更新 一次处理大量的数据 面向主题,分析驱动 决策人员,高级管理人员 分析决策 复杂的查询 100GB-TB
数据仓库
OLAP
终端用户
数据集市
维度表
• 维度是分析中描述性的分类,通过它 可以将度量值分离出来进行分析。
主键
• 主键
– 唯一性 – 关联事实表与维度表
product_dim_key product_id_app
• 两个选择
– 应用主键 (app suffix) :原 业务系统的主键 – 代理键 (key suffix) 数据仓 库系统产生的数字键
Sales_Fact
TimeKey EmployeeKey ProductKey CustomerKey ShipperKey Sales Amount Unit Sales ...
Product_Dim
ProductKey ProductID ...
Shipper_Dim
ShipperKey ShipperID ...
商务智能发展
• 当前,商务智能(BI)市场正处于一个重要 的转型期 • 进入二十一世纪,“应用”成为关键词之一, 商务智能的深入应用也成为业界关注的焦点 • 2003年起,商务智能领域掀起并购热潮
BI受市场关注的原因
• 如何利用大量数据进行决策: ERP/SCM/CRM等产生大量地数据,刺激了BI 投资,其目的应用数据进行决策 • 绩效管理成为BI市场增长重要因素: 绩效 管理是驱动商业智能市场增长的重要因素之 一,绝大多数公司希望在该领域做出成绩 • 日益严格的行业规范要求:例如萨班斯-奥 克斯利(Sarbanes-Oxley)法等法案的颁布,也 推动了BI工具的接受和认同
商务智能的热点应用
• 财务
– – – – – 绩效评估 盈利分析 预算 风险控制 欺诈识别
• 销售
– – – – – – – – – – – 销售分析 客户管理 销售漏斗管理 需求预测 关联销售分析 Web点击流和销售分析 供应链优化 IT运营优化 分销商评估 质量控制 内部管理流程优化
• 市场
– – – – – – – 客户关系管理 市场促销 市场细分 品牌管理 客户忠诚度分析 客户流失分析 产品及服务目录管理
– 报告、分析工具、关键性能 指标(KPI)和仪表板
• 规范 组织的运营 • 从数据中挖掘出新的信息
– 同运营系统、信息反馈系统 的双向集成
BI 对现有系统的整合
• • • • • 基于现有业务系统和历史数据 通过对数据的充分运用提升现有系统价值 可以同时支持多种不同的数据库平台 面向数据分析而非过程跟踪 可以基于实时数据也可以基于非实时数据
• 运营
BI国内应用
l 企业信息化整体上处理基础建设阶段 数据整合,规划基础体系架构,实施基础应 用 l 多数企业BI应用处于较低的层次 报表查询+初步分析 l 金融、电信、保险等企业起步早些 BI应用的大好时期正在到来
BI主要用途
BI具有三方面的主要用途: • 对组织的财务和运营健康 状况进行监视。
数据仓库的特征
• 为商业分析过程展示数据 • 提供一致的历史数据存储 • 把数据储存为抽取和查询而优化的结 构 • 整合异构的数据 • 统一有效的数据源 • 把数据整理为稳定、面向主题的结构
数据仓库系统的创建
数据仓库
原始业务数据
终端用户
数据集结区
数据的提取,转换,加载(ETL)
了解数据仓库
数据仓库
术语介绍
• 粒度 :数据汇总的层次或深度。 • 聚合 :聚合是预先计算好的数据汇总,由于在问题提出之前已经 准备了答案,聚合可以改进查询响应时间。 • 切片 :由一个维的一个成员限定的分区数据,称为一个切片。 • 数据钻取 :最终用户从常规多维数据集、虚拟多维数据集或链接 多维数据集中选择单个单元,并从该单元的源数据中检索结果集 以获得更详细的信息,这个操作过程就是数据钻取。 • 级别 :级别是维度层次结构的一个元素。级别描述了数据的层次 结构,从数据的最高(汇总程度最大)级别直到最低(最详细) 级别。
• 传统的方案不能提供一个经过整合的,功能强大的分析工具给最 终用户。特别是给那些非技术的商业用户。由于下图中所示的两 个主要原因,传统系统不能满足商务层面的分析需要。
传统分析系统常见问题
难以获得的信息
未经整合的信息
获得性和整合性的空缺
术语介绍
• 数据仓库 :面向主题的、集成的、与时间相关且不可修改 的数据集合。 • 维度 :维度是分析中描述性的分类,通过它可以将度量值 分离出来进行分析 • 度量 :在多维数据集中,度量值是一组值,这些值基于多 维数据集的事实数据表中的一列,而且通常为数字。此外, 度量值是所分析的多维数据集的中心值。即,度量值是最终 用户浏览多维数据集时重点查看的数字数据。您所选择的度 量值取决于最终用户所请求的信息类型。一些常见的度量值 有 sales cost 、 和 production count 等
OLTP 与OLAP的区别
• OLTP(On-Line Transaction Processing ) 联机事务处理 • OLAP(On-Line Analysis Processing )联 机分析处理