数据挖掘数据集PPT课件

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Legend 1st Qtr 2nd Qtr 3rd Qtr 4th Qtr
产品
查询报表
OLAP
DB
.
ODS
数据仓库
统计分析 数据挖掘
决策支持
Hale Waihona Puke Baidu
服务
19
谢谢
.
20
16
监督性分类性-举例
结果输出—分类
将打分文件输入待预测数据集,对新数 据产生分类。
.
2020/5/11
17
文本数据集
文本
只有单列文本
.

18
企业决策支持信息系统
File
Edit
Location 1992
PowerPlay
Data
Values
All Products Age groups
Display Text Revenue($000)
预测效果图
.
10
多维属性数据集
目标
属性/值
有目标值则是有监督性
.
11
分类性结果模式
各种机器学习
K中心、两阶段、邻近、系统等无监督聚类 分类树、逻辑回归、神经网等监督性分类模式
.
12
监督性分类性-举例
信贷风险预测
数据来源于银行信贷部门对用户贷款信息的记录,包括客户基本信息、信用信 息、是否拖欠等。希望通过对以往客户数据的分析来对新客户评价信用,降低风险。
以各种回归式、方程式、检验结果等无偏预测值展现
线性、多项式、泊松、岭脊等回归类 ARIMA、X-11、WOLD分解等时间序列模式 嵌入式网状结构、过拟合网状神经等学习模式
.
8
ARIMA平稳时间序列预测-举例
某地年最低气温时序数据
绘制时序图
定阶
参数估计
平稳性和纯随机性检验
模式化及预测
ARIMA时间序列预测-举例
数据挖掘建模数据集
——不同数据挖掘模式下的各种数据集
引例
统计学奥卡姆剃刀 以尽量少的因子去解释现象,减少中间过程。
• 误差会以乘积的方式扩大 • 引入因子会使主题偏移
.
2
辛普森悖论 分组中具有优势,总评中却是劣势。
爱荷华州的一位居民移居到阿拉巴马州,结果提 高了这两个州的平均智商。
• 分组兼顾权重 • 定量因子细化分析
.
3
数据挖掘的三种基本数据集
数 事物数据集
据 集
时序/序列数据集
多维属性数据集
.
4
事物数据集
ID —— WORK ID —— TIME —— WORK
.
5
描述性结果模式
以描述性语言及规则等展现形式
关联规则 序列规则 If-then 规则集
……
.
6
时序数据集



序列数据集


.
7
预测性结果模式
数据变换
数据挖掘
解释评价
数据抽取
数据 仓库
数据预处理
待分析 数据
处理后 数据
变换后 数据
模式
知识
建模数据集
.
13
监督性分类性-举例
界面化流程图
.
2020/5/11
14
监督性分类性-举例
结果输出—模型比较
.
预测的0/实际所有的0
2020/5/11
15
监督性分类性-举例
结果输出—最优模型—树
.
2020/5/11
相关文档
最新文档