基于近似查询的在线分组聚集及其应用
基于近似查询的在线分组聚集及其应用
冯玉才
华中科技大学计算机科学与技术学院
摘
要
提出了在线分组聚集方案
关键词
联机查询处理
Abstract
Key words
16
2005年
8月
August 2005
1000
0097
A
中图分类号
用户经常需要对数据
仓库中存放的海量多维数据进行在线分组聚集
才能提炼出结
果中的有用信息用于挖掘关联规则或是引导部分结果的具体
分析
COUNT
首先要扫描整个源数据集
再对排序结果分组
因为整个过程需要大量的磁盘
I/O 和相当长的
处理时间
在实际应用中
轮廓
感
兴趣
这种系统快速响应的需求可以通过近似查询处理来实
现
本文对比了近似查询处理的两种方案
结合文献
[4]中的动态重排
序技术和文献
[5]
中的基本国会抽样方法
该系统能够灵活地与用户交互
提供较好的响应速度和误差
通过形成块嵌套循环和散
列连接
所有的多表连接查
询
只讨论单表查询
而响应时间与已处理的数据量成正比
对应用户不同的需求
通过引入对源数据集的预先计算过
程得到数据量相对较小的样本集或初步聚集结果
特点是通过减少运行时的
处理时间缩短系统响应时间
不能进一步改进
其二的联机查询处理方案
动态计算和聚集
返回当前的近似结果和置信区间
交互性能好
完成查询的总时间较长
响应速
度更快
用户很少需要完成查询
控制查询的执行速度
相对于灵活
性较差的预计算方案
SELECT AVG(grade) FROM student WHERE classname=041
基金项目
冯玉才(1944
男
研究方向
张鹏程
2004-07-10 E-mail
相关主题