基于近似查询的在线分组聚集及其应用

基于近似查询的在线分组聚集及其应用

冯玉才

华中科技大学计算机科学与技术学院

提出了在线分组聚集方案

关键词

联机查询处理

Abstract

Key words

16

2005年

8月

August 2005

1000

0097

A

中图分类号

用户经常需要对数据

仓库中存放的海量多维数据进行在线分组聚集

才能提炼出结

果中的有用信息用于挖掘关联规则或是引导部分结果的具体

分析

COUNT

首先要扫描整个源数据集

再对排序结果分组

因为整个过程需要大量的磁盘

I/O 和相当长的

处理时间

在实际应用中

轮廓

兴趣

这种系统快速响应的需求可以通过近似查询处理来实

本文对比了近似查询处理的两种方案

结合文献

[4]中的动态重排

序技术和文献

[5]

中的基本国会抽样方法

该系统能够灵活地与用户交互

提供较好的响应速度和误差

通过形成块嵌套循环和散

列连接

所有的多表连接查

只讨论单表查询

而响应时间与已处理的数据量成正比

对应用户不同的需求

通过引入对源数据集的预先计算过

程得到数据量相对较小的样本集或初步聚集结果

特点是通过减少运行时的

处理时间缩短系统响应时间

不能进一步改进

其二的联机查询处理方案

动态计算和聚集

返回当前的近似结果和置信区间

交互性能好

完成查询的总时间较长

响应速

度更快

用户很少需要完成查询

控制查询的执行速度

相对于灵活

性较差的预计算方案

 

SELECT AVG(grade) FROM student WHERE classname=041 

基金项目

冯玉才(1944

研究方向

张鹏程

2004-07-10 E-mail

相关主题
相关文档
最新文档