空间关联规则挖掘技术的研究及应用

合集下载

空间数据挖掘技术的发展与应用

空间数据挖掘技术的发展与应用

空间数据挖掘技术的发展与应用1. 引言空间数据挖掘技术是指利用数据挖掘算法和技术手段对空间数据中的有价值信息进行提取和分析的过程。

随着科技的不断进步和数据的大规模产生,对空间数据挖掘技术的需求也在逐渐增加。

在本文中,将探讨空间数据挖掘技术的发展与应用。

2. 空间数据挖掘技术的发展2.1 空间数据挖掘的概念与原理空间数据挖掘技术是将数据挖掘技术应用到空间数据中,通过对空间数据的挖掘和分析,挖掘出数据中的潜在规律和有价值的信息。

空间数据挖掘技术的核心任务包括:分类、聚类、关联规则挖掘和异常检测等。

2.2 空间数据挖掘技术的发展历程空间数据挖掘技术的发展可以追溯到上世纪80年代。

在当时,由于计算机技术的限制和数据量的有限,空间数据挖掘技术受到了很多限制。

但随着计算机技术和数据采集技术的不断进步,空间数据挖掘技术发展迅速。

现在,各种针对空间数据挖掘的算法和模型被提出,并且得到了广泛的应用。

3. 空间数据挖掘技术的应用3.1 地理信息系统地理信息系统(Geographic Information System,简称GIS)是空间数据挖掘技术最常见的应用之一。

利用空间数据挖掘技术,可以对地理数据进行分析和挖掘,从而提取出地理数据中的有价值信息。

这些信息可以用于城市规划、环境保护、交通管理等领域。

3.2 物流与交通管理空间数据挖掘技术也被广泛应用于物流与交通管理领域。

通过对交通数据和物流数据的挖掘,可以分析交通流量、相关道路的瓶颈问题,进而优化交通路线和物流方案,提高效率和降低成本。

3.3 智能导航系统智能导航系统是一个利用空间数据挖掘技术的应用。

通过对用户位置数据的挖掘,可以为用户提供个性化的导航服务。

智能导航系统可以根据用户的出行习惯和实时交通状况,提供最佳的导航方案,并且能够根据用户的反馈进行实时调整。

3.4 自然灾害预测与应对空间数据挖掘技术在自然灾害预测与应对方面也发挥着重要的作用。

通过对历史灾害数据的挖掘,可以分析出自然灾害的规律和趋势,提前预测自然灾害的发生概率和影响范围。

地理信息系统中的空间数据挖掘技术应用教程

地理信息系统中的空间数据挖掘技术应用教程

地理信息系统中的空间数据挖掘技术应用教程地理信息系统(Geographic Information System,GIS)是一种通过空间数据的收集、存储、管理、分析和展示来描述地理现象和解决地理问题的技术系统。

空间数据挖掘技术是在地理信息系统中应用的一种数据分析方法,它通过从空间数据集中发现和提取潜在的模式、关系和知识,以帮助用户更好地理解和利用地理空间数据。

本教程将介绍地理信息系统中空间数据挖掘技术的基本原理和常见的应用方法。

一、空间数据挖掘技术简介空间数据挖掘技术是一种结合地理信息系统和数据挖掘方法的交叉学科。

它通过运用统计学、机器学习、模式识别等技术,从大规模的空间数据中提取有用的信息和知识。

常用的空间数据挖掘技术包括聚类分析、关联规则挖掘、空间插值、预测模型等。

二、空间数据挖掘技术的应用1. 聚类分析聚类分析是一种常用的空间数据挖掘方法,它将地理空间数据划分为具有相似特征的集群。

聚类分析可以帮助用户发现地理空间数据的分布模式,从而进行空间规划、资源优化和决策制定等工作。

例如,通过对城市人口分布数据进行聚类分析,可以了解到城市发展的热点区域、人口密度分布等信息。

2. 关联规则挖掘关联规则挖掘是一种用于发现地理空间数据中存在的关联关系的方法。

它通过分析地理空间数据中的属性之间的关联关系,帮助用户了解地理现象之间的相互关系。

例如,在商业领域中,通过关联规则挖掘可以发现商品之间的关联销售关系,从而进行市场推广和销售策略的优化。

3. 空间插值空间插值是一种通过已知点的观测值来推算未知点的值的方法。

在地理信息系统中,常用的空间插值方法有逆距离插值、克里金插值等。

空间插值可以用于对地理空间数据进行补全和预测,比如对气候数据进行插值分析可以得到整个区域的气候变化趋势。

4. 预测模型预测模型是一种利用历史数据预测未来趋势和结果的方法。

在地理信息系统中,可以利用地理空间数据建立预测模型,通过对未来地理现象的预测,辅助决策制定和规划工作。

面向精准农业的空间数据挖掘技术研究与应用

面向精准农业的空间数据挖掘技术研究与应用

面向精准农业的空间数据挖掘技术研究与应用一、内容综述随着科技的发展和人们对精准农业的需求不断提高,空间数据挖掘技术在农业领域的应用越来越受到关注。

本文主要围绕面向精准农业的空间数据挖掘技术研究与应用展开讨论,旨在为农业领域的相关研究提供一些有益的启示和借鉴。

首先我们要了解什么是空间数据挖掘技术,简单来说空间数据挖掘就是在地理空间数据的基础上,通过计算机技术对数据进行分析、挖掘和处理,从而揭示空间数据中的规律和关联。

在精准农业中,空间数据挖掘技术可以帮助我们更好地理解农田、作物、病虫害等信息,为农业生产提供科学依据。

接下来我们将重点介绍几种常用的空间数据挖掘技术,包括:基于属性的空间聚类分析、基于位置的空间关联规则挖掘、基于时空的数据融合与分析以及基于机器学习的空间分类与预测等。

这些技术在精准农业中的应用场景各有不同,例如。

此外本文还将探讨空间数据挖掘技术在精准农业中的发展趋势和挑战。

随着物联网、大数据等技术的不断发展,空间数据挖掘技术在精准农业中的应用将会更加广泛和深入。

然而如何提高数据的准确性和可靠性、如何保护农民的隐私权益等问题仍然需要我们去解决和探索。

面向精准农业的空间数据挖掘技术研究与应用是一个具有重要意义的课题。

通过深入研究和实践,我们有望为我国农业现代化和绿色发展做出更大的贡献。

1.1 研究背景和意义随着社会的发展,人们对食品安全和质量的要求越来越高。

而精准农业作为一种新型的农业生产方式,可以通过对空间数据进行挖掘技术的研究与应用,实现对农业生产过程的精细化管理,提高农业生产效率和质量。

因此本篇文章将探讨面向精准农业的空间数据挖掘技术研究与应用。

1.2 国内外研究现状在过去的几年里,随着科技的发展和人们对精准农业的需求不断提高,空间数据挖掘技术在农业领域的应用越来越受到关注。

国内外学者们纷纷投入到这一领域的研究中,希望通过挖掘空间数据来提高农业生产效率、降低成本、保障粮食安全。

在国内许多高校和科研机构已经开始了空间数据挖掘技术在农业领域的研究。

空间关联规则挖掘技术的研究及应用

空间关联规则挖掘技术的研究及应用

算法 、 基 于空 间距离挖 掘 算法 和基 于空 间方位 关系 挖掘 算 法 , 并通 过 实 例验 证 了 方法 的有效 性 。最 后 对未 来 可 能 研究 的
方 向做 了分析 和展望 。 关 键词 : 空 间数据挖 掘 ; 空间关 联规 则 ; 拓 扑关 系 ; 距 离关 系 ; 方 向关 系
Ab s t r a c t : S p a i t a l d a t a mi n i n g( S D M )r e f e r s t o p i c k i n g u p i n t e r e s i t n g r u l e s f r o m s p a t i a l at d i ve , s u c h a s s p a i t a l p a t t e ns r a n d c h a r a c t e r i s —
中图分 类号 : T P 3 1 文献标 识 码 : A 文章编 号 : 1 6 7 3 — 6 2 9 X ( 2 0 1 3 ) 0 5 — 0 0 2 6 — 0 4
d o i : 1 0 . 3 9 6 9 / j . i s s n . 1 6 7 3 — 6 2 9 X. 2 0 1 3 . 0 5 . 0 0 7
Re s e a r c h a n d App l i c a t i o n o f S pa t i a l As s o c i a t i o n Rul e s
Mi n i n g Te c h no l o g y
LU Xi n- hu i , W U Ch e n, YANG Xi - be i
he t p o s s i b l e d i ec r i t o n o ff ut u r er es e  ̄c h.

空间数据挖掘技术及其应用

空间数据挖掘技术及其应用

空间数据挖掘技术及其应用一、介绍空间数据挖掘技术是一种将空间数据与数据挖掘技术相结合的分析方法,旨在从大量的空间数据中发现隐藏的模式、关联以及规律,以提供更深入的空间信息洞察力。

在现代社会中,随着地理信息系统(GIS)和遥感技术的发展,空间数据的数量与规模不断增加,因此,利用空间数据挖掘技术进行数据分析已成为一种重要的研究领域。

二、空间数据挖掘技术的分类空间数据挖掘技术主要可分为三大类:空间聚类分析、地理关联规则挖掘和空间预测分析。

1. 空间聚类分析空间聚类分析旨在将相似的空间对象分组或聚集在一起,从而形成具有内部紧密性和外部分离性的空间簇。

其中最常用的聚类方法包括静态聚类和动态聚类。

静态聚类方法使用一次性的计算,将空间对象划分为不同的集群。

动态聚类方法则允许随着时间变化对空间数据不断地进行聚类,从而更好地反映实际情况。

2. 地理关联规则挖掘地理关联规则挖掘是指在空间数据集中发现空间对象之间的关联性规则。

通过关联规则挖掘,可以发现不同空间对象之间的关联性,例如购物中心的开设与周边商户的关系,或是犯罪地点与周边环境因素的关系。

地理关联规则挖掘为规划和决策提供了重要依据。

3. 空间预测分析空间预测分析通过利用历史数据和当前空间数据进行模型训练,进而预测未来的空间趋势和变化。

空间预测分析可应用于多个领域,如气象预测、交通预测和人口迁移模拟等。

预测分析的准确性对于决策制定和规划调整具有重要影响。

三、空间数据挖掘技术的应用1. 城市规划与建设空间数据挖掘技术可以帮助城市规划师更好地理解城市的发展趋势和特征,支持科学决策和规划设计。

例如,通过挖掘城市空间数据,可以确定新建街道或公共交通设施的最佳位置,优化城市交通流量。

2. 环境保护与资源管理利用空间数据挖掘技术,可以对环境资源进行有效管理和保护。

例如,在森林砍伐行为监测中,可以通过挖掘遥感影像数据和地面监测数据,识别出非法砍伐行为以及砍伐的热点地区。

这有助于提高监管效能,保护生态环境。

空间数据挖掘技术及其应用

空间数据挖掘技术及其应用

空间数据挖掘技术及其应用随着现代社会的不断发展,各种数据都在以前所未有的速度增长,这就意味着人们需要更加便捷和高效地管理这些数据。

而空间数据就是其中一种特殊的数据,在现代的生产和社会生活中扮演着越来越重要的角色。

那么,如何更好地利用空间数据?这就需要我们关注空间数据挖掘技术及其应用。

一、空间数据挖掘技术概述空间数据挖掘技术是一种将有关位置、扩张和范围信息融入到数据分析过程中的技术,它能够分析、挖掘和理解具有空间特征的大量数据,从而深入挖掘数据背后的价值和信息。

空间数据挖掘技术目前处于快速发展的阶段,它包括了数据前处理、数据分析、模型建立等多个方面。

数据前处理是空间数据挖掘技术的第一步,它包括数据清洗、数据预处理、特征提取等。

数据清洗是指去除、修正和补充掉数据中的不一致或错误信息,该过程可以大大提高数据分析的准确性和可靠性。

数据预处理是指对原始数据进行处理和加工,提高数据的可读性和可操作性。

特征提取是指从原始数据中提取出与分析任务相关的特征,这也是空间数据挖掘技术中非常关键的一环。

数据分析是空间数据挖掘技术的核心环节,它包括了聚类、分类、回归、关联规则挖掘等多个方法。

其中,聚类是基于数据相似度进行的一种分组方法,它能够将具有相似性质的数据归为同一类别,有利于发现数据中存在的规律。

分类是将数据指定为预定义类别的过程,它可以自动划分不同的数据类别,并对未知数据进行预测。

回归是一种预测性分析方法,通过建立数学模型来预测数据结果。

关联规则挖掘可以有效地挖掘与数据相关的事物之间的关联关系。

二、空间数据挖掘技术的应用空间数据挖掘技术有着广泛的应用领域,这里只介绍其中的一些。

1. 地图导航在城市建设和规划中,空间数据挖掘技术可以帮助我们更好地建立和管理地图信息的数据库,包括建筑、道路、公交站台等等。

这些数据可以通过地图导航软件进行实时导航,并在路上提供路况及交通信息。

2. 医学研究在医学研究中,利用空间数据挖掘技术对人体各个部位的组织和器官进行大规模的数据采集和分析,可以为医学诊断提供有效依据,有利于发现疾病预测和治疗的关键指标。

关联规则挖掘AI技术中的关联规则挖掘模型与关联分析

关联规则挖掘AI技术中的关联规则挖掘模型与关联分析

关联规则挖掘AI技术中的关联规则挖掘模型与关联分析在人工智能(AI)技术的发展中,关联规则挖掘模型和关联分析起到了重要的作用。

关联规则挖掘模型是一种用于挖掘数据集中项目之间关联关系的技术,而关联分析则是一种基于关联规则挖掘模型的数据分析方法。

本文将介绍关联规则挖掘模型的基本原理和常用算法,并探讨其在AI技术中的应用。

一、关联规则挖掘模型的原理关联规则挖掘模型基于数据库中的事务数据,通过分析不同项之间的关联关系,提供有关数据集中潜在关联的信息。

其基本原理是挖掘数据集中频繁项集,并基于频繁项集构建关联规则。

频繁项集是指在数据集中经常同时出现的项的集合,而关联规则则是对频繁项集进行关联分析后得到的规则。

二、常用的关联规则挖掘算法1. Apriori算法Apriori算法是关联规则挖掘中最常用的算法之一。

该算法通过迭代的方式逐渐生成频繁项集,先从单个项开始,再逐步增加项的数量,直到不能再生成频繁项集为止。

Apriori算法的时间复杂度相对较高,但由于其简单易懂的原理和广泛的应用,仍然是挖掘关联规则的首选算法。

2. FP-growth算法FP-growth算法是一种基于频繁模式树的关联规则挖掘方法。

相比于Apriori算法,FP-growth算法不需要事先生成候选项集,而是通过构建频繁模式树来挖掘频繁项集。

该算法在空间和时间效率上都表现较好,尤其适用于处理大规模数据集。

三、关联规则挖掘模型在AI技术中的应用关联规则挖掘模型在AI技术中有广泛的应用场景,主要体现在以下几个方面:1. 推荐系统推荐系统是AI技术中常见的应用之一。

通过挖掘用户的历史行为数据,关联规则挖掘模型可以找出用户喜好的频繁项集,并根据这些项集为用户提供个性化的推荐内容。

例如,在电商平台中,可以根据用户购买记录挖掘出用户的购买偏好,从而向其推荐相似的商品。

2. 市场篮子分析市场篮子分析是指通过分析顾客购买的商品组合,挖掘出商品之间的关联关系。

数据挖掘原理 算法及应用第3章 关联规则挖掘

数据挖掘原理 算法及应用第3章 关联规则挖掘

第3章
关联规则挖掘
图3-1 搜索候选项集和频繁项集过iori算法和它的相关过程的伪代码。
算法3.1
Apriori (发现频繁项目集)
输入: 数据集D、最小支持数minsup_count。 输出: 频繁项目集L。 (1) L1={large 1-itemsets}; //所有支持数不小于 minsup_count 的1
第3章
关联规则挖掘
(1) 发现频繁项目集:通过用户给定的最小支持度, 寻找所有频繁项目集,即满足支持度Support不小于 Minsupport的所有项目子集。发现所有的频繁项目集是形 成关联规则的基础。 (2) 生成关联规则:通过用户给定的最小可信度, 在 每个最大频繁项目集中,寻找置信度不小于Minconfidence 的关联规则。
l2 是可连接的,即l1[1]=l2[1]∧l1[2]=l2[2]
∧…∧l1[k-1]<l2[k-1]。条件l1[k-1]<l2[k-1]可以
保证不产生重复,而按照L1,L2, …,Lk-1,Lk, …,Ln
次序寻找频繁项集可以避免对事务数据库中不可能发生的
项集所进行的搜索和统计的工作。连接l1、l2的结果项集是l1 [1]、l1[2]、 …、 l1[k-1]、l2[k-1]。
第3章
关联规则挖掘
第 3章
3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 3.10
关联规则挖掘
基本概念 关联规则挖掘算法 Apriori改进算法 不候选产生挖掘频繁项集 使用垂直数据格式挖掘频繁项集 挖掘闭频繁项集 挖掘各种类型的关联规则 相关分析 基于约束的关联规则 矢量空间数据库中关联规则的挖掘
第3章
关联规则挖掘
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Research and Application of Spatial Association Rules Mining Technology
LU Xin-hui,WU Chen,YANG Xi-bei
( College of Computer Science and Engineering,Jiangsu University of Science and Technology, Zhenjiang 212003,China)
·27·
空间数据中的客观世界的本质规律、内在联系和发展 趋势,提供技术决策与经验决策的依据。
相对于传统数据挖掘,空间数据挖掘较为复杂,其 主要原因在于其挖掘对象空间数据本身的复杂性。 空 间数据具有空间位置和距离属性,并且数据本身就具 有一定的空间相关性。 1. 1 空间数据的特点
(1)空间数据的自相关性[2] 。 由于数据的空间相 关性而产生的空间差异、空间依赖、空间回归[3] 以及属 性数据与空间数据不可分,使得空间数据挖掘比传统 数据挖掘复杂得多。
图 1 拓扑关系图 (2) 距离关系。
在传统数据库中,距离关系是给两个元组之间进 行的人为的概念定义,通常任取两个属性 x 和 y,则元 组 A 和 B 之间的距离通常定义为:f( A,B) = ( Ax - Bx)2 + (Ay - By)2。 但在空间数据库中, 距离函数[6] f(A, B) 是有它的实际意义的。 一般情况, f( A,B) = 100, 可能是指 AB 两地的距离为 100km。 所以在空间数据 库中,定义距离关系 r,r ∈ { < , > , =}。 根据距离函 数 f(A,B),有 ArB 当且仅当 f(A,B) rK,其中 K 为一个 阈值。
Abstract:Spatial data mining ( SDM) refers to picking up interesting rules from spatial database,such as spatial patterns and characteristics,the universal relations of spatial and non-spatial data and other universal implicated in spatial data. Introduce the spatial data mining and the spatial association rules technology first. Based on the shortage of the traditional association rule mining method,propose three algorithms for spatial association rules including spatial topological relation based mining method,spatial distance based mining method and spatial direction based mining method,which was proved to be effective through the experiment. Finally,made the analysis and forecast to the possible direction of future research. Key words:spatial data mining;spatial association rule;topological relation;distance relation;direction relation
(3) 方位关系。 首先找准一个参考对象 A 和一个需要定位的对象 B,则方位关系可以做如下定义( 如图 2) 。 设 R(A) 是参照对象 A 中的一个特征点[7] : a. 若 B 在 A 的东北方向,if∀b ∈ B:bx ≥ R ( A) x ∧ by ≥ R ( A) y。 同理可得东南、西北南、西北等方向的确 定条件。 b. 若 B 在 A 的北方,if∀b ∈ B:by ≥ R ( A) y。 同理 可得东,南,西方向的确定条件。 c. 若 B 在 A 的某个方向,则对于所有的 A 和 B,此 关系为真。
(2)空间数据的尺度特征。 空间数据所遵循的规 律以及体现出的特征根据观察层次的变化而不尽相 同。 故空间数据的尺度特征是其复杂性的又一表现形 式。
(3)空间数据维度的增高。 空间对象属性的迅速 增长,导致空间数据维度相应增高。 如遥感领域, 随 着感知器技术的飞速发展, 波段的数目由最初的几个 增加到几十甚至上百个。

23 卷 2013 年
第5 5月

计算机技术与发展
COMPUTER TECHNOLOGY AND DEVELOPMENT

Vol. 23 No. 5 May. 2013
空间关联规则挖掘技术的研究及应用
陆新慧,吴 陈,杨习贝
( 江苏科技大学 计算机科学与工程学院,江苏 镇江 212003)
1 空间数据挖掘
空间数据 挖 掘 的 主 要 目 的 就 是 挖 掘 人 们 感 兴 趣 的、事先未知的并且最终可以被理解的知识。 与传统 数据挖掘不同的是,空间数据挖掘以空间数据库为基 础,综合利用神经网络、模式识别、人工智能等学科的 理论技术来实现数据的挖掘,并且最终揭示出蕴含在
第 5 期 陆新慧等:空间关联规则挖掘技术的研究及应用
c% ),这种形式是从事务型关系数据库的关联规则延
伸过来的,不过其中的 A 和 B 是空间和非空间谓词的
集合。
其实这种形式的空间关联规则只是一种比较狭义
的定义方式,还有很多更为复杂的形式,比如 is_a( X ,
'house ') ∧ close _ to ( X , ' suburbs ') → is _ cheap ( X )
摘 要:空间数据挖掘是指从空间数据库中提取用户感兴趣的空间模式与特征、空间与非空间的普遍关系及其它一些隐 含在空间数据库中的普遍数据特征。 文中首先介绍了空间数据挖掘和空间关联规则挖掘技术。 结合空间数据的关联特 性,针对传统关联规则挖掘方法的不足,提出了三种适合空间数据挖掘的空间关联规则挖掘算法:基于空间拓扑关系挖掘 算法、基于空间距离挖掘算法和基于空间方位关系挖掘算法,并通过实例验证了方法的有效性。 最后对未来可能研究的 方向做了分析和展望。 关键词:空间数据挖掘;空间关联规则;拓扑关系;距离关系;方向关系 中图分类号:TP31 文献标识码:A 文章编号:1673-629X(2013)05-0026-04 doi:10. 3969 / j. issn. 1673-629X. 2013. 05. 007
在人们日常生活中,接触和利用的数据大部分都 是空间数据,即地理位置信息和属性及其空间分布有
收稿日期:2012 -08 -20 ;修回日期:2012 -11 -25 基金项目:江苏省自然科学基金( BK2011492) 作者简介:陆新慧(1988 -) ,女,江苏盐城人,硕士研究生,研究方向 为空间数据挖掘;吴 陈,教授,研究方向为计算机应用技术和模式 识别与智能系统。
0 引 言
随着数据库技术发展的不断成熟以及数据应用的 普及,人们日常生活中接触到的数据中不断涌现出各 种形式的复杂数据类型。 为了从各种复杂数据中提取 有用的信息,必须对这些数据进行数据挖掘。 数据挖 掘技术的研究是一个比较年轻而充满生机的领域,它 的诞生是在 1989 年 8 月的第一届国际联合人工智能 学术会议上,当时是由一些从事数据库、人工智能、数 理统计和可视化等技术的学者们首次提出。
(4)空间数据是海量的。 空间数据具有多源、多 维、时态性的特点,所以其数据量是惊人的。 很多算法 因为计算量过大而根本无法实施。 因此如何克服海量 数据,提出高效 算 法 是 空 间 数 据 挖 掘 的 主 要 任 务 之 一[4] 。 1. 2 空间数据的关联特性
(1) 拓扑关系。 通常使用点、线、面这三种空间数据类型来描述空 间对象,分别将它们表达为:节点( Node) 、弧段( Arc) 和多边形( Polygon) 。 它们的拓扑关系可以表达为以 下 3 种[5] :拓扑邻接,描述的是同类元素间的拓扑关 系,如 N1 / N2 ,N1 / N3 ,P1 / P2( 如图1) ;拓扑关联,描述的 是不同类之间的拓扑关系,如 N1 / C1 C3 C6 ,P1 / C1 C4 C6 ; 拓扑包含,描述的是同类但不同级的元素之间的拓扑 关系,在拓扑包含中有简单包含, 如 P3 / P4 、 多层包含 和等价包含。
· 28 · 计算机技术与发展 第 23 卷
务 A 同时也包含事务 B 的百分比,即式(2)。
s(A → B) = P(A ∪ B)
(1)
c(A → B) = P(B | A)
(6% ,80% ) [9] ,说明 80% 靠近郊区的房子价格是便宜
的,并且只有 6% 的数据符合这一规则。 在上述例子
中,close_to 是一种空间谓词,而 is_cheap 是非空间谓
词。 在空间谓词的知识库中还有很多其他空间谓词,
如 left_to( 左边) ,north_to( 北边) ,是表示空间方向的;
图 2 方位关系图
2 空间关联规则
2. 1 关联规则 关联规则是目前在数据挖掘中最活跃、研究最为
广泛的一种知识类型。 关联规则模式属于描述性模 式,对数据间的重要关系非常敏感,可以用简单的形式 来表达,并且很容易解译,是无监督学习的方法之一。
数学模型来描述关联规则如下[8] : 设有项的集合: I = { I1 ,I2 ,…,Im} 。 任务相关的数 据 D 是数据库事务的集合,每个事务 T 都是项的集合, 使得 T ⊆ I。 每个事务 T 有一个唯一的标识符 TID。 假 设 A 是一个项集,事务 T 包含 A,当且仅当 A ⊆ T。 则关 联规则是形如 A → B 的蕴含式,其中 A ⊂ I,B ⊂ I,并且 A ∩ B = ∅。 规则 A → B 要在事务 D 中成立,受到支持 度 s 和置信度 c 的约束。 支持度 s 是指 D 中事务包含 A ∪ B 的百分比,即式(1);置信度 c 是指在 D 中包含事
相关文档
最新文档