基于web的数据挖掘技术研究
基于Web搜索的数据挖掘系统的研究与实现

( . co l f o ue 1 Sh o mptr&Ifr t nE g er gChn z o stt fT cn lg C a ghu23 0 ; oC noma o ni en , a ghuI tueo eh ooy,h n zo 10 2 i n i ni
2 Y nigSho , hn zo ntueo ehoo , hn zo 10 2 . a l colC agh uIstt f c lg C agh u2 30 ) n i T n y
收 稿 日期 :0 00 —7 2 1 -72 基 金 项 目 : 州 工 学 院基 金 项 目( 0 1 ) 常 YN 7 1 作 者 简 介 : 志 琴 (9 8 查 16 一 )女 , 士, , 硕 副教 授 。
的结果 : ①搜索结果很多, 往往有许多页, 信息太 过庞大 ; ②搜索到的数据信息大部分是无用信息 , 属于垃圾信息 , 且搜到信息的准确率不能保证 ; ③
第2 4卷第 1期 21 0 1年 2月
常 州 工 学 院 学 报.
J u a fCh n h u I tt t fTe h ol y o r l o a gz o nsiu e o c n og n
V o . 4 No. 12 1
R . 01 2 1
基 于 We 索 的数 据挖 掘 系统 的研 究 与实 现 b搜
W e ie W e g s ec De l g wih te e da sa c mpl ae r c s . e C l a q ie u e u a n b sts, b pa e , t . ai t s t i o n h a i td p o e s W al c u r s f ld t a d c a i f r to y me n f d t n n Thi a rma e a r s ac n s a c i g a n n ft e W e a n o mai n b a so a mi i g. a sp pe d e e h o e h n nd m i g o h b d t r r i a n v lpe e fs se ih p ro a d de eo d a s to y t mswh c e f r e e c n a o t e I tm e nd d t nng a d c e td m d s a h g d t f m h n e ta aa mi r i ar i r ae n
基于Web数据挖掘中XML的应用研究

1 X ML的含义和 × ML文档 的基本结构
11XML的 含 义 .
Tc L( eM 技术数据标记语言 )等许多语言都派生 自 X 。基 于 X ML ML具有 以上 的优点 , 以 目前 它在业 所
难 的 问题 。
关 键 词 : / ; ML 数据 信 息 ; b 据 挖 掘 Hml X ; We 数
中图分 类 号 :P I. T 3 】8 3 文献 标志 码 : A 文章 编 号 :0 8 8 8 (0 1o — l4 0 10— 8 12 1 ) lO2 — 3
当我 们进 入 了一 个பைடு நூலகம் 息 化飞 速发 展 的时代 , 如
何从 大量 We b信息 中得到相关 和有用 的信息 ? 们 人
X ML更 容易 在应用 程序 间迁 移 。( ) 自我描述 性 , 3
X 以 明确 地表 示数 据模 型中各 个部分 的意 义 。 M[可 ( ) 构和 内容分 离 , 4结 在运 用 X ML时 , 数据 的显示和
首先想 到 的是 网络搜 索 引擎 , 它虽 可 以解决 一部 分
性 ,使 用 X ML可 以 按 照 自己 的 需 要 定 制 语 言 。 M tML ( ah 数学 标记语 言 )C 、 ML ( 学标 记语 言 ) 化 和
满 足对 It nt 的信息 进行 筛选 ,但 由于 We ne e上 r b上 的数据是 无结 构化 或半 结构 化 的 , 法 与数据 库 上 无
的 问题 , 由于其 精 确度不 够 高 , 难让 用 户满 意 , 但 很 鉴 于此 , b数 据挖 掘 ( bD t Miig技 术 应 运 We We a nn ) a
Web数据挖掘技术在数字图书馆中的应用研究

Web数据挖掘技术在数字图书馆中的应用研究摘要:随着信息技术的高速发展,人们积累的数据量也急剧增加,Web数据挖掘技术作为处理数据的专项技术,其优越性能在许多领域都有所体现。
针对Web数据挖掘技术在数字图书馆中的应用进行研究,分别从Web数据挖掘的难点、XML在Web数据挖掘中的应用以及Web数据挖掘技术在数字图书馆个性化服务中的应用三个方面展开分析,以促进Web数据挖掘技术的不断完善,使它能够为数字图书馆提供更好的服务。
关键词:XML;Web;数据库;数据挖掘;数字图书馆0引言信息时代带动了网络技术的高速发展,随着人们对数据知识量需求的增大,图书馆的功能也逐渐趋向于多元化,数字图书馆是一种建立在传统图书馆基础上的信息环境。
图书馆的信息化及网络化使得图书馆可以将知识和信息进行分布式储存,它除了具备传统图书馆的功能外还能向用户提供各种智能化的访问服务。
分布数据存储是利用站点的存储功能,将数据信息储存在多个站点当中,用户只需利用网络的搜索功能就能实现信息的搜索。
网络数据挖掘就是根据人们对网络信息服务需求的原理制作而成,它能为用户快速提供网络信息检索及信息服务等。
1Web数据挖掘的难点1.1Web信息量大且更新迅速数据仓库中的数据相对其它数据而言更加稳定,随着网页信息容量的不断增大,信息的更新速度使得搜索引擎无法发挥其功能。
尽管搜索引擎的规模在不断扩大,但仍无法适应网页的更新速度,在信息的跟踪、管理和收集上都存在一定的局限性。
虽然网络带宽也在逐渐扩大,相关处理技术也不断更新,但在网页搜索引擎方面仍达不到快速、全面的要求,相对特定用户而言,绝大部分网络信息都属于垃圾信息,因此,对网页的数据挖掘应根据用户需求设定一个范围。
1.2Web信息获取困难早期的网页信息多以HTML文件的形式存在,简单的HTML文件使得Web挖掘工具能够轻而易举地获取到信息,且Web站点并未设置相关防护措施。
随着数据库技术和语言的不断拓展,网络页面信息也从静态发展成动态,大部分信息和数据都是直接从数据库中调用,因此,网页抓取工具对网页的访问受到了限制。
基于Web的数据挖掘技术

义 , 称 为 半 结 构 化 (e —t c rd 的数 据 。所 谓 半 结 构 化 是 如 图 11 例 。 图 中箭 头 的方 向 表示 访 问 被 Smisu t e ) r u .示 相 对 于 完全 结 构 化 的传 统 数 据 库 的 数 据 而 言 .半 结 构 化 是 We 路径 从 图 中可 以确 定 最频 繁 的访 问 路径 。 b
数 据 的最 大 特 点 由 于 We b是 Itme 上 非 官 方联 结 的 资 源 集 通 过 路径 分 析 .可 以 改进 页 面 及 网站 结 构 图 11访 问模 式 示 例 ne t . 合 。 b数 据缺 乏 结 构 和 规 范 。 目前 . b上 数 据 主 要 由静 态 的 的设 计 。 We We H ML表 达 。 据 庞 大 。 据 具 有 多 样 性 。 态 性 强 , 成 了一 个 2 T 数 数 动 构 . 联 规 则挖 掘 技 术 2关
息 。We b挖 掘 可 以广 义 地 定 义 为从 WWW 中 发 现 和 分析 有 用 的 图来 表 示 , = ,)其 中 V 是 页面 的集 合 , G E, E是 页 面 之 间 的 超链 信息。 接 的集 合 . 面 定 义 为 图 中 的顶 点 , 页 面 页 而 1 b上 的数 据特 点 . We 2 之 间 的超 链 接 定 义 为有 向边 。顶 点 V 的 入 We b中有 大量 丰 富 的数 据 : 本 、 片 、 音 、 文 图 声 图像 等 , 些 边 表 示 对 页 面 V 的 引 用 . 这 出边 表 示 V 引 用 数 据 多存 在 于 H ML超 文本 文件 中 .没 有 严 格 的结 构 及 类 型定 了 其 它 的 页 面 , 样 就形 成 了 网站 结 构 图 。 T 这
基于WEB访问信息挖掘提高电子商务个性化服务研究

36《商场现代化》年月(中旬刊)总第55期电子商务一、引言随着i nt e r ne t 技术的发展,个性化信息服务已经被广泛应用到很多领域:如个性化导航、个性化网站等。
尤其是在电子商务领域,对用户进行个性化服务,已经成为许多电子商务企业追求的目标。
W EB 访问信息挖掘就是对用户访问W EB 时在服务方留下的访问记录进行挖掘,即对用户访问W EB 站点的存取方式进行挖掘。
挖掘对象是在服务器上的包括ser ver l og dat a 等在内的日志文件记录。
二、电子商务个性化服务的数据挖掘方法访问信息挖掘是在电子商务上进行知识发现,最关键的是进行客户访问信息的挖掘,得到客户的浏览行为和访问模式,从而发现客户的兴趣、爱好等有用的市场信息,最常用的挖掘方法有:1.路径分析常用于判定在一个we b 站点中最频繁访问的路径。
如:80%的用户在存取/c om pany/pr odc ut 1时是经过/com pa ny/new 。
通过客户访问的路径分析,可以改进页面和网站目录结构的设计,使用户直奔所需,减少客户的流失率。
2.关联规则挖掘使用关联规则挖掘可以从W EB 访问事务集中,找到一般性的关联知识。
如:30%的客户在访问/c om pa ny/pr odcut 1也访问了/com pany/pr odc ut 2。
利用这些相关性,可更好地组织W EB 空间,实施有效的营销策略。
3.序列模式发现序列模式发现就是在时间戳有序的事务集中,找到那些“一些项跟随另一些项”的内部事务模式,即挖掘出交易集之间有时间序列关系的模式。
如:在com pa ny/pr odcut 1上进行订购的用户中有60%的在一个月内也订购了c om pany/pr odc ut 2。
序列模式发现能够预测客户的访问模式,了解客户的兴趣及需求所在,采取有针对性的广告服务,以满足访问者的特定要求。
4.分类分类就是为具有某些公共属性的特定群体建立概要特征,这些特征可以用来对新增到数据库里的数据项进行分类。
基于云计算技术的Web数据挖掘的算法研究

基于云计算技术的Web数据挖掘的算法研究摘要:本文提出一种基于云计算的web数据挖掘算法,云计算技术将大数据集与进行数据挖掘的人员分配到多台计算机工作站上进行并行处理。
Web数据挖掘是指探寻网络中的大量有用信息进行分析,选择和存储有用的信息。
利用云计算技术可以明显提高web数据挖掘的效率。
关键词:云计算技术Web数据挖掘map-reduce 算法随着互联网技术的迅猛发展,互联网中存在着大量有用的数据信息,Web数据挖掘就是指如何对互联网上的大量数据中提取出有用的信息,并能再这些信息中挖掘出他们之间的相互关系以及发现新的有用的概念。
从而提出对领导者的决策有用的数据分析。
如今,互联网数据几乎达到了单机无法处理的地步了,云计算具有非常高的可拓展性,非常适合处理大规模的数据,可以通过并行计算等超强的计算能力来面相海量的数据及复杂过程的计算任务。
1 云计算技术及服务模型云计算技术是一种近年来新兴起来的共享型的编程架构的方法,是由分布式计算(Distributed Computing)、并行计算(Parallel Computing)和网格计算(Grid Computing)发展而来。
云计算的基本原理是为互联网用户提供计算、存储、软硬件等服务,利用远程服务器组成的集群,用户可以根据需要以及任务的优先程度,来访问计算机和存储系统。
按照需求来提高对软硬件资源的利用率。
大大节省了资金以及时间的分配。
云的服务模型包括三大类,分别为:基础设施即服务(infrastructure as a service,IaaS) 、平台即服务(platform as a service,PaaS)、软件即服务(software as a service,SaaS)三大类,如(图1)所示。
以IaaS的模式搭建系统平台,形成虚拟化的IT应用基础设施;以PaaS的模式搭建支撑平台,满足IT应用需求;以SaaS的模式搭建应用平台,按照用户需求分发软件授权并提供应用服务。
基于Web的数据挖掘技术的研究

化模 型 和半 结 构 化数 据 模 型抽 取 技 术 为前 提 建立 数 据 仓库 。
2基 于 We b的数 据挖 掘 的主 要方 法
21访 问 路 径 分 析 . 访 问路 径 是 用 户在 网络 上 浏 览 时 . 一个 网 页到 另 一 个 网 页 的 从 路 径 访 问路 径 分 析 就 是 寻找 频 繁 访 问路 径 的 方 法 即 通 过 对 We b 服 务器 的 日志 文 件 中 客 户访 问站 点 的访 问 次 数 分 析 , 挖 掘 出频 繁
i g t e c aa tr t so b i fr ai n, i p p rt k sar s ac n t e p o l m fwe aam ii g t a sap m e p o lm O b ov d' n h rce i i f h sc we n o m t o t s a e e ee r h o h r be o b d t n n t r r be t e s l e h a h i i
Ke r ¥ d t e c v d n W e x a a o ; aa wa e o s y wo d :aa x a a o ; b e c v t n d t r h u e i
在 Itme 技 术 迅 猛 发 展 的 今 天 , 对 We ne t 面 b上 浩 如 烟 海 的 数
的特 点 人 手 . 究 面 向 We 研 b的 数 据 挖 掘 需 解 决 的 主 要 问 题 , 出 提
了一 种 基 于 We 据 挖 掘 的 应 用 模 式 框 架 . 着 重 从 功 能 的 角 度 b数 并
数据挖掘在Web中的应用研究

数据挖掘在Web中的应用研究摘要:web中的数据挖掘技术是一种新型的技术,web自身的特点,决定了web数据挖掘技术具有更多的特点,而且应用也非常广泛,不仅能够提取页面的信息,进行站点设计分析,而且在电子商务方面也具有非常广阔的应用前景。
本文对数据挖掘技术在web中的应用进行分析。
关键词:数据挖掘技术;web应用;网络技术中图分类号:tp352 文献标识码:a 文章编号:1007-9599 (2012)18-0000-02随着网络技术的快速发展,网络上数据资源的越来越丰富,人们迫切需要将这些数据转换成有用的信息和知识,进而促生了数据挖掘(data mining,dm)和知识发现(knowledge discovery,kd)领域。
信息技术的发展,对web应用提出更高了要求,为了能够满足人们对信息获取的要求,研究基于web的数据挖掘技术,以便人们能够更加智能、更加自动地抽取数据以及信息中的知识。
1 数据挖掘技术相关概述1.1 基本概念数据挖掘技术主要是指寻找隐藏在大量数据中有价值的信息,从中寻找其规律,揭示出隐含的、具有潜在价值的知识,从而为决策支持提供有力依据的过程。
数据挖掘的目标主要包括特征、趋势以及相关性等多个方面的信息。
随着网络应用的普及,网络中信息量迅速增加,传统的知识发现(kdd:knowledge discovery indatabases)技术和方法已经不能满足人们从web中获取信息的需要,基于网络技术提供对各类数据的深层次实时分析,提供决策支持服务,就使得基于web的数据挖掘技术应运而生,这种技术将传统的数据挖掘和web应用技术相互结合起来,实现高度自动化的分析和归纳性的推理。
图1为web数据挖掘原理流程:2.3 在购物网站的应用web数据技术采用web-dms系统可以构建一个基于web 的挖掘的购物网站和交易环境,还能够充分利用站点上积累的信息,从而更好地服务于企业和客户。
在购物网站中采用web 数据挖掘技术不仅能够通过了解购物者的行为习惯,选择提供最佳的服务方式、消费习惯,还能够分析购物者的个人爱好[3],从而提供更加贴切的商品推介。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
21 0 0年 第 l O期
C m u e DS f w r n p l c t o s o p t rC o ta ea dA p ia in
工 程 技 术
基于 w b的数据挖掘技术研究 e
王 婉 晨
( 天津工业大学,天津
3 06 ) 0 10
摘 要 :we b数据挖 掘 简称 w e b挖掘 ,是从 数 据挖掘 技 术发展 而 来 ,是数 据挖 掘技 术应 用 于 We 信 息 的一 个崭新 领 b 域 。它是 帮助人们 从 海量信 息 中进 行 智 能的、 自动 的抽取 有价值 的知识 ,从 中揭 示 出蕴含在 这 些数据 背后 的客观 世界 的 内 在 联 系和规律 ,解决社 会发展 中的 实际 问题 并 用于宏 观辅 助决 策的 。 关键 词 :We b数据挖 掘 ;电子 商务 ;X ML应 用 中 图分 类号 :T 3 1 3 P 1. 文 献标识 码 :A 1 文章编 号 :10— 59 ( 00 1— 03 0 07 99 21 ) 0 08— 1
应 用 .0 31 20 .
『 康 晓 东. 于数据 仓 库的数 据挖 掘技 术. 工 业 出版 社, 0 , 4 1 基 机械 2 4 0 1
[ J d e r a aa Ro e o l , k n s ad . e s e 5 a epS vs v , b mC o y Mu u d h n eW bU a ]i i t e De p g
Mi n nig: D ic vey n Ap iai n ofU sg Patr fo e so r a d pl to s a e c tens r m W b
D a a S g d pl r ton , 0 , : 25 38 t . i k d Ex o a i s 20 0 2 3 —3
W e b-b s d Da a M i n c a e t ni g Te hno o y lg
W ang W an hen c
(innP l eh iU i rt,i j 3 0 0C i ) Ta j oy c n n esyTa i 0 1 ,hn i t c v i nn 6 a
wo l n elw fi ena eainsfo t s a at ov a tc lp o e si s ca e lp e nd frm a r u po t g rda d t a o r l lto r m he ed t,os leprc a r blm n o ild veo m nta o c o s p ri h nt r i n d cso - a n e iin m kig.
数 据通 常具 有杂 乱性 、冗 余性 、不 完整 性等特 点 ,为 此数据 采掘 必 须经 过数据 准 备阶 段 以提高 数据挖 掘质 量 。挖 掘操 作包括 选择 合 适 的算法 ,进 行挖 掘知 识 的操 作 ,最后 证 实发现 的 知识 :表达 和 解释 阶段 是对 结果 进行 分析 ,提取 出最 有 价值 的信 息 。如 果获 得 的信 息不 能使 决策 者满意 ,则 需要 重复 以上数 据挖 掘 阶段 。 ( )分 析 与评估 四 分 析与评 估 模块 是对 数据挖 掘所 得 到的 知识模 式进 行可 信度 和 有效 性分析 ,并对 其做 出评估 结论 。为用户 的经 营 决策提 供信 息 支持 。 ( )知 识表 述 五 知 识表 述 模块 是 指将 利用 数 据挖 掘 工 具从 Wb 据 中挖 掘 出 e数 来 的知 识模式 .用适 当的形 式表 现 出来 , 以利 于用 户接 受和 相互 交流。 三 、数据 挖掘 工具 的评 价标 准 评价 一个 数据 挖掘 工 具 ,需 要从 以下 几个 方面 来考 虑 :产生 的模 式种 类 的多 少 ;解 决 复杂 问题 的能力 : 易操作 性 ;数据存 取 能力; 与其 他产 品的接 口。 于W b 基 e 的数据 挖 掘技术 在处 理极 大量 的数 据 时 ,如 何提 高算 法效 率 的 问题 ;对 于挖 掘迅 速更 新 的数据 的挖 掘算 法 的进 一步研 究 ;在挖 掘 的过程 中 ,提 供 一种 与用 户进 行交 互 的方法 ,将 用户 的领 域知 识结 合在 其 中:对 于数 值型 字段 在关 联规 则 中的 处理 问题 ;生成 结果 的可 视化方 面 等等 有待 于进 步 的研 究 。
n o i . l p o l it l e t n uo t a y gt a a l n w e ef m t s if ifr t n t e e pe ne i nl a da tma c l e v l bek o l g o emas no a o , v a t bet e ma o I h p lg y i l u d r h r t n e el h oj c v m i r e i
一
参考 文献 : 『 陈京 民. 据仓 库 与数据 挖掘技 术 . : 1 1 数 北京 电子工业 出版社 , 0 2 2 0
f 谢 丹夏 . e上 的数 据 挖 掘 技 术和 工具 设 计 . 算 机 工 程 与 应 2 】 W b 计
用 ,0 16 20 ,
f 孙 颖, 波 . 于数据挖 掘技 术 的虚 拟社 区成 员行 为研 究 .Байду номын сангаас3 1 毛 基 计算机
[] e . ak , . fce t tM i gfr ahT a esl 6Ch nM S P r JsYuPS Ef in a mn t rv ra i Da oP
Pa t r s n te i Dit bu e S se s Pr c. o h 1 t EEE I t m e n sr t d y t m . i o f t e 6 hl ne t Co f on D i r t d Co p i y t ms 1 9 2 : 8 n. s i e m ut t bu ng S se , 9 6, 7 3 5—3 2 9
K e w o dsW e aam ii ; c m m ec ; y r : b d t nngE—o r eXM L p iains a pl to c
基于 wb e 的数 据挖 掘需 要解 决 的几个 问题 ( )异构 数据库 环境 一 Wb 的 每一 个站 点 就 是一 个数 据 源 。每 个数 据源 都 是 异构 e上 的 ,因而每 一站 点之 间 的信 息和 组织 都 不一样 ,这 就构 成 了一个 巨大 的异构 数据 库环 境 。如果 想要利 用 这些 数据进 行数 据挖 掘 , 首先 ,必须 要研 究站 点之 间异构 数据 的集 成 问题 。其次 ,还 要解 决W b 的数 据查 询 问题 。 e上 ( )半结 构化 的数据 结构 二 Wb 的数据 非常 复杂 , 有特定 的模 型描 述 , e上 没 每一 站点 的数 据 都各 自独 立设 计 ,并且数 据本 身具 有 自述性 和动 态可 变性 。因 而 。 e 上 的数据 具有一 定 的结构 性 , 因 自述层 次的存 在 。从而 Wb 但 是一种 非完 全结 构化 的数据 ,这 也被 称之 为 半结构 化数 据 。半结 构化是W b 数据 的最 大特 点 。 e上 二 、W b e 数据 挖掘 的主要 过程 Wb e 数据 的特 点决 定 了对 其进 行 有 效数 据挖 掘 具有 极 大 的挑 战性 。 根据 W b e 数据 的特 点 。 结合数 据挖 掘 的一般 过程 , 以将W b 可 e 数 据挖 掘流程 描述 如 图所示 的数据 采集 、数据预 处理 、 据挖 掘 、 数 分 析与评 估 和知 识表述 5 个功 能模 块 。 ( )数据采 集 一
Absr c : e aam i ng r fre o a e mi i ,e eo m e tfo t edaam i n e h olg ,lo an w ra o e t a tW b d t ni ee r dt sW b nngd v lp n m h t nig tc n o yas e a e fW b r
一
、
据 挖掘 过程 一般 由数据 准 备、 掘 操作 、 果表达 和解 释3 挖 结 阶段组 成 。数 据挖 掘算 法对 数据 有一 定 的要求 ,如 数据 冗余 性小 、数据 属 性之 间 的相 关 性小 、数 据 出错 率 小等 。而 现实 世界所 采集 到 的
按照 主题 相关 的原 则 , 数据 采集 模块 完成 从外 部的W b 境中 e环 有选 择地 获取 数据 ,为后面 的数据 挖掘 提供 素材 和 资源 。 e环 境 Wb 所提 供 的数据 源包 括Wb e 页面 数据 、 链接 数据 和记 录用 户访 问情 超 况 的数据 等 。 根据 数 据源形 式 的不 同可 以将 Wb e 数据 挖掘 分为基 于 内容 的挖 掘 、 基于 结构 的挖 掘和基 于用 户使 用 的挖 掘 等3 。 一 种 每 种数 据挖 掘类 型在 数据 采集 过程 中会使 用不 同的方法 和技 术 ,但 它们 都有 共 同的基本 过 程。通 常 ,数据 采集 由数 据搜 索 、数据 选 择和 数据 收集等 3 相对独 立 的过程 组成 。 个 ( )数据 预处 理 二 数据 预处 理模块 主 要对 数据采 集所 获得 的源 数据 进行 加工 处 理和 组织 重构 .构建 相 关主题 的数 据仓 库 .为下 一步 的数据 挖 掘 过程 创建 基础平 台。数据 预 处理是 为数 据挖 掘所 做 的前期准 备 , 它主 要包 括数据 清理 、数据 集成 、 数据变 换 、数据 约简 等 。 ( )数据 挖掘 三 数据挖 掘模 块是 数据 挖掘 系统 的核 心部 分 ,它 的主 要 功能 是 运用 各种数 据挖 掘技 术 。从海量 的经过 预处 理的 数据 中提取 出潜 在 的、有 效且 能被人 理解 的知 识模 式 。概括 地讲 。数据 挖掘 的最 终 目标只有 描述 和预 测两 个 ,所 谓 描述 就是用 可 理解 的模式 表达 数据所 包含 的属 性和 特征 信息 :而 预测 则是指 根据 属性 的现 有数 据值 找出其 规律 性 ,进而 推测 出其 在未 来可 能出现 的属 性值 。数