web使用挖掘介绍及趋势

合集下载

电子商务中Web数据挖掘的应用

电子商务中Web数据挖掘的应用

电子商务中Web数据挖掘的应用[摘要] 本文介绍了web数据挖掘的概念及其分类,探讨了电子商务中web数据挖掘的过程,研究了web数据挖掘在电子商务方面的应用。

[关键词] 电子商务数据挖掘 web挖掘搜索引擎中图分类号:f407.63 文献标识码:a 文章编号:网络的发展带动了电子商务市场的繁荣,大量的商品、信息在现有的网络平台上得以交易,大大简化了传统的交易方式,节约了时间,提高了效率,但电子市场繁荣背后隐藏的问题,也成为人们关注的焦点,突出表现在海量信息的有效利用上,如何更加有效的管理利用潜在信息,使他们的最大效用得以发挥,成为人们现在研究的重点,数据挖掘技术的产生,在一定程度上解决了这个问题。

一、电子商务与web数据挖掘电子商务是利用计算机技术、网络技术和远程通信技术,实现电子化、数字化和网络化的整个商务过程。

无论是b2b、b2c还是b2g 电子商务模式,商品的采购者都需要通过web方式与商品的供应商及其合作者之间建立信息流的交互,那么,一方面通过web方式与购买者主动、方便、快捷的获得期望主题的信息;另一方面供应商与合作伙伴们如何通过他们的集成信息系统,运用知识把访问者、网上购买者的访问数据从潜在的、隐含的、事先不知的状态,经过提取、洗涤、加工变为潜力巨大的价值信息,从而提高企业的核心竞争力。

web数据挖掘(web data mining)是利用数据挖掘从web文档及web服务中自动发现并提取用户感兴趣的、潜在的、有用的模式和隐藏信息。

web数据挖掘的主要目标就是从web的访问记录中抽取用户感兴趣的模式,www服务器中的访问日志,记录了关于用户访问和交互的信息,通过web数据挖掘,就可以根据用户的访问兴趣、访问频度、访问时间动态地调整页面结构,改进服务,开展有针对性的电子商务活动,以更好地满足客户的需求。

二、web挖掘的分类电子商务web数据挖掘一般可分为三个部分:内容挖掘、结构挖掘、用法挖掘。

Web信息挖掘现状及应用前景

Web信息挖掘现状及应用前景
参 考文 献 来自( 5 :8 1) . 2
[ ] 姜瑞其 . 3 国外 机构库发展 概况 [] 图书情报工 作 ,0 5 1 )1 2 J. 20 ( 1 :4 —
1 5; 49 4 1 .
( 责任编辑 : 刘翠玲 ) 第一作者简介 : 春燕 , ,9 9 5 李 女 17 年 月生 ,0 2 2 0 年毕业于武汉大学 图书馆 学系,助理馆员 ,中山大学图书馆 , 广东 省广州市新港西路 15 3
之 为半结 构化数据 。半结构化是 We 上数据 的最大特点 。 b 23 解 决半结构化的数据源 问题 .
1 We 信 息挖 掘概 述 b
We b挖掘( bMiig是数据挖掘在 We We nn ) b上的应用 , 是一项 综合 技
术, 涉及 W b 数据挖掘 、 机语言学 、 e、 计算 信息学等多个领域 , 同研究 者 不 从 自身的领域 出发 ,对网络挖掘的含义有着不 同的理解 。但 总体 而言 ,
从数据库研究的角度出发 , b网站上 的信息也可以看作是一个数 We
据库 , 一个更大 、 复杂的数据库 。We 更 b上 的每一 个站点就是一 个数据
源, 每个数据源都是异构 的, 因而每一站点 之间的信 息和组织都不一样 , 这就构成 了一个巨大的异 构数据库环境 。 如果想要利用这些数据进行数 据挖 掘 , 首先必须要研究站 点之间异构数 据的集成 问题 , 只有将 这些站 点的数据都集成起来 , 提供 给用户一个统 一的视图 , 才有 可能从 巨大的 数据资源 中获取所需 的东西 。其 次 , 还要解决 We b上的数据查询 问题 , 因为如果所需的数 据不能很有效地得到 , 对这些数据进行 分析、 集成 、 处
理就无从谈起 。 22 半结构化的数据结构 .

浅谈web数据挖掘在电子商务领域中的应用

浅谈web数据挖掘在电子商务领域中的应用

We b数据挖掘在电子商务中的研究 和应用 ,已经越来越受到 3 . 面对 一个非常广泛的形形色色 的用 户群 体 。不 同的用 户访 人们 的重 视和关 注, 它的前景广阔 , 势 头 良好 。并且经过各类 电子 问 We b的兴趣 、 爱 好和使用 目的千差 万别 , 面对一 个非常广 泛 的 商务网站 的实践 以及经验 的证 明, 电子商务的优点突 出, 它不仅价 形形 色色 的用户群体 , 能否使用 户根据 自己的爱好兴趣定制 网页, 格低廉 , 而且交易方便 , 它吸引着无数 的消 费者。对于电子商务 网 甚至能否 根据发现 的用户 , 自动为用户定制网页 , 从 而提供个 性化 站来 说 , 要 了解到顾 客的购买意 向 、 吸引顾 客的活动 、 了解顾 客 的 的信息检索和查询服务 。 购物行为心理 。 这些都是 当前需要研究 的问题。 通过数据的挖掘技 三 、 数 据 挖 掘 在 电子 商 务 中 的 应 用 术 的应用 ,我们就能够从海量的数据信息 当中提取 出那 些相对来 目前 对于 We b 挖 掘的对象和使用的方法层 出不穷 , 但 随着电 说 比较有用 的信息 , 来 帮助商家对 客户进行 进一步的理解 , 才能够 子商 务网站的兴起 , 电子 商务 将是未来 We b挖掘的主要发展 方向 推 出更多更为实惠 的商业服务 。 并且通过数据的挖掘 , 瞄准一个客 之一 , 因此它在各种商 业领域都存在广泛 的使用价值 。 当电子商务 户群体 , 通过一些比较特殊 的信息手段来进 行一次宣传工作 , 以此 在企业 中得到应用时 , 企业信息 系统将产 生大量数据 , 这些海 量数 来更大 的对广告的预算 以及增加收入进行减少 ,从 而让 这一切都 据使数据挖掘有 了丰富的数据基础 ,同时高性能计算机 和高传输 能 够 自行 完 成 。 速率 网络 的使用 , 也给数据挖掘技术提供 了坚实的保障 。 介绍以下

基于Web数据挖掘简述

基于Web数据挖掘简述
局 面 , 了解 决 这 个 问题 , 代 引 入 了 数据 挖 掘 这 个 概 念 。 为 现 所 谓 数 据 挖 掘 D t nn a Miig就 是 从 大 量 的 、 完 全 的 、 噪 a 不 有
1We 使 用 挖 掘 、 b We b使 用 挖 掘 通 过 挖 掘 We 日志记 录 ,来 发现 用 户访 问 b b页 面 的模 式 。通 过 分 析 和 探讨 We 日志 记 录 中 的规 律 。 b 增 们 对数 据 库 技 术进 行 长期 研 究 和 开 发 的 结 果 .而 数 据 挖 掘 技 术 We 并 b服 发展 的同 时 它 又反 过 来 促 使 数 据 库 技 术 进 入 了 一 个 更 高 级 的 阶 强 对 最 终 用 户 的 因 特 网信 息 服 务 的 质 量 和 交 付 . 改 进 We 段 :传 统 的 数 据环 境 基 本 上 是 数 据 操 作 型 的 传 统 的 信 息 系统 只 务 器 系 统 的性 能 负 责数 据 的增 、 删及 修 改 操 作 , 在 数 据 库 的 基 础 上 可 实 现 的 工 而 作 就 是 O T (n ieTasco rcs. 机 事 务处 理 ) 现 在 L PO Ln rnat nPoes联 i 。 2 We 、 b内容 挖 掘 We b内 容 挖 掘 是 指 对 We b上 大 量 文 档 集 合 的 ” 容 ” 行 内 进


引言
随着 计 算 机 硬件 和软 件 的 飞 速 发 展 .尤 其 是 数 据 库 技 术 与


在2 O世 纪 8 O年 代 . 球 信 息 量 每 隔 2 全 O个 月 就 要增 加 ~ 倍 。 如 今 美 国 宇 航 局 的 数 据 库 每 天 从 卫 星 下 载 的 数 据 量 就 能 达 到 3 B 4 B. T -T 面对 n 积 如 山” 堆 的数 据 集 合 . 用传 统 的 数 据 分析 手 利 段 难 以 应 付 . 是 造 成 了 ” 据 过 剩 ” ” 识 匮 乏 ” 存 的特 殊 于 数 与 知 并

Web数据结构挖掘分析与研究

Web数据结构挖掘分析与研究

引 擎 信息 检索 的质 量 。 用 D 表 示 Ca lr 第 i 下 载 数 据 集 , 包 含 了 j 页 面 : ; rw e 的 次 它 个 D d d …d} 和 j 产f 。i . , 分别 代 表 下 载 次 数 和 每 一 次 下载 的 页 面 数 , We b数 据 挖 掘 ( bd t miig 是 从 大 量 的 We We aa nn ) b文 档 集 合 中 , 。 . 次 个 R P 表示 第 i 的 所 有 页 面 的 P 次 R 通 过 对 各 种 网页 、 据 库 、 e 数 W b链 接结 构 、 户 信 息 等 分 析 , 发 现 其 P 表 示 第 i 的 第 i 页 面 的 p 值 ,。 用 去 则 i{i ' 胁 P, 一个 U L的 A R R值为 A P s ef ) 中 P R= Rxi o( , z D其 R 中蕴 藏 的 、 知 的 、 潜 在 应 用 价 值 的 、 平 凡 模 型 (atr ) 按 照 处 值 , P:pl …, } 未 有 非 Ptn 。 e RL的 P gR n ae ak值 , zo() We s ef 是 i D b文 档 集 页 面 的 总 量 。 终 得 到 最 理 对 象 的 不 同 ,将 We b数 据 挖 掘 分 为 We 内容 挖 掘 ( bC ne t 是 U b We o tn 个 页面 的 P 修 正值 P R R MiigW eC 和 We nn , b M) b结 构挖 掘 ( bSrcueMiig WeS 。其 We t tr nn , b M) u 中 We b结 构 挖 掘 是 从 We b结 构 和 链 接 关 系 中 . 现所 需 要 的 信 息 。 发 斯 P
更 加 提 高 了 we 索 的精 确 度 。 b检

Web使用挖掘技术在电子商务中的应用

Web使用挖掘技术在电子商务中的应用
21 0 0年
《 田 师 范 专 科 学 校 学 报 》( 文 综 合 版 ) 和 汉
J 1 0 0第 2 u. 1 2 9卷 第 四 期
总第 6 6期
We 使用挖掘技术在电子商务中的应用 b
唐 晓琴
( 商洛学院中文系
屈正庚
陕西商洛 760) 200
【 摘 要 J Wb服务 志 从 e 器日 文件和客户 交易数 挖掘出有意 据中 义的用 的用户端在访 问/ a ,0l 时,是从/a 开始 ,经过/ms w, c S b02 ls ( cs ls d  ̄e
子商务活动。 该文分析了 Wb e 使用挖掘技术, 阐述 了挖掘数据的过程并提出了 Wb e 使用挖掘技术在电子商务中的作用 。
骤如图 1 所示 :
活动 。
35聚类技 术。聚类技术 是对符合某 一访 问规律特 征的用户进 . 行用 户特 征挖掘 。聚类 分析可 以从 Wb访 问信息数据 中聚集 出具有 e 相似特性的那些客户。在 We 事务日志中,聚类顾客信息或数据项 b 能够 便于开发和执 行未来的市 场战略 。这种 市场战略包括 : 自动给 个特定的顾客聚类发送销售邮件,为一个顾客聚类动态地改变一
户访 问模式和潜在的客户群,使为企业提供全方位信息服务和开展有针对性的电 & ̄s o , c & o l l &ok / ̄s o k,最后才 到的/  ̄s o2 这 条规则说明在 l c &ok 。 l
/as 0l 页面上有有用的信息,但因为客户对站点进行的是迂回 c s bo2 l / ( 绕行 访 问,所 以这个有用信 息并不 明显 。如果这个页面对 网站来说 [ 关键字]e使 挖 ; 子 务 关 ; 类: 列 w 用 掘 电商 ;联 聚 序 b 比较重要,那么可以通过此路径分析改进页面及网站结构的设计, 1引言 . 从而使客户更容易的访问,as ol 。 c s bo2 l/ 【 电子商务的出现改变了传统的商务模式,使顾客在购买商品的 32关联规则。关联规则主要关注事物内的关系。在 W b使用 . e 过程中有了更大的选择空间,而不是像以前首先考虑品牌和地理因 挖掘 中,关联规 则就 是寻找 出用户 在访 问一个服 务器期 间中页面 / 素。因此,只有更好的了解客户的爱好、价值取 向等,才能赢得更 文件 之间 的关系 ,找出在某 一次服务器会话 中最经常一起 出现 的相 多的客户。We b使用挖掘是将传统的数据挖掘同We 结合起来, b 从 关画面。 例如,0 的客户购买了笔记本电脑之后又购买屏幕清洁剂。 4% We 文档和 We 活动中抽取用户感兴趣的、 b b 潜在的有用模式和隐藏 利用挖掘 出来的这些 相关性 ,我们 可以更好 的组 织站点 ,实施有效 信息,从而可有效地了解客户行为, 提高站点效率、 优化网站设计, 的市场策 略。 在激烈的市场竞争中处于有利位置。 33序列模式。序列模式挖掘就是挖掘出交易集之间有时间序 . 2 Wb使用挖掘 .e 列关系的模式, We 在 b曰志中发现所有满足用户规定的最小支持度 2 1e .Wb使用挖掘的概念 。 b 用挖掘 , We 挖掘 的一个方 的大序列模式。序列模式的发现就是在时间戳有序的事务集中,找 We 使 是 b 面。 b We 挖掘是从 WwW ( o d i e )上抽 取知识 的过程 ,它 到 那 些 “ 些 项 跟 随 另 一 个 项 ”的 内部 事 务 模 式 。例 如 :在 w r d w b lw e 一 是从与 www 相 关的资源和行 为中抽 取感兴趣 的、 有用 的模 式和隐 M ̄ &ok 上进行过在线定购的顾客, 6% s ol 有 0 的人在过去 1 天内也 5 含信 息, 也是将数据挖掘 技术和理论应 用于 WWw 资源 中进行挖 掘 在/I s a l处下 过订单 发现序列模式 能够便于进行 电子商务的 c S, g a b 的一个 新兴 的研究领域 。 组织预测客户的访问模式,对客户开展有针对性的广告服务。通过 We 用记录挖掘在 新兴的电子商务领域有 重要意义 ,主 要任 系 列模式 的发现,能够在服 务器方选取有 针对性 的页 面,以满足访 b使 务是从 Wb的访问记录 中抽取 感兴趣的模式 。Wb使用挖掘数据 除 问者的特定要求 。 e e 了服 务器的 日志记录外还 包括代理服 务器 日志 、浏 览器端 日志 、注 3 4分类规则。分类规则主要是根据用户群的特征挖掘用户群 . 册信息、用户会话信息、交易信息、C oi ok e中的信息、用户查询、 的访问特征 。 We 在 b数据挖掘 中,分类规则 的发现就 是给出识别一 鼠标点击流等一切用户与站点之间可能的交互记录。 个特殊群体公共属性的描述,这个描述可以用来分类新的项,例如: 22 b .We 使用挖掘 的过 程 。 电子商务环境下 , 在 主要 的挖掘对 象 在/  ̄s o2 c &ok 进行过在线定购 的顾客中有 5%是 2一O l 5 O3 岁生活在南 是服务器 日志 。W b使用挖掘 是一个多步骤 的挖掘 过程 。其主要 步 方 的年轻人 。得 到这一分类 后,就可 以进 行适合这一类客户 的子商务中的应用 .e

基于Web的数据挖掘技术研究及其应用


【 关键 ̄ ] we b ; 数据挖掘 ; q ' - g 息服务 ; 常用技 术
依此类推 通过分析和学习 电子商务识别该数据可能会延长树模型的 基础 上 .用户标 识才能浏览 .所以 。根据用户访问的 we b日志挖掘 We b日志挖掘用户兴趣 的关联规则 .多个用户访 问网页速度 加快 . 存 储相关 的知识 . 以此为基础预测用 户的行为 。 1 . 2 . 3 We b结构挖掘 We b空间的 网络结构包括一个 We b网页的结 构之间的互 相联系 的整体 . 可以用在 H T M L . X M L 或 图形 的树结构来表示 , 并 在 目录结构 1 . 定 义 与 分 类 中的文件如 U R L 等结构来表示 We b 结构 挖掘 的 目的是要找到网页 1 . 1 We b数据挖掘概述 在这个分类和聚类的基础上 . 找到权威 的页面 , 这 数据挖掘就是从大量的 、 不完 全而又随机的实际应用数据信息 中 之间的结构 和结构 b 数据挖掘的速度 发现潜在而又有规律性的 、 人们事先并不 知道但又是存在潜在价值知 种方法可 以提高搜索引擎 We 2 . We b数 据 挖 掘 技 术 的 常 用技 术 识 的探索过程 。 We b 数据挖掘最初 就是数据挖掘 。 一般情 况下指 的是 将数据挖掘技术应用到 We b上 。 具体定义为 : We b数据挖 掘通 常简称 用 于该领域数据挖掘技术主要有分类 聚类技术 . 关联规则序列模 为 We b 挖 掘 .它是一项 涉及 多个领域 的综合 技术 .其 内容包 括有 式技术 和 We b 技术的路径分析技术 。 We b 、 数据挖掘 、 信 息学、 计算机语言学等 。 We b 挖掘的理论性定义 : 指 2 . 1 数据分类聚类 的数据挖掘技术 数据分类技术可以通过挖掘数据 中的某些共 同特性从而对数据项 从大量 We b 文档结构和使用 的集合 s中发 现隐含的 、 未知 的、 有潜在 应用价值 的模式 如果将 s 看作输入 . P 看作输 出。 那么 We b 挖掘 的过 进行分类 在 We b 数据挖掘中. 分类技术可 以捕获 W e b 访问用户 的个 程就是从输入到输 出的一个映射 : S —P 。 人信 息或通过公共访 问方式来访 问服务器上的文件从而了解用户 的特 We b 挖掘 的实质就是从 We b文档 以及 We b 活动 中寻找 出 出用 点。常用 的数据分类方法有 : 决策类 , 贝叶斯分类 , 贝叶斯网络 , 神经网 基于案例 的推理。 遗传算法, 粗糙集 , 模糊集方法。群集是一组物理的 户有用 的、 有潜在价值模型的隐藏信息。We b 挖掘在很多地方都可 以 络. 发挥作用 . 比如对搜索引擎的结构进行挖 掘 、 对权威页面进行鉴定 、 对 或抽象的 对象组成的多个对象的类似的的过程 聚类分析技术可用于在 We b 文档 归纳 分类 、 挖掘 We b日志 、 智 能查 询 、 建 立 We b 元数 据仓 网络上的文件进行分类 . 归纳总结 已发现的信息。 作为一个独立的工具 来获得数据分布 的情况. 可以使用聚类分析 , 观察每个群集 的特陛。 重点 库、 分析远程教育过程 的信息等方面。 1 . 2 We b挖掘数据分类 在一些簇 E 作进一步的分析 。常用 的聚类算法可以大致分为几类 : 划分 层次方法 , 基于密度的方法 , 基于网格的方法和基于模型的方法。 We b 上的信息资源主要可 以分 为三大类 :一是 We b网页上 的内 方法。 容. 包括各种文本信 息以及各类媒体信息及各种图片 : 二是 We b 服务器 2 - 2 关联规则挖掘技术 上的用户群体登陆访 问网站的 日 志数据以 及记录: 三是 We b 网页中存在 关联规则挖掘技 术主要用于从用 户访 问序列数据库 的序 列项 中 的超链接方式之间相互引用的数据 据此可以将这三类不 同的信息 We b 挖掘出的相关规则 。 在 We b 挖掘 , 关联规则挖掘是挖掘 出用户 的访问 数据挖掘分 为 We b内容挖掘、 We b日 志数据挖掘与 W e b 结构挖掘 。 会话期间从服务 器访 问这些页 面之 间的链接的页面或文 件之间可能 不存在直接引用关 系。最常用 的算法是 A p r i o r 算法 , 挖掘 出最大频繁 1 . 2 . 1 We b内容挖掘 从 We b 上的文件 内容及其描述 的信 息资源 中获取潜在 的、有价 项 目集参观这个 集挖掘关联规则 的事务数据库用户访 问模式 。 值 的知识 及模式的过程 . 即是 We b内容挖掘 . 在这一过程 中也 可以对 2 - 3时间序列模式挖掘技术 We b组织结构和链 接关 系进行挖 掘. 通过人为 的链接结构并分析 整理 时间序列模式数 据挖掘是挖掘 出交易集之间 的时 间序列模 型 。 从而获取有价值 的知识 。We b内容挖掘 的主要组成部分有两种 . 即页 We b服务器 中的 日志 中. 用户的访 问作为一个单元在一段时间 内。得 这些序列反映用户 面 的分类和 聚类 根据不 同页面 的不同特征 . 将其划分为事先建 立起 到交易确认的净 化和事件数据后 中断 的时间序列 . 来 的不同的类称为 We b 页 面的分类 。文本 、 图像 、 音频 、 视频 、 元 数据 行为有助于帮助企业证 明其产 品在生命周期阶段 等形式 的数据是 We b 上 的基 本信 息内容 .根据形式 的不 同可 以把这 2 . 4路 径 分 析技 术 些信息 内容简单地分为 We b 文本信息 和 We b 多媒体信 息 根 据需要 路径分析技术对 We b 数据进行挖掘时。 最常用 的是图。因为 We b 可 处理 的 We b 信 息对象 . We b 内容挖掘 又可分为两 个部分 .即是 We b 以用来表示—个有向图 G = ( v 。 E ) , V是网页的集合 , E是集的页面之 间的 文本挖掘和 We b多媒 体挖掘 超链接。页面抽象为图中的顶点 , 而页面之间的超链接抽象为图中的有 1 . 2 . 2 We b 日志 数 据 挖 掘 向边 顶点 v的人边表示对 v的引用 . 出边表示 v引用了其它的页面。 从用户存取模 式 中获取有价值 的信息 .对 We b上 日志数据 及相 3 . We b数 据挖 掘 技 术 主 要 应 用 关数据 的挖掘来发现用户访问 We b页面的模式 即是 We b日志的数据 3 . 1在电子商务 中的应用 挖掘 . 又称为 We b使用挖 掘。We b挖掘其他两个挖掘的对象是网上的 电子商务与 We b数据挖掘技术在电子商务 中的 We b 数据挖掘可 原始数据 . we b日志 挖 掘是 用 户 和 网 络之 间 的互 动 过 程 .是 从 二 手 数 以开发产品的营销策略 . 企业 可以通过优化可用 的商 品促销活动 和销 据 的摘录 , 代 理 日志 , 浏览器访 问 We b服务器 的访问 日志 , 记 录用户 售进行挖掘 . 获得客户访 问规则 来确定生命周期 的消费支出 , 根据市 的个人档案 . 登记信息 . 用户的需求登信息 中寻找有用 的信 息资源 . 并 场变化 , 对 于不 同的产品制定相应 的营销 策略。可以 ( 下转第 3 4页)

WEB数据挖掘及其在电子商务中的应用

维普资讯
20 0 8年 第 1 期

建 电脑 17 来自 WE . B数据挖 掘及 其在 电子 商务 中的应 用
r . 阳 理 工 学 院 河 南 南 阳 4 3 0 . 南 1 704 2 州 交通 大 学 甘 肃 兰 州 7 0 7 .兰 3 0 0)
赵 焕 平 仝 选 悦 0
【 摘
用。
要】 随着互联 网信息的增长 , B挖掘 已经成 为数据挖掘研 究的热点之 一, : WE 尤其适 用于电子 商务领域 。 中介绍 文
了 w b数 据 挖 掘 的 概 念 和 分 类 . 阐述 了 W b挖 掘 在 电子 商 务 中的 挖 掘 方 法 和 过程 , 析 了数 据挖 掘 在 电子 商 务 中的 具 体 应 e e 分
面. 开展 有 针对 性 的 电子 商 务 以更好 的 满 足访 问者 的 需求 。
2WE . B数 据 挖 掘 概 述 2 1 B 数据 挖掘 的定 义 . WE
2知 识 发 现 : 于 人 工 智 能 和 机 器 学 习 , 用 数 据 搜 寻 过 . 源 利 程 . 到 一 个 有 意义 的 数 据 模 式 . 中 可 以发 现 规 律 , 体 的 方 得 从 具 法 有 人 工 神 经 网络 、 策树 方 法 、 传算 法 、 则 推 理 等 。 决 遗 规
售策略。 22 据 挖 掘 的分 类 .数 We b数 据 有 三 种 类 型 : nl 记 的 We Ht 标 l b文 档 数 据 , b文 33电 子 商 务 中 WE We . B数 据 挖 掘 的过 程 档 内连 接 的结 构 数 据 和 用 户 访 问 数 据 。按 照 对 应 的数 据 类 型 . 电 子 商 务 中 的数 据 挖 掘 的过 程 一 般 由 以下 几 个 主 要 的阶 段 We b挖 掘 可 以分 为 三 类 : 组成 : 据准备、 掘操作、 果表达和解释。 数 挖 结 1 b内容 挖 掘 : 是 从 We . We 就 b文 档 或其 描 述 中筛 选 知 识 的 1数 据 准 备 : b数 据 挖 掘 的 数 据 来 自两 个 方 面 : 方 面 是 . We 一

利用Web挖掘技术实现个性化推送服务


We 数 据挖 掘技 术 的 应 用 可 以使 资 源 了 解 用 户 交 互 行 为 b
数据 中所 包 含的 意 义 , 此 , 技 术 可 以 被 广 泛 应 用 于个 性 化 因 该
活 动 中发 现 和 抽 取 有 用 的 信 息 。W e b资 源 与 传 统 的 数 据 库 资
源 相 比具 有数 据 量 庞 大 、 构 比较 复 杂 、 态 性 较 强 及 用 户 目 结 动 标 不 明确 等特 点 。 因此 . b挖 掘 是 一 个 具 有 挑 战 性 的课 题 。 We 根 据 We b挖 掘 处 理 对 象 的 不 同 , 般 将 We 一 b挖 掘 分 为 三 类 : We b内 容挖 掘 ( bc netmiig We We o tn nn )、 b结 构挖 掘 ( bsrc We tu 一 /r nn )和 We uemiig b使 用 模 式 挖 掘 ( b ua emiig We sg nn )。we b 内容 挖掘 是 指 从 文 档 的 内容 或 其 描述 中 提 取 知 识 。 内容 挖 掘
推 送 服 务 、 息 智 能化 服 务 等 领 域 。 通 过 We 掘 . 仅 可 以 信 b挖 不 将 大 量 的各 种 各样 的看 似 无 关 的 We b数据 关联 起 来 从 中 提 取
我 们 需要 的有用 知 识 . 可 以得 到 关 于 群体 用 户 访 问 行 为 和 方 还 式的 普遍 知 识 , 过 对 这 些 知 识 的理 解 和 分 析 . 对 用 户 访 问 通 如
进行 we b页 面推 送 。
在 数 字 图书 馆建 设 过 程 中 , 户 将 面 临 着 数 字 化 信 息 资 源 用 的海 洋 。在 网络 技 术 和信 息技 术 高 速 发 展 的 今 天 , 们 将 前 所 人 未有 地 处 于 信 息 资 源 的包 围 之 中 、 入 信 息 的 海 洋 中 无 法 自 陷 拔 : 字 图 书 馆 信 息 资 源 是 为 满 足 各 类 型 的 用 户 而 搜 集 整 理 数 的 , 而是 全 面综 合 的 , 对 某一 个 特 定 用 户 来 说 . 的 需 求 可 因 但 他 能 是 特 定的 . 限 于 某一 个 范 围 内 的 。传 统 We 局 b服 务 中 . 息 信

Web挖掘技术在电子商务中的应用研究

电 三 商 务 j F
We b挖掘技术在电子商务[ 的应用硼 夯 1 】
一 周
[ 摘ቤተ መጻሕፍቲ ባይዱ

中国矿 业大 学管理 学 院
要 ]w 曲挖 掘 是 数据 挖 掘 应 用 于 互联 网的 具体 表现 形 式 , 是 从 海量 的 电子 商 务 交 易信 息 中提 取知 识 以 掌握 网络 客 也
户 消 费 习惯 的 重要 技 术手段 。 本 文 旨在 分析 W b 掘 常 用 的技 术 及 其 在 电子 商 务 中的挖 掘 流程 , 并 对其 在 电子 商 务 中 的应 e挖 用 领域 进 行 探 讨 ,以 协助 商 家 更好 的 运 用 网络 开展 电子 商 务活 动 。 [ 关键词 ]W b 掘 电子 商 务 e挖

数据挖 掘
引 言
类是以 ” 簇内最 大相似 、簇 间最大不同”为宗旨的.它没有任何
1 多年 来 . 据 挖掘 技 术 在我 国理 论 界和 应 用 实 践 上都 取 得 划 分 标 志 .最终 可 划 分 为 几簇 也 不 可知 。序列 模 式 与 关联 分 析 类 0 数
了长足发展。电子商务通过 I e e 被越来越多的人认识并使用 . 似 .它寻找的是事件之间时间上的相关性。能发现数据库 中形如 nr t tn 成为现代社会节省资源、提升交易效率的新型商业运作模式 。正 “ 一段 时间 内 .顾 客 购买 物 品 A.然 后购 买 物 品 B 在 .而 后购 买物 是由于电子商务的深入发展 ,积累了大量的客户信息和 交易信
三 We 挖 掘在 电子商务中的流程 b 与普通的数据挖掘不同的是 we 挖掘的对象是互联 网上的 b
的动 态 特 征 .使 得 w b 掘 过 程 更加 复 杂 。 总体 来 说 we 挖掘 e挖 b
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档