序列模式挖掘
序列模式挖掘算法的研究与实现

序列模式挖掘算法的研究与实现序列模式挖掘算法是一种可以从历史数据中发现规律的数据挖掘算法。
它能够帮助我们更好地理解历史数据,并有助于决策和预测未来发展趋势。
本文主要就序列模式挖掘算法进行研究和实现。
一、序列模式挖掘算法研究1.算法框架序列模式挖掘算法主要是通过分析已有的历史数据,来发现有意义的模式和规律。
它的基本构成由3个部分组成:首先,收集有关的数据,然后从数据中抽取有用的信息,最后分析这些信息,从中发现规律和模式。
2.关联规则分析使用关联规则分析来发现序列模式的方法是,首先从多个历史序列中获取大量的事务数据,然后将这些数据转换为易于处理的格式,然后运用关联规则分析来发现有意义的模式。
3.簇划分算法簇划分算法是用来发现序列模式的一种方法,主要是通过迭代的方式,将序列进行划分,最终得到的是一系列的相关的序列,然后从中发现有规律的模式。
4.时间强算法时间强算法是一种基于概率的方法,它可以发现序列中模式出现的频率和预测将来出现模式的可能性。
首先,它会分析出每个序列中出现的模式,然后根据每个模式的出现频率,来预测出未来可能会出现的模式。
二、序列模式挖掘算法实现1.数据集序列模式挖掘算法的实现过程包括:数据集的构建、特征抽取、模式挖掘算法的实现、模式的验证和应用。
首先,需要构建一个合适的数据集,以便实现算法。
2.特征抽取特征抽取是模式挖掘所必须的一部分,因其可以帮助更好地将原始数据转换成易于处理的特征,以提高算法的精度。
主要的抽取方法有:基于属性的抽取、基于时间的抽取、基于空间的抽取。
3.模式挖掘算法实现模式挖掘算法是根据特征抽取出来的特征以及数据集来进行实现的,模式挖掘算法的选择可以因为不同的应用场景而有所不同,如果要对历史数据进行分析,则可以使用关联规则分析算法;如果要对频繁模式进行分析,则可以使用簇划分算法;如果要预测未来模式,则可以使用时间强算法。
4.模式的验证和应用模式有可能是噪声造成的,为此,在实际应用时,需要将模式进行验证,以避免错误的应用。
序列模式挖掘算法

单项间在 同一事务 内以及事 务间旳关 系
单项间在 同一事务 内旳关系
13
二、序列模式挖掘旳应用背景
应用领域: ▪ 客户购置行为模式预测 ▪ Web访问模式预测 ▪ 疾病诊疗 ▪ 自然灾害预测 ▪ DNA序列分析Biblioteka 2024/9/2814
B2C电子商务网站能够根据客户购置纪录来分析客 户购置行为模式,从而进行有针对性旳营销策略。
ID User transaction sequence
1
………………………………………………… ………..
2 ………………………………………………
3
………………………………………………… …..
4 ………………………………….
图书交易网站将顾客购 物纪录整合成顾客购物 序列集合
应用案例1:客户购置有关行商品为推荐:模假如式顾
2024/9/28
35
例:下图演示了怎样从长度为3旳序列模式产生长度为 4旳候选序列模式
Sequential patterns With length 3
<(1,2) 3> <(1,2) 4> <1 (3,4)> <(1,3) 5> <2 (3,4)> <2 3 5>
Candidate 4-Sequences
L1 C2 L2 C3 L3 ……
2024/9/28
29
哈希树
GSP采用哈希树存储候选序列模式。哈希树旳 节点分为三类:
1、根节点; 2、内部节点; 3、叶子节点。
2024/9/28
30
哈希树
根节点和内部节点中存储旳是一种哈希表, 每个哈希表项指向其他旳节点。而叶子节点 内存储旳是一组候选序列模式。
数据仓库与数据挖掘 第10章

第一节 序列的概念及定义
2. 概念及定义
示例:设序列数据库如下图所示,并设用户指定的最小支持 度min-support = 2
序列<a(bc)df>是序列<a(abc)(ac)d(cf)>的子序列 序列<(ab)c>是长度为3的序列模式
Sequence_id
10 20 30 40
Sequence
第一节 序列的概念及定义
2. 概念及定义
设 = <a1 a2 …a n>, = <b1 b2 … bm>,如果存在整数1 <= j1 < j2 <…< jn <= m,使得a1 bj1,a2 bj2,…, an bjn, 则称序列为序列的子序列,又称序列包含序列,记为 序列在序列数据库S中的支持数为序列数据库S中包含序列的 序列个数,记为Support() 给定支持度阈值,如果序列在序列数据库中的支持数不低于, 则称序列为序列模式 长度为l的序列模式记为l-模式
<{1}{5}> <{1}{2,3,4}> <{1,3}> <{1}{2,3,4}{5}> <{5}>
第二节 序列模式挖掘
1. 序列模式挖掘
序列阶段 利用频繁项集发现所希望的序列 最大阶段
在频繁项集中发现最大的序列 设最长序列的长度为n for (k=n; k>1; k--) do for(每一个k序列Sk ) do 从s中删除所有 Sk的子序列
<a(abc)(ac)d(cf)> <(ad)c(bc)(ae)> <(ef)(ab)(df)cb> <eg(af)cbc>
序列模式挖掘及其应用研究

序列模式挖掘及其应用研究摘要序列模式挖掘是数据挖掘研究的一个重要的研究领域。
目前,成熟的序列模式挖掘算法要紧有三类:基于Apriori性质的候选码生成-测试的算法;基于垂直格式的候选码生成-测试的算法;基于投影数据库的模式增加算法。
最近几年来,序列模式挖掘在散布式环境下的应用的研究慢慢成为热点,提出了各类算法。
本文介绍序列模式挖掘算法及各自的优缺点和在散布式环境下的应用,在此基础上发觉了散布式环境下站点之间局部模式子树的传输存在问题。
本文提出了散布式环境下基于叶子节点传输的序列模式挖掘方式LMSP(leaf-based mining of sequential patterns),即在生成全局L2序列模式的进程中,各站点传输局部L2子树时只传输局部子树的叶子节点的序列和所有节点的支持度计数,在选举站点上再依照接收到的子树信息将局部L2子树还原。
接着又简单地提出约减的树结构的传输,除根节点外的每一个节点都只记录相对其父节点的后缀序列。
实验结果说明,LMSP算法性能优于FDMSP算法。
文章最后简单的介绍了序列模式挖掘的实际应用。
关键词:数据挖掘;序列模式;散布式算法;数据传输AbstractSequential pattern mining is an important domain of data mining. Now there are three types of mature algorithms of sequential patterns mining: Apriori-based algorithms by candidate sequence generating-and-testing; vertical format database based algorithms by candidate sequence generating-and-testing; projection database based algorithms with by pattern-growth. In recent years, mining of sequential patterns in distributed environment is becoming hot topic, and some algorithms have been proposed. In this paper, three algorithms of sequential pattern mining and advantages and disadvantages of them are introduced, and then the applications of sequential pattern mining algorithms in distributed environment. Since this, we find a problem of local pattern subtree transportation from one site to another in distributed environment. In this paper, we propose a leaf-based algorithm in distributed environment, LMSP (leaf-based mining of sequential patterns), only transport the leaf node sequences and all the support counts of the local L2 subtree, while every site transporting the local L2 subtree to polling site in the course of global L2 patterns generating. At polling site, we get the local L2 subtree back from received subtree message. And we also propose transportation of reduction subtree simply,all the nodes (except the root) register only suffix according to its parent instead of the entire sequence. The experiments show that the algorithm LMSP outperforms the algorithm FDMSP. The last part of this paper, we simply introduce the applications of sequential pattern mining.Key words: data mining; sequential pattern; distributed algorithm; data transportation目 录1. 引言 .......................................................................................................................................................................... 1 数据挖掘概述 . (1)什么是数据挖掘? ..................................................................................................................................................... 1 数据挖掘能做什么?................................................................................................................................................. 1 数据挖掘技术的进展前景 (2)序列模式挖掘概述 (2)序列模式挖掘概念 ..................................................................................................................................................... 2 序列模式挖掘传统算法及瓶颈 (3)2. 序列模式挖掘算法 ................................................................................................................................................ 4 序列模式挖掘基础知识. (4)相关概念 ........................................................................................................................................................................ 4 Sm (5)S ............................................................................................................................................................................................ 5 3. 散布式环境下的序列模式挖掘 .......................................................................................................................... 7 相关概念 ............................................................................................................................................................................ 8 散布式环境下序列模式挖掘算法 (9)算法要紧思想 .............................................................................................................................................................. 9 算法详细描述 (12)L1-SEQ-SET=GENERATE_L1-SEQ() 05010015020025011.522.5Minsup(%)Ru n n i n g t i m e (s )50100150200250100150200300Data amount(MB)R u n n i n g t i m e (s )序列ac b d d e e f f ac c db d f g g a bb c d e模式挖掘的应用 (12)会员顾客购物模式挖掘 (13)网络入侵检测系统 (13)5.小结 (15)[6]刘平安.试论一人有限责任公司[EB/OL].(2006-10-20)[2006-12-08]. (16)(网络文献的写法。
数据分析中的关联规则挖掘和序列模式挖掘

数据分析中的关联规则挖掘和序列模式挖掘数据分析是一个日益重要的领域,在各个行业中被广泛应用。
在数据分析的过程中,关联规则挖掘和序列模式挖掘是两个重要的方法。
本文将分别介绍关联规则挖掘和序列模式挖掘的概念、算法以及应用,并探讨它们在实际问题中的价值和局限性。
一、关联规则挖掘1.概念关联规则挖掘是一种从大规模数据集中发现项集之间有趣关系的技术。
它主要用于发现事物之间的相关性,帮助人们理解数据集中的隐藏模式和规律。
2.算法常见的关联规则挖掘算法有Apriori算法和FP-growth算法。
Apriori算法是一种基于频繁项集的方法,通过迭代生成频繁项集和关联规则。
FP-growth算法则使用了一种更高效的数据结构FP树,可以在不显式生成候选项集的情况下挖掘关联规则。
3.应用关联规则挖掘在市场篮子分析、推荐系统、生物信息学等领域都有广泛的应用。
例如,在市场篮子分析中,关联规则可以帮助店家发现顾客的购买习惯,进而进行商品摆放和促销策略的优化。
二、序列模式挖掘序列模式挖掘是一种从序列数据中发现频繁模式的技术。
序列数据是指按时间顺序记录的事件序列,如购物记录、日志数据等。
序列模式挖掘的目标是找到在序列中频繁出现的模式,以揭示事件之间的关联性和规律。
2.算法常见的序列模式挖掘算法有GSP算法和PrefixSpan算法。
GSP算法是一种基于频繁序列的方法,通过递归地生成频繁子序列和模式。
PrefixSpan算法则利用前缀投影将序列划分为多个较小的子序列,从而减少了搜索空间。
3.应用序列模式挖掘在web点击流分析、用户行为分析、生产过程控制等领域都具有重要意义。
例如,在web点击流分析中,序列模式挖掘可以帮助网站优化用户体验,提高点击率和留存率。
三、关联规则挖掘和序列模式挖掘的比较1.异同点关联规则挖掘和序列模式挖掘都是从大规模数据中挖掘隐藏模式和规律的方法。
它们都可以发现项集之间的关联性,但关联规则挖掘更偏重于静态数据集的挖掘,而序列模式挖掘更适用于动态数据中的模式发现。
第十一章-序列模式挖掘

2、其它网址
/~kdd /~anp/TheDataMine.html http://www.gmd.de/ml-archive /AI/ML/Machine-Learning.html /maincat.thml#45 http://www.neuroney.ph.kcl.ac.ul a.de/~prechelt/FAQ/neural-net-
定β=义β11→1-β22→设⋯序→列βmα=。α若1→存α在2→整⋯数→i1α<n,i2<序⋯列<in,使得 , 则称序列α是序1 列βi1 ,的子2 序列i2 , .,..,或n序列inβ包含序列α。在 一组序列中,如果某序列α不包含其他任何序列中,则称 α是该组中最长序列(Maximal sequence)。
1
30
02.10.25
一个客户90所有的0事2.1务0.3可0 以综合的看成是一个序列,每一
个 成事一2 务 个都序由列1相。03,02应称0 的这一样00个的22..11项序00..11集列50 来为表客示户。序交事列易1 务。号 按通交常易,客时将户(3购间一0),物(序个90序排客) 列列户 的 义交成3 易ite按ms交e43t00易(,,T6500时i),,77。00间这排样00序22..,11成00..这22T05个1 ,客T户2 ,的…客234…户,序T列(n1。成0,(23T了00()i)中3,这((043,00的5样,)07,(,项074的)00(),9集6一00)定,个70) 序列4 :〈ite4m03,0s7e0t(T1)00i22t..e11m00..21s15et(T2) … item5 set(Tn)〉。 (90)
数据挖掘方法

数据挖掘方法数据挖掘是一种通过从大量数据中发现模式和关联规律来提取有用信息的技术。
数据挖掘方法通过使用各种算法和技术,可以帮助我们在海量的数据集中找到隐藏的知识和洞察力,以支持业务决策和问题解决。
本文将介绍几种常用的数据挖掘方法。
一、关联规则挖掘关联规则挖掘是一种常用的数据挖掘方法,它用于发现数据集中的关联关系。
关联规则挖掘可以帮助我们找到数据中的相关性,并从中发现隐藏的知识。
在关联规则挖掘中,我们首先需要定义一个支持度和置信度的阈值,然后使用Apriori算法或FP-Growth算法等来发现频繁项集和关联规则。
二、分类和预测分类和预测是数据挖掘中的另一种常见方法。
它用于根据已经标记好的数据集来预测未知数据的类别或属性。
常见的分类和预测算法包括决策树、朴素贝叶斯、支持向量机等。
这些算法可以根据已知的特征和标签来构建模型,并将未知数据映射到特定的类别或属性。
三、聚类分析聚类分析是一种将数据集中的对象按照其相似性进行分组的方法。
聚类分析可以帮助我们在没有先验信息的情况下对数据进行探索性分析。
常见的聚类算法包括K均值、层次聚类和密度聚类等。
这些算法可以根据数据之间的相似性将其划分成不同的簇。
四、异常检测异常检测是数据挖掘中的另一个重要方法。
它用于识别数据集中的异常或离群值。
异常检测可以帮助我们发现潜在的问题或异常情况,并采取相应的措施。
常见的异常检测算法包括基于统计学的方法、基于距离的方法和基于聚类的方法等。
五、序列模式挖掘序列模式挖掘是一种挖掘序列数据中频繁模式或关联规则的方法。
序列数据包含了一系列按照时间顺序排列的事件或项。
序列模式挖掘可以帮助我们发现序列数据中的规律和趋势,以支持业务决策和行为分析。
常见的序列模式挖掘算法包括GSP算法和PrefixSpan算法等。
六、回归分析回归分析是一种用于建立和分析变量之间关系的方法。
它可以帮助我们预测一个或多个连续变量的值。
常见的回归分析算法包括线性回归、多项式回归和逻辑回归等。
频繁序列模式挖掘算法pbwl算法

频繁序列模式挖掘算法PBWL算法1. 简介频繁序列模式挖掘是数据挖掘领域中的一项重要任务,它用于发现数据集中频繁出现的序列模式。
序列模式是指在一个时间序列数据集中,经常以特定顺序出现的事件或行为。
PBWL(Prefix-Based Window Level)算法是一种用于频繁序列模式挖掘的有效算法。
它通过将时间序列划分为窗口,并使用前缀树来存储和搜索频繁序列模式。
本文将详细介绍PBWL算法的原理、步骤和优势,并通过示例说明其应用和效果。
2. PBWL算法原理2.1 窗口划分PBWL算法首先将时间序列划分为多个窗口,每个窗口包含固定数量的事件或行为。
窗口大小可以根据实际需求进行调整。
2.2 前缀树构建接下来,PBWL算法使用前缀树(Prefix Tree)来存储和搜索频繁序列模式。
前缀树是一种多叉树结构,其中每个节点表示一个事件或行为,路径表示事件之间的顺序关系。
2.3 频繁序列模式挖掘PBWL算法通过遍历每个窗口,将窗口中的事件序列插入到前缀树中。
在插入过程中,PBWL算法会记录每个节点的计数信息,以便后续的频繁模式挖掘。
当所有窗口都被处理完毕后,PBWL算法从前缀树中提取频繁序列模式。
频繁序列模式是指在整个时间序列数据集中经常出现的序列。
3. PBWL算法步骤PBWL算法的主要步骤如下:1.将时间序列划分为多个窗口,确定窗口大小和滑动步长。
2.初始化前缀树,并设置根节点。
3.遍历每个窗口:–将窗口中的事件序列插入到前缀树中。
–更新前缀树节点的计数信息。
4.从前缀树中提取频繁序列模式:–使用深度优先搜索(DFS)遍历前缀树。
–对于每个节点,检查其计数是否满足最小支持度要求。
–对于满足要求的节点,将其作为频繁序列模式输出。
4. PBWL算法优势PBWL算法相对于其他频繁序列模式挖掘算法具有以下优势:•高效性:PBWL算法通过窗口划分和前缀树存储结构,减少了搜索的空间和时间复杂度,提高了算法的效率。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
序列模式 VS 关联规则
问题 序列模式挖掘 关联规则挖掘
数据集
序列数据库
事务数据库
关注点
单项间在同一事务 单项间在同一事务 内以及事务间的关 内的关系 系
序列模式挖掘算法概述
类Apriori算法
该类算法基于Apriori理论,即序列模式的任一子序列也是序列模 式。算法首先自底向上的根据较短的序列模式生成较长的候选序列 模式,然后计算候选序列模式的支持度。典型的代表有GSP算法, spade算法等
Index 网站入口
web1 web2
应用案例3:疾病诊断
医疗领域的专家系统可以作为疾病诊断的辅助决策手段。对应特定的 疾病,众多该类病人的症状按时间顺序被记录。自动分析该纪录可以 发现对应此类疾病普适的症状模式。每种疾病和对应的一系列症状模 式被加入到知识库后,专家系统就可以依此来辅助人类专家进行疾病 诊断。
基于划分的模式生长算法
该类算法基于分治的思想,迭代的将原始数据集进行划分,减少数 据规模,同时在划分的过程中动态的挖掘序列模式,并将新发现的 序列模式作为新的划分元。典型的代表有FreeSpan算法和prefixSpan 算法
知识回顾
基本概念 支持度计数:包含特定项集的事务的个数: ( X ) 关联规则:形如 X Y 的蕴涵表达式 支持度:同时包含X,Y的事务在所有事务中所占的比例
关联规则挖掘的任务划分:
频繁项集的产生(候选( C 产生 C ),剪枝(基于先验原理)) 规则的产生(逐层方法来产生关联规则,定理1剪枝)
i
i 1
知识回顾
Apriori算法伪代码:
Ck: Candidate itemset of size k Fk : frequent itemset of size k F1 = {frequent items}; for (k = 1; Fk !=; k++) do begin Ck+1 = candidates generated from Fk ; for each transaction t in database do increment the count of all candidates in Ck+1 that are contained in t Fk+1 = candidates in Ck+1 with min_support end return k Fk;
基本概念
项集(Itemset)是所有在序列数据库出现过的单项 组成的集合 例:对一个用户购买记录的序列数据库来说,项 集包含用户购买的所有商品,一种商品就是一个 单项。通常每个单项有一个唯一的ID,在数据 库中记录的是单项的ID。
基本概念
元素(Element)可表示为(x1x2…xm), xk(1 <= k <= m)为不同的单项。元素内的单项不考虑顺序关 系,一般默认按照ID的字典序排列. 在用户事务数据库里,一个事务就是一个元素
F1 C2 F2 C3 F3 C4 F4 ……
GSP算法伪代码
输入:大项集阶段转换后的序列数据库DT。 输出:最大序列
(1) L1 = {large 1-sequences}; (2) FOR (k = 2;Lk-1 ;k++) DO BEGIN (3) Ck = GSPgenerate(Lk-1); (4) FOR each customer-sequence c in the database DT DO (5) Increment the count of all candidates in Ck that are contained in c; (6) Lk = Candidates in Ck with minimum support; (7) END; (8) Answer = Maximal Sequences in ∪kLk;
(X Y ) s( X Y ) N
臵信度:事务X出现时Y出现的频繁程度
(X Y ) c( X Y ) (X )
频繁项集:满足最小支持的项集
知识回顾
定理
先验原理:如果一个项集是频繁的,那它的所有子集一定都是 频繁的 定理1:如果规则X Y X 不满足臵信度阈值,则形如 X ' Y X ' 的规则一定也不满足臵信度阈值,其中 X'是 X的子集
基本概念
设序列 = <a1a2…an>,序列 = <b1b2…bm>,ai 和bi都 是元素。如果存在整数1 <= j1 < j2 <…< jn <= m,使得a1 bj1,a2 bj2,…, an bjn,则称序列为序列的子 序列,又称序列包含序列,记为 。
c( X ' Y )
(X Y ) (X )
( X (Y X )) c( X Y X ) (X )
( X '(Y X ' )) c( X ' Y X ' ) (X ')
知识回顾
基于支持度的候选项集剪枝
A B null
C
D
E
AB
AC
如果序列s是非频繁序列,则s的所有超集序列都是非频繁的
Sequence
Seq. ID
10
20 30 40 50
<(bd)cb(ac)>
<(bf)(ce)b(fg)> <(ah)(bf)abf> <(be)(ce)d> <a(bd)bcb(ade)>
min_sup =2
<hb> 非频繁 则: <hab> 非频繁 <(ah)b> 非频繁
3
4
图书交易网站将用户购 物纪录整合成用户购物 序列集合
得到用户 购物行为 序列模式
<(“UML语 言”)(“Visio2003实用 技巧”)>
相关商品推荐:如果用 户购买了书籍“UML语 言”, 则推荐 “Visio2003实用技巧”
应用案例2:Web访问模式分析
大型网站的网站地图(site map) 往往具有复杂的拓扑结构。用 户访问序列模式的挖掘有助于 改进网站地图的拓扑结构。比 如用户经常访问网页web1然后 访问web2,而在网站地图中二者 距离较远,就有必要调整网站 地图,缩短它们的距离,甚至 直接增加一条链接。
知识回顾
支持度度量满足单调性(X'为X的子集)
N N 臵信度一般不满足单调性(X'为X的子集)
S(X Y )
(X Y )
S(X ' Y )
( X 'Y )
( X 'Y ) (X ') 如果关联规则产生自同一项集,则臵信度满足单调性
c( X Y )
数据挖掘与商务智能
Data Mining & Business Intelligence 第六章 序列模式挖掘
西安电子科技大学 软件学院 主讲人:黄健斌
内容提纲
序列模式挖掘简介 序列模式挖掘的应用背景 序列模式挖掘算法概述 GSP算法 SPADE算法 PrefixSpan算法 CloSpan算法 利用SPSS软件挖掘频繁序列模式
GSP算法
产生候选序列模式主要分两步:
连接阶段:如果去掉序列模式s1的第一个元素与去掉序列模式
s2的最后一个元素所得到的序列相同,则可以将s1与s2进行连 接,即将s2的最后一个元素添加到s1中
剪枝阶段:若某候选序列模式的某个子序列不是序列模式,
则此候选序列模式不可能是序列模式,将它从候选序列模式 中删除 L1 C2 L2 C3 L3 C4 L4 ……
GSP算法
候选序列模式的支持度计算:对于给定的候选序列模式集合C, 扫描序列数据库,对于其中的每一条序列s,找出集合C中被s所
包含的所有候选序列模式,并增加其支持度计数
ABC=>D
CD=>AB
BD=>AC
BC=>AD
AD=>BC
AC=>BD
AB=>CD
D=>ABC
C=>ABD
B=>ACD
A=>BCD
Pruned Rules
GSP算法
算法思想(候选产生测试法): 类似于Apriori算法,采用冗余候选模式的剪除 策略和特殊的数据结构-----哈希树来实现候选模 式的快速访存。
序列模式挖掘简介
序列模式的概念最早是由Agrawal和Srikant 提出 的。 动机:大型连锁超市的交易数据有一系列的用户 事务数据库,每一条记录包括用户的ID,事务 发生的时间和事务涉及的项目。如果能在其中挖 掘涉及事务间关联关系的模式,即用户几次购买 行为间的联系,可以采取更有针对性的营销措施。
序列模式挖掘的应用背景
应用领域: 客户购买行为模式预测 Web访问模式预测 疾病诊断 ······
应用案例1:客户购买行为模式分析
B2C电子商务网站可以根据客户购买纪录来分析客 户购买行为模式,从而进行有针对性的营销策略。
ID 1 2 User transaction sequence ………………………………………… ……………….. ………………………………………… …… ………………………………………… ………….. ………………………………….