基于模糊聚类的可扩展的协同过滤算法研究
基于模糊权重相似性的协同过滤算法研究

基于模糊权重相似性的协同过滤算法研究张雅科【摘要】在传统协同过滤算法中,相似度直接依据用户评分.但是,用户评分会受各种不确定因素影响.采用数值评分的推荐系统收集到的用户喜好信息是模糊、不精确和不完整的.单一的数值不能包含丰富的信息来表达用户喜好,也会导致推荐结果的不准确性.文中定义了几种模糊集的隶属函数,提出了基于模糊逻辑的相似度计算方法.实验结果表明,基于模糊权重的相似度有效的提高了推荐系统的预测准确度,一定程度上解决了协同过滤算法的可扩展性和数据稀疏性问题.【期刊名称】《电子科技》【年(卷),期】2015(028)007【总页数】4页(P111-114)【关键词】推荐系统;协同过滤;相似度;模糊权重【作者】张雅科【作者单位】西安电子科技大学数学与统计学院,陕西西安710071【正文语种】中文【中图分类】TP273互联网作为信息时代的基础平台,承载了大量的信息资源。
面对海量的信息资源,用户无法筛选出对自己有用的信息,这就是信息过载(Information Overload)问题[1]。
为了解决信息过载问题,推荐系统应运而生。
与传统的信息过滤技术搜索引擎相比,推荐系统无需用户提供搜索的关键词,而是通过分析用户历史行为记录发现用户潜在爱好,从而产生推荐,满足用户的个性化需求。
协同过滤推荐算法是推荐系统的主流算法,这种算法的基本思想是:用户会喜欢(不喜欢)与他兴趣相同(不同)的用户所喜欢的项目。
协同过滤算法主要分为基于内存的算法和基于模型的算法。
基于内存的协同过滤算法可分为基于用户的协同过滤算法(User-Based Collaborative Filtering,UBCF)和基于项目的协同过滤算法(Item -Based Collaborative Filtering,IBCF)。
两种算法的关键都在于相似度的计算,不同的相似度计算方法会对目标用户产生不同的邻居集,进而影响推荐结果。
文献[2]研究了评分和权重线性组合以优化相似度计算函数方法,其中权重通过遗传算法(Genetic Algorithm)迭代收敛到预定条件。
基于聚类的协同过滤算法的研究

基于聚类的协同过滤算法的研究
杨文娟;金子馨
【期刊名称】《电脑知识与技术》
【年(卷),期】2018(014)016
【摘要】作为推荐系统中被普遍使用的算法之一,各大电商网站都会利用协同过滤算法来进行相应物品的推荐.对协同过滤算法来说,推荐精度和时间效率两个方面具有重要的研究价值.因此,如何结合这两方面的优势,从而能设计一种时间效率较高,并且推荐精度很好的协同过滤推荐算法是一个很好的研究方向.为了应对大数据时代的信息量过大的问题,聚类算法与协同过滤算法的结合屡见不鲜.基于此,本文主要就各种聚类算法之间的不同,对聚类算法与协同过滤算法的不同结合方式进行了深入的讨论,并就此进行了实验对比分析.
【总页数】4页(P185-188)
【作者】杨文娟;金子馨
【作者单位】合肥工业大学计算机与信息学院,安徽合肥230009;合肥工业大学计算机与信息学院,安徽合肥230009
【正文语种】中文
【中图分类】TP393
【相关文献】
1.基于聚类分析的协同过滤算法研究 [J], 颜颖;
2.基于聚类分析的协同过滤算法研究 [J], 颜颖
3.基于用户兴趣和双重聚类融合的协同过滤算法的优化研究 [J], 翟烁
4.基于BiasSVD和聚类用户最近邻的协同过滤算法研究 [J], 李佳; 张牧
5.基于BiasSVD和聚类用户最近邻的协同过滤算法研究 [J], 李佳;张牧
因版权原因,仅展示原文概要,查看原文内容请购买。
基于SVD与模糊聚类的协同过滤推荐算法

基于SVD与模糊聚类的协同过滤推荐算法
林建辉;严宣辉;黄波
【期刊名称】《计算机系统应用》
【年(卷),期】2016(025)011
【摘要】协同过滤为个性化推荐解决信息过载问题提供了方案,然而也存在着数据的稀疏性、可扩展性等影响推荐质量的关键问题.我们提出了一种基于奇异值分解(SVD)与模糊聚类的协同过滤推荐算法,通过引用物理学上狭义相对论中能量守恒的方法以保留总体特征值的数目,较为准确地确定降维维度,实现对原始数据的降维及其数据填充.另外,再运用模糊聚类的方法将相似用户进行聚类,从而达到减少邻居用户搜索范围的目的.在MovieLens与2013年百度电影推荐系统比赛等不同数据集上的实验结果表明,该算法能够提高推荐质量.
【总页数】8页(P156-163)
【作者】林建辉;严宣辉;黄波
【作者单位】福建师范大学数学与计算机科学学院,福州350007;福建师范大学数学与计算机科学学院,福州350007;福建师范大学数学与计算机科学学院,福州350007
【正文语种】中文
【相关文献】
1.基于SVD与层次聚类的协同过滤推荐算法实现 [J], 徐泽兵;王忠
2.基于SVD的协同过滤推荐算法研究 [J], 黄丽
3.基于SVD与层次聚类的协同过滤推荐算法实现 [J], 徐泽兵[1];王忠[1]
4.基于改进的BiasSVD和聚类用户最近邻的协同过滤混合推荐算法 [J], 刘超;赵文静;贾毓臻;蔡冠宇
5.缺失数据下基于SVDIFC的协同过滤推荐算法 [J], 纪成君;李蕊;王仕勤
因版权原因,仅展示原文概要,查看原文内容请购买。
《基于聚类专家选择的协同过滤推荐算法研究》

《基于聚类专家选择的协同过滤推荐算法研究》一、引言随着互联网技术的飞速发展,信息过载问题日益严重,用户面临着从海量数据中筛选出有价值信息的挑战。
推荐系统作为一种有效解决信息过载问题的方法,已经广泛应用于电子商务、社交网络、视频网站等领域。
协同过滤推荐算法作为推荐系统中的一种重要方法,其通过分析用户行为数据,发现用户之间的兴趣相似性,从而为用户提供个性化的推荐服务。
然而,传统的协同过滤推荐算法在处理大规模数据时存在计算复杂度高、推荐准确度不高等问题。
因此,本文提出了一种基于聚类专家选择的协同过滤推荐算法,以提高推荐准确度和计算效率。
二、相关工作协同过滤推荐算法是一种基于用户行为的推荐方法,其基本思想是利用用户的历史行为数据,发现用户之间的兴趣相似性,然后根据相似用户的行为预测目标用户的行为。
聚类技术作为一种有效的数据挖掘方法,可以用于发现用户之间的兴趣相似性。
因此,将聚类技术与协同过滤推荐算法相结合,可以提高推荐准确度和计算效率。
目前,已经有许多研究者将聚类技术应用于协同过滤推荐算法中。
例如,有些研究者利用K-means聚类算法将用户划分为不同的兴趣组,然后在每个兴趣组内进行协同过滤推荐。
然而,这些方法忽略了不同聚类算法的适用性和有效性问题。
此外,一些方法在处理大规模数据时仍存在计算复杂度高的问题。
因此,本文提出了一种基于聚类专家选择的协同过滤推荐算法,以提高推荐准确度和计算效率。
三、基于聚类专家选择的协同过滤推荐算法本文提出的基于聚类专家选择的协同过滤推荐算法主要包括两个步骤:聚类专家选择和协同过滤推荐。
1. 聚类专家选择在聚类专家选择阶段,我们首先利用多种聚类算法对用户行为数据进行聚类分析。
具体地,我们可以选择K-means、谱聚类、DBSCAN等不同的聚类算法进行实验。
然后,我们利用一些评价指标(如轮廓系数、NMI等)对不同聚类算法的结果进行评估,选择出最佳的聚类算法和聚类结果。
这样,我们可以将用户划分为不同的兴趣组,并为每个兴趣组选择一个“专家”用户,该用户在该兴趣组内具有较高的活跃度和较好的兴趣代表性。
基于模糊聚类和改进混合蛙跳的协同过滤推荐

基于模糊聚类和改进混合蛙跳的协同过滤推荐许智宏;田雨;闫文杰;暴利花【期刊名称】《计算机应用研究》【年(卷),期】2018(035)010【摘要】由于传统的协同过滤推荐算法存在很多缺陷,如数据稀疏性、冷启动、低推荐精度等,提出了一种基于模糊聚类和改进混合蛙跳的协同过滤推荐算法.首先利用一种构造的基于时间的指数遗忘函数对原始评分数据进行处理;然后根据得到的基于时间衰退的评分矩阵对用户进行模糊C-均值(FCM)聚类,并找出与目标用户有较高相似性的前几个类作为候选邻居集;再用改进的混合蛙跳算法找到最近邻居集;最后求出目标用户对未参与项目的预测评分.经实验证明,该算法比其他一些算法的推荐精度要高,且由于数据稀疏性引起的不良影响也得到了有效的缓解.【总页数】4页(P2908-2911)【作者】许智宏;田雨;闫文杰;暴利花【作者单位】河北工业大学计算机科学与软件学院,天津300401;河北省大数据计算重点实验室,天津300401;河北工业大学计算机科学与软件学院,天津300401;河北工业大学计算机科学与软件学院,天津300401;河北省大数据计算重点实验室,天津300401;河北工业大学计算机科学与软件学院,天津300401【正文语种】中文【中图分类】TP301.6【相关文献】1.基于SVD与模糊聚类的协同过滤推荐算法 [J], 林建辉;严宣辉;黄波2.基于混合蛙跳模糊聚类的电子商务协同过滤推荐 [J], 邵琳琳3.基于改进的BiasSVD和聚类用户最近邻的协同过滤混合推荐算法 [J], 刘超;赵文静;贾毓臻;蔡冠宇4.基于改进混合蛙跳算法的个性化旅游路线推荐 [J], 申晓宁;王森林;吴俊潮;仇友辉;张磊;李常峰;王玉芳5.基于混合蛙跳联合聚类的协同过滤算法 [J], 喻金平;张勇;廖列法;梅宏标因版权原因,仅展示原文概要,查看原文内容请购买。
基于聚类技术的协同过滤优化算法

1
1
16 16
图的划分准则
(1)最小切(Min_cut)准则
cut ( A1 ,..., Ak ) i 1 cut ( Ai , Ai )
k
• 问题:
– 只考虑类外联结 – 不考虑类内密度
• 退化实例:
最优划分 最小切准则
17 17
图的划分准则
(2)率切(Ratio_cut)准则
0 0 0 0 1.7 0
x6
0 0 0 0 0 1.5
15 15
图的Laplacian矩阵
未规范化的拉普拉斯矩阵
规范化的拉普拉斯矩阵
L D W
1 2 1 2
Lsym D
1 2
LD
1 2
I D
WD
Lrw D L I D W
规范化的拉普拉斯矩阵Lsym和Lrw的特征值为0的个数即
0.8 0
14 14
度矩阵 Degree matrix(D)
n x n 对角矩阵
D(i, i ) wij : 入射到xi边权值和
j
x1 x1 x2 x3 x4 x5 x6
1.5 0 0 0 0 0
x2
0 1.6 0 0 0 0
x3
0 0 1.6 0 0 0
x4
0 0 0 1.7 0 0
x5
| Ai |=集合Ai中元素的个数
(3)规范切(Normalized_cut)准则
vol(Ai )=Σdi
平均割集准则(Min-Max-Cut) 多路规范割集准则(Multiway -Normalized-Cut)
18 18
谱聚类算法基本步骤
对数据集进行预处理,构建相似度矩阵W; 构造W的规范化拉普拉斯矩阵Lsym。对Lsym进行特征
基于蚁群模糊聚类的协同过滤推荐算法

其 中, 为 目标 用 户 “对 信 息 资 源 项 _ 预 测值 . P, f的 算 法根据 与 目标用 户 相 似 的 N 个用 户 的评 价 进行 预测, 并非 所 有用 户 都参 与预 测 P 值 ,i ( ) sr , 为 e
利用 蚁群 模糊 聚类 算 法对 用 户 进 行 聚类 , 生成 若 干
P —R f +k∑sm( ) R i u, ( —R )
() 2
收 稿 日期 :0 1 0 —2 2 1- 6 9 作 者 简介 : 金 凤 (9 1 ) 硕 士 , 师 , 究 方 向 : 算 机 应用 . 黄 17一 , 讲 研 计 自动控 制 .
待 解决 的问题 : 推荐 适 合 当前 浏 览用 户 的商 品 给该 浏览 用户 , 从而 避免 用 户 由于在 过 多 的 商 品 中 找到 自己所需 商 品过 于 耗 时耗 力 而 离 开. 电子 商务 推 荐 系统 就是 解决此 类 问题 的解 决 方 案. 多 大 型 电子 许
用 户聚类 中心 , 再计 算 每个 用 户 和各 聚类 中心 的相 似性 以得 到相似 性 度量 矩 阵 ; 在线 时计 算 目标 用户 与各 聚类 中心 的相 似性 , 以 此搜 索 相 似 性 度 量矩 再 阵找 到其 最近邻 居并进 行评论 预测 , 最后 生成 推荐. 同时, 仿真 实验结 果表 明 , 本算 法在一 定程 度上 提高 了推荐 速度 和质 量.
其 中 ,。为用户 “的评 分向量 ,J I J J I 为 的长度 , 即
用户 打过分 的数 字资源数 目, R。 表示 用 户 “对项 目 _ 『的评 分.
其 次 , 算 目标 用户对 未 评 价过 的信 息 资源 项 计
基于粗集和模糊聚类的协同过滤算法

定义 2 给定不完 备信息 系统
( A
力,M
表示 经过扩充 的可辨识矩 阵 中的第 行第 ,
.
列元 素 ,则经 过扩充 的可辨识矩 阵 M 定义 为 : M J )= { k a EAAa X 7a (_ Aa X l a (i  ̄k ) ): ( i ) k(i )≠ k( ) ≠ 八a ) 其 中 , j l ,…,1 ’表 示遗 失值 。 =, 2 1;“ 定义 3信 息系统 ( A /, = { 1 ,…, }是属性集 ,x∈U,定义 :MAS { k a 9 a , 2 m i a fk =
0 引 言
个性 化推荐作为一种崭新的智 能信 息服务方式 “ 以根据 用户 提 出的明确 要求,或通过用户个性 、 ,可 习惯 、偏 好的分析 ,准确地 向用户 提供感新 区的信息和服务 ,从而有效解 决信息过载和信 息迷失带来 的
种种 问题 。协 同过滤 ( o a oai Fl r g F C lb rt e iei ,C )是通过 比较用户之 间 的相似 性,把和 目标用户具有相 l v tn 似 兴趣的其他用户 的意见提供给 目标 用户完成推荐 , 目前最成功 的推荐 技术 乜 A z n和 C - w等 是 mao 。 D No 国外著名的 电子商务 网站都应用协 同过滤技术 向顾客推荐产 品,提高服务 的效率和质量 。 但 协 同过滤需要在整个用 户空间上搜 索 目标用户 的最近邻 居 ,随着 系统规模 的不断扩大 ,用户和项 目数量 急剧增加 ,最近邻协 同过滤技术面 临着评分数据稀疏 性这一 巨大挑战 。在用户评 分数据稀疏 的
( au n s)和不确 定 ( n e any V g ees U cr it)信息 的新型数 学工 具,它用等价类 的思想来研 究 问题 ,用集 合的上 t 近似和下近似 来刻 画集合 】 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于模糊聚类的可扩展的协同过滤算法研究1王惠敏聂规划武汉理工大学经济学院电子商务系,武汉(430070)Email: huiminwangbj@摘要:本文主要分析了传统协同过滤算法的不足,提出了一种新的电子商务推荐算法。
该算法将模糊聚类技术用于划分相似的项目和相似的用户,在项目的划分中采用基于项目的协同过滤算法计算出用户对未评分项目的初始评分,在此基础上在用户的划分中采用基于用户的协同过滤算法完成预测评分。
实验结果表明,该算法改善了协同过滤算法的数据稀疏性和可扩展性问题,提高了推荐系统的推荐质量。
关键词:电子商务;协同过滤;模糊聚类;推荐系统中图分类号:TP3911. 引言电子商务推荐系统是基于可得到的信息资源向用户推荐适合其需要的信息或商品的系统[1]。
电子商务推荐技术是电子商务推荐系统中最核心、最关键的技术,很大程度上决定了推荐系统性能的优劣。
目前电子商务推荐技术主要有基于内容的推荐技术和协同过滤推荐技术[2]。
协同过滤作为目前最成功的推荐算法被广泛的应用,其目标是根据具有相似偏好的用户的观点向目标用户推荐新的商品。
协同过滤推荐算法基本上可以分为 Memory-based 协同过滤推荐算法和 Model-based 协同过滤推荐算法两类[3]。
Memory-based 协同过滤算法利用整个用户—项目评分数据集来产生推荐,系统利用统计技术搜寻一组用户,称为邻居,他们与目标用户有一致的历史偏好。
Memory-based 协同过滤算法主要有基于用户的协同过滤推荐算法和基于项目的协同过滤推荐算法。
基于用户的协同过滤根据评分相似的最近邻居的评分数据向目标用户产生推荐。
基于用户的协同过滤虽然当给出足够清楚的偏好信息时,它通常表现出良好的性能,但随着站点结构,内容的复杂度和用户人数的不断增加,一些缺点逐渐暴露出来,主要存在稀疏性和可扩展性两个问题。
通常在电子商务网站中,用户购买或评分的商品相对于总商品数量仅占有限的百分比,为总数量的1%以下,这导致用户-项目评分数据集稀疏。
在这种数据量大而评分数据又极端稀疏的情况下,一方面难以成功的定位邻居用户集,影响推荐精度;另一方面在整个用户空间上计算相似用户群的过程不可避免地成为了算法的瓶颈。
并且输入数据通常包含大量的用户和商品,致使系统扩展困难,推荐质量下降。
针对基于用户的协同过滤推荐算法面临的问题,研究者们提出了基于项目的协同过滤推荐算法[3]。
基于项目的协同过滤推荐依赖于项目的相信似度来决定推荐。
算法的不足之处是只能推荐那些和用户当前购买的商品相类似的商品,不能挖掘用户的潜在兴趣,作出“跨类型”的推荐。
聚类分析是数据处理的一种重要手段和工具,通过把样本按照某种相似性准则划分成各种不同的类别,从而发现人们感兴趣的内容。
聚类技术已被广泛地大数据集的处理,研究者们也将其应用于协同过滤可扩展性问题的改善。
张海燕等运用模糊聚类技术将项目的属性特性的相似性与基于项目的协同过滤推荐算法相融合,以改善推荐质量[4]。
Xue G. R.采1 本课题得到国家自然科学基金“基于知识网络的电子商务智能推荐系统研究”(70572079)资助- 1 -用聚类方法将训练集中的用户聚类,在类中采用基于用户的协同过滤方法预测所有未评分数据并将其填充,然后用平滑后的用户—项目评分数据集预测测试集中的未评分数据[5]。
针对基于用户的协同过滤和基于项目的协同过滤两种算法的不足,本文提出的协同过滤算法融合了 两种算法的基本思想,不仅考虑了用户的相似性,而且也考虑了项目的相似性对目标用户推荐产生的影响。
同时运用模糊聚类技术分别将相似的项目和相似的用户进行划分。
在项目的划分中利用用户对相似商品的评分预测用户对未评分商品的评分,在此基础上在用户的划分中计算用户的相似度,产生推荐的预测评分。
2. 相关工作协同过滤是预测某客户对某个他没有评价过的项目的喜爱程度,预测的依据是过去用户群体对一系列项目的历史评分。
用户-项目评分数据可用一个n m ×阶矩阵表示,m 行代表个用户,列代表个项目,第i 行第),(n m R m n n j 列的元素代表用户i 对项目j i R ,j 的评分数值。
2.1基于用户的协同过滤推荐基于用户的协同过滤推荐根据评分相似的最近邻居的评分数据向目标用户产生推荐。
该算法的核心部分是为一个需要推荐服务的目标用户寻找最相似的最近邻居集。
最近邻居查找的效果和效率很大程度上决定了基于用户的协同过滤算法的效果和效率。
余弦相似性和相关相似性是常用的二种相似性度量方法。
本文采用相关相似性度量方法,其表示如下:∑∑∑∈∈∈−−−−=xy xy xy S s S s y ys x xs S s y ys x xs R R R R R R R Ry x sim 22)()())((),(xs R 和分别是用户ys R x 和用户y 对项目的评分;s x R 和y R 分别是用户x 和用户y 的平均评分;是用户xy S x 和用户y 评分项目的交集。
基于相似性度量找出最相似的用户之后,需要根据目标用户的评分,预测其对未评分项目的评分。
用户x 对未评分项目p 的预测评分可表示为:∑∑==×−+=uul i l i i ip x xp i x sim i x sim R R R P 11),(),()(其中为相似的用户数。
u l 2.2 基于项目的协同过滤推荐- 2 -基于项目的协同过滤推荐是用目标用户对相似项目的评分来预测其对未评分项目的评分。
该算法是根据目标用户已经评价过的项目与目标项目的相似性,选择项目的最近邻居集,按如下公式预测用户u 对未评分项目的评分。
s us P ∑∑==×=i i l b l b ub us b s sim b s sim R P 11),(),( 其中为相似的项目数,项目相似度可通过相关相似性度量方法计算获得。
i l ),(b s sim 3. 基于模糊聚类的可扩展的协同过滤算法针对由于评分数据的极端稀疏导致难以定位相似的用户集合,本文首先对用户—项目评分数据集按项目进行模糊聚类,在聚类后的划分中计算项目的相似度,预测用户对未评分项目的评分,并将其预测值填充在用户评分数据集中。
填充后的评分数据集作为输入数据,运用模糊聚类算法对数据集中的用户进行划分,在用户的划分中计算用户的相似度,完成最后的预测评分。
具体算法如下:步骤1:将模糊c-均值算法应用于训练集的用户—项目评分数据集,将项目划分为 类;c 步骤2:查找目标用户的未评分数据所属的类,类中的项目作为目标用户未评分项目的邻居;步骤3:在类中采用相关相似性函数作为度量函数,计算用户未评分项目与其邻居项目的相似度;步骤4:预测用户对未评分项目的评分,并将其预测值填充在训练集的用户—项目评分数据集中;步骤5:将模糊c-均值算法应用于填充后的评分数据集,将用户划分为 g 类;步骤6:查找测试集中目标用户所属的类,类中的用户作为目标用户的邻居;步骤7:在类中采用相关相似性函数作为度量函数,计算目标用户与其邻居用户的相似度,预测目标用户对未评分项目的评分。
4. 实验及结果分析实验采用的数据集来自 Minnesota 大学 GroupLens Research 项目组收集的MovieLens 数据集。
MovieLens 站点( /)是一个基于 Web 的研究型推荐系统,用于接收用户对电影的评分并提供相应的电影推荐列表。
从MovieLens 数据集中随机截取100个用户对800部电影的评分数据,然后将评分数据按0.9的比率划分为训练集和测试集,从测试用户中的评分中随机选取5个评分作为可见的评分。
- 3 -本文采用平均绝对偏差MAE(Mean Absolute Error)作为评价推荐系统推荐质量的度量标准,验证算法的有效性。
平均绝对偏差MAE 通过计算预测的用户评分与实际的用户评分之间的偏差来度量预测的准确性,MAE 越小,推荐质量越高。
对于测试集中的项目评分和用户,MAE 表示为:Lr PMAE s x s x s x ∑−=,,,|| 其中,表示用户s x P ,x 对项目的预测评分,表示用户s s x r ,x 对项目的实际评分,为测试集合的基数。
s L 实验以传统的基于用户的协同过滤推荐算法和基于项目的协同过滤算法作为参照,分别计算其平均绝对偏差MAE ,然后与基于模糊聚类的可扩展的协同过滤推荐算法作比较,实验结果为:基于用户的协同过滤算法的MAE 为0.731;基于项目的协同过滤算法的MAE 为0.726,基于模糊聚类的可扩展的协同过滤推荐算法的MAE 为0.692。
实验结果表明基于模糊聚类的可扩展的协同过滤推荐算法具有较小的MAE ,完成的推荐质量要较高一些。
5. 结论在本文提出的电子商务推荐算法中,将模糊聚类技术应用于项目最近邻居和用户最近邻居的查找,降低了在项目空间和用户空间的计算维度,改善了传统协同过滤算法的可扩展性。
同时未评分项目的预测过程综合考虑了用户—项目评分数据集中所含的项目相关和用户相关的信息,降低了评分数据的稀疏性,预测结果更为准确。
参考文献[1] Weng L.T., Xu Y., and Li Y.F. An Improvement to Collaborative Filtering for Recommender Systems[A]. Proceedings of the 2005 International Conference on Computational Intelligence for Modelling, Control and Automation, and International Conference on Intelligent Agents, Web Technological and Internet Commerce, 2005, 792-795[2] Breese J., Heckerman D. and Kadie C..Empirical Analysis of Predictive Algorithms for Collaborative Filtering[A]. Proceedings of the 14th Conference on Uncertainty in Artificial Intelligence, 1998.43-52[3] Sarwar B., Karypis G., and Konstan J .Item-based collaborative filtering recommendation algorithms[A]. Proceedings of the 10th International World Wide Web Conference, 2001,285-295[4] 张海燕,顾峰,姜丽红.基于模糊簇的个性化推荐方法[J].计算机工程,2006,32(12):65-67[5] Xue G. R., Lin C., Yang Q., et al. Scalable Collaborative Filtering Using Cluster-based Smoothing[A]. Proceedings of the 28th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, 2005, 114-121- 4 -Research on Scalable Collaborative Filtering AlgorithmBased on Fuzzy ClusteringWang Huimin, Nie GuihuaDepartment of Economics, Wuhan University of Technology, Wuhan, HuBei, PRC, 430070AbstractThe paper proposes a novel e-commerce recommendation algorithm on the basis of the limitations of traditional collaborative algorithms. The algorithm applies the fuzzy clustering technology to partition similar items and similar users. In the partition of items, original ratings of items that users have not rated are predicted by the item-based collaborative filtering, then in the partition of users, final ratings are predicted by the user-based collaborative filtering. Experiments show the proposed algorithm can improve data sparsity and scalability of traditional collaborative filtering and provide a better recommendation.Keywords:E-commerce, Collaborative filtering, Fuzzy clustering, Recommendation system作者简介:王惠敏,女, 1971年生,博士、讲师,主要研究方向是电子商务和商务智能。