一种基于多正则化参数的矩阵分解推荐算法

Computer Engineering and Applications 计算机工程与应用

2017,53(3)1引言随着信息技术的发展以及互联网的普及,人们面临着严重的信息过载问题(information overload )。电子商务网站提供了多种多样的商品以满足不同兴趣的用户的需求,将满足用户喜好的商品推荐给用户将会提高用户的满意度。推荐系统(Recommender Systems ,RS )能够从规模庞大的商品中快速地找到用户喜欢的商品,提供个性化的推荐,是电子商务领域的研究热点之一。推荐系统算法中使用最广泛的是基于协同过滤(Collaborative Filtering ,CF )的推荐算法,它利用用户历史行为(如用户历史交易记录或者用户的评分)来进行个性化的推荐。协同过滤推荐算法包括基于邻域的模型与潜在因子模型(latent factor model )等,其中,基于

矩阵分解(Matrix Factorization ,MF )的潜在因子模型[1]在预测的稳定性以及精确度上获得了广泛的认可[2-3]。对于N 个用户与M 个项目,假设评分矩阵为R ∈?N ×M ,其中元素r ij 表示用户u i 对项目v j 的评分。通常R 中有许多元素为空(即没有相应的评分值),因此是一个稀疏矩阵。基于矩阵分解的潜在因子模型是通过对用户的评分矩阵R 进行分解,推导出两个分别代

表用户与项目的低维潜在特征矩阵,进而完成对未知评分的预测。记U ∈?f ×N 和V ∈?f ×M 分别为分解得到的用户以及项目的f -维特征矩阵,其列向量U i 和V j 分别表示相对应的用户u i 与项目v j 的潜在特征向量。评一种基于多正则化参数的矩阵分解推荐算法

张航,叶东毅

ZHANG Hang,YE Dongyi

福州大学数学与计算机科学学院,福州350108

College of Mathematics and Computer Science,Fuzhou University,Fuzhou 350108,China

ZHANG Hang,YE Dongyi.Recommender algorithm based on matrix factorization with multiple regularization https://www.360docs.net/doc/4417712012.html,puter Engineering and Applications,2017,53(3):74-79.

Abstract:Regularization technique is needed for the collaborative filtering recommendation algorithm based on the gradi-ent descent matrix factorization to restrict the problems.Regularization parameter used in the loss function can control the trade-off between prediction accuracy of the model and overfitting avoidance to the training.A method of multiple regular-ization parameters is proposed.It can obtain the regularization parameters according to the user activity and item populari-ty,avoid the overfitting in the users and items with different numbers,and get better prediction accuracy.The experiment results show that this method is correct and feasible.

Key words:recommender system;collaborative filtering;probabilistic matrix factorization;regularization parameter

摘要:基于梯度下降矩阵分解模型的协同过滤推荐算法需要利用正则化技术对问题加以约束。损失函数中的正则化参数能够提高模型的预测精度,防止训练过拟合,并可以在二者间调节,使二者平衡。提出了一种多正则化参数的方法,根据用户的活跃度或者项目的流行度确定正则化参数的值,能在不同评分数量的用户或者项目上防止训练过拟合,同时可以得到更好的预测精度。实验结果验证了算法的正确性和有效性。

关键词:推荐系统;协同过滤;概率矩阵分解;正则化参数

文献标志码:A 中图分类号:TP311doi :10.3778/j.issn.1002-8331.1506-0131

基金项目:国家自然科学基金(No.61473089)。

作者简介:张航(1989—),男,硕士研究生,研究领域为数据挖掘,E-mail :zh3c21@https://www.360docs.net/doc/4417712012.html, ;叶东毅(1964—),男,博士,教授,研究

领域为计算智能和数据挖掘。

收稿日期:2015-06-15修回日期:2015-10-20文章编号:1002-8331(2017)03-0074-06

CNKI 网络优先出版:2015-10-28,https://www.360docs.net/doc/4417712012.html,/kcms/detail/11.2127.TP.20151028.1528.034.html

◎大数据与云计算◎

74万方数据

相关文档
最新文档