利用信任网络特性的基于信任的推荐算法_张光前
《2024年基于信任的协同过滤推荐算法研究》范文

《基于信任的协同过滤推荐算法研究》篇一一、引言随着互联网的快速发展和大数据时代的到来,信息过载问题日益严重。
为了解决这一问题,推荐系统应运而生,并逐渐成为现代信息处理的重要手段。
其中,协同过滤推荐算法因其简单有效而被广泛应用。
然而,传统的协同过滤推荐算法往往忽略了用户之间的信任关系,导致推荐结果的准确性和满意度有所降低。
因此,本文将研究基于信任的协同过滤推荐算法,以提高推荐系统的性能。
二、协同过滤推荐算法概述协同过滤推荐算法是一种基于用户行为的推荐方法,通过分析用户的历史行为数据,发现用户之间的相似性,进而为用户推荐其可能感兴趣的项目。
协同过滤推荐算法主要包括基于用户的协同过滤和基于项目的协同过滤两种方法。
其中,基于用户的协同过滤主要依据用户的历史行为数据计算用户之间的相似性,然后根据相似用户的行为预测当前用户对项目的兴趣;而基于项目的协同过滤则是根据项目之间的相似性以及用户对项目的评价来预测用户对项目的兴趣。
三、基于信任的协同过滤推荐算法研究为了充分利用用户之间的信任关系提高推荐性能,研究者们提出了基于信任的协同过滤推荐算法。
该算法在传统的协同过滤基础上引入了信任传播机制,通过分析用户之间的信任关系,将信任关系融入到推荐过程中。
具体而言,该算法首先构建一个信任网络,网络中的节点表示用户,边表示用户之间的信任关系;然后,利用信任传播算法计算每个用户的综合信任度,将综合信任度作为用户相似性的度量依据;最后,根据综合信任度和用户历史行为数据预测用户对项目的兴趣,生成推荐结果。
四、算法实现与优化在实现基于信任的协同过滤推荐算法时,需要解决以下几个关键问题:1. 信任网络构建:如何从海量数据中提取出有效的信任信息,构建一个高质量的信任网络是算法成功的关键。
这需要考虑到数据的准确性、时效性和完整性等因素。
2. 信任传播机制:如何设计有效的信任传播机制,将信任关系融入到推荐过程中,提高推荐的准确性和满意度。
融合用户信任和影响力的top-N推荐算法

DOI: 10.3785/j.issn.1008-973X.2020.02.012融合用户信任和影响力的top-N 推荐算法张雪峰,陈秀莉,僧德文(杭州电子科技大学 复杂系统建模与仿真教育部重点实验室,浙江 杭州 310018)摘 要:针对现有基于信任的推荐方法通常直接利用社交网络的二值信任关系来提高推荐质量,较少考虑用户间信任强度的差异和潜在影响的问题,提出结合用户信任和影响力的混合推荐算法进行top-N 项目推荐. 采用自动编码器对用户行为进行无监督的初始特征优化,将高维、稀疏的用户行为压缩成低维、稠密的用户及项目特征向量;提出融合用户交互信息、偏好度和信任的新型信任度量模型,发掘社交网络中用户间的隐含信任关系,重构社会信任网络;将社会信任网络的拓扑结构和用户的交互信息融入结构洞算法,通过改进的结构洞算法来识别网络中的影响力用户,提高top-N 项目推荐性能. 实验在FilmTrust 、Epinions 、Ciao 这3个标准数据集上进行对比验证,实验结果证明了所提算法的有效性.关键词: 社会化推荐;用户信任;影响力;矩阵分解;自动编码器中图分类号: TP 391 文献标志码: A 文章编号: 1008−973X (2020)02−0311−09Top-N recommendation algorithm combininguser trust and influenceZHANG Xue-feng, CHEN Xiu-li, SENG De-wen(Key Laboratory of Complex Systems Modeling and Simulation , Hangzhou Dianzi University , Hangzhou 310018, China )Abstract: A hybrid recommendation algorithm with the incorporation of user trust and social influence was proposedfor top-N item recommendation, in view of the existing trust-aware recommendation systems, which directly use the binary trust relationship of social networks to improve the quality of recommendation, and less consider the difference of trust intensity and potential impact between users. The auto-encoder is used to perform unsupervised initial feature optimization on user behavior, and the high-dimensional and sparse user behaviors are compressed into low dimensional and dense users and item feature vectors. A novel trust value measurement model that combines user interaction information, preferences, and trust is brought up to explore the implicit trust relationship between users in social networks and reconstruct the social trust network. The improved structure hole algorithm is used to identify the influential users in the network and improve the top-N item recommendation performance, which integrates the topological structure of the social trust network and the user's interactive information. Comparison verification was conducted on three standard datasets, FilmTrust, Epinions and Ciao, and experimental results demonstrated the effectiveness of the proposed algorithm.Key words: social recommendation; user trust; influence; matrix factorization; auto-encoder近几十年来,越来越多的个性化推荐方法相继被提出,依据模型构建方式可以大致分为3类:基于内容的方法[1]、基于协同过滤的方法[2]和混合推荐方法[3]. 其中,协同过滤推荐算法仅利用评收稿日期:2019−01−05. 网址:/eng/article/2020/1008-973X/202002012.shtml基金项目:浙江省基础公益研究计划资助项目(LGF19F020015);中国高等教育学会高等教育科学研究“十三五”规划课题资助项目(2018GCLYB12).作者简介:张雪峰(1980—),男,讲师,从事推荐系统和智能计算研究. /0000-0002-7735-6342. E-mail :***************.cn通信联系人:僧德文,男,副教授. /0000-0003-0921-848X. E-mail :**************.cn第 54 卷第 2 期 2020 年 2 月浙 江 大 学 学 报(工学版)Journal of Zhejiang University (Engineering Science)Vol.54 No.2Feb. 2020分信息进行推荐,受到工业界与学术界的广泛关注[1].依据社交关系理论[4],在社交网络中拥有较强社交关系的用户在某些方面往往具有相似偏好且互相影响,社会化推荐因此引起巨大关注[5-6]. 在社交网络中,用户间是否存在社交关系往往依赖于用户之间是否相互信任,信任关系从某种程度上来说提供了用户的偏好信息. Yang等[7]提出基于信任与被信任关系的社交推荐模型TrustMF. 依据信任关系的有向性,TrustMF将每个用户映射为2个不同的K维特征向量,分别称为信任者特征向量和被信任者特征向量. Jamali等[8]将信任传播的方法引入推荐算法SocialMF,通过约束用户与其好友的平均偏好相似来传播信任关系,从而得到更准确的结果. Ma等[9]提出社交正则化推荐模型,使用社交信息对用户特征向量进行规则化处理,从而利用好友的偏好信息影响用户的最终预测评分. 为了处理评分和信任关系的稀疏问题,Guo等[10]在奇异值分解(singular value decom-position++,SVD++)模型[11]的基础上引入社交信息,提出兼顾评分和信任信息的基于信任的矩阵分解模型TrustSVD,在预测未知项目的评分时考虑评分和信任信息的显性和隐性影响.在现实生活中,用户对每个好友的信任度并不相同,甚至有可能完全不信任(即有可能仅仅出于礼貌而添加好友关系). 上述前人研究假设每个好友对用户的影响相同. 实际上,用户间的信任关系受多种因素的影响,有的是由于爱好相似,有的是由于相同的社交圈子,有的则仅仅是出于礼貌. 简单的二值信任网络并不能反映用户之间的影响力,也不能充分挖掘社交网络中隐含的用户偏好信息,即须进一步评估用户间的信任度.为了解决以上问题,本研究提出基于用户信任和影响力的相似度推荐模型(factored similarity model with user trust and influence recommendation,FSTID)进行top-N项目推荐研究. 1)为了解决信任数据稀疏和二值信任关系问题,提出融合用户交互信息、偏好度和信任的新型信任度量模型,发掘社交网络用户间存在的隐含信任关系,构建社会信任网络. 2)将社会信任网络的拓扑结构和用户交互的显式反馈、隐式反馈信息融入结构洞算法,通过改进的结构洞算法来识别网络中的影响力用户,从而更全面地利用信任关系中的隐含信息. 3)综合考虑用户信任和影响力对推荐效果的影响,提出基于用户和项目相似性、信任及社会影响力的新型推荐模型,并针对传统协同过滤算法随机初始化用户及项目特征向量,采用自动编码器对用户行为进行无监督的初始特征优化,提高推荐性能. 4)在FilmTrust、Epinions、Ciao这3个标准数据集上进行大量对比验证以证明所提算法的高效性.1 基于信任和影响力推荐算法1.1 问题定义mU={u1,u2,···,u m}nI={i1,i2,···,i n}R=[r u,i]m×n r u,i I u={i|r u,i 0}U i={u|r u,i 0}在基于评分的协同过滤算法中,给定个用户的集合,个项目的集合及用户-项目评分矩阵,为用户u在项目i上的评分. 为用户u已评分的项目集合,为对项目i已评分的用户集合.G=(V,E)VE<u,v>T u+T u−T−u|T−u|T+u|T+u|构建社会信任网络有向图,其中,为顶点集,即所有用户;为节点边集,为从节点u指向节点v的边,表示用户u对用户v的信任关系. 考虑信任的相互性、传递性和非对称性等特征,信任关系可以描述为信任与被信任2种状态. 如果用户A信任用户B,并不能保证用户B 也对A具有同样的信任程度,即用户在信任与被信任时所变现出来的偏好并不相同. 因此,在建立的信任网络有向图基础上,引入参数、分别表示用户u的信任者和被信任者,以描述用户的相互信任关系. 为所有指向节点u的节点集合,即信任用户u的所有用户集合,为节点u的入度;为从节点u指出的节点集合,即用户u信任的所有用户集合,为节点u的出度.1.2 特征提取如图1所示为将用户-项目的评分矩阵输入自动编码器的输入层,经过自动编码器进行用户特征和项目特征提取的过程.5?34433?2?1项目用户评分矩阵深度自动编码器···输出层输入层隐藏层PX用户特征项目特征··················图 1 特征提取流程图Fig.1 Flow chart of feature extraction312浙江大学学报(工学版)第 54 卷U i /I u P d S =[I 1,I 2,···,I m ]设计基于项目(或用户)的自动编码器,包含编码(输入层到隐含层)与解码(隐含层到输出层)2个部分. 在编码部分,将每个部分观察到的作为输入,投影到低维潜在(隐藏)空间;在解码部分,将编码数据映射回样本空间. 以样本的d 维隐含层为例(为每个隐含层的神经元个数),令为样本,自动编码器的主要步骤如下.W ∈R d ×m b∈R dd P 1)解码. 通过位于输入层与隐含层之间的权值矩阵和偏置向量对样本S 进行解码,得到样本的维隐含层,表达式如下:h 1=σ(W 1S +b 1),P =σ(W 2h 1+b 2).(1)σ(·)σ(x )=1/(1+e −x )式中:h 1为隐含层矩阵;函数为Sigmoid 激活函数,.W b P ˆS2)编码. 自动编码器通过位于隐含层与输出层之间的权值矩阵和偏置向量,从隐含层中重构原始数据:h 2=σ(W 3P +b 3),ˆS=W 4h 2+b 4.(2)W b 3)优化模型. 通过调整权值矩阵与偏置向量,从而最小化目标函数,表达式如下:L =12m m∑i =1 ˆS i −S i2+λ2∥W 1∥2+···+λ2∥W L ∥2.(3)ˆSi S i ˆS S ∥·∥2L 2ˆSi S i 式中:、分别为重构数据及原始数据的第i 维向量;W L为第L 层隐含层矩阵;表示向量或矩阵的范数的平方,即各维度数值的平方和;目标函数中的第1项是误差项,用来最小化重构数据与原始数据的误差;后几项是正则项,用来预防模型向训练数据过拟合.在训练过程中,采用反向传播算法训练自动编码器. 利用反向传播算法,从输出层开始反向计算每个节点的残差,并利用这些残差计算代价方程对每个参数的偏导数. 在每个迭代过程中,更新权重矩阵的表达式如下:W =W −l ∂L /∂W .(4)l b 式中:为学习率. 采用相同的方式进行更新.P X 重复以上步骤不断对模型进行优化直至训练结束. 在训练结束后,将得到用户特征向量和项目特征向量.1.3 信任度计算进行如下假设:如果2个用户对同一项目进行评价,就认为他们之间进行一次交互.u v v t u ,v 信任来源于主观个体的经验积累,用户越信任用户,与的交互才会越多. 初始信任度表达式如下:t u ,v =min (|I u ∩I v |,D u )D u.(5)I u ∩I v u v D u =√|I u |式中:为用户、已进行过的交互次数,即共同评分项目数;D u 为阈值,是可调节参数,用于衡量2个用户完全信任对方时的最少交互次数. 考虑到每个用户评分数目不一致,对完全信任的标准也可能不同,因此,设定每个用户的阈值.u v i 在现实生活中,人们之间的信任程度受交互经验的影响,彼此的信任度随项目交互结果的变化而逐渐变化. 若用户、对项目的评分均高于(低于)该用户的平均评分,就认为这次交互是成功(success )的,反之失败(failure ):(r u ,i −¯u )(r v ,i −¯v )⩾0,i ∈success;(r u ,i −¯u )(r v ,i −¯v )<0,i ∈failure .}¯u ¯v u v 式中:r u,i ,r v,i 分别为用户u 、v 对项目i 的评分,、分别为用户、的平均评分.u i 另外,从大众心理出发,区分用户对项目的兴趣度差异对信任度变化造成的影响,即偏好度.用户对项目的偏好度的表达式如下:Pre (u ,i )=∑o ∈U isim (u ,o )|U i |.(6)o U i sim (u ,o )sim (u ,o )式中:为中的用户,为用户u 、o 的相似度,=0~1,值越大,说明用户u 与o 越相似.采用皮尔逊相关系数计算用户间的相似度:sim (u ,o )=12+∑i ∈I u ∩I o (r u ,i −¯u )(r o ,i −¯o )2 ∑i ∈I u ∩I o(r u ,i −¯u )2 1/2 ∑i ∈I u ∩I o(r o ,i −¯o )2 1/2×|I u ∩I o ||I u |.(7)在成功或失败的交互中,根据用户对项目的偏好度为不同的项目分配不同的权重,得到最终的信任度:T (u ,v )=∑i ∈success pre (u ,i )−∑i ∈failurepre (u ,i )∑i ∈success pre (u ,i )+∑i ∈failurepre (u ,i )t u ,v .(8)1.4 影响力用户识别结构洞[12](structural holes ,SH )理论能够较好第 2 期张雪峰, 等:融合用户信任和影响力的top-N 推荐算法[J]. 浙江大学学报:工学版,2020, 54(2): 311–319.313地度量社会网络的影响力节点,识别影响力用户.受相关研究的启发,本研究提出改进的结构洞算法(improved structural holes ,ISH ). ISH 在传统的结构洞算法的基础上,融入邻居节点的入度及出度对目标节点的影响,能够有效挖掘有向图中的关键节点. 表达式如下:C (u )=∑v ∈T −up (v ,u )+∑q ∈T −up (v ,q )p (q ,u ) 2×|T +v||T +v |+|T −v|,u q v .(9)C (u )u p (v ,u )u v 式中:为节点受其他节点的网络结构约束的程度,较高的约束度表示较低的独立权,几乎没有接触非冗余信息源的机会;为节点为维持节点和其关系所投入的精力占总精力的比例,表达式如下:p (v ,u )=Z vu/∑v ∈T −uZ vu ,Z vu ={1,<v ,u >∈E ;0,<v ,u > E .(10)∑q ∈T −up (v ,q )p (q ,u )u v q u v q C (u )由节点和节点的桥接节点的数量决定. 节点、、连接越紧密,它们之间形成的闭合三角形越多,越大,形成结构洞的机会就越小.1.5 个性化推荐b i p T v q u p v q u x T j y i x j y ip T w y i 所提模型建立在FST (factored similarity mod-els with social trust )[13]方法的基础上,将用户u 对项目i 的预测评分分为四部分:1)项目偏置;2)用户u 和对项目i 进行过评分的任何其他用户v 之间的相似性,、分别为用户v 与用户u 的特定用户潜在特征向量;3)项目i 和用户u 已评分的任何其他项目j 之间的相似性,、分别为项目j 与项目i 的特定项目潜在特征向量;4)用户u 的任何信任用户w 对目标项目i 产生的影响. 评分预测的表达式如下:ˆr u ,i =s |U i −u |−β∑v ∈U i −u p T v q u +(1−s )|I u −i |−α∑j ∈I u −ix T j y i +|T +u |−z∑w ∈T up T w y i +b i .(11)U i −u I u −i T +us ∈[0,1]αβ式中:为除用户u 之外对项目i 已评分的用户集合;为除项目i 外用户u 已评分的项目集合;为用户u 的信任用户;b i 为项目i 的偏置值;为用户相似性对预测评分的重要性;参数、、z 分别控制获得高评分时所需的相似项目、α,β,z ⩾0ββ=1i u β=0相似用户以及信任用户的数量,. 以参数为例,当时,预测评分考虑的是对项目进行过评分的其他用户与用户之间的平均相似度,只有当绝大多数用户与用户u 的相似度都较高时才能获得高评分;反之,当时,即使只有少量用户拥有高相似度,项目i 也能得到高分,从而被系统推荐给目标用户.i u u 根据以上分析,影响力用户对项目的推荐信息较重要. 另外,Guo 等[10]证明那些信任用户的其他用户在一定程度上也影响用户对某个项目的决策. 因此,通过考虑以上因素来扩展FST 的预测评分公式,提出FSTID 模型,表达式如下:ˆr u ,i =s |U i −u |−β∑v ∈U i −up T v q u +(1−s )|I u −i |−α∑j ∈I u −ix T j y i +δ|T +u |−z∑a ∈T +up T a y i +(1−δ)|T −u |−z∑b ∈T −up T b y i +|IU |−µ∑f ∈IUp T f y i +b i .(12)µδT +uT −uδ∈[0,1]δ=0δ=1f ∈IU p T f y i f i P Q X Y P =Q ,X =Y 式中:为考虑影响力用户数量的参数;IU 为影响力用户集合;为控制信任者集合和被信任者集合的权重,, 表示完全不考虑信任者用户的影响,表示仅考虑信任者用户的影响. 对于每个影响力用户,内积被视为影响力用户对目标项目的影响. 在FST 中,特征矩阵、、、都是随机生成的,由于本研究使用自动编码器进行预训练以实现特征提取,在FSTID 方法中初始化特征矩阵为.构建损失函数来优化FSTID 模型. 本研究借鉴贝叶斯个性排序[14](Bayesian personalized rank-ing ,BPR )中的损失函数,该函数不拟合具体评分值,而是最大化目标用户已有行为的出现. 损失函数表达式如下:J =12∑u ∈U ∑i ∈I +u ,j ∈I −u(r u ,i −r u ,j )−(ˆr u ,i −ˆr u ,j ) 2F +λ2(∥P ∥2F +∥Q ∥2F +∥X ∥2F +∥Y ∥2F +∥b ∥2F ).(13)I +u I −u式中:、分别为用户u 已评分项目及未评分项目.采用梯度下降法进行最优化求解,直到损失函数收敛. 最后,返回偏移向量和特征矩阵作为输出.2 实验结果和分析为了避免实验的倾向性,选择3个独立的数314浙 江 大 学 学 报(工学版)第 54 卷据集Filmtrust 、Epinions 、Ciao 进行算法验证. 这3个真实世界的数据集同时包含评分数据和在线社交数据,如表1所示. 可以看出,这些数据集本质上都较稀疏.P @N F 1@N 采用5-折交叉验证方法,选取5次结果的平均值作为最终实验结果. 和评分预测问题不同的是,采用3种流行的排名指标来评估推荐性能,即精确率(precision )、F 1度量(F 1 - measure )及归一化折损累积增益(normalized discounted cumulative gain ,NDCG ). 与大多数推荐系统类似,将备选项目按评分排序,并推荐前N 个项目. 对于每个用户,定义、、NDCG@N 表达式分别为P @N =1|U ′|∑u ∈U ′|R N (u )∩I u |N,(14)R @N =1|U ′|∑u ∈U ′|R N (u )∩I u ||I u |,(15)F 1@N =2×P @N ×R @NP @N +R @N,(16)DCG@N =N ∑i =12rel(i )−1log 2(i +1),(17)NDCG@N =1|U ′|∑u ∈U ′DCG@NIDCG@N.(18)N =5N =10U ′R N (u )u P @NR @N F 1i rel(i )=1IDCG@N DCG@NP @N F 1@N NDCG@N 式中:N 为推荐的项目数,在本研究中通常设或;为测试集中的用户合集;为所提算法给用户做出的top-N 推荐列表;为精确率,衡量推荐正确的物品个数占总推荐数量的比率;为召回率,计算所有被推荐的项目占被用户评过分项目的比例;为精确值和召回率的调和均值;当项目被采用时,,否则为0;为理想情况下的值,即当所有推荐项目均按用户的喜欢程度排序时的的取值. 、、越高,代表推荐性能越高.选择当前最先进的算法进行对比和分析:1)MostPopular :通过受欢迎程度来计算项目的评分分数的基线方法,即该项目被其他用户评分或消费的次数. 2)BPR :经典的基于成对偏好假设的物品排序算法[14],在建模时只使用目标反馈,而没有考虑辅助反馈,通过学习用户对一对产品的偏好关系来预测用户最有可能偏好的产品. 3)GBPR (group Bayesian personalized ranking ):Pan 等[15]提出的基于BPR 的改进方法,结合社交群体对用户偏好的影响来提高项目推荐质量. 4)FISM (factored item similarity model ):Kabbur 等[16]提出的基于项目相似度的top-N 推荐方法,提高项目推荐性能.5)FST :Guo 等[13]提出的基于隐式用户反馈,并融合相似度和社会信任的top-N 推荐方法. 6)FST-ID 、FSTID-:本研究所提出的用于对比的2个方法.其中,FSTID-不采用自动编码器进行特征优化,其用户特征和项目特征值在(0,0.01)随机产生.2.1 节点影响力分析γ∈(0,1.0)S I 为了进行节点影响力分析,采用经典的传染病Susceptible Infected (SI )模型进行仿真研究,该模型可以很好地模拟信息、病毒的传播过程. 在SI 疾病传播模型中,网络中的节点在任一时刻都有2种可能状态,易感态S 和感染态I . 感染态的节点在每个时间段会以的传播概率向邻居节点传播病毒,处于易感态的节点在被感染后转变为感染态并且不能恢复.γ=0.001t =10S im 在实验中,以FilmTrust 和Ciao 的实际社交网络数据为样本,设定,取网络中任意节点作为初始传播源,定义在规定传播时间后受感染的节点总数为该节点的实际传播影响力.重复多次实验以得到更为可靠的结果,表达式如下:S i =1M M∑m =1S im .(19)M =100S i 式中:M 为对节点i 进行重复实验的次数,在本研究中取;取M 次结果的平均值作为节点的最终实际影响力. 实验结果如图2所示.图2(a )~(c )为在FilmTrust 数据集上的实验结果,图2(d )~(f )为在Ciao 数据集上的实验结果. 图中,No 为排名. 结果表明,1)低影响力节点(下部阴影区域内):在2个数据集中,SH 方法与度中心性(degree centrality ,DC )方法所得结果相比,节点数目较一致,但SH 所得的节点排名比DC 更靠后,说明结构洞方法效果好于度中心性方法. 同时,ISH 方法统计出的节点中低影响力节点所占表 1 数据集稀疏性分析Tab.1 Dataset sparsity analysis数据集用户数量项目数量评分记录评分稀疏度/%Epinions 40 163139 738664 8240.01Ciao 7 37599 746139 7380.04FilmTrust1 5082 07140 1631.14第 2 期张雪峰, 等:融合用户信任和影响力的top-N 推荐算法[J]. 浙江大学学报:工学版,2020, 54(2): 311–319.315比例明显低于其他2个方法,且大部分集中在排名后半段. 2)高影响力节点(上部阴影区域内):对Top-25节点进行统计,发现在FilmTrust 数据集中,DC 、SH 、ISH 方法算出的高影响力节点数目分别为18、15、18;在Ciao 数据集中,3个方法算出的高影响力节点数分别为8、9、11;结果相差不大,说明“入度”越大的节点越重要这一原则依然有效. 本研究所提出的改进结构洞方法充分利用邻居节点的度信息,从而能更好地识别高影响力节点. 3)平均值:平均值越大说明整体识别性能越好,由图可以看出,ISH 在3个数据集中都取得了最高的均值.2.2 模型参数影响分析αβz µα,β,z ,µδ2.2.1 参数、、、的影响 为了节省空间,设置={0.5,1.0,2.0},同时设置参数s 、=0.5,以更直观地观察这些参数对推荐性能的影响.由于实验数据过多,仅列出各个数据集中前5个P @10α=0.5,β,z >1,µ<1N 最好结果的参数配置,并统计每个数据集的最佳参数,如表2所示. 可以看出,不同的参数设置会导致不同的结果,并且在不同数据集上最佳参数也不相同. 在Epinions 、Ciao 、FilmTrust 中,最佳参数配置分别为{0.5,2.0,2.0,0.5}、{0.5,2.0,0.5,0.5}、{0.5,1.0,1.0,0.5},即当时,通常能得到最好的结果,表明在前项推荐中,应该减少用户相似度和影响力用户的影响,同时增加项目相似性和信任用户的影响.s δαβz µs δs =0.5δδss δ2.2.2 参数、的影响 在实验中,将、、、设为2.2.1节实验中得出的最优值,、在[0,1.0]以0.1的步长改变进行实验. 首先,设定,从而取得的一系列结果并确定,再反过来对进行实验,结果如图3所示. 可以看出,对于不同的数据集,适当的、可以帮助改善推荐性能,虽然达到卓越性能的值可能在不同的数据集中有所1008060−S i40200050100No (a) DC150200平均值: 44.11008060−S i40200050100No (b) SH1502001008060−S i40200050100No (c) ISH150200平均值: 55.2平均值: 46.0360345*********−S i285270050100No (d) DC150200平均值: 331.5360345*********−S i285270050100No (e) SH150200平均值: 331.9360345*********−S i285270050100No (f) ISH150200平均值: 333.3图 2 各算法得出的排名与实际影响力的相关性分析Fig.2 Correlation analysis between rankings obtained by each algorithm and actual influence表 2 3个数据集上精确率排名Top-5的参数配置Tab.2 Top 5 parameter configurations for precision on three datasets排名EpinionsCiaoFilmTrustP @10αβzµP @10αβzµP @10αβzµ10.010 4860.5 2.0 2.00.50.023 780.5 2.0 2.0 2.00.352 258 2.0 1.0 1.00.520.010 467 1.0 2.00.50.50.023 6090.50.50.50.50.351 964 2.00.5 2.0 2.030.010 379 2.0 1.0 2.00.50.023 411 1.0 2.0 1.0 1.00.351 8190.5 1.00.5 1.040.010 243 1.0 2.0 1.0 1.00.023 3960.5 2.0 1.00.50.351 819 1.0 1.00.50.550.010 2310.52.00.52.00.023 362.00.50.51.00.351 7750.50.50.50.5316浙 江 大 学 学 报(工学版)第 54 卷s δs δ不同,但、= 0和、= 1时的性能远远差于取大多数其他值时的性能. 可以得出结论:相比绝对的只考虑用户相似性或者信任者用户,不如将用户相似性、项目相似性,以及信任者和被信任者进行适当组合,这样能带来更好的推荐性能,这也是本研究的初衷.k k k =02.2.3 影响力用户数目的影响 在本研究所提方法中,选取影响力最大的前k %的用户作为全局影响力用户. 在社交网络中仅有少量用户具有明显的影响作用,所以最多选取前10%的用户进行实验. 为了验证参数对推荐性能的影响,以1的步长,从0到10修改,结果如图4所示. 可以看出,在Epinions 、Ciao 、FimlTrust 中的最佳值分别为2、4、7;在这3个数据集中,当时,即不考虑影响力用户时,结果是最差的,说明考虑影响力用户可以有效提高推荐精度.2.3 对比方法实验分析为了使实验不失偏向性,在Filmtrust 、Epin-ions 、Ciao 数据集上进行测试,并且验证算法在维度为5、10时的精度. 各种算法在3个数据集中的实验结果和分析如表3所示. 可以看出,1)FST 是基于FISM 的改进方法,在所有实验中,它都取得除本研究所提方法之外最好的结果,证明隐式反馈并融合社会信任的方法是可行的. 在FSTID-中同时融入社会影响力,并将被信任者用户的影响也纳入推荐中,实验结果表明本研究所提方法FSTID-比FST 的效果更好,说明融入影响力用户对提升推荐性能有较大帮助. 2)对比FSTID-与FSTID ,可以看出,FSTID 的性能总是优于FSTID-,表明相比于随机生成特征,采用自动编码器从原始数据进行特征提取更加有益于算法整体推荐性能的提升.2.4 算法复杂度和运行时间对比分析O (n t bd (|R |+|T |))n t bd 所提方法FSTID 的时间复杂度分析关键点在于目标函数和最优化求解过程的计算,总计算时间成本为,为训练矩阵的数目,为用户的平均已评分项目个数,为特征向量维0.010 00.009 80.009 60.009 4s δs δs δP @10P @100.009 20.023 50.023 00.022 50.022 00.021 50.021 0P @100.3530.3520.3510.3500.3490.3480.20.40.6s , δs , δs , δ(a) Epinions 0.81.00.20.40.6(b) Ciao0.81.00.20.40.6(c) Filmtrust0.81.0s δ图 3 参数、在3个数据集上的精确率结果s δFig.3 Precision results of parameter and on three datasetsP @100.010 350.010 050.010 200.009 900.009 750.009 600.009 45P @100.023 460.023 120.022 440.022 780.022 100.021 76P @100.352 000.352 160.351 680.351 840.351 520.351 36246k810(a) Epinions246k 810(b) Ciao 0246k810(c) Filmtrustk 图 4 参数在3个数据集上的精确率结果k Fig.4 Precision results of parameter on three datasets第 2 期张雪峰, 等:融合用户信任和影响力的top-N 推荐算法[J]. 浙江大学学报:工学版,2020, 54(2): 311–319.317度. 鉴于评分矩阵R和信任矩阵T较稀疏,FST-ID的时间复杂度远低于矩阵基数.为了进一步验证算法的效率,展示各算法分别在3个数据集上的运行时间,如表4所示. 考虑FSTID比FSTID-相对增加了读取特征矩阵文件的时间,在实际运行中,该时间差可忽略不计,为此仅展示FSTID运行时间. 由表4可以看出,FST-ID方法在保持较高推荐性能的前提下,在Ciao、FilmTrust这2个数据集上的运行时间较短,优于FST的运行时间. 在Epinions数据集上FISM和GBPR花费了最长的运行时间,且FST获得了除MostPop外最好的成绩. 与FST相比,FSTID虽然需要更久的运行时间,但差距并不明显,并且FSTID能有效提升推荐性能.3 结 语基于社会信任和影响力的个性化推荐算法,着重于利用社会网络中高影响力用户的信息传播能力,从而进一步提高推荐精度;同时利用自动编码器初始化用户和项目潜在特征向量,有效提升推荐算法的整体性能. 在FilmTrust、Epinions、Ciao这3个标准数据集上的对比实验结果证明本表 3 Top-N项目推荐对比实验结果Tab.3 Top-N item recommendation comparison experiment results数据集方法N=5N=10P@N F1@N NDCG@N P@N F1@N NDCG@NEpinions MostPop0.011 6900.012 980.012 3340.009 1710.013 050.016 238 GBPR0.009 3530.011 030.012 2960.007 5600.011 110.016 095 FISM0.011 4700.013 070.012 8080.009 0200.013 150.016 361 FST0.011 7900.013 300.013 9880.009 1870.013 280.016 930 FSTID-0.012 3100.014 020.014 3550.010 2400.014 590.017 588 FSTID0.012 4300.014 150.014 4700.010 4800.014 760.017 832Ciao MostPop0.026 7700.024 360.025 9060.021 4200.026 620.033 443 GBPR0.022 2800.020 630.022 3190.018 2700.021 160.028 759 FISM0.027 0400.024 950.026 1850.021 4100.026 870.032 510 FST0.027 4100.025 230.027 2400.021 7400.027 200.034 910 FSTID-0.028 3000.026 440.027 3890.023 2900.029 140.035 503 FSTID0.029 2400.026 820.027 6340.023 6100.029 500.035 932FilmTrust MostPop0.417 0000.409 500.409 5290.350 3000.451 800.538 924 GBPR0.412 4000.405 100.372 9230.347 0000.445 800.500 997 FISM0.417 1000.408 700.413 4040.350 3000.451 600.540 511 FST0.419 1000.409 900.419 3510.351 4000.452 100.545 109 FSTID-0.419 8000.411 600.426 2730.353 2000.454 100.547 688 FSTID0.420 5000.412 400.427 5690.353 3000.454 800.551 260表 4 各算法在3个数据集上的实际运行时间Tab.4 Actual runtime of each algorithm on three datasets min数据集MostPop GBPR FISM FST FSTIDEpinions8.9897.20106.2047.0063.60Ciao0.38 8.86 7.7020.0011.61FilmTrust0.05 0.92 1.34 5.00 3.83 318浙江大学学报(工学版)第 54 卷研究所提方法FSTID 的有效性和较高推荐精度,特别是对于稀疏用户,能够取得明显的提高.此外,在实验中发现仍有一些问题值得进一步研究. 一方面,在识别影响力用户时,没有考虑信任的领域相关性从而导致识别出的影响力用户不是用户所期望领域的影响用户;另一方面,如果仅在信任网络的一个静态快照上识别影响用户而忽略信任网络的动态性,会导致识别出影响力已经消失或变弱的影响用户. 后续将继续引入主题和时间的概念,致力于研究如何根据用户的评分时间来计算用户对项目喜好的动态变化以及信任的动态变化,以便能够更及时地推荐符合用户偏好的项目.参考文献(References):MOONEY R J, ROY L. Content-based book recommending usinglearning for text categorization [C]// Proceedings of the 5th ACM Conference on Digital Libraries . San Antonio: ACM, 2000:195–204.[1]RESNICK P, IACOVOU N, SUCHAK M, et al. GroupLens: anopen architecture for collaborative filtering of netnews [C]//Proceedings of the 1994 ACM Conference on Computer Supported Cooperative Work . North Carolina: ACM, 1994:175–186.[2]BALABANOVI M, SHOHAM Y. Fab: content-based,collaborative recommendation [J]. Communications of the ACM ,1997, 40(3): 66–72.[3]MARSDEN P V, FRIEDKIN N E. Network studies of socialinfluence [J]. Sociological Methods and Research , 1993, 22(1):127–151.[4]KAUTZ H, SELMAN B, SHAH M. Referralweb: combiningsocial networks and collaborative filtering [J]. Communications of the ACM , 1997, 40(3): 63–65.[5]MA H, YANG H, LYU M R, et al. Sorec: social recommendationusing probabilistic matrix factorization [C]// Proceedings of the 17th ACM Conference on Information and Knowledge[6]Management . California: ACM, 2008: 931–940.YANG B, LEI Y, LIU J, et al. Social collaborative filtering bytrust [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence , 2017, 39(8): 1633–1647.[7]JAMALI M, ESTER M. A matrix factorization technique withtrust propagation for recommendation in social networks [C]//Proceedings of the 4th ACM Conference on Recommender Systems . New York: ACM, 2010: 135–142.[8]MA H, ZHOU D, LIU C, et al. Recommender systems with socialregularization [C]// Proceedings of the 4th ACM International Conference on Web Search and Data Mining . Hong Kong:ACM, 2011: 287–296.[9]GUO G, ZHANG J, YORKE-SMITH N. A novel recommendationmodel regularized with user trust and item ratings [J]. IEEE Transactions on Knowledge and Data Engineering , 2016,28(7): 1607–1620.[10]KOREN Y. Factorization meets the neighborhood: a multifacetedcollaborative filtering model [C]// Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining . Las Vegas: ACM, 2008: 426–434.[11]BURT R S. Structural holes: the social structure ofcompetition [M]. Cambridge: Harvard university press, 2009.[12]GUO G, ZHANG J, ZHU F, et al. Factored similarity models withsocial trust for top-N item recommendation [J]. Knowledge-based Systems , 2017, 122: 17–25.[13]RENDLE S, FREUDENTHALER C, GANTNER Z, et al. BPR:Bayesian personalized ranking from implicit feedback [C]//Proceedings of the 25th Conference on Uncertainty in Artificial Intelligence . Montreal: ACM, 2009: 452–461.[14]PAN W, CHEN L. GBPR: group preference based bayesianpersonalized ranking for one-class collaborative filtering [C]//Twenty-Third International Joint Conference onArtificial Intelligence . Beijing: ACM, 2013: 2691–2697.[15]KABBUR S, NING X, KARYPISs G. Fism: factored itemsimilarity models for top-N recommender systems [C]//Proceedings of the 19th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining .Chicago: ACM, 2013: 659–667.[16]第 2 期张雪峰, 等:融合用户信任和影响力的top-N 推荐算法[J]. 浙江大学学报:工学版,2020, 54(2): 311–319.319。
一种基于用户信任和卷积神经网络的个性化推荐方法[发明专利]
![一种基于用户信任和卷积神经网络的个性化推荐方法[发明专利]](https://img.taocdn.com/s3/m/9f70426571fe910ef02df805.png)
专利名称:一种基于用户信任和卷积神经网络的个性化推荐方法
专利类型:发明专利
发明人:王建芳,苗艳玲,韩鹏飞,王滢溪,张秋玲,桑大朋,罗最,郑丞甫
申请号:CN201810539162.0
申请日:20180530
公开号:CN110555161A
公开日:
20191210
专利内容由知识产权出版社提供
摘要:本发明公开了一种基于用户信任和卷积神经网络的个性化推荐方法,该方法应用于具有社交网络用户之间的信任和项目描述文档等信息的协同过滤推荐,该方法包括:1)通过第三方数据,分析用户的历史评分,获取用户‑项目评分矩阵;2)基于用户社交网络,计算用户之间信任值;3)利用卷积神经网络模型,从项目描述文档提取文档特征向量;4)利用用户评分数据、用户之间的信任值和文档特征向量计算用户和项目的潜在特征向量;5)利用用户和项目的潜在特征向量预测评分并进行个性化推荐。
本发明考虑了个性化推荐中的用户之间信任问题,并融合了卷积神经网络模型,以提升相似度的计算方式从而进行个性推荐,提高了推荐的准确性和效率。
申请人:河南理工大学
地址:454004 河南省焦作市高新区世纪路2001号河南理工大学
国籍:CN
更多信息请下载全文后查看。
《基于信任的协同过滤推荐算法研究》范文

《基于信任的协同过滤推荐算法研究》篇一一、引言随着互联网技术的快速发展和大数据时代的到来,推荐系统在许多领域如电子商务、社交网络和在线媒体平台等发挥着重要作用。
协同过滤是推荐系统中最常用的一种算法,其主要依赖于用户和项目之间的关系。
传统的协同过滤推荐算法主要通过计算用户间的相似度进行推荐,而信任在人际关系中具有举足轻重的地位。
因此,本文旨在研究基于信任的协同过滤推荐算法,以更好地提升推荐系统的准确性和用户满意度。
二、基于信任的协同过滤推荐算法概述基于信任的协同过滤推荐算法,顾名思义,是在传统的协同过滤算法基础上,融入了用户之间的信任关系。
这种方法利用用户的社交网络和交互数据,衡量用户间的信任程度,然后利用这种信任关系进行更准确的推荐。
在构建基于信任的协同过滤推荐算法时,需要考虑以下方面:1. 信任关系的获取:这通常通过分析用户的社交网络、交互记录、评分数据等获得。
2. 信任度的计算:根据不同的数据源和上下文,采用不同的算法计算用户间的信任度。
3. 推荐策略的制定:结合用户的兴趣和信任关系,制定合适的推荐策略。
三、算法研究(一)信任关系的获取与表示在推荐系统中,信任关系的获取主要依靠用户的社会网络信息和行为数据。
具体来说,可以结合用户的评分记录、交互记录、社交网络结构等信息,通过机器学习和图论等方法提取用户间的信任关系。
此外,还可以利用用户对其他用户的评价、反馈等数据来进一步确定信任关系。
这些信任关系可以用图模型、矩阵等形式进行表示。
(二)信任度的计算信任度的计算是算法的核心部分。
常用的计算方法包括基于用户评分的相似度计算法、基于用户行为的马尔科夫链法、基于图模型的PageRank算法等。
此外,还可以考虑结合用户的行为时间、行为频率等动态因素来计算信任度。
在实际应用中,往往需要综合考虑多种因素,根据具体情况选择合适的计算方法。
(三)推荐策略的制定在制定推荐策略时,需要综合考虑用户的兴趣和信任关系。
《2024年基于信任的协同过滤推荐算法研究》范文

《基于信任的协同过滤推荐算法研究》篇一一、引言随着互联网的快速发展和大数据时代的到来,信息过载问题日益严重。
为了解决这一问题,推荐系统应运而生,其中协同过滤推荐算法是应用最广泛的推荐技术之一。
然而,传统的协同过滤推荐算法在处理大规模数据和稀疏数据时存在一定局限性。
因此,本文提出了一种基于信任的协同过滤推荐算法,旨在提高推荐准确性和用户体验。
二、相关研究背景协同过滤推荐算法是一种基于用户行为数据的推荐技术,其核心思想是利用用户的历史行为数据预测用户的未来兴趣。
然而,传统的协同过滤推荐算法在处理用户评分数据时,忽略了用户之间的信任关系。
信任关系在社交网络中具有重要意义,能够提高推荐的准确性和可信度。
因此,基于信任的协同过滤推荐算法成为了研究热点。
三、基于信任的协同过滤推荐算法(一)算法原理基于信任的协同过滤推荐算法的核心思想是利用用户之间的信任关系来改进传统的协同过滤推荐算法。
具体而言,该算法首先构建用户之间的信任网络,然后利用该网络中的信任关系来调整用户相似度计算,从而更准确地预测用户对商品的评分。
(二)算法实现步骤1. 构建用户信任网络:通过分析用户的历史行为数据和社交网络数据,构建用户之间的信任网络。
在信任网络中,每个用户都与其他用户存在一定程度的信任关系。
2. 计算用户相似度:在考虑了信任关系的基础上,计算用户之间的相似度。
这可以通过使用余弦相似度等方法来实现。
3. 预测用户评分:根据用户相似度和信任关系,预测用户对未评分商品的评分。
这可以通过加权平均等方法来实现。
4. 生成推荐列表:根据预测的评分,为用户生成推荐列表。
推荐列表中的商品按照预测评分从高到低排序。
四、实验与分析(一)实验数据集为了验证基于信任的协同过滤推荐算法的有效性,我们使用了两个公开的数据集进行实验。
实验数据集包括电影评分数据集和购物网站商品购买数据集。
(二)实验结果与分析我们对比了基于信任的协同过滤推荐算法与传统协同过滤推荐算法在两个数据集上的表现。
基于信任机制的社交网络中的推荐算法研究

基于信任机制的社交网络中的推荐算法研究随着社交网络的迅速发展,社交网络上的算法也变得越来越重要。
社交网络成为了人们分享思想、生活和信息的主要平台。
随着社交网络的扩大和快速增长,用户在社交网络上面受到了更多的信息推荐。
然而,不同的用户在社交网络上受到的推荐信息也不同。
因为推荐算法基于用户的兴趣、行为和其他因素,这些因素对信息推荐起重要的作用。
同时,社交网络上的推荐算法通常是基于信任机制的。
因此,本文将探讨基于信任机制的社交网络中的推荐算法研究。
第一篇: 基于信任机制的社交网络在社交网络上,用户之间的信任关系非常重要。
基于信任机制的社交网络是指用户之间建立了一种信任机制,即用户之间建立的关系。
这种信任关系有很多种表现形式,如关注、点赞、评论等。
这些行为都可以建立用户之间信任的基础,并且推荐算法可以利用这些信任关系对用户提供更好的推荐。
因此,社交网络上的基于信任机制的推荐算法可以利用信任关系对用户进行以下推荐:1. 基于用户关注的推荐社交网络上,用户之间通常会相互关注并加强社交网络中的关系。
用户之间存在关注关系时,推荐算法可以利用这种关系通过用户的关注的人来推荐内容。
这种推荐算法是基于用户关注行为的。
推荐算法可以通过分析用户的关注行为和他们的兴趣点,来找到适合的内容进行推荐。
这种信任机制的推荐算法可以更好地满足用户的兴趣和需求。
2. 基于用户行为的推荐用户在社交网络上的行为信息也能够建立信任关系并且进行推荐。
比如,一个用户在他的时间线上聊天、点赞和评论一些内容时,推荐算法可以利用这些信息并以此推荐适当的信息。
这种推荐算法是基于用户行为的。
推荐算法可以通过分析用户的行为,例如评论和点赞分析,来向用户推荐最适合的内容。
3. 基于用户社交网络的推荐用户在社交网络上不仅仅是与其他人交流,也会形成一个社交网络。
这个网络可以被看作是一口井,而这口井的水来源则是用户之间的社交联系。
基于这种社交网络关系,推荐算法可以根据用户之间的联系进行推荐。
《基于信任的协同过滤推荐算法研究》范文

《基于信任的协同过滤推荐算法研究》篇一一、引言随着互联网的快速发展和大数据时代的到来,信息过载问题日益严重。
为了解决这一问题,推荐系统应运而生,成为了现代信息处理的重要手段。
其中,协同过滤推荐算法因其简单有效而备受关注。
然而,传统的协同过滤算法往往忽略了用户之间的信任关系。
基于信任的协同过滤推荐算法研究旨在弥补这一不足,通过引入信任关系来提高推荐准确性。
本文将探讨基于信任的协同过滤推荐算法的原理、方法及实验结果。
二、背景与意义传统的协同过滤推荐算法主要依据用户的历史行为数据,如浏览、购买、评价等,来预测用户的未来兴趣。
然而,这些算法往往忽视了用户之间的信任关系,导致推荐结果有时偏离用户真实需求。
基于信任的协同过滤推荐算法通过引入用户之间的信任关系,可以更准确地反映用户的兴趣和需求,从而提高推荐准确性。
此外,该算法还有助于增强用户之间的互动和社交性,提升推荐系统的用户体验。
三、算法原理基于信任的协同过滤推荐算法主要包含以下步骤:1. 构建信任网络:根据用户的历史行为数据和社交网络信息,构建一个信任网络。
在这个网络中,节点表示用户,边表示用户之间的信任关系。
2. 计算信任度:通过分析用户的历史行为数据和社交网络信息,计算用户之间的信任度。
信任度反映了用户之间关系的紧密程度和可靠性。
3. 协同过滤:利用计算得到的信任度,对用户的兴趣进行协同过滤。
具体而言,通过分析目标用户的邻居用户的兴趣和行为,以及这些邻居用户与目标用户之间的信任度,为目标用户生成推荐结果。
4. 推荐结果优化:根据用户的反馈信息和实时数据,对推荐结果进行优化和调整,以提高推荐准确性和用户体验。
四、方法与技术在实现基于信任的协同过滤推荐算法时,需要采用以下技术和方法:1. 数据预处理:对用户的历史行为数据进行清洗、去重和格式化等预处理操作,以便后续分析。
2. 信任网络构建:采用图论、机器学习和深度学习等技术,根据用户的历史行为数据和社交网络信息构建信任网络。
《2024年度基于信任的协同过滤推荐算法研究》范文

《基于信任的协同过滤推荐算法研究》篇一一、引言在当今的信息时代,互联网技术的飞速发展使得人们面临着一个严重的问题——信息过载。
为了从大量的信息中筛选出用户感兴趣的内容,推荐系统应运而生。
协同过滤推荐算法作为推荐系统中的核心算法之一,一直受到广泛关注。
然而,传统的协同过滤算法在处理稀疏性和冷启动问题时存在一定局限性。
因此,本文提出了一种基于信任的协同过滤推荐算法,以提高推荐系统的准确性和效率。
二、协同过滤推荐算法概述协同过滤推荐算法是一种基于用户行为数据的推荐方法,通过分析用户的历史行为数据,找出相似用户或物品,从而为用户提供推荐。
常见的协同过滤算法包括基于用户的协同过滤和基于物品的协同过滤。
基于用户的协同过滤主要是通过寻找与目标用户兴趣相似的其他用户,然后根据这些用户的喜好为目标用户提供推荐。
而基于物品的协同过滤则是通过分析用户对物品的评分或行为,找出与目标物品相似的其他物品,然后推荐给目标用户。
三、基于信任的协同过滤推荐算法本文提出的基于信任的协同过滤推荐算法,主要思想是在传统的协同过滤算法中引入信任关系。
具体而言,通过分析用户之间的社交网络关系、历史交互记录等,构建一个信任关系网络。
在这个网络中,信任度高的用户对目标用户的推荐将具有更高的权重。
同时,考虑到不同领域专家的信任度可能更高,该算法还结合了领域知识,对专家用户的推荐给予更大权重。
四、算法实现与优化在实现基于信任的协同过滤推荐算法时,首先需要构建一个完整的信任关系网络。
这可以通过分析用户的社交网络、历史交互记录、评价一致性等多种途径实现。
然后,根据信任关系网络计算用户之间的信任度。
在此基础上,结合传统的协同过滤算法,为用户提供推荐。
为了提高算法的准确性和效率,本文还提出了一系列优化措施。
首先,采用矩阵分解技术对用户-物品评分矩阵进行降维处理,以减少计算复杂度。
其次,引入时间因素,考虑用户兴趣的动态变化。
此外,还采用了多种融合策略,将不同来源的信息进行整合,以提高推荐的准确性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Trust-based Recommender Algorithm Using the Properties of TrustNetworkZhang Guangqian a and He Youqin bFaculty of Management and Economics, Dalian University of Technology, Dalian, Liaoning, Chinaa zhgq@, b250010835@Keywords: Trust, Trust Network, Recommender System, Small-world Network.Abstract. The trust network is a social network where nodes are inter-linked by their trust relations.Trust-based recommender systems have made many contributions to improve the performance and overcome some limitations of recommender systems. However, little is known about the structural properties of trust network. And little exploration of using these properties to develop novel trust-based recommender model has been done. We leveraged implicit trust information to developa trust network, and illustrated that this trust network is a dynamic small-world network byanalysing its properties. Finally, we proposed a novel trust-based recommender algorithm using the properties of trust network. Experimental results clear showed that: our proposed algorithm is superior to the classic collaborative filtering on the accuracy performance.利用信任网络特性的基于信任的推荐算法张光前a, 何友沁b大连理工大学管理与经济学部,大连,辽宁,中国a zhgq@, b250010835@关键词:信任; 信任网络; 推荐系统; 小世界网络中文摘要.信任网络是由社区中的节点和节点间因信任关系连接的边所组成的网络。
基于信任的推荐系统在提高系统表现和克服推荐系统的不足的方面做出了许多贡献,但对信任网络的拓扑结构特性的研究,以及利用这些特性建立模型的探索还很少。
本文利用隐性信任信息构造了一个信任网络,分析其结构特性,说明这个网络是一个动态的小世界网络。
利用信任网络的结构特性提出一个新的基于信任的推荐算法。
实验结果显示:该算法在精确度上的表现优于经典的协同过滤算法。
1.引言自推荐系统[1]提出以来,就一直受到重要关注。
推荐系统能帮助用户在数目繁多和复杂的项目中找到自己感兴趣的商品和服务。
通常,协同过滤被认为是在推荐系统中被应用最广泛的技术[2],因它的简单和有效性。
然而,因为系统稀疏性[3]的存在,影响了协同过滤在精1275-049-1/10/$25.00 ©2013 IERI ERMI 2012确度和覆盖率[4]上的表现。
还因为协同过滤易受恶意攻击的影响,导致用户失去对系统的信任,降低推荐的精确度。
基于信任的推荐系统被证实能够很好地解决这些问题[5][6][7]。
基于信任的推荐系统简单的说,就是在构建推荐算法时,利用了信任这个概念。
其中,对信任的理解通常是:用户基于推荐者的能力和行为,在某个情境下,在某个具体时刻,相信推荐者的推荐的一种意愿。
如,在文献[8-15]中,都利用了信任这个概念,提出新的算法,去解决传统推荐算法的不足。
信任网络是这方面研究当中的一个重要概念。
它是由社区中的节点(用户)和节点间因信任关系连接的边所组成的网络。
利用信任在信任网络上的传播,可以有效地解决系统稀疏性问题。
信任网络的形成来源于系统中的显性信任信息或隐性信任信息[15]。
显性信息,如用户对其他用户的直接信任声明;隐性信息,如用户对项目的评分。
现有的基于信任的推荐系统主要关注于对显性信任声明的使用。
它的不足在于获取显性信任费时费力,并且,大多数用户对个人隐私敏感,出于保护自己的意愿,并不愿给出自己的信任声明。
因此,在大多数的推荐系统中显性信任并不可行。
再者,虽然信任网络已经广泛应用于推荐系统当中,但对将网络的拓扑特性应用于基于信任的推荐系统的研究还很少。
本文利用隐性信任信息构建信任网络,分析网络的特性,将其利用在推荐算法中,在协同过滤算法的基础上提出了一个新的基于信任的推荐算法。
最后,用实验验证该算法与经典协同过滤相比在精确度上的优势。
2.相关工作正如上节所提到的,对基于信任的推荐系统的研究已经很多了。
其中,具有代表性的是由Massa 等人[8]提出的一个基于信任的推荐系统。
系统的输入是两个矩阵:用户信任关系矩阵和用户—项目评分矩阵。
关系矩阵来源于用户对其他用户的显性信任声明,反映用户间的信任关系;评分矩阵来源于用户对项目的评分,记录了用户对项目的评分。
输出是由系统生成的对用户的未评分项目的预测评分矩阵。
大多数基于信任的推荐系统产生预测评分的机制与经典协同过滤相似[19],其算法核心是Resnick 提出的标准预测公式,如式(1):∑∑∈∈−+=)()(,,)(c R j ijc R j j c j ij i c i sim r r sim r p (1) 其中, c i p ,是系统生成的用户对项目c 的预测评分。
i r 是用户i 的平均项目评分。
)(c R 是对项目c 评过分的用户集合。
ij sim 表示用户i 和用户j 的相似度,一般利用皮尔逊相关系数求得。
c j r ,是推荐用户j 对项目c 的评分,来自评分矩阵。
比如,在文献[4]中,O’Donovan 等人利用信任—相似度混合权重法,即式(2)、(3),将信任加入到推荐当中。
∑∑∈∈−+=)()(,,)(c R j ijc R j j c j ij i c i w r r w r p (2) ij ij ijij ij T sim T sim w +=2 (3)其中,ij w 就是信任-相似度混合权重,ij T 表示用户i 对用户j 的信任度。
基于信任的推荐系统的研究对信任关系和信任度的构造和使用都有不同的方法和理论。
这方面的研究主要就是集中于对信任模型的研究,在提高系统表现和克服之前推荐系统的不足方面做出了许多贡献[16]。
但是,对信任网络的拓扑特性的研究,以及利用这些特性建立模型的探索还很少。
目前知道的一个工作是Weiwei Yuan 等人[15]提出的,一个利用网络特性的推荐算法。
这篇文献基于Massa 等人在文献[15]中提出的信任模型,通过分析多个信任网络的特性,利用网络特性去确定模型中的一个重要参数。
其中,所用的信任信息是用户的显性信任声明。
然而,正如上节提到的,在大多数的推荐系统中显性信任并不可行。
所以,在接下来的一节中,本文将提出一个新的利用隐性信任信息构建信任网络的方法,并分析该信任网络的拓扑特性。
3.信任网络的拓扑特性在这一节中,本文先从用户—项目评分矩阵中获取隐性信任信息,然后基于隐性信任信息构建隐性信任网络。
用实验证明,该网络是一个小世界网络,并更进一步,说明它是一个动态的小世界网络。
3.1 隐性信任信息构建信任网络大多数推荐系统都不具备显性的用户声明,如果要推测用户间信任关系只能通过其他数据。
如,用户对项目评分用户网页浏览行为、用户购买行为等。
文献[10][11]在利用这些数据,推测用户间信任关系上做了有益探索。
本文也提出了一种新的推测方法。
绝大多数的推荐系统都记录有用户对项目的评分,即用户—项目评分矩阵。
这样,可以知道用户对哪些项目评过分,以及评分是多少。
本文做如下假定:如果系统中有两个用户对同一个项目的评分相同,那么系统就认为这两个用户有直接“信任”关系,并记录下这两个用户间这样的项目的个数,用ij η表示,反映两用户间信任关系的强度。
然后可以建立如下的用户信任矩阵:n i u u u 1n i i u u u ⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡0001111ni n in i n i ηηηηηη 0=ii η ),,2,1(n i …=显然,ji ij ηη=,即用户信任矩阵是对称阵。
这样就利用隐性信任信息建立了用户信任关系矩阵。
自然的,就可以导出用户信任网络了,用户作为节点,信任关系作为连接节点的边。
注意,矩阵中元素取值不只是0和1,即信任网络是一个加权网络。
本文利用信任关系矩阵时,做了这样的处理:把矩阵中大于零的元素都当作1。
这样,信任网络就是一个无向无权网络。
3.2 小世界网络在介绍实验之前,对小世界网络做一个简单说明。
小世界网络具有以下特性[17]:聚类系数高;平均路径长度短。
3.3 信任网络的实验分析在这一部分,本文利用数据集Movielens ,用实验证明提出的信任网络是一个小世界网络。
3.3.1 实验设置Movielens 数据集包含了943个用户,以及这些用户对其中1682个电影的10万个评分。
其中,每个用户至少对20个电影进行了评分。
Movielens 数据集是由明尼苏达大学的Gruoplens 研究项目,在1997年至1998年期间收集得到。
经过计算统计,将信任网络的特性总结在表1中。
表1 信任网络的特性网络类型节点数n网络中边数M平均节点度><k平均路径长度L网络直径D聚类系数C 无向943 366962 778.3 1.17 2 0.87 3.3.2 实验结果实验证明了本文构造的信任网络是一个小世界网络。
小世界特性:信任网络具有很高的聚类系数;平均路径长度很短,网络直径。
网络的节点度分布如图1所示,图1 信任网络节点度分布图2是节点度分布的一个近似图。
实际上,最小节点度为301,最大节点度为940。
结合图2,可以得到这样的结论,网络中节点的度都很高,并主要集中于600到940之间。