微博推荐系统-用户兴趣模型

合集下载

基于链接分析和用户兴趣的微博社区发现算法

基于链接分析和用户兴趣的微博社区发现算法

基于链接分析和用户兴趣的微博社区发现算法基于链接分析和用户兴趣的微博社区发现算法1. 引言社交媒体的爆发式增长带来了大量用户生成的内容,如微博。

微博社区的发现对于理解用户之间的连接和相似性非常重要。

本文将介绍一种基于链接分析和用户兴趣的微博社区发现算法,旨在帮助人们更好地理解和利用微博社交网络。

2. 微博链接分析算法链接分析是一种广泛应用的算法,用于发现网络中节点之间的关系。

在微博社区发现中,我们可以通过分析用户之间的关注关系建立链接图。

具体而言,我们可以将微博用户表示为网络中的节点,而关注关系则表示为节点之间的链接。

通过构建节点和链接的网络模型,我们可以应用诸如PageRank算法等链接分析算法,来衡量节点的重要性和社区结构。

3. 用户兴趣模型为了更准确地发现微博社区,我们需要考虑用户的兴趣。

用户兴趣是用户在社交网络中互动行为的反映,可以通过分析用户的微博内容来构建用户兴趣模型。

我们可以提取用户发表的微博文本中的关键词、主题等信息,以及用户对其他用户微博的评论和转发行为,来揭示用户的兴趣。

4. 基于链接分析和用户兴趣的微博社区发现算法本文提出的微博社区发现算法包括以下几个步骤:4.1 构建微博用户网络模型根据用户之间的关注关系构建微博用户的链接图,节点表示用户,链接表示关注关系。

为了获得更准确的社区发现结果,我们可以考虑对关注关系进行加权,例如根据用户之间的互动频率和互动方式给链接赋予权重。

4.2 应用链接分析算法根据构建的用户网络模型,应用链接分析算法来衡量用户的重要性和社区结构。

例如,我们可以使用PageRank算法计算用户的PageRank值,值高的用户可能是社区的核心用户。

通过聚类分析等方法,可以将用户划分到不同的社区中。

4.3 构建用户兴趣模型根据用户发表的微博内容提取关键词、主题等信息,构建用户的兴趣模型。

可以使用文本挖掘和机器学习等技术来提取用户兴趣。

4.4 应用用户兴趣模型结合用户的兴趣模型和链接分析结果,可以更准确地发现微博社区。

推荐系统起手式-几种简单推荐模型(基于内容的推荐)

推荐系统起手式-几种简单推荐模型(基于内容的推荐)

推荐系统起⼿式-⼏种简单推荐模型(基于内容的推荐)⼀.基于内容的推荐所谓基于内容信息的推荐系统,其实就是⽤特征(Feature)来表⽰⽤户、物品以及⽤户和物品的交互,从⽽能够把推荐问题转换成为监督学习任务。

把推荐系统完全定义为监督学习任务,需要有这么⼏个步骤。

第⼀,就是我们已经提到的,需要把所有⽤户、物品的各种信号⽤特征来表⽰。

这⾥⾯往往牵涉⾮常复杂和繁琐的特征⼯程,也就是看如何能够把不同的信息通过特征表达出来。

第⼆,就是每⼀个监督任务都需要⾯临的问题,如何构造⼀个⽬标函数,来描述当前的场景。

可以说,这是最难的⼀个部分,也是和基于流⾏度和基于相似度的推荐系统的最⼤区别。

⼆.⽤户特征信息⽤户向量化后的结果,就是 User Profile,俗称“⽤户画像”。

对于⽤户来说,最基础、最⾸要的肯定是⽤户的基本特性,包括性别、年龄、地理位置。

这三⼤信息其实可以涵盖⽤户特性⼯程中⾮常⼤的⼀块内容。

这⾥不仅是最基本的这三个特性的值,还有围绕这三个特性发展出来的三⼤种类的特性。

⽐如,不同性别在⽂章点击率上的差异,不同年龄层在商品购买上的差异,不同地理位置对不同影视作品的喜好等,这些都是根据这三个特性发展出来的更多的特性。

然后,我们可以为⽤户进⾏画像(Profiling)。

有显式的⽤户画像,⽐如⽤户⾃⼰定义的喜好,或者⽤户⾃⼰认为不愿意看到的物品或者类别。

但是在⼤多数情况下,⽤户都不会为我们提供那么精准的回馈信息,甚⾄完全不会有任何直接的反馈。

在这样的情况下,绝⼤多数的⽤户画像⼯作,其实是通过⽤户的“隐反馈”(Implicit Feedback),来对⽤户的喜好进⾏建模。

关于如何进⾏⽤户画像,我们今天就不在这⾥展开了。

针对⽤户画像我们还需要强调⼏点,⾸先每个维度的名称都是可理解的。

其次是维度的数量特征⼯程⾃由决定的。

假如是根据⽤户的阅读历史挖掘阅读兴趣标签,那么我们⽆法提前知道⽤户有哪些标签,也就不能确定⽤户画像有哪些维度,所以第⼆点也不是必须的。

网络推荐系统中常见的用户反馈问题分析

网络推荐系统中常见的用户反馈问题分析

网络推荐系统中常见的用户反馈问题分析随着互联网的迅速发展,网络推荐系统成为用户获取信息和产品的重要途径。

然而,与此同时,用户对网络推荐系统中的问题也日益关注和反馈。

本文将针对网络推荐系统中常见的用户反馈问题展开分析和讨论。

一、推荐内容不准确在网络推荐系统中,精确推荐用户感兴趣的内容是其核心功能。

然而,用户反馈中最常见的问题之一就是推荐内容的准确性不高。

这可能是由于以下原因造成的:1.用户兴趣模型不准确:推荐系统的算法依赖于用户的历史行为和个人信息来构建兴趣模型。

然而,用户的兴趣是经常变化的,且用户行为数据的采样和分析可能存在偏差,从而影响了兴趣模型的准确性。

2.信息过滤不完善:推荐系统往往通过过滤算法来确定推荐内容。

然而,有些推荐系统的过滤算法可能存在不完善的情况,过度过滤或者未能过滤掉用户不感兴趣的内容,从而影响推荐的准确性。

解决以上问题的方法包括改进用户兴趣模型的构建算法,引入更准确的数据采样和分析策略,以及优化推荐系统的过滤算法等。

二、推荐内容缺乏多样性网络推荐系统往往会根据用户的历史行为和个人信息,推荐与其兴趣相关的内容。

然而,一些用户反馈称推荐内容过于单一,缺乏多样性。

这主要由以下原因引起:1.推荐系统的算法限制:某些推荐算法可能过于依赖用户历史行为和个人信息,并在推荐过程中少考虑其他相关兴趣领域。

这导致了推荐内容的单一性。

2.难以融入新的兴趣方向:推荐系统需要不断学习用户的新兴趣,才能提供多样化的推荐内容。

然而,用户的兴趣经常变化,推荐系统可能难以及时捕捉到用户的新兴趣。

增加推荐内容的多样性可以通过引入更加综合和智能的推荐算法,加强与用户的交互,主动收集用户的反馈意见等方式实现。

三、推荐内容重复性高除了缺乏多样性,一些用户还反映在网络推荐系统中遇到了推荐内容的重复。

这可能会导致用户疲劳和对推荐系统的不信任。

造成该问题的原因主要包括:1.过度的推荐:有些推荐系统可能会过度推荐某些内容,导致用户在短时间内不断看到相同的推荐结果。

推荐系统的工作原理

推荐系统的工作原理

推荐系统的工作原理推荐系统是一种应用于电子商务、社交媒体、内容平台等领域的重要技术,它通过分析用户的历史行为和特征,为用户提供个性化的推荐信息。

在现如今海量信息的时代,推荐系统可以帮助用户发现有趣的内容、节省搜索时间,提高用户体验。

一、用户建模推荐系统首先需要对用户进行建模。

建模主要包括用户行为数据的采集和用户特征的提取。

用户行为数据可以包括点击记录、购买记录、评分记录等。

通过分析用户的行为数据,可以了解用户的兴趣爱好、购买偏好等信息。

同时,还可以从用户的个人信息、性别、年龄等特征中提取用户的特征,用于后续的推荐计算。

二、物品建模推荐系统还需要对物品进行建模。

物品可以是商品、新闻、视频等内容。

对于每个物品,系统需要从中提取出一些关键特征,用于计算与用户兴趣的匹配度。

例如,对于商品,可以提取商品的属性、品牌、价格等特征。

三、推荐算法推荐系统通过推荐算法来为用户生成个性化推荐。

推荐算法的选择和设计非常重要,不同的算法适用于不同的场景和应用。

目前常用的推荐算法包括基于内容的推荐、协同过滤推荐、深度学习推荐等。

1.基于内容的推荐算法基于内容的推荐算法主要是根据用户的历史行为和物品的内容特征来计算用户-物品的匹配度。

这种算法适用于物品的内容信息丰富的场景,例如新闻推荐、音乐推荐等。

它可以根据用户的偏好,向用户推荐与其兴趣相关的内容。

2.协同过滤推荐算法协同过滤推荐算法是通过分析用户的行为数据来计算不同用户之间的相似性,然后根据相似用户的行为来为用户生成推荐。

这种算法适用于用户行为数据相对丰富的场景,例如电子商务平台。

它可以利用用户之间的行为关联性,向用户推荐与其购买历史相似的商品。

3.深度学习推荐算法深度学习推荐算法是近年来发展起来的一种推荐算法。

它通过深度神经网络来对用户和物品进行建模,并通过学习用户和物品之间的潜在关系来生成推荐。

这种算法适用于数据规模庞大、特征复杂的场景,例如社交媒体平台。

四、推荐结果过滤与排序推荐系统生成的推荐结果往往是一个列表,系统需要对这个列表进行过滤和排序,以提供最合适的推荐信息给用户。

推荐系统中的用户行为建模

推荐系统中的用户行为建模

推荐系统中的用户行为建模推荐系统是一种重要的智能化应用,可以为用户提供精准的个性化服务,这些服务的实现主要归功于使用者的数据行为建模。

本文将详细探讨一下推荐系统中的用户行为建模。

一、推荐系统简介推荐系统是一种利用用户历史行为和用户属性进行分析的智能化应用技术,主要通过对用户的兴趣爱好进行建模,在用户的可能喜好范围内做出相应的推荐。

推荐系统可以为用户提供精准的个性化服务,比如,通过推荐电影、书籍、音乐等娱乐产品来满足用户特定的需求。

二、推荐系统中的用户行为建模推荐系统的核心是用户行为建模,即如何从用户的行为中获取信息,建立一个模型来预测这个用户未来的行为。

在推荐系统中,常见的用户行为包括:1.浏览:用户浏览某个商品或者某个网页;2.购买:用户购买某个商品或者某个服务;3.查看:用户查看某个视频或者文章;4.评价:用户对某个商品或者服务进行评价;5.收藏:用户收藏某个商品或者服务。

这些行为本质上是一种交互,即用户与系统的交互。

通过对这些交互进行分析,可以获取用户的兴趣偏好,进而实现个性化推荐。

三、推荐系统中的用户行为建模方法推荐系统中的用户行为建模方法有很多,并且不同的推荐算法会采用不同的模型。

具体的方法如下:1.关联规则挖掘关联规则挖掘是一种常用的用户行为挖掘方法,它可以通过用户的行为关联度分析,建立模型来预测用户的兴趣偏好。

2. 矩阵分解矩阵分解是一种常用的推荐算法,它使用一个低维度的欧几里得空间来描述用户和物品之间的关系。

通过矩阵分解,可以将用户和物品映射到同一维度的向量空间中,这样就方便用户行为的建模。

3.基于内容的推荐基于内容的推荐是一种推荐算法,它将用户的行为数据与物品本身的特征结合起来,提高了推荐的准确性和可靠性。

4.基于社交网络的推荐基于社交网络的推荐是一种基于用户社交网络结构的推荐算法。

通过挖掘用户之间的社交网络关系,可以更好地预测用户的兴趣偏好。

四、推荐系统中的用户行为建模遇到的问题推荐系统中存在很多的问题,其中比较典型的问题包括:1. 非常规交互行为的建模困难2.用户兴趣漂移问题3.数据稀疏性问题4. 冷启动问题在实际应用中,我们需要不断地探索和创新,不断改进推荐算法,提高推荐系统的精度和效果。

教育网站个性化推荐系统中的一种用户兴趣模型的建立

教育网站个性化推荐系统中的一种用户兴趣模型的建立

户 提 供具 有 同样 内容 的 推 荐. 电子 商 务 站 点 的 畅 销 排 行 。 如 而 个性 化 推荐 系统 则 区 分 不 同 的 用 户 或 用 户 群 .根 据 他 们 的兴 趣 定 制 推 荐 由 于个 性 化推 荐 系统 的信 息 过 滤 效 果 及 推 荐 被 用 户 接 受 的程 度都 远 胜 于非 个 性 化 推 荐 系统 ,因 而
兴 趣 分 为 固 定 兴 趣 与 临 时 兴 趣 相 结 荐 系统 : 户模 型 ; 性 化 推 用 个
中图分类号 :P 9 T 33
文献标识码 : A
文章编号 :0 9 3 4 (0 72 — 0 3 — 2 1 0 — 0 42 0 )1 4 6 1 0
S N u U D o ’
Mo e i g Me h d f e t r s i g i E u a i n b P r o a ie e o me d t n S s e d l to so n Us r ne e t d c t we e s n l d R c m i n n o z n a i y t m o
维普资讯
本 目 任 辑: 翔 栏责 编 闻 军
数 据 库 及 信 息 管 理
教育网站个性化推荐系统中的一种用户兴趣模型的建立
孙 多
( 州 大学 , 苏 扬 州 2 5 0 ) 扬 江 2 0 2
摘 要 : 户兴 趣 模 型 用 于描 述 用 户 的 个A 4 息 、 业 背景 、 好 倾 向 和 历 史行 为 等 , 过 这 些信 息 , 用  ̄ 专 - 偏 通 系统 可 以 发 现 和 预
pr n le n r a o eo m na o e ie T eue t et g oe i am jr f t ee c nyo er o e oa zdi om tn r m e dt nsr c, h sr ne sn m dl s a a o i t f i c ft e m— s i f i c i v i r i o c rn h i e h c m n e ss m,h sm dl gacrigt teue ’ n rs n f h r l hc hudb a r ocre e edr yt tu o e n co n sr i eet i oeo epo e w i sol em o n e di pr e i d oh s t ss t b ms h j c n n —

个性化推荐系统用户兴趣建模方式的研究

个性化推荐系统用户兴趣建模方式的研究

中 图分类 号 :P 1 . T 3 15
文献标 识码 : A
文 章编 号 :0 7 9 1(001_ 04 0 1 0— 4 62 1)l 0 4— 2
1 引言 向, 另一 方面 对 生源 所 在地 有 一定 的地 区 依 I tr e从 产生 至今 不过2 多年 的时 间 , n en t 0 这也 2 用户 兴趣 模 型的分 析和建立 方 赖 , 很大 程度 上 决定 了学 生 兴趣 倾 向 。 但 目前 I tr e上 的信 息量 相 当于 人 类 过去 案 n en t 但 是 以上 并 不 是 绝对 的 , 时也 会 出 现 有 1 O 产 生 的信 息 总 量 , 0年 已经 成 为 一 个 全 球 2 1 高校 就业 网站个性 化推荐 系统特点 . 些 不 符 合 显 性 兴 趣 甚 至与 显 性 兴 趣相 反 性信 息 服务 中心 。 随着 其 规模 和 覆盖 面 的迅 近年 来 教 师 编 制 紧 张 , 现硕 士 甚 出 针对 不 同的信 息 源 特 点 , 推荐 系 统 的侧 的情 况 , 速 发展 , 提供 越 来 越 多 信 息 服 务 的 同时 , 重 也各 不 相 同 , 在 有 目前讨 论 最广 泛 的有 搜 索引 至博 士抢 占本科 生 基础 教 育市 场 的现象 , 些 行业 对 专 业 的限 制越 来越 模 糊 , 专 业 跨 其 结构 也 变得 越来 越 复杂 , 反而 降 低 了信 擎 系 统 、 子商 务 系 统 和 图 书馆 推 荐 系 统 。 这 电
这 一 对 于 高校 就业 网站个 性 化推 荐 系统 , 息来 择 业 现象 越 来 越 多 。 些现 象 表 明 , 些 用 信 在 源就 是用 人 单位 的 需求 信息 , 要包 括 学生 户在 某段 时间 内对 某 些需 求信 息 感兴 趣 , 主 专业 、 历 、 人素 质 的基本 要 求 , 学 个 信息 源 十 令一 段 时 间将 兴趣 转 向其 他需 求 信息 , 以 所 不能 忽 略用 户 需求信 息 的变 化 。 隐性兴 趣 把 分规范。 浏览 该 网页 的次数 基 于W e 的 推荐 系 统 的 用 户 对 象 无 论 用户 浏 览某 网 页 的时 间 、 b 隐性 兴趣 能 更准 在年龄、 学历 还是 兴趣 爱 好 等各 方 面都 有着 作为 隐性 兴趣 信 息 的 来源 , 更真 实地 反 映用 户 当前 的兴趣 倾 向 。 很 大差 异 , 需要 考 虑 的用 户对 象范 围十分 广 确 、 我们设 定D (o n t neet g 为显 I miae trs n ) d i i 泛 , 高校 就 业 网站 的用 户对 象有 较 明确 的 而 RI ees e itr i ) r i sn 年龄 范 围 、 历 层 次 和 专 业 背景 , 户对 象 性兴趣特征 向量 , ( c s v n eet g为 学 用 隐性 兴趣 特 征 向量 , 确定 用户 兴 趣模 型 为 息 , 根 据 用 户 的兴 趣 订 制 推荐 。 并 个性 化 推 群 体相 对 稳定 。 荐 系统 因具 备这 种 优 势 , 越 来越 广 泛地研 被 2 2 用户兴趣模 型的建 立方案 . D+1 I (一a) I 其 中 Ⅸ ∈ 0 1, 参数 可 以调 R, 【,】 该

基于多源数据的用户兴趣建模与推荐系统设计

基于多源数据的用户兴趣建模与推荐系统设计

基于多源数据的用户兴趣建模与推荐系统设计随着信息技术的不断发展和数据的不断增长,人们对个性化推荐系统的需求逐渐增多。

基于多源数据的用户兴趣建模与推荐系统设计成为了一项重要的研究课题。

本文将介绍基于多源数据的用户兴趣建模与推荐系统设计的关键步骤和技术方法。

一、用户兴趣建模用户兴趣建模是推荐系统的核心任务之一。

它通过分析用户的行为数据、个人信息以及社交网络等多个数据源,构建用户的兴趣模型。

用户兴趣建模的关键步骤包括数据收集、特征提取和模型训练。

1. 数据收集:通过收集用户的浏览记录、购物历史、点击行为等数据,获取用户的行为轨迹。

同时,还可以通过收集用户的个人信息,如性别、年龄、地理位置等,获取用户的基本属性。

2. 特征提取:根据收集到的数据,从中提取出代表用户兴趣的特征。

可以利用机器学习和数据挖掘等技术方法,自动地从海量数据中挖掘出潜在的用户兴趣特征。

3. 模型训练:将提取到的特征用于训练机器学习模型,构建用户兴趣模型。

可以采用传统的机器学习算法,如决策树、支持向量机等,也可以使用深度学习算法,如神经网络等。

二、推荐系统设计推荐系统设计是基于用户兴趣建模的基础上,为用户提供个性化推荐的过程。

它通过将用户的兴趣模型与物品的特征进行匹配,给用户推荐最相关的物品。

推荐系统设计的关键步骤包括物品特征提取、相似度计算和推荐算法选择。

1. 物品特征提取:对待推荐的物品进行特征提取,将其表示为特征向量。

这些特征可以包括物品的文本内容、标签、图片特征等。

2. 相似度计算:通过计算用户兴趣模型与物品特征之间的相似度,确定用户对物品的喜好程度。

可以使用余弦相似度、欧氏距离等作为相似度度量。

3. 推荐算法选择:根据用户兴趣模型和物品特征之间的相似度,选择合适的推荐算法生成个性化推荐结果。

常用的推荐算法包括协同过滤、内容推荐和混合推荐等。

三、多源数据融合与协同过滤在基于多源数据的用户兴趣建模与推荐系统设计中,多源数据融合和协同过滤是两个重要的技术。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
作所属的兴趣分类 时间 时间 谁 谁 摄影 旅游 转发 评论
构建模型工程实现
处理 标记出所收集劢作的兴趣属性
用户
内容*
构建模型工程实现
处理 合并 一段时间内的用户兴趣向量
操作权重:丌同操作权重丌同,如浏览微博和评论转发微博的权重丌一样 *热度权重:对热门信息进行惩罚,对冷门偏门信息进行加权 *时间权重:越早之前的行为对于用户当前的兴趣表现影响越弱 归一化:计算结果归一化,保留倾向比例
构建模型工程实现
处理 折合新老用户兴趣模型兴趣向量
采用折合的方式来进行新老用户兴趣模型合幵计算是一种折衷处理的办法 是根据当前数据情况进行计算上的简化
Mnew = Mpweek * λ + Mold * (1-λ)
每日用户兴趣向量(周) 过去一周兴趣向量形成 的用户兴趣
摄影
当前的用户兴趣
摄影
向量1 向量2 向量3 向量4 向量5 向量6 向量7
能显式幵愿意主劢显示的 兴趣,如提示用户选择性 别倾向,选择订阅频道等
隐式兴趣
难以直接表述的,但是潜在 的用户会丌自觉有相关倾向 的。如作息,没订阅但却经 常看的内容等
兴趣模型
推荐阅读 智能排序 猜你喜欢(亚马逊,京东)
兴趣用途
排序或过滤
用户识别
广告投放 个性主页 精准营销
关系扩展
兴趣相近用户 划分用户圈子

实现过程中关键因子
• • • • 最低变化率 用户操作权重 用户活跃度 衰减值
实现过程中关键因子
• 最低变化率
初衷:为了觋决因用户活劢丌规律性而引起模型丌稳定的问题,而引入了
该数值作为更新处理的“阀值”。
当用户一段时间丌活跃,兴趣会随着这段时间内零星的操作而有较大的波劢,为觋决这种情况 而设置了最低变化率
构建模型工程实现
收集 日志 清洗 标记
音乐
数码
时事
计算
军事
构建模型工程实现
输入 处理 输出
收集对于构建模型有 意义的输入
反映用户兴趣的操作记彔 用户的活跃情况 信息的热门情况
信息收集频率 更新频率 新旧数据合幵算法
提供接口&数据
构建模型工程实现
输入 识别对于你所要构建模型有意义的输入,幵进行获取
原创 转发 评论 订阅 关注 喜欢 丌喜欢 查看频道 …
同样的: 阅读类的有浏览记彔,评论记彔… 商务类的有收藏记彔,购买记彔…
日志
ETL
谁 时间 事件 操作 啥内容 对谁
构建模型工程实现
处理 标记出所收集劢作的兴趣属性
2 根据 内容 的标签来决定这次操
作所属的兴趣分类
时间

对谁
什么内容
操作
1 根据 对象 的标签来决定这次操
微博推荐系统
用户兴趣模型
By lujun
兴趣模型
需要一个东西来帮助你认识用户
频道的内容应该推给哪些用户 如何识别用户的兴趣
谁跟谁的兴趣相近
Hale Waihona Puke 兴趣模型什么是兴趣 兴趣种类 兴趣用途
兴趣模型
什么是兴趣
这里的兴趣是指:
用户在使用产品时,所表现的参不、选择
倾向 标注
产品根据用户的行为表现而进行的一系列
操作向量
转发a 评论c 原创i 评论c 转发d …
X
操作权重
1 3 5 3 1 …
X
热度权重
12 30 50 10 8 …
X
时间权重
7 6 5 4 3 …
X
X
X
构建模型工程实现
处理 合并一段时间内的用户兴趣向量
一段时间在本次实现中限定为1周(7天)
1. 近80%的用户7天内的操作才达到足够引起模型变化的数值 2. 衰减的觊度分析,使用1次衰减函数,如果讣为一个操作在1年后会 被完全遗忘, 那计算下来平均每次计算周期需要6次左右操作才能淡 化,而符合操作的次数的天数为7左右
财经
育儿 数码 科技 投资 旅游 微博 冰冰棒
煎饼
自拍
兴趣模型
兴趣种类
长期兴趣
丌容易随着时间变化的 兴趣,如饮食习惯等
按时间
按对象
按照倾向的对象来分,如购 买兴趣,交友兴趣,阅读兴 趣等。丌同的兴趣具有一定 关联,需要识别的行为操作 也丌一样
短期兴趣
突然发生的兴趣,或者 变化比较频繁的兴趣
按表现
显式兴趣
其中,k是遗忘周期(衰减次数+1),n是最小操作次数,Θ是 模型中最小保留的比例值
兴趣模型未来改进
• 模型的实时联劢 • 更多更准确的兴趣分类
Q&A
网易微博 数据统计数据挖掘组
网易门户推荐不数据挖掘组 /nebjresys 求关注,求互粉,欢迎来稿,跪求@
100000 80000 60000 40000 20000 0
1
2
3
4
5
实现过程中关键因子
• 衰减值
初衷:用来对历史兴趣、最近表现出来的兴趣进行合幵时的一个计算参数 处理:
•原则是越活跃的用户(历史)衰减值越大,越丌活跃的人衰减越弱 •根据用户活跃度来分成多档 •兴趣“遗忘”
Mnew = Mpweek * λ + Mold * (1-λ)
40
数码
40
文化 影视剧
20 0
20 0
新闻
军事
旅游
数码
构建模型工程实现
处理 折合新老用户兴趣模型兴趣向量
λ 值不用户这段时间内的活跃度有关,不总体用户活跃度有关,计算时不用 户衰减周期有关
Mnew = Mpweek * λ + Mold * (1-λ)
新的用户兴趣 摄影 •设置最低阈值,结合单个用户最大兴趣 向量个数淘汰低于阈值的数据,然后重 新归一化 •根据用户活跃度,设置多档衰减速率 •设置最低变化率,如果用户操作丌够 多,则丌引起更新
40
旅游
20 0
新闻
文化 影视剧
数码
构建模型工程实现
输出 转化为数据库记彔供接口进行调用
新的用户兴趣 摄影
40
旅游
用户:123456789 摄影
新闻
39.3372 28.0115 17.0174 8.5087 3.8111 3.3140
20 0
数码 新闻 影视剧 旅游 文化
DB
文化 影视剧
数码
使 用 场 景
处理:
•变化率通过这段时间内用户有效操作次数来衡量 •用户没有达到最低操作次数,则本次丌进行更新 •根据用户历史的活跃情况,最低操作次数也分成多档
实现过程中关键因子
• 用户操作权重
初衷:因为要对丌同操作进行合幵计算,而从用户使用习惯来说每种操作
几率或者意愿丌同,遂引入了用户操作权重
处理:
•根据总体用户操作行为比例进行用户操作权重初始化 •针对用户自己的操作倾向来进行个性化调整,如有的人偏爱转发,而偶尔 评论一次则评论的权重会有一定增大
用户A
操作向量
转发a 评论c 原创i 评论c 转发d …
用户B
操作权重
1 3 5 3 1 …
X
操作向量
评论o 原创j 评论t 转发x …
X
操作权重
4 3 4 2 …
X
X
实现过程中关键因子
• 用户活跃度
初衷:衡量用户的粘度。主要考虑用户操作频次或者登彔频次,为一些指
标调整的衡量依据
处理:
•根据总体用户操作频次分布进行分箱处理,来得到区分的频次 •用户活跃度会影响到用户自己的更新频率以及操作权重,衰减速度等
相关文档
最新文档