基于LDA主题扩展的个性化电影推荐系统

合集下载

基于LDA文本主题挖掘的个性化推送及其在Spark平台的实现

基于LDA文本主题挖掘的个性化推送及其在Spark平台的实现

工程硕士学位论文基于LDA文本主题挖掘的个性化推送及其在Spark平台的实现作者姓名梁剑工程领域电子与通信工程校内指导教师陆以勤教授校外指导教师宗凌高级工程师所在学院电子与信息学院论文提交日期2015年12月The Personalized Recommendation Based on LDA Text Topic Mining and Implementation on SparkA Dissertation Submitted for the Degree of MasterCandidate:Liang JianSupervisor:Prof. Lu YiqinSouth China University of TechnologyGuangzhou, China摘要随着互联网技术的发展,互联网已经深入生活中的方方面面,数据规模也从GB级发展到TB级,甚至是PB、EB级。

传统的信息检索技术通常只能返回主动查询的结果,并不能很好的解决用户实际的搜索需求。

在面对海量结果的情况下,也不能达到准确的满足用户之间差异化检索的需求。

个性化推荐技术通过对用户的历史数据进行挖掘,分析用户的历史记录以产生用户的兴趣模型,根据所产生的用户兴趣模型产生主动推荐的内容信息。

个性化推荐这一方法将传统的用户主动检索信息转变为网站的主动推荐信息,在满足用户信息需求的同时又能实现用户间的差异化。

本文在文本资源挖掘的基础上,研究如何通过对用户历史行为分析及文本的主题挖掘,获取用户主题层面的兴趣偏好,进而进一步的进行相似性计算工作。

本文工作主要包括以下几个方面:本文提出了个性化主题网络(Personalized Topic Network,PTN)模型,构建基于用户、文本和主题的无向图模型。

通过对用户的历史行为和文本的隐含主题挖掘,建立用户通过文本到主题的联系,使得从主题层面描述用户的兴趣偏好成为可能。

模型底层采用LDA(Latent Dirichlet Allocation)算法对文本的主题进行挖掘,以获得文本的主题向量描述。

面向电影推荐的个性化推荐系统设计与实现

面向电影推荐的个性化推荐系统设计与实现

面向电影推荐的个性化推荐系统设计与实现个性化推荐系统在如今互联网时代发挥着越来越重要的作用,为用户提供了针对个人喜好的定制化服务。

在电影领域,个性化推荐系统的设计与实现对于提高用户的观影体验和影视产业的发展非常关键。

本文将介绍面向电影推荐的个性化推荐系统的设计思路与实现方法。

一、系统设计思路1. 数据收集与预处理面向电影推荐的个性化推荐系统需要收集用户的行为数据和电影的属性数据。

用户的行为数据包括用户的观影历史、评分、收藏等信息,可以通过用户登录账号或者匿名访问的方式进行收集。

电影的属性数据包括电影的类型、导演、演员等信息,可以通过爬虫等方式从电影数据库中获取。

收集到的数据需要进行预处理,包括数据清洗、去重、归一化等,以便后续的推荐算法处理。

2. 特征提取与表示在个性化推荐系统中,特征提取与表示是一个重要的环节。

对于电影推荐系统,可以从电影的属性数据中提取特征,如电影的类型、导演、演员等作为特征。

另外,还可以考虑用户的观影历史、评分等作为用户的个性化特征。

通过合理选择和设计特征,可以提高推荐算法的准确性和效果。

3. 推荐算法选择与实现推荐算法是个性化推荐系统的核心。

针对面向电影推荐的个性化推荐系统,可以选择常见的推荐算法,如基于内容的推荐算法、协同过滤算法等。

基于内容的推荐算法通过分析用户和物品的内容特征进行推荐,协同过滤算法则通过分析用户的历史行为和与其他用户的相似性来推荐物品。

根据实际情况,可以选择单一的算法或者组合多种算法来实现推荐系统。

二、系统实现方法1. 数据存储与管理一个高效的个性化推荐系统需要一个稳定的数据存储与管理系统。

可以选择使用数据库来存储用户的行为数据和电影的属性数据。

常用的数据库包括MySQL、MongoDB等。

另外,为了实现实时推荐,还可以使用缓存技术将热门的电影数据存放在内存中,提高推荐的响应速度。

2. 推荐模块开发推荐模块是个性化推荐系统的核心部分,需要开发相应的算法和模型来实现推荐功能。

基于推荐系统的个性化电影推荐与评价系统设计与开发

基于推荐系统的个性化电影推荐与评价系统设计与开发

基于推荐系统的个性化电影推荐与评价系统设计与开发个性化推荐系统(Personalized Recommendation System)是一种根据用户的兴趣、喜好、行为等个人特征,为用户精确、个性化地推荐内容的系统。

近年来,随着互联网的快速发展,个性化推荐系统在各个领域得到了广泛的应用,其中之一就是电影推荐与评价系统。

电影推荐与评价系统在这个信息爆炸的时代可以起到指导用户选择电影的作用。

然而,由于电影的种类繁多,用户在选择电影时往往面临信息过载的情况,因此设计和开发基于推荐系统的个性化电影推荐与评价系统就显得尤为重要。

设计与开发这样一个系统需要考虑几个关键的方面。

首先,需要考虑如何获得用户的个人特征信息。

为了实现个性化推荐,我们需要了解用户的电影偏好、观看历史、社交网络等个人信息。

这可以通过用户登录、问卷调查、数据挖掘等方式来获取。

通过收集和分析这些用户个人特征信息,可以更好地了解用户的兴趣并进行个性化推荐。

其次,需要考虑如何建立电影的特征向量。

电影的特征向量是用来描述电影特征的一个向量,可以使用多种方式获得,比如基于电影内容的特征(如导演、演员、类型、时间等),基于用户评价的特征(如用户评分、评论内容等),以及基于协同过滤的特征(如用户-电影关联矩阵等)。

通过将电影转化为特征向量,可以更好地进行电影的相似度计算和个性化推荐。

然后,需要考虑如何进行电影推荐算法的选择与优化。

目前常用的电影推荐算法包括基于内容的推荐算法、基于协同过滤的推荐算法以及混合推荐算法等。

基于内容的推荐算法主要通过比较电影特征向量的相似度来进行推荐;基于协同过滤的推荐算法则根据用户的历史行为和其他用户的行为进行推荐;混合推荐算法结合了多种算法的优势。

在选择合适的推荐算法时,需要根据系统的需求和效果进行权衡,并进行算法的优化以提高推荐效果和速度。

最后,需要考虑如何进行用户评价的管理和分析。

用户的评价信息有助于提高推荐算法的准确性和用户体验。

基于数据挖掘的个性化电影推荐系统设计与实现

基于数据挖掘的个性化电影推荐系统设计与实现

基于数据挖掘的个性化电影推荐系统设计与实现随着互联网和视频流媒体技术的快速发展,人们对于电影的需求也日益增长,如何设计一个能够个性化推荐电影的系统成为了一个重要的研究方向。

数据挖掘作为一种从大规模数据中提取模式、关系或知识的技术,被广泛应用于电影推荐系统的设计与实现当中。

本文将介绍一个基于数据挖掘的个性化电影推荐系统的设计与实现,包括数据预处理、特征提取、模型训练与推荐等几个关键步骤。

首先,对于一个个性化电影推荐系统而言,数据预处理是一个非常重要的步骤。

我们需要收集包括用户信息、电影信息和用户对电影的评分等多种类型的数据。

收集到的数据需要进行清洗和去噪,以保证数据的准确性和完整性。

同时,还需要对数据进行特征工程,提取出能够描述用户和电影的相关特征,如用户性别、年龄、电影类型等。

接下来,特征提取是构建个性化电影推荐系统的关键步骤之一。

通过对用户和电影特征进行提取,可以将其转换为计算机可处理的数据形式。

可以采用多种技术来实现特征提取,如词袋模型、TF-IDF、Word2Vec等。

这些方法可以将用户和电影的特征向量化,方便后续的模型建立和计算。

然后,模型训练是推荐系统中重要的一步。

根据用户对电影的评分数据,可以采用机器学习或深度学习的方法,训练出一个推荐模型。

常用的模型包括协同过滤、内容过滤和混合过滤等。

协同过滤通过分析用户的历史行为和兴趣,发现与其相似的用户或电影,从而进行推荐。

内容过滤则是通过对电影内容的分析,将电影推荐给与其相似的用户。

混合过滤结合了协同过滤和内容过滤的优点,提供更准确的个性化推荐。

最后,推荐是个性化电影推荐系统的核心功能。

通过将用户特征和电影特征输入到训练好的推荐模型中,可以得到推荐结果。

根据推荐模型的输出,将推荐的电影信息展示给用户。

同时,可以采用评估指标来评价推荐系统的性能,如准确率、召回率和F1值等。

总之,基于数据挖掘的个性化电影推荐系统的设计与实现是一个多步骤的过程,包括数据预处理、特征提取、模型训练和推荐等几个关键步骤。

《2024年基于协同过滤算法的个性化电影推荐系统的实现》范文

《2024年基于协同过滤算法的个性化电影推荐系统的实现》范文

《基于协同过滤算法的个性化电影推荐系统的实现》篇一一、引言随着互联网的迅猛发展,电影资源的不断丰富,人们面临着众多的电影选择。

然而,如何在众多的电影资源中寻找到真正符合个人口味的电影成为了人们迫切需要解决的问题。

因此,个性化电影推荐系统应运而生。

本文将介绍一种基于协同过滤算法的个性化电影推荐系统的实现。

二、协同过滤算法概述协同过滤算法是一种常用的推荐系统算法,其基本思想是利用用户的历史行为数据,寻找与目标用户兴趣相似的其他用户,然后根据这些相似用户的喜好进行推荐。

协同过滤算法主要包括用户之间的协同过滤和基于项目的协同过滤。

三、系统设计(一)数据预处理首先,我们需要收集用户的观影历史数据,包括用户观看的电影、评分等信息。

然后对这些数据进行清洗、去重、归一化等预处理操作,以便后续的算法处理。

(二)用户相似度计算在协同过滤算法中,用户相似度的计算是关键。

我们可以采用余弦相似度、皮尔逊相关系数等方法来计算用户之间的相似度。

系统将计算所有用户之间的相似度,并存储在相似度矩阵中。

(三)推荐算法实现基于用户相似度,我们可以采用最近邻法、基于矩阵分解的方法等来实现推荐算法。

系统将根据目标用户的相似用户及其喜欢的电影,为目标用户推荐相似的电影。

(四)推荐结果输出系统将根据推荐算法计算出的结果,将推荐的电影按照一定顺序(如评分高低、更新时间等)输出给用户。

同时,系统还将提供一些额外的功能,如电影详情查看、电影评价等。

四、系统实现(一)技术选型系统采用Python语言进行开发,使用pandas、numpy等数据科学库进行数据处理和计算,使用Flask等Web框架进行Web服务开发。

同时,为了加速数据处理和计算,系统还采用了分布式计算框架Hadoop和Spark。

(二)数据库设计系统采用MySQL数据库进行数据存储。

数据库包括用户表、电影表、评分表等。

其中,用户表存储用户的基本信息;电影表存储电影的基本信息;评分表存储用户对电影的评分信息。

基于机器学习的个性化电影推荐系统

基于机器学习的个性化电影推荐系统

基于机器学习的个性化电影推荐系统个性化电影推荐系统是一种利用机器学习算法来根据用户个人兴趣和偏好推荐电影的智能系统。

它能够根据用户的历史观影记录、评分和行为数据,快速分析用户的喜好,从大量的电影库中选择适合用户的个性化推荐。

随着互联网的快速发展和海量电影资源的涌现,用户在面对众多电影的选择时常常感到困惑。

传统的电影推荐往往只是基于电影的流行度和类型来推荐,缺乏对用户个人兴趣的考虑。

而个性化电影推荐系统通过机器学习的方法,能够自动识别用户兴趣和偏好,精准地为用户推荐感兴趣的电影,提供了更好的观影体验。

在构建个性化电影推荐系统时,首先需要收集用户的观影历史数据以及评分数据。

这些数据可以来自于用户在平台上观看电影的记录、评分页面以及其他用户行为信息。

然后,利用机器学习算法对这些数据进行分析和建模,从而能够更好地了解用户的喜好和兴趣。

在机器学习算法中,常用的推荐算法包括协同过滤、内容过滤和混合过滤等。

协同过滤算法是最为常用的推荐算法之一,它通过分析用户历史行为和其他用户的行为差异,从而预测用户对电影的偏好。

协同过滤算法可以分为基于用户和基于物品的两种方法。

基于用户的协同过滤算法侧重于根据用户之间的相似度来推荐电影,而基于物品的协同过滤算法则是根据电影之间的相似度来进行推荐。

相比于协同过滤算法,内容过滤算法更注重对电影本身的内容进行分析和推荐。

内容过滤算法通过分析电影的类型、导演、演员等相关信息来预测用户对电影的偏好。

这种算法能够根据用户的观影历史和电影的特征,精准地推荐感兴趣的电影。

除了以上两种常用的推荐算法,还可以采用混合过滤算法来进行电影推荐。

混合过滤算法结合了协同过滤和内容过滤的优点,通过综合考虑用户之间的关系和电影的特征来进行推荐。

这种方法能够提高推荐的准确性和覆盖率,给用户更好的观影体验。

在构建个性化电影推荐系统时,还需要考虑推荐系统的可解释性和透明度。

推荐系统应该能够向用户解释为什么会给出这样的推荐结果,以增加用户的信任和满意度。

《2024年基于大数据分析的推荐系统研究——基于Hadoop的电影推荐系统的设计与实现》范文

《2024年基于大数据分析的推荐系统研究——基于Hadoop的电影推荐系统的设计与实现》范文

《基于大数据分析的推荐系统研究——基于Hadoop的电影推荐系统的设计与实现》篇一一、引言随着互联网技术的飞速发展,大数据时代已经来临。

海量的数据资源为各行各业提供了前所未有的机遇和挑战。

在电影推荐领域,基于大数据分析的推荐系统已经成为了一种趋势。

本文将介绍一种基于Hadoop的电影推荐系统的设计与实现,通过分析用户行为数据和电影内容数据,提供精准、个性化的电影推荐服务。

二、相关技术概述2.1 Hadoop技术Hadoop是一个开源的分布式计算平台,能够处理海量数据。

它包括分布式文件系统HDFS和分布式计算框架MapReduce等核心技术,能够提供高效、可靠的数据存储和计算服务。

2.2 推荐系统技术推荐系统是一种利用用户行为数据和物品特征数据,为用户提供个性化推荐服务的系统。

常见的推荐算法包括协同过滤、内容过滤、深度学习等。

三、系统设计3.1 系统架构设计本系统采用分布式架构,基于Hadoop平台进行设计。

整个系统包括数据采集层、数据处理层、推荐算法层和应用层。

其中,数据采集层负责收集用户行为数据和电影内容数据;数据处理层负责对数据进行清洗、转换和存储;推荐算法层负责运用各种推荐算法进行电影推荐;应用层负责向用户提供电影推荐服务。

3.2 数据处理流程设计数据处理流程包括数据采集、数据预处理、特征提取、模型训练和结果输出等步骤。

首先,通过爬虫等技术收集用户行为数据和电影内容数据;然后,对数据进行清洗、转换和存储;接着,提取出用户特征和电影特征,运用推荐算法进行模型训练;最后,输出电影推荐结果。

3.3 推荐算法选择与实现本系统采用协同过滤和内容过滤相结合的混合推荐算法。

协同过滤算法包括基于用户的协同过滤和基于物品的协同过滤,能够根据用户的历史行为数据和物品的相似度进行推荐;内容过滤算法则根据电影的内容特征和用户偏好进行推荐。

在实现上,我们采用Hadoop的MapReduce框架进行分布式计算,提高系统的可扩展性和性能。

《2024年基于大数据分析的推荐系统研究——基于Hadoop的电影推荐系统的设计与实现》范文

《2024年基于大数据分析的推荐系统研究——基于Hadoop的电影推荐系统的设计与实现》范文

《基于大数据分析的推荐系统研究——基于Hadoop的电影推荐系统的设计与实现》篇一一、引言随着互联网技术的快速发展,大数据技术被广泛应用于各个领域。

电影行业也正在通过运用大数据分析技术来提高用户体验和服务质量。

基于Hadoop的电影推荐系统是其中的一个重要应用,该系统能够通过分析用户的历史行为和喜好,为用户提供个性化的电影推荐服务。

本文将介绍基于大数据分析的推荐系统的设计与实现,重点探讨基于Hadoop的电影推荐系统的设计思路和实现方法。

二、系统设计1. 需求分析在系统设计阶段,首先需要进行需求分析。

根据电影行业的特点和用户需求,我们需要设计一个能够分析用户行为和喜好、提供个性化推荐服务的系统。

系统需要支持海量数据的存储和处理,以及快速响应和准确推荐的能力。

2. 架构设计基于Hadoop的电影推荐系统采用分布式架构,以Hadoop生态系统为基础,包括HDFS、MapReduce、Hive等组件。

系统架构包括数据层、处理层和应用层。

数据层负责存储用户行为数据和电影数据;处理层负责处理和分析这些数据;应用层负责向用户提供推荐服务。

3. 数据处理流程数据处理流程包括数据采集、数据预处理、特征提取、模型训练和推荐生成等步骤。

首先,通过数据采集模块从各种数据源中获取用户行为数据和电影数据;然后,通过数据预处理模块对数据进行清洗和转换;接着,通过特征提取模块提取出有用的特征;然后,使用机器学习算法进行模型训练;最后,根据用户的行为和喜好生成推荐结果。

三、关键技术实现1. 数据存储系统采用HDFS作为数据存储层,能够支持海量数据的存储和管理。

通过将数据分散存储在多个节点上,提高了系统的可靠性和可扩展性。

2. 数据处理与计算系统采用MapReduce框架进行数据处理和计算。

MapReduce 能够将大规模的数据集分割成多个小任务,并分配给多个节点进行并行处理,从而提高了处理速度和效率。

此外,系统还采用了机器学习算法进行模型训练和推荐生成。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。



依据用户评分数据的传统电影推荐算法存在数据稀疏、评分信息不能够真实有效地表达用户兴趣等问题。而
文章引用: 崔苹, 宋丽, 杨新凯. 基于 LDA 主题扩展的个性化电影推荐系统[J]. 计算机科学与应用, 2018, 8(6): 860-866. DOI: 10.12677/csa.2018.86095
3. 基于情感分析和 LDA 主题拓展的推荐算法
3.1. 用户评论文本情感分析
Word2vec 是 Google 公司在 2013 年提出的一款以深度学习算法思想为基础将词语表征转化为实数值
DOI: 10.12677/csa.2018.860要是利用深度学习方法训练文本内容将词语转化为词向量形式,从而词语语 义相似度可以通过向量空间中词向量相似度表示,也可以对文本处理简化为向量空间中词向量运算。 Word2vec 算法主要包含两种语言模型:CBOW (Continuous Bag of Words)和 Skip-gram (Continuous Skip-gram Model)。这两种模型都包括输入层(input)、映射层(projection)、和输出层(output)。CBOW 根据 上下文语境预测目标词语,Skip-Gram 根据当前单词预测上下文语境窗口内的词语。 主要步骤: 1) 爬取评论信息经分词、去停用词等预处理; 2) 训练生成 word2vec 词向量模型; 3) 获取每条评论文本词语的词向量, 计算每条评论文本词向量均值, 做为每条评论文本的文本向量; 4) 将有标记的评论文本向量按 4:1 比例分为训练集和测试集,采用 SVM 分类器,筛选出物品的正 向评论、获取物品正向评论率。物品 i 正向评论率 posri 为物品 i 正向评论条数 counti ,与物品 i 总评论条 数 commentsi 比值。
Computer Science and Application 计算机科学与应用, 2018, 8(6), 860-866 Published Online June 2018 in Hans. /journal/csa https:///10.12677/csa.2018.86095
Open Access
1. 引言
评论信息已成为消费者制定商品购买决策的重要信息来源,且对消费者的商品购买决策影响非常显 著[1],然而,评论信息形式为半结构化或非结构化,商品购买决策时面临前所未有的挑战[2]。推荐系统 一般使用户评分数据的推荐算法存在数据稀疏、评分信息不能够真实有效地表达用户兴趣等问题。因此 以网站商品评论为物品特征描述语料,利用 word2vec 词向量模型进行评论文本情感分析,获得商品好评 率,并筛选商品正向评论文本集,作为商品正向特征的描述文本集,本文使用 LDA 主题模型提取物品主 题特征,在此基础上,结合 TF-IDF 提取主题关键词特征,作为物品描述文本信息的主题——关键词特征 集,以增强主题粗粒度特征对物品的描述能力,提高推荐的准确率。
关键词
推荐系统,主题模型,情感分析,文本挖掘
Copyright © 2018 by authors and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY). /licenses/by/4.0/
Personalized Movie Recommendation System Based on LDA Theme Extension
Ping Cui, Li Song, Xinkai Yang
College of Information, Mechanical and Electrical Engineering, Shanghai Normal University, Shanghai Received: May 24 , 2018; accepted: Jun. 8 , 2018; published: Jun. 15 , 2018
某一隐藏主题 zm, n ,接着以多项式概率分布 Mulitinomial (ϕ ( z ) ) 即 ϕ k ,从主题 z 中择某一特征词 wm ,n 。
Figure 1. Three layer Bayesian network model diagram of LDA 图 1. LDA 的三层贝叶斯网络模型图 DOI: 10.12677/csa.2018.86095 862 计算机科学与应用
2. 相关研究
安悦等人[3]采取的基于内容的热门话题的个性化推荐,首先利用 TF-IDF 的文本表示方法对微博中 的文本数据进行量化表示;然后利用相似度计算方法计算微博话题与用户之间的相似度,进而给出个性 化的推荐列表。单京晶[4]提出一种联合 K-means 的个性化推荐方法,该方法首先对与用户感兴趣的产品 特征进行聚类,将具有相似特征的产品聚到一个类别内,然后将与每个聚类中心点最近的产品推荐给用 户。李峰刚等人[5]在新闻文本分类的文本分类算法中使用 LDA 进行特征降维;胡勇军等人[6]利用 LDA 模型将特征维度进行扩展,实现对短文本的分类;Chen 等学者[7]在研究文本间的相似性问题时,使用 LDA 模型计算文本相似,根据文本相似度将搜索记录数据结果集进行分类。Feng 等人[8]基于组合的概 率主题模型-用户主题模型(UTM)和随机行走与重启(RWR)方法的组合推荐。 UTM 通过利用用户的偏好概 况和项目的内容信息来提供用户、组和项目的潜在框架,它们可以更全面地描述组兴趣和项目特征。然 后将该潜在框架与 RWR 结合,通过检测综合潜在关系来预测群体对未评级项目的偏好程度。Aslanian 等人[9]提出基于协同过滤和内容推荐的混合推荐算法,介绍了一种新的提取内容特征关系矩阵的方法, 然后对协同过滤推荐算法进行了改进,使得该关系矩阵能够有效地集成到算法中。与现有的算法相比, 该算法能更好地解决冷起动问题。
崔苹 等
3.3. LDA 主题模型拓展
LDA 主题模型对特征维度较高的评论词进行降维处理,对于评论文本信息,在使用 LDA 主题模型 进行降维之后,可以获得每个文本关于主题的概率分布。记 Di ( t1 , t2 , , tk ) 为电影 i 评论文本信息主题的 概率分布。 如果仅仅使用 LDA 主题模型,虽然对类似的词语进行归类合并,但也只能获取数量有限的 K 个主 题来实现对文本内容的概述。这样的特征较为宽泛,粒度较为粗糙。即 Di ( t1 , t2 , , tk ) 为电影 i 评论文本 信息关于主题的粗粒度特征。如果在对文本进行预处理后,将每个特征词都作为文本的特征,那么就会 导致粒度太细致而具有稀疏性。对此,本文通过粗粒度主题特征选取每个主题下 m 个主题关键词作为细 粒度特征,即 Di ( w1 , w2 , , wmk ) 为物品 i 评论文本信息关于主题关键词的细粒度特征。将粗、细粒度特征 的结合综合特征记为 Di ( t1 , t2 , , t K , w1 , w2 , , wmk ) ,可增强文本描述能力。 运算:
th th th
Abstract
Traditional movie recommendation algorithms based on user score data have some problems, such as sparse data and false score information, which cannot really and effectively express user interest. User comments, as an effective carrier of information from users’ interests and opinions, can quantify the product features through mining, analyzing and commenting information, and achieve personalized recommendation effect. Site review analysis of text information based on feature film recommended to the users in time according to the user history information analysis. User interest recommendation algorithm is proposed for expanding fusion sentiment analysis and LDA topic model features personalized selection keywords combined with TF-IDF weight item keywords and the characteristics development; the positive rate of sentiment analysis combined with topic comment expands the feature vector for item similarity calculation; the user is interested in the high similarity of the product as the recommended items list recommended. Experiments show that the proposed method improves the accuracy of recommendation.
Keywords
Recommendation System, Topic Model, Sentiment Analysis, Text Mining
基于LDA主题扩展的个性化电影推荐系统
崔 苹,宋 丽,杨新凯
相关文档
最新文档