基于社会化标注的个性化推荐研究进展
基于社会化标注的博客标签推荐方法

个性化推荐系统的研究进展

个性化推举系统的探究进展导言个性化推举系统是近年来迅猛进步的一个领域,其目标是依据用户的爱好、偏好和行为数据,为用户推举最相关的信息、产品或服务。
个性化推举系统已经被广泛应用于电子商务、社交媒体、新闻推举等领域。
本文将综述个性化推举系统的探究进展,包括算法、评估指标、应用领域等方面的最新探究效果。
一、个性化推举系统的算法个性化推举系统的核心是算法,它决定了系统的推举效果。
在过去的几十年里,探究学者提出了许多个性化推举算法,主要包括基于内容的推举、协同过滤、混合推举等。
基于内容的推举算法通过分析用户的历史行为和物品的属性信息,将用户与具有相似属性的物品进行匹配,以推举具有高相关性的物品。
协同过滤算法则是通过分析用户的历史行为和爱好,找到具有相似用户行为的用户,将其他用户喜爱的物品推举给目标用户。
混合推举算法是基于内容和协同过滤的算法的结合,综合利用用户行为和物品属性信息,提升推举的准确性和多样性。
近年来,随着深度进修的兴起,各种基于神经网络的推举算法也取得了冲破性进展。
例如,矩阵分解算法通过将用户-物品矩阵分解为两个低维矩阵来提取用户和物品的隐含特征,再利用这些特征进行推举。
深度进修算法则可以从巨大的用户行为数据中进修到更复杂、更精确的用户爱好模型,从而提升推举的效果。
这些基于神经网络的推举算法不仅在学术界取得了良好的探究效果,也在业界得到了广泛的应用。
二、个性化推举系统的评估指标评估指标是用来衡量个性化推举系统性能的重要标准。
常用的评估指标包括准确率、召回率、遮盖率、多样性等。
准确率是指推举列表中与用户真实爱好相符的物品占推举列表的比例。
召回率则是指推举列表中与用户真实爱好相符的物品占用户历史行为中物品的比例。
遮盖率是指推举系统能够推举到的物品占整个物品库的比例。
多样性是指推举列表中物品之间的差异性,用于衡量推举系统是否能够满足用户多样化的爱好。
评估指标的选择与详尽的应用场景密切相关。
例如,对于电子商务平台来说,最关注的指标可能是准确率和召回率;而对于新闻推举系统来说,遮盖率和多样性可能更为重要。
《2024年个性化推荐系统的研究进展》范文

《个性化推荐系统的研究进展》篇一一、引言随着互联网的飞速发展,信息过载问题日益严重,用户面临着从海量数据中筛选出有用信息的挑战。
个性化推荐系统因此应运而生,旨在根据用户的兴趣、需求和行为,为用户提供定制化的信息和服务。
本文将就个性化推荐系统的研究进展进行详细阐述。
二、个性化推荐系统的基本原理与分类个性化推荐系统主要基于用户的历史行为、兴趣偏好、社交关系等因素,通过算法分析,为用户推荐符合其需求的信息。
其基本原理包括协同过滤、内容过滤、混合推荐等方法。
协同过滤是推荐系统中应用最广泛的方法,它通过分析用户的历史行为和兴趣偏好,寻找与之相似的用户,从而为用户推荐相似的物品或服务。
内容过滤则是根据物品的内容属性,为用户推荐符合其兴趣爱好的内容。
混合推荐则是将协同过滤和内容过滤等方法结合起来,以提高推荐的准确性和满意度。
三、个性化推荐系统的发展历程与研究现状个性化推荐系统的发展经历了从简单到复杂,从单一到多元的过程。
早期的推荐系统主要基于协同过滤,利用用户的历史行为进行推荐。
随着技术的发展,内容过滤、深度学习、强化学习等算法被广泛应用于推荐系统中,提高了推荐的准确性和个性化程度。
目前,个性化推荐系统已经在各个领域得到广泛应用,如电商、视频、音乐、社交等领域。
同时,研究人员也在不断探索新的算法和技术,以提高推荐系统的性能和用户体验。
四、个性化推荐系统的研究进展近年来,个性化推荐系统的研究取得了显著的进展。
一方面,研究人员不断探索新的算法和技术,如深度学习、强化学习、自然语言处理等,将这些技术应用于推荐系统中,提高了推荐的准确性和个性化程度。
另一方面,研究人员也关注用户的隐私保护和推荐系统的可解释性等问题,以保障用户的权益和提高系统的可信度。
五、未来展望未来,个性化推荐系统将继续朝着更智能化、个性化和多样化的方向发展。
一方面,随着人工智能技术的不断发展,更多的先进算法和技术将被应用于推荐系统中,提高推荐的准确性和满意度。
基于LDA的社会化标签系统推荐技术

基于LDA的社会化标签系统推荐技术张彬彬;林丕源;黄沛杰【摘要】标签推荐中采用将三维模型拆分成多个二元关系的方法,导致用户信息的描述模糊、语义丢失、标签的个性化信息减弱问题,提出一种基于LDA模型的个性化标签推荐模型(LTR).使用LDA模型的吉布斯采样算法对参数进行估计,利用模型输出的概率关系进行排序,选取最高的N个预测结果作为最终的个性化推荐.以CiteULike数据集为研究对象,实验结果表明,该模型考虑了具有丰富语义信息的摘要文本,发挥了涵盖用户意识的个性化标签作用来增强推荐的准确性,有效为用户推荐个性化标签,提高了推荐效果.【期刊名称】《计算机工程与设计》【年(卷),期】2016(037)010【总页数】6页(P2722-2727)【关键词】社会化标签系统;标签推荐;个性化推荐;主题模型;狄利克雷分配模型【作者】张彬彬;林丕源;黄沛杰【作者单位】华南农业大学数学与信息学院,广东广州510642;华南农业大学数学与信息学院,广东广州510642;华南农业大学数学与信息学院,广东广州510642【正文语种】中文【中图分类】TP301.6标签是由用户人为自由、不受约束地环境下创造出来的,因此具有自由性和低限度的特点,当然标签系统的优点往往也正是它的缺点,标签具备一定的社会性和含糊性,也同时存在着例如同义词、多义词等一词多义甚至是错误的拼写等情况,所以导致了标签系统中存在了大量重复、不规范、无效的标签,我们称之为噪音。
当用户对其感兴趣的资源进行标注标签行为的时候,规范、有效、质量高的标签则会创造出标签系统的循环性,促进系统的良性循环。
很多时候,用户正准备给资源进行标注的时候,却发现自己难以确定该使用哪个标签更为合适,则应该凭借目前已经存在的标签、现有的资源内容或者结合用户的兴趣有选择性地向因犹豫等因素造成的困难用户进行推荐标签。
这种推荐的优点在于不仅可以减少用户在标注标签过程中由于思考而造成的压力、方便用户进行标签标注,而且还可以避免由于不同用户的文化水平、不规范、无效的标签而造成标签系统的数据稀疏性问题,所以长期以来一直是人们研究的热点[1,2]。
基于社会化标签的服务个性化推荐机制的研究与实现的开题报告

基于社会化标签的服务个性化推荐机制的研究与实现的开题报告一、选题背景和意义随着互联网技术的快速发展,人们对于信息需求的个性化需求也日益增加。
在大数据时代,信息资源的数量呈现爆炸式增长,通过传统的信息检索方式难以满足用户的个性化需求。
因此,基于社会化标签的服务个性化推荐机制成为解决信息过载问题的有效途径。
本课题的研究意义在于提出一种基于社会化标签的服务个性化推荐机制,并实现相关的软件系统,从而能够根据用户的个性化需求,提供更加精准、全面的服务推荐,进一步提升用户的使用体验。
二、研究内容和方法本课题拟通过以下几个方面进行研究:1. 社会化标签的使用原理及其在信息推荐中的应用研究;2. 个性化推荐算法的研究,包括基于内容的推荐算法、基于协同过滤的推荐算法等;3. 基于社会化标签的服务个性化推荐机制的设计与实现,主要包括用户兴趣模型的构建、推荐算法的优化、推荐结果的评估等;4. 软件系统的设计与开发,基于网页应用和移动端应用的形式,实现推荐功能;5. 系统测试、评价和改进研究。
三、预期成果和创新之处本课题的预期成果为:1. 提出一种基于社会化标签的服务个性化推荐机制,实现用户兴趣模型的构建和推荐结果的优化,提升服务推荐的准确性和全面性;2. 设计和实现一种基于网页应用和移动端应用的推荐系统,向用户提供个性化的服务推荐服务;3. 评估推荐系统的推荐结果,改进和完善推荐算法和系统性能。
本课题的创新之处在于:1. 将社会化标签引入个性化推荐机制中,构建用户兴趣模型,提高用户画像的准确度;2. 采用基于协同过滤的个性化推荐算法,提升推荐准确性;3. 实现基于网页应用和移动端应用的推荐系统,提高用户使用服务的便捷性。
四、研究计划和进度安排第一阶段(1个月):1. 确定课题研究方向和主题;2. 搜集相关文献,了解研究现状和研究方向;3. 制定研究计划和进度安排。
第二阶段(2个月):1. 研究社会化标签的使用原理及其在信息推荐中的应用研究;2. 深入研究个性化推荐算法,并确定适用于本课题的算法;3. 论文初稿的撰写和修改。
社会性标签系统的个性化资源推荐的开题报告

社会性标签系统的个性化资源推荐的开题报告导语:社会性标签系统是一种基于用户生成内容的标签系统,可以帮助用户快速找到相关的内容和资源。
同时,个性化资源推荐也是一种非常重要的技术,可以根据用户的兴趣、偏好和行为历史等信息来推荐更加符合用户需求的内容和资源。
本文主要研究如何利用社会性标签系统来进行个性化资源推荐。
一、研究背景和意义随着社交网络和社区的兴起,用户生成内容日益增多,如何有效地管理和利用这些内容成为了互联网发展的重要问题。
社会性标签系统作为一种基于用户生成内容的标记机制,可以帮助用户快速找到相关的资源。
然而,由于不同用户对标签的使用习惯和偏好不同,标签的可靠性和有效性存在一定的问题。
因此,如何利用社会性标签系统来提高资源的推荐质量,成为当前研究的热点问题。
另一方面,用户对于信息的需求是多样化的,因此如何根据用户的兴趣和偏好来进行个性化资源推荐也成为了当前研究的重点。
通过分析用户的历史行为和社交网络,提取用户的特征信息,并利用机器学习算法进行模型训练和优化,可以有效地提高推荐的准确性和覆盖率,加强用户的粘性和忠诚度。
二、研究内容和方法本文主要研究如何利用社会性标签系统来进行个性化资源推荐,主要涉及以下两个方面:1.社会性标签系统的建立社会性标签系统的建立主要包括标签抽取、标签过滤和标签关联等。
具体地,可以利用基于文本挖掘的技术来提取标签,如TF-IDF算法、主题建模和情感分析等。
同时,也可以利用用户反馈来对标签进行筛选和修正,增强标签的准确性和有效性。
最后,可以通过标签的共现关系来构建标签之间的关联网络,提高资源的查找和推荐效率。
2.个性化资源推荐个性化资源推荐主要是从用户的历史行为、兴趣和偏好等方面入手,对用户进行特征提取和建模,并运用机器学习算法来优化推荐模型。
具体地,在特征提取方面,可以利用用户的社交网络信息、搜索记录和浏览行为等数据来获得用户的兴趣特征和偏好信息。
在建模方面,可以采用协同过滤算法、基于内容的推荐算法和深度学习算法等来进行模型训练和优化。
基于社会化标注的个性化推荐研究进展

情报学报 ISSN1000-0135第29卷第4期625-633,2010年8月JOURNALOFTHECHINASOCIETYFORSCIENTIFICANDTECHNICALINFORMATIONISSN1000-0135Vol.29 No.4,625-633August 2010收稿日期:2009年3月23日作者简介:魏建良,男,1980年生,毕业于南京大学信息管理工程专业,管理学博士,浙江工商大学讲师,主要研究领域:信息服务与电子商务。
E-mail:jianliang53@gmail.com。
朱庆华,男,1963年生,毕业于南京大学情报学专业,管理学博士,南京大学信息管理系教授,博士生导师,主要研究领域:网络信息资源管理。
1) 基金项目:国家自然科学基金(70671094),浙江省自然科学基金重点项目(Z109061F)。
doi:10.3772桙j.issn.1000-0135.2010.04.007基于社会化标注的个性化推荐研究进展1)魏建良1 朱庆华2(1畅浙江工商大学计算机与信息工程学院,杭州310018;2畅南京大学国家信息资源管理南京研究基地,南京210093)摘要 社会化标注是当前互联网研究中的一个热点。
本文在对社会化标注的内涵和结构加以简单介绍的基础上,重点探讨了基于社会化标注进行推荐的相关进展。
首先是明确了标签对于用户模型的意义,接着,从用户、资源和标签三个角度对基于社会化标注的聚类算法进行了讨论。
同时也对基于社会化标注的排序算法进行了分析,并进一步将其分为依附补充、独立排序和通用排序三类算法。
然后,对标签推荐方面的研究进行了探讨,主要是围绕内容分析、协同分析、语义分析三个方面展开的。
最后,分析了社会化标注中个性化信息推荐的研究,发现借助矩阵、聚类和网络的分析是三种主要思路。
关键词 社会化标注 标签 个性化推荐 聚类 排序AdvancesinPersonalizedInformationRecommendationBasedonSocialTaggingWeiJianliang1andZhuQinghua2(1.SchoolofComputerScienceandInformationEngineering,ZhejiangGongshangUniversity,Hangzhou310018;2.NationalCenterforInformationResourceMangement-Nanjing,Nanjing210093)Abstract SocialtaggingisahottopicincurrentInternet-relatedresearches.Basedontheintroductionofthemeaningandstructureofsocialtagging,thispapermainlydiscussestheadvancementsofpersonalizedinformationrecommendationbasedonsocialtagging.Firstly,tag’smeaningforuserprofileisproved,andclusteringalgorithmsbasedonsocialtaggingfromtheaspectsofusers,resourcesandtagsarediscussed.Meanwhile,rankingalgorithmsbasedonsocialtaggingarealsostudied,andfindsupplementary,independentanduniversalrankingarethreesub-algorithms.Afterwards,researchesabouttagrecommendationarediscussed,whichmainlyfocusonmeansofcontent,collaborativeandsemanticanalysis.Finally,studiesonpersonalizedinformationrecommendationbasedonsocialtaggingareanalyzed,andfindmatrix,clusteringandnetworkanalysisarethreeprimarilymethods.Keywords socialtagging,tag,personalizedrecommendation,clustering,ranking 在Web2畅0的环境下,社会化标注(socialtagging)的出现,已经在产业界得到了广泛应用,出现了Delicious、Flickr、Youtube、LibraryThing、Last.fm、Connotea、CiteUlike、Technorati等众多新的应用与体验。
社会化标注理论研究综述

社会化标注理论研究综述魏建良朱庆华摘要社会化标注,将众多用户与信息资源联系起来,形成用户与资源的关系网络。
这种关系网络为信息的组织、检索与推荐提供了新的思路。
目前社会化标注网站已成为互联网研究中的一个热门领域。
鉴于此,很多研究者进行了相关研究,但目前的研究还停留在理论层面的探讨,处理的方法还较为初步,研究成果往往是试验性的,还难以将其直接应用到产业领域。
因此,亟需有更多对社会化标注感兴趣的研究者加入,以推动社会化标注理论的发展与在实践中的应用。
参考文献63。
关键词社会化标注标签系统模型语义分析信息分类分类号G203ABSTRACT Th is paper first d i scusses t h e basic t heory of social tagg i ng,i n cl ud i ng t h e m ean i ng,stru cture, class ificati on,advan tages and d is advan t ages.Soci al t aggi ng is a hot top i c i n cu rrent Internet2rel ated researches.Th en,it f ou cses on the advan ce m ents of syste m m odeland i nfor m ati on reco mm endati on bas ed on s oci al t aggi ng.Si nce soci al taggi ng is still d istress ed by so m e s hort ages,the paper fi nall y add ress es the se m an ti c i m provi ng m ethod s of soci al taggi ng, i ncl ud i ng con cep t analys is,net w ork theory,co m m on sen s e,ontol ogy and s o on.63refs.K EY W ORDS Social t aggi ng.Tag.Syste m m ode.l Se m anti c an al r m ati on class ificati on.CLASS NUM BER G203W eb2.0环境下,社会化标注(soc i a l tag2 gi ng)在产业界得到了广泛应用,并出现了Deli2 cio us、F lickr、Yo u t ube、Li brary Th i ng、Last.f m、Con2 notea、C ite U li ke、Technorati等众多新的应用与体验。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
情报学报 ISSN1000-0135第29卷第4期625-633,2010年8月JOURNALOFTHECHINASOCIETYFORSCIENTIFICANDTECHNICALINFORMATIONISSN1000-0135Vol.29 No.4,625-633August 2010收稿日期:2009年3月23日作者简介:魏建良,男,1980年生,毕业于南京大学信息管理工程专业,管理学博士,浙江工商大学讲师,主要研究领域:信息服务与电子商务。
E-mail:jianliang53@gmail.com。
朱庆华,男,1963年生,毕业于南京大学情报学专业,管理学博士,南京大学信息管理系教授,博士生导师,主要研究领域:网络信息资源管理。
1) 基金项目:国家自然科学基金(70671094),浙江省自然科学基金重点项目(Z109061F)。
doi:10.3772桙j.issn.1000-0135.2010.04.007基于社会化标注的个性化推荐研究进展1)魏建良1 朱庆华2(1畅浙江工商大学计算机与信息工程学院,杭州310018;2畅南京大学国家信息资源管理南京研究基地,南京210093)摘要 社会化标注是当前互联网研究中的一个热点。
本文在对社会化标注的内涵和结构加以简单介绍的基础上,重点探讨了基于社会化标注进行推荐的相关进展。
首先是明确了标签对于用户模型的意义,接着,从用户、资源和标签三个角度对基于社会化标注的聚类算法进行了讨论。
同时也对基于社会化标注的排序算法进行了分析,并进一步将其分为依附补充、独立排序和通用排序三类算法。
然后,对标签推荐方面的研究进行了探讨,主要是围绕内容分析、协同分析、语义分析三个方面展开的。
最后,分析了社会化标注中个性化信息推荐的研究,发现借助矩阵、聚类和网络的分析是三种主要思路。
关键词 社会化标注 标签 个性化推荐 聚类 排序AdvancesinPersonalizedInformationRecommendationBasedonSocialTaggingWeiJianliang1andZhuQinghua2(1.SchoolofComputerScienceandInformationEngineering,ZhejiangGongshangUniversity,Hangzhou310018;2.NationalCenterforInformationResourceMangement-Nanjing,Nanjing210093)Abstract SocialtaggingisahottopicincurrentInternet-relatedresearches.Basedontheintroductionofthemeaningandstructureofsocialtagging,thispapermainlydiscussestheadvancementsofpersonalizedinformationrecommendationbasedonsocialtagging.Firstly,tag’smeaningforuserprofileisproved,andclusteringalgorithmsbasedonsocialtaggingfromtheaspectsofusers,resourcesandtagsarediscussed.Meanwhile,rankingalgorithmsbasedonsocialtaggingarealsostudied,andfindsupplementary,independentanduniversalrankingarethreesub-algorithms.Afterwards,researchesabouttagrecommendationarediscussed,whichmainlyfocusonmeansofcontent,collaborativeandsemanticanalysis.Finally,studiesonpersonalizedinformationrecommendationbasedonsocialtaggingareanalyzed,andfindmatrix,clusteringandnetworkanalysisarethreeprimarilymethods.Keywords socialtagging,tag,personalizedrecommendation,clustering,ranking 在Web2畅0的环境下,社会化标注(socialtagging)的出现,已经在产业界得到了广泛应用,出现了Delicious、Flickr、Youtube、LibraryThing、Last.fm、Connotea、CiteUlike、Technorati等众多新的应用与体验。
由于允许任意用户可以对感兴趣的网络资源进行基于自身理解的无约束标注,并且所有用户的标注都互为可见,这种开放、共享的模式以及反映用户真实理解和观点的标注为信息资源组织、检索和共享带来了一种全新的理念,它是一种大众智慧的浮现。
因此,社会化标注一经出现,就引起了学术界的—526—KG20ⅡLcG2T98G1-LUn2GL2极大热情。
1 社会化标注的内涵与结构1畅1 社会化标注的内涵 标注(tagging)或者标签(tag)并不是最近的新鲜事物,特别对于图书馆员、编目者和专业分类人员而言,只是其所用的标签是受控的,而且没有体现出社会性。
本文所指的社会化标注(socialbookmarking)起源于1997年一项建议通过协同方法加强网络浏览器书签功能的研究[1]。
之后,文献[2]也进行了一项类似的研究。
受此启发,在2003年底JoshuaSchachter开始提供第一个社会化标签服务,也就是现在的Delicious网站,该网站允许用户可以对自己所感兴趣的信息资源添加标签。
标签类似于关键词,它是用户用来对发布的信息所进行的标注,但它与关键词不同的是,标签的标注不存在词与权限的限制,而关键词往往是只能由信息的发布者或创造者添加的。
标注是对用户添加标签的行为的描述。
用户可以对自己发布的信息进行标注,也可以对其他用户发布的信息进行标注。
当多个用户对多个对象添加标签时,标签就具有了社会性,也就成为了社会化标签。
这种行为模式就称之为社会化标注。
在这种新的模式下,每个用户都在进行标注,而不再是一小部分专家,标签走向了公开化,并在用户间形成共享[3]。
社会化标注在英文里有着较多类似的概念,如socialbookmarking、socialtagging、socialannotation、collaborationtagging、folksonomy、socialclassification、socialindexing等。
在这些概念中,除socialbookmarking的对象为URL外,其余的概念都表达了相同的内涵,其对象不仅可以包括URL,而且也涵盖了图片、视频、参考文献、博客、图书等众多互联网资源。
从理论而言,所有的网络资源都可以用社会化标签进行标注。
从学术研究的角度而言,socialtagging和folksonomy是目前运用较多的两个概念。
前者表示的是社会化标注,后者是大量社会化标注所产生的结果,使信息资源浮现出类别的特征,称之为大众分类。
1畅2 社会化标注的结构在社会化标注中,包括了三个主要要素:用户、资源和标签[4]。
用户包括信息资源的创建者、标注者或使用者。
社会化标注系统模型见图1。
在社会化标注系统中,绝大部分的用户是互联网的普通使用者。
资源是指存在于互联网中的各种类型的信息,如网页、文献、博客、图片、视音频等。
标签是指用户所选择的进行资源标注的词。
在这其中,标签是由个人用户所赋予的,而且标签的选词是根据用户对资源的理解,在形式和内容上不受已有词表的限制;而且标签和标注的环境是基于共享和开放的;最后,大量个人用户的标注行为通过碰撞与融合,形成了社会性,信息资源实现了基于标签的自动归类。
这也正如一些研究者所指出的,社会化标注不是添加关键词的简单行为,它是大量用户对事物特定看法的词汇集,是一种综合的行为[5]。
因此,通过综合标签、资源以及用户三者,就可以比简单的关键词得到更为丰富的视角[6]。
图1 社会化标注系统模型2 基于社会化标注的推荐研究标签与以往推荐系统所能获得的信息的本质区别是:标签作为用户所选择的关键词,体现了用户对资源的理解,并且成为了用户之间联系和交流的纽带。
可以说,标签既表达了信息资源的主要特征,同时又涵盖了用户与资源之间,以及用户与用户之间的关系,兼具内容与关联的特征。
将标签作为推荐技术的数据来源,便有可能开发出同时具备内容过滤和协同过滤优越性的推荐技术。
因此,许多研究者对此进行的探讨,并取得了一定的成果。
在对文献进行系统梳理的基础上,我们认为目前基于社会化标注的推荐研究主要包括了以下几个方面:标签对于用户模型的意义;基于标签的聚类算法;基于标签的排序算法;标签的推荐;基于标签的个性化信息推荐。
—626—情报学报 第29卷 第4期 2010年8月2畅1 标签对于用户模型的意义很多研究对于标签的作用予以了肯定。
有研究认为了解用户的兴趣,只要将注意力放在与该用户相关的标签和资源即可[7]。
可以说,社会化标注为了解用户打开了一扇新的窗户,通过社会化标注就可以掌握其信息需求和习惯[3]。
进一步地,文献[8]在比较了作者元数据(标题、关键词等)与标签之后,认为标签比元数据更具有优越性,而且标签往往蕴含了原文中没有直接表达的内容。
尽管目前受应用范围和领域的限制,标签的作用还没有得到深刻体现,但标签的确提供了传统信息源所不具有的信息[9]。
只要具备足够大量的用户,标注系统的表现就能够得到改善[4]。
在对标签的信息检索效果进行的实证分析中,研究者发现标签已具备良好的检索性能[10],特别是在查全率和查准率两项指标上表现出色[11]。
对于任意一项资源而言,往往会有一部分高频率的标签。
一方面,这些具有高频率的流行标签可以代表该资源的内容[12]。
尽管不同用户在标注中会存在不同的认知,但社会化标注的一致性会随着信息资源在网络中的流行性和标注用户数的上升而得以提高[13]。
有研究者通过对Delicious等标签网站的分析指出,就单个资源来说,其标签的分布较为稳定,且频繁使用的那部分标签比例较小且稳定,10%的最流行标签覆盖了所有URL的84畅3%[14];另一方面,用户对标签的多次使用也说明了用户兴趣的浮现[3]。
由于标注系统有可能收集到用户所标注的全部标签。