《社交大数据环境下影响力最大化节点挖掘技术及其应用》项
社会网络中的节点影响力与分析方法

社会网络中的节点影响力与分析方法社交网络中的节点影响力与分析方法社交网络是当今社会中非常重要的一个概念。
在现代科技的背景下,社交网络的影响力在日益扩大,人们的社交方式也日益多元化。
社交网络是一种互联网应用,通过社交网络,人们可以通过各种方式与他人沟通、分享或交换信息、建立互动关系等等。
这种交流方式使得社交网络中的各种节点成为一个非常重要的因素,不同的节点在社交网络中所拥有的影响力也是不同的。
本文将详细介绍节点影响力的定义、影响因素以及分析方法。
一、节点影响力的含义和定义节点影响力指的是在社交网络中,某个节点对其他节点的影响程度,即一种影响力度量标准。
这种影响力包含了节点在社交网络中的传播能力、交互能力、对话能力和引导能力等多个方面。
节点影响力的高低直接影响着该节点在社交网络中的重要性,同时也能够对整个社交网络产生影响。
二、节点影响力的影响因素节点的影响力与其社交网络中的地位和行为等多个因素相关。
以下是一些常见的影响节点影响力的因素:1. 节点在社交网络中的地位节点在社交网络中所处的位置与其在社交网络中的影响力密切相关。
如果某个节点在社交网络中的连接较多、关系紧密,那么其影响力会相应提高。
例如,拥有多个好友的人在社交网络中通常会比拥有少数好友的人更容易传播一些信息。
2. 节点在社交网络中的受欢迎程度节点受欢迎程度对其影响力有很大的影响。
由于社交网络的性质是人与人之间的互动,因此在社交网络中,人们往往会先接收比较受欢迎的节点所发布的信息,并更愿意与这些节点互动。
3. 节点在社交网络中的活跃程度节点在社交网络中的活跃程度也对其影响力有着重要的影响。
通过社交网络平台的各种操作,例如发布消息、留言评论、分享等等,会提高节点在社交网络中的能见度,从而增加节点的影响力。
4. 节点在社交网络中的贡献在某些社交网络中,节点通过像众筹、分享文章、打赏等方式来为社交网络做出贡献,其在社交网络中的影响力也会得到相应的提升。
影响力最大化算法的研究与应用

影响力最大化算法的研究与应用在当今社会中,信息传播越来越依赖于网络。
社交网络的兴起,使得信息传播更加快速和广泛。
影响力最大化算法的研究与应用,成为了一个越来越热门的话题。
影响力最大化的目的在于,在给予一定的限制(如预算、时间、二度联系)的情况下,找到一个种子节点,来使得其它节点被把影响最大化。
影响力最大化算法早在1995年就已被提出。
如今,它已经在社交网络营销、病毒传播和信息推荐等多个领域得到了应用。
那么,在实际应用中,如何选取种子节点以及如何精准地扩散影响呢?1. 影响力最大化算法的分类常见的影响力最大化算法通常可以分为无贪心(无法鲸吞策略)和贪心两类。
其中,无贪心算法可以较好地解决节点数较少的问题,但节点数较多时运算量巨大;贪心算法可以更准确地寻找影响力节点,分布相对均匀,但容易将是次优解。
另外,还有一种常见的影响力最大化算法——基于矩阵分解的方法。
该方法通过分析矩阵的结构,发现使得影响最大的节点。
这种方法比传统的算法计算量更小,效率更高,推荐的结果也更加准确。
但是,由于现实网络存在动态变化,这种算法的应用受到了一定时间尺度的限制。
2. 影响力最大化算法的应用2.1 社交网络营销社交媒体平台上广告投放是目前比较比较常见的社交网络营销方式。
通过影响力最大化算法,能够精确确定需要花费大量资金的种子节点,以达到良好的广告效果。
同时,影响力科技能够更好地评估营销执行效果,以便日后调整。
2.2 病毒传播病毒传播也是影响力最大化的一个应用场景。
在病毒传播的过程中,通过寻找感染概率最高的种子节点,能够起到提高传播效率的作用。
同时,影响力科技亦可通过算法优化、用户建模等手段,提高病毒传播的效果。
2.3 信息推荐在推荐系统中,影响力最大化算法能够帮助推动不同用户的兴趣转变和信息扩散。
借助于影响力最大化,为用户推荐的信息组织更加紧凑,推荐内容更加符合用户之间的联系、兴趣和行为。
3. 影响力最大化算法的发展在算法的发展过程中,影响力最大化算法的研究者和开发者们主要关注于算法的实用性和效率。
基于社交网络的影响力最大化算法

基于社交网络的影响力最大化算法
王璿;张瑜;周军锋;陈子阳
【期刊名称】《通信学报》
【年(卷),期】2022(43)8
【摘要】影响力最大化问题研究在给定传播模型下如何选取社交网络中的一组种子用户,使信息通过这些用户实现最大范围的传播。
现有算法主要存在2个问题:一是由于影响范围有限、时间复杂度高,难以适用于大规模社交网络;二是仅局限于特定传播模型,只能解决单一类型社交网络下的影响力最大化问题,当使用在不同类型社交网络上时效果较差。
对此,基于2个经典影响力传播模型,结合反向影响采样技术,提出一种高效的影响力最大化(MTIM)算法。
为验证MTIM算法的高效性,将其与IMM、TIM和PMC等贪心算法,以及OneHop和Degree Discount等启发式算法在4个真实社交网络上进行对比实验,结果表明MTIM算法能够提供〔1-1/e-ε〕近似保证,显著扩大影响范围,并有效提高运行效率。
【总页数】13页(P151-163)
【作者】王璿;张瑜;周军锋;陈子阳
【作者单位】东华大学计算机科学与技术学院;上海立信会计金融学院信息管理学院
【正文语种】中文
【中图分类】TP393
【相关文献】
1.基于NVPA算法的社交网络影响力最大化算法
2.一种改进的社交网络影响力最大化算法
3.边缘覆盖去重的社交网络影响力最大化算法
4.基于3-layer中心度的社交网络影响力最大化算法
5.基于阈值的社交网络影响力最大化算法
因版权原因,仅展示原文概要,查看原文内容请购买。
社交网络分析中的节点影响力度量与分析方法

社交网络分析中的节点影响力度量与分析方法社交网络作为一个庞大的信息传播平台,吸引了亿万用户来分享、交流和互动。
在这个巨大的网络中,节点的影响力度量和分析方法变得至关重要。
节点的影响力可以帮助我们理解节点在网络中的重要性,从而更好地进行网络调整、产品推广和信息传播。
节点影响力度量是指根据节点在网络中的位置和连接状况进行量化和测量,以评估节点的重要程度。
下面将介绍几种常见的节点影响力度量和分析方法。
1. 度中心性(Degree centrality):度中心性是指节点的直接连接数量。
节点的度中心性越高,代表节点在网络中有更多的直接连接,因此具有更大的影响力。
度中心性是最简单和常见的影响力度量方法,适用于大多数社交网络。
2. 接近中心性(Closeness centrality):接近中心性度量了节点与其他节点之间的距离。
节点的接近中心性越高,代表它与其他节点之间的距离越近,能更快地接收和传播信息。
接近中心性适用于那些注重快速传播信息的网络,如新闻传媒。
3. 介数中心性(Betweenness centrality):介数中心性度量了节点在网络中的桥梁作用。
节点的介数中心性越高,代表它在网络中扮演了连接其他节点的重要角色,能够影响更多的信息传播路径。
介数中心性适用于那些注重传播和连接的网络,如线上社区。
4. 特征向量中心性(Eigenvector centrality):特征向量中心性度量了节点的连接数量以及连接节点的重要性。
节点的特征向量中心性越高,代表它不仅与其他节点连接数量多,而且这些连接节点本身也具有较高的影响力。
特征向量中心性适用于那些注重节点自身影响力的网络,如名人或权威人士。
所有这些节点影响力度量方法都可以帮助我们识别在社交网络中具有重要影响力的节点。
然而,在进行节点影响力分析时需要注意以下几点。
首先,不同的网络可能需要不同的影响力度量方法。
根据网络的特点和需要,选择适当的度量方法以获得更加准确的结果。
社交媒体数据分析与挖掘技术

社交媒体数据分析与挖掘技术随着社交媒体的广泛普及和使用,大量的数据被用户在平台上传和分享。
这些数据包含了丰富的信息和数字足迹,使得分析和挖掘这些数据成为一项重要的技术。
社交媒体数据分析与挖掘技术被广泛应用于商业、社会研究以及个人用户的需求。
首先,社交媒体数据分析与挖掘技术在商业领域中发挥着重要作用。
通过分析社交媒体上的数据,企业可以了解消费者的喜好和趋势,从而对市场做出准确的分析和预测。
例如,某家时尚品牌可以通过分析社交媒体上的用户评论和购买行为来了解哪种款式的衣服受欢迎,从而调整生产和供应链策略,满足市场需求。
此外,通过社交媒体数据分析,公司还可以了解用户对产品或服务的评价和反馈,从而优化产品设计和客户服务。
其次,社交媒体数据分析与挖掘技术也在社会研究领域中发挥着重要作用。
社交媒体平台上的用户活动可以反映出社会热点、事件趋势和情感倾向等信息,这些都对社会研究具有重要价值。
例如,通过分析社交媒体上关于某一特定疾病的讨论和分享信息,疾病研究人员可以了解患者喜好的治疗方法和药物,从而改善医疗服务和推动疾病治疗的进步。
此外,社交媒体数据还可以用于舆情分析,帮助政府和企业了解公众对某一事件或政策的态度和反馈情况,为决策提供参考。
不仅在商业和社会研究领域,社交媒体数据分析与挖掘技术还对个人用户具有重要意义。
通过分析自己在社交媒体上的信息和行为,个人用户可以了解自己的兴趣爱好、社交圈子以及与他人的交流方式。
例如,通过分析自己在社交媒体上的点赞、评论和分享行为,个人用户可以了解自己感兴趣的内容类型和社交关系,从而更好地选择和筛选自己的信息源和交流对象。
此外,社交媒体数据分析与挖掘技术还可以用于个人用户的个性化推荐和广告定制,从而提供更符合个人偏好的服务和产品。
然而,社交媒体数据分析与挖掘技术也面临着一些挑战和问题。
首先,隐私问题是一个重要的关注点。
社交媒体平台上的数据包含大量的个人信息,包括用户的姓名、年龄、性别、地理位置等。
社交媒体领域数据挖掘技术在社交网络中的应用

社交媒体领域数据挖掘技术在社交网络中的应用近年来,随着社交媒体的普及和用户数量的急速增长,社交网络逐渐成为人们沟通交流的重要平台。
然而,这些平台中所产生的庞大数据量却给人们带来了一定的管理和分析困惑。
为了更好地理解和利用这些海量数据,社交媒体领域的数据挖掘技术开始得到广泛应用。
本文将探讨社交媒体领域数据挖掘技术在社交网络中的应用。
一、用户分析社交媒体平台积累了大量用户个人信息和行为数据,通过数据挖掘技术,可以进行用户画像的创建,帮助平台进行优化和个性化推荐。
这些技术可以识别用户的兴趣、喜好、行为模式等,并根据这些信息为用户提供更加精准的服务。
其次,社交网络中用户的社交关系分析也是数据挖掘技术的一个重要应用方向。
通过分析用户之间的互动情况、社交圈子和社交影响力等指标,可以了解用户之间的关系网络,并通过这些数据为用户推荐适合的社交圈子、好友或相关内容。
二、内容挖掘社交媒体平台每天都会产生大量的文本、图片、视频等内容。
通过数据挖掘技术,可以对这些内容进行挖掘和分析,提取出其中的信息和主题。
例如,通过文本挖掘技术,可以自动识别出内容中的情感倾向、关键词和主题等。
这不仅有助于用户更好地了解和筛选社交媒体上的信息,还可以为平台提供更加有效的内容推荐。
三、舆情监测社交媒体平台成为了用户表达观点、分享感受和批评产品的重要场所。
通过数据挖掘技术,可以对社交网络中的舆情进行实时分析和监测。
例如,可以通过情感分析技术,对用户在社交媒体上对产品或事件的态度进行判断,及时发现用户的需求和问题,并进行相应的处理和优化。
四、社交广告社交媒体平台的商业化进程促使了社交广告的兴起。
通过社交媒体的数据挖掘技术,可以对用户的个人信息、行为数据进行分析,实现广告的精准投放。
例如,根据用户的兴趣、地理位置和社交关系等信息,将广告投放给潜在的目标用户,提高广告的效果和转化率。
总结社交媒体领域数据挖掘技术在社交网络中的应用广泛且成效显著。
通过对用户行为、社交关系、内容和舆情等数据的挖掘和分析,可以更好地理解用户需求,优化用户体验,提供个性化的推荐和服务。
大数据时代下的社交网络分析与挖掘

大数据时代下的社交网络分析与挖掘一、引言随着互联网的迅猛发展和智能设备的普及,我们正处在一个大数据时代。
在这个时代,海量的数据被产生、存储、传输和使用。
在这些数据中,社交网络数据占据了很大一部分。
社交网络已经成为了人们日常生活中必不可少的一部分,并且不仅仅用于社交娱乐,还被广泛应用于商业和学术研究中。
在这样的背景下,如何对社交网络数据进行有效地分析和挖掘,成为了一个极具实践意义和研究价值的课题。
二、社交网络的概述社交网络是由一组个体(可以是个人、组织或其他实体)以及它们之间的关系所构成的网络。
在社交网络中,个体之间可以通过多种方式进行连接和交流,如好友关系、关注关系、互动行为等。
社交网络的研究重点在于分析个体之间的关系、交流模式和信息传播规律,从中挖掘出有用的信息和知识。
三、社交网络分析的方法社交网络分析的核心是研究网络中的个体和关系。
为了进行有效的分析,研究者们开发了各种方法和指标。
其中常用的方法包括:节点中心性分析、社团检测、路径分析和信息传播模型等。
1. 节点中心性分析节点中心性是衡量一个节点在网络中的重要性的指标。
通常用度中心性、介数中心性和接近中心性来度量一个节点的中心性。
度中心性反映了一个节点的关联程度,介数中心性反映了一个节点在信息传播中的作用,接近中心性反映了一个节点与其他节点之间的距离。
2. 社团检测社团是网络中紧密联系在一起的一组节点。
社团检测算法可以将网络中相似的节点聚集到一起,从而发现隐藏在网络结构中的社团结构。
常用的社团检测算法有Modularity、Louvain和GN算法等。
3. 路径分析路径分析是研究网络中节点之间的关联关系和路径特征。
研究者可以通过计算节点之间的最短路径、最短路径长度和路径可达性等指标,揭示节点之间的相互作用和信息传播路径。
4. 信息传播模型信息传播模型是研究网络中信息传播过程的模型。
常见的信息传播模型有独立级联模型、线性阈值模型和复杂阈值模型等。
社交网络中的网络影响力分析与节点关键性评估

社交网络中的网络影响力分析与节点关键性评估一、引言社交网络在现代社会中扮演着重要的角色,人们利用社交网络平台与他人进行交流、分享信息和建立社交关系。
随着社交网络规模的扩大,网络影响力分析成为了研究的热点之一。
本文将探讨社交网络中的网络影响力分析与节点关键性评估的方法与应用。
二、网络影响力分析的概念及方法1. 网络影响力的定义和意义网络影响力是指一个节点在社交网络中对其他节点产生的影响程度。
研究网络影响力有助于揭示信息在社交网络中的传播规律,对于个人用户、政府机构和商业企业都具有重要意义。
2. 社交网络中的网络影响力评估方法(1)度中心性评估法:评估一个节点的网络影响力可以从度中心性出发,即节点的度量,即节点与其他节点之间的连通性。
节点的度越大,其在网络中的网络影响力越高。
(2)接近中心性评估法:接近中心性是指一个节点与其他节点之间的平均距离。
节点的接近中心性越高,其在网络中的网络影响力越大。
(3)介数中心性评估法:介数中心性是指一个节点在所有最短路径中作为中介节点的频率。
节点的介数中心性越高,其在网络中的网络影响力越大。
三、节点关键性评估的概念及方法1. 节点关键性的定义和意义节点关键性是指在社交网络中具有重要作用和影响力的节点。
节点关键性评估可以帮助用户、企业和政府等利益相关方确定与其目标相关的关键节点,从而明确实施战略和决策。
2. 社交网络中的节点关键性评估方法(1)度中心性评估法:与网络影响力评估中的方法一致,节点的度越大,其在关键性评估中的重要性越高。
(2)PageRank算法:PageRank算法是著名的节点关键性评估方法,通过考虑网络上的链接关系,将节点的关键性评估与其周围节点的关系相结合,从而得出节点的权重分数。
(3)Eigenvector中心性评估法:Eigenvector中心性是指一个节点的重要性与其与其他重要节点之间的关联程度。
节点与其他重要节点的连接越多,其在关键性评估中的权重越高。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《社交大数据环境下影响力最大化节点挖掘技术及其应用》项目总结报告一、项目概况项目基本信息:本项目是由东南大学和苏州米谷网络科技有限公司联合承担,立项时间为2014年9月,项目编号为BY2014127-10,项目负责人为东南大学计算机科学与工程学院曹玖新。
本项目研究经费150万元,其中省拨款30万元,单位自筹120万元。
计算机技术的快速发展和社交方式的多样化催生了很多大规模的在线社交网站。
这些大型在线社交网络的成员数目庞大、结构错综复杂、交互行为数据繁多。
它们的出现对社交网络的研究提出了巨大的机遇和挑战。
通过研究影响最大化问题不仅有助于人们理解影响传播的动态过程,而且在社会心理学、传播学、公共关系学、广告学、营销学、消费行为学等领域也具有重要的应用,比如市场营销、疾病预防、舆论引导和社会安定等。
最大影响力节点挖掘的目标是挖掘社交网络社区中具有一定影响力的节点,这些节点的交互行为对整个网络的信息传播趋势具有重大影响。
因此,最大影响力节点的挖掘有助于网络舆情的监控与引导。
微博是目前主流的社交网络,信息流动速度快,用户交互行为频繁,以内容简洁、发布实时、互动性强、自由开放和高容纳性吸引了越来越多的用户,成为虚拟全民社会。
通过对一些意见领袖的监控,可以有效地从源头抑制谣言的流传与扩散。
另外,通过对意见领袖的舆论引导,如微博中通过意见领袖的转播或评论行为使热点新闻消息得到爆炸式传播,产生一定的社会反响,引起有关部门的高度关注,目前政府部门竞相开通政务微博,微博、BBS等社交媒体成为事件曝光、网络反腐、政务公开的一个重要网络平台。
作为传播媒介的社交网络,在社会个体之间相互影响,信息传播和思想引导方面,发挥着重大作用。
研究表明,通过朋友或其他信任源的推荐可以获得更高的满足度。
这就提出了如何充分利用个体之间的相互关系来达到最好影响效果问题。
例如一家创业公司新开发了一个新型且很实用的产品,想通过社交网络对产品做推广营销,然而推广资金有限,例如厂家只能给小部分用户发放免费产品去使用它,如果其中有用户满意他们就会购买,并且推荐给他们的朋友也去购买,这些受到影响的朋友又会把该产品推荐给他们自己的朋友,同样的过程持续进行,就产生了级联推荐的效果,这就是营销领域的“口碑效应”(work-of-mouth)现象和“病毒式营销”(viral marketing)。
综上所述,针对以上问题,东南大学与苏州米谷网络科技有限公司联合承担了江苏省产学研前瞻性联合研究项目“社交大数据环境下影响力最大化节点挖掘技术及其应用”的研究工作,去研究真实社交网络中影响力最大化节点挖掘技术,即在大规模社交网络中挖掘一个较小的节点集合使得该集合在社交网络中的影响力最大化,通过高效且准确的影响力最大化节点挖掘算法,实现企业广告在社交网络中的精准营销与投放、社会舆论的监控等。
具体研究内容包括六个方面:(1) 基于话题的最大影响力节点挖掘:本部分旨在基于社交网络用户的交互行为和信息传播机制,对社交网络的节点影响力进行深度挖掘。
通过建立合适的用户节点属性模型,包括结构属性和话题属性,设计有效的挖掘算法,解决能适用于真实社交环境中的意见领袖识别算法,从而为微博类新型社交网络的舆情分析与传播控制提供技术支撑。
(2) 基于拓扑结构的最大影响力节点挖掘:本部分首先对真实社交网络数据集进行抽象,分析网络中的结构特性和节点属性;然后对所有数据集提供一个抽象的接口,以供其他模块使用,而无需关注具体的数据集特征;再次,基于具体的传播模型和网络接口,对节点的影响力进行建模;最后,基于节点核数概念提出高效的影响力节点集合发现算法;同时,提出一种综合启发式和贪心策略的混合算法,它既有着贪心算法那样稳定且高的传播影响力,又没有传统贪心算法那样高的时间复杂度,在时间效率和影响效果上达到良好的平衡。
(3) 基于节点主题属性的最大影响力节点挖掘:通过对比发现,本部分研究的问题与基于拓扑结构的影响最大化问题的最大区别就在于网络中加入了节点主题属性信息,最终选取的节点在具有特定主题属性的节点集内影响最大化。
节点主题属性对信息传播的影响从深层次来说,是节点主题属性对节点间影响概率的影响,这是由于节点主题属性影响节点对信息的偏好程度。
因此,解决基于节点主题属性的影响最大化问题的直观思路就是:根据节点主题属性对节点间影响概率建模,在此基础上研究高效的影响最大化算法挖掘k个影响力节点。
(4) 基于成本效益的最大影响力节点挖掘:传统的影响最大化问题的研究在选择影响力节点时忽略了节点之间的差异性,没有考虑到选择节点所要花费的成本,而实际营销中的推广活动都有预算的约束,选择不同的用户需要不同的花费。
基于以上考虑,本项目给出了对节点成本的定义方法,并提出了基于成本效益的影响最大化问题。
针对这个问题,本部分综合考虑网络拓扑和传播模型的特点,提出了基于概率覆盖范围的启发式算法,并在此基础上利用子模函数特性和惰性计算技术提出基于概率覆盖范围的惰性节点选择算法。
(5) 基于成本的广告投放策略研究:本部分同时考虑了选择节点所需要的成本和节点主题属性两个因素,提出了基于成本的广告投放问题,旨在广告预算有限的情况下选择合适的初始种子节点来达到尽可能好的广告效应,这个问题本质上是考虑了成本效益和节点主题属性的影响最大化问题。
针对这个问题,本部分首先结合网络营销平台和现实情况对节点成本建模;然后利用节点对某信息的偏好程度(节点主题属性与广告主题间的相似度)和节点之间关系亲密程度(节点间的关注度)这两个因素对节点间影响概率p uv进行建模;最后根据节点间影响概率p uv和节点的成本提出新的度量节点影响力的指标:平均概率,之后设计一种基于平均概率的种子节点选择算法。
(6) 社交网络中影响力最大化节点挖掘系统的实现:根据上述研究内容,采用本项目的研究成果,实现社交网络中影响力最大化节点挖掘系统。
该系统主要由以下几个模块组成:数据输入与处理模块、算法实现模块、传播模拟模块和结果可视化模块。
二、项目实施情况经东南大学及苏州米谷网络科技有限公司双方协作,本项目成立了以项目负责人为首的校企联合研发团队共计15人,其中副教授2人,讲师1人,企业工程师5人,博硕士研究生7人。
经过两年多的产学研合作研究,较系统地研究了社交大数据环境下影响力最大化节点挖掘技术,成功实现了社交网络中影响力最大化节点挖掘原型系统,圆满完成了研发和产业化任务。
具体表现在以下几方面:(1) 在基于话题的最大影响力节点挖掘方面,通过社交网络提供的开放接口获得我们所需要的数据集,包括用户信息,微博内容等。
在此基础上提取评论集进行话题识别,得到网络兴趣社区。
在网络兴趣社区中对于每个话题形成的用户发帖和回帖网络进行用户的观点挖掘,得到话题的意见评价情况。
最后,在网络兴趣社区中结合观点挖掘得到的结果以及网络兴趣社区的结构特征与话题特征识别某个兴趣社区中的意见领袖,为话题传播的舆情控制与引导提供决策支持。
(2) 在基于拓扑结构的最大影响力节点挖掘方面,基于社交网络的拓扑结构和节点之间的等概率传播,提出一种基于节点核数的核覆盖算法,k-核解析是一种研究大规模网络的层次性方法,通过k-核解析,网络逐渐趋于核心的区域,节点核数越大,其连通性也越强,并在节点之间存在大量不同的路径,再通过限制节点间的距离,使得影响力能够有效的传播。
同时,提出一种综合启发式和贪心策略的混合算法,它既有着贪心算法那样稳定且高的传播影响力,又没有传统贪心算法那样高的时间复杂度,在时间效率和影响效果上达到良好的平衡。
(3) 在基于节点主题属性的最大影响力节点挖掘方面,选择影响力节点时加入了节点主题属性信息。
节点主题属性对信息传播的影响从深层次来说,是节点主题属性对节点间影响概率的影响,这是由于节点主题属性影响节点对信息的偏好程度。
因此,针对这个问题,首先根据节点主题属性对节点间影响概率建模,在此基础上研究高效的影响最大化算法挖掘k个影响力节点。
(4) 在基于成本效益的最大影响力节点挖掘方面,选择影响力节点时考虑了节点成本因素,并提出了基于成本效益的影响最大化问题。
本项目对节点成本建模使得影响最大化问题更贴近真实,同时综合考虑网络拓扑和传播模型的特点,提出了基于概率覆盖范围的启发式算法,并在此基础上利用子模函数特性和惰性计算技术提出基于概率覆盖范围的惰性节点选择算法。
(5) 在基于成本的广告投放策略研究方面,选择影响力节点时同时考虑了节点成本和节点主题属性。
在对节点成本建模时结合了网络营销平台和现实的情况,对节点间影响概率p uv建模时又利用了节点对某信息的偏好程度和节点之间关系亲密程度这两个因素,最后根据节点间影响概率p uv和节点的成本提出新的度量节点影响力的指标:平均概率,然后设计了基于平均概率的种子节点选择算法。
(6) 在社交网络中影响力最大化节点挖掘系统实现方面,根据本课题的理论研究成果,实现了社交网络中影响力最大化节点挖掘系统,该系统主要包括数据输入与处理模块、算法实现模块、传播模拟模块和结果可视化模块。
这样可以将整个研究成果更直观地呈现给用户,使得用户能更方便地使用它,同时也可以将复杂数据转换成图形或图像在屏幕上显示出来,并与用户进行交互。
(7) 项目共申请发明专利3项;软件著作权1项;在国内外核心期刊和会议上发表论文6篇,EI收录论文6篇。
(8) 项目研究过程中,培养博士研究生1名(周涛),硕士研究生7名(徐顺、董丹、吴江林、赵钊、王浩然、冯雪艳、袁堂飞)。
三、项目技术情况本项目主要围绕社交大数据环境下影响力最大化节点挖掘技术,从基于话题的最大影响力节点挖掘、基于拓扑结构的最大影响力节点挖掘、基于节点主题属性的最大影响力节点挖掘、基于成本效益的最大影响力节点挖掘、基于成本的广告投放机制以及社交网络中影响力最大化节点挖掘系统六个方面进行研究与开发,具体技术情况汇报如下:1. 基于话题的最大影响力节点挖掘(1) 解决的关键技术通过社交网络提供的开放接口获得我们所需要的数据集,包括用户信息,微博内容等。
在此基础上提取评论集进行话题识别,得到网络兴趣社区。
在网络兴趣社区中对于每个话题形成的用户发帖和回帖网络进行用户的观点挖掘,得到话题的意见评价情况。
最后,在网络兴趣社区中结合观点挖掘得到的结果以及网络兴趣社区的结构特征与话题特征识别某个兴趣社区中的意见领袖,为话题传播的舆情控制与引导提供决策支持。
(2) 研究方法及技术路线基于兴趣的话题识别。
通过对用户产生的话题进行文本分析,采用聚类算法进行话题识别。
得到话题集后进行话题-用户映射,识别出主题社区。
多维度属性挖掘和观点挖掘。
意见领袖挖掘建立在网络兴趣社区中,为了获得意见领袖的影响力和权威度,有必要从评论内容角度分析周围用户对意见领袖的态度趋势,同时还需要挖掘其他体现用户权威度的特征,比如用户的粉丝数,参与话题的活跃度,所发表微博获得的转发数与评论数等。