社交网络数据挖掘
社交网络中的数据分析与挖掘

社交网络中的数据分析与挖掘随着互联网的迅猛发展,社交网络成为了人们日常生活中不可或缺的一部分。
我们可以通过社交网络和朋友们保持联系,获取新的信息和知识,分享自己的生活和思想。
同时,随着数据挖掘技术的发展,我们也可以通过社交网络中的各种数据,来挖掘用户的行为习惯、个性特征和情感倾向。
一、社交网络中的数据类型社交网络中的各种操作行为和内容,如个人资料、发表的文章、浏览历史、评论和点赞等,都会被记录下来。
这些数据可以被分成以下几个类型:1. 用户个人信息:例如姓名、性别、年龄、地理位置、职业、爱好等。
2. 用户行为数据:包括发布的内容、点赞、评论、转发、关注、私信、浏览和搜索历史等。
3. 数据关系:用户之间的关系网络,包括好友关系、粉丝关系、关注关系等。
4. 文本数据:包括用户发布的文字内容,如微博、朋友圈、评论和私信等。
5. 图片、视频数据:包括用户发布的图片、视频等多媒体内容。
二、社交网络中的数据分析与挖掘应用1. 社交网络情感分析情感分析是一种将自然语言处理和机器学习技术结合起来的技术,可用于分析社交网络用户发表的文字内容,并判断其中包含的情感倾向。
例如,可以通过对用户发表的带有标签的评论进行情感分类,判断该评论是正面、中性还是负面的。
2. 社交网络推荐系统社交网络平台与许多其他应用程序常常充当基于兴趣的推荐系统。
根据用户的兴趣和行为数据,推荐系统会向用户提示可能感兴趣的人、内容和社区。
这些推荐系统常常基于机器学习模型和大规模的数据挖掘算法构建。
3. 社交网络网络分析社交网络中的各种关系可以用网络图的形式呈现,根据节点的度、网络密度等统计指标,可以分析出某一社交圈子或社区的特征。
通过网络分析算法,可以找到关键节点、社区、子图等。
网络分析可以揭示个体之间的关系,以及这些关系的长期变化规律。
4. 社交网络用户画像社交网络还可以用于用户画像的建立。
根据用户在社交网络平台上的行为、兴趣和其他数据,可以对用户进行分析和分类,并建立用户画像。
社交网络中的数据挖掘及隐私保护研究

社交网络中的数据挖掘及隐私保护研究社交网络是当今世界上最为流行的网络应用之一。
人们常常借助社交网络平台进行交流、分享、娱乐等活动,使得每个人在网络上都能找到自己的社交圈,找到与自己有共同爱好和兴趣的人。
然而,在社交网络中我们不仅可以分享自己的信息,也会不知不觉地暴露自己的一些隐私,这些隐私可能会被一些不法分子所利用。
因此,社交网络中的数据挖掘和隐私保护问题引起了广泛关注。
一、社交网络中的数据挖掘社交网络平台让我们的交际变得更加便捷,方便了我们和他人之间的连接和交流。
然而,在海量的交际和交流信息中,我们可以挖掘出很多有用信息。
数据挖掘技术可以通过对社交网络平台上的各种信息进行深度挖掘,找到潜在的相关性或潜在的影响力。
在社交网络中,我们可以使用数据挖掘技术来做以下事情:1、推荐算法推荐算法是一种基于用户行为和历史数据,对用户进行商品或服务推荐的技术。
在社交网络平台上,通过对用户行为和历史数据的分析,可以向用户推荐朋友、兴趣、产品等。
例如,Facebook会向你推荐“你可能认识的人”,很多网站会向你推荐你可能想要购买的商品等。
2、情感分析情感分析是指通过对文本、音频、图片等信息的分析,发现其中蕴含的情感信息。
在社交网络中,情感分析可以帮助我们分析用户发布的内容是否具有积极的、消极的或中性的情感,了解用户的情感状态和生活方式。
例如,分析用户在社交网络中发表的言论是否积极向上,或者是负面的。
3、社交网络分析社交网络分析是一种通过网络拓扑结构发现不同人群之间的关联、交集、群体动态等知识的技术。
在社交网络中,社交网络分析可以帮助我们了解用户之间的关系、用户群体的特点和行为习惯等信息。
例如,我们可以分析某些人在社交网络中频繁互动,判断他们之间是否存在某种关系,进而发掘他们之间的共同点。
二、社交网络中的隐私保护随着社交网络的发展,越来越多的人使用社交网络平台来与其他人进行互动。
然而,这种便利性是以用户隐私为代价的。
社交网络数据挖掘与分析

社交网络数据挖掘与分析一、社交网络数据挖掘概述社交网络数据挖掘是一种从社交网络中提取有用信息的技术过程。
因为社交网络已经成为了很多人生活的一部分,所以社交网络数据挖掘也变得越来越重要。
社交网络数据挖掘可以用于许多领域,例如社交推荐、情感分析、社交媒体营销等。
二、社交网络数据挖掘方法社交网络数据挖掘有许多方法,包括:文本挖掘、网络分析、机器学习等。
下面分别介绍它们的具体内容。
1. 文本挖掘文本挖掘是从文本数据中提取知识的过程。
在社交网络中,文本数据通常是指用户发表的帖子、评论、私信等。
文本挖掘的任务包括情感判断、主题提取、关键字提取等。
以情感判断为例,我们可以通过分析用户发表的评论来判断用户对某个话题的态度是积极的还是消极的。
2. 网络分析网络分析是指分析社交网络中的用户之间的互动关系。
社交网络中的用户可以通过关注、点赞、分享等方式进行互动。
通过网络分析,我们可以了解哪些用户之间交流比较频繁,哪些用户之间交流不太频繁等。
通过对这些数据的分析,我们可以了解用户的兴趣、好友、群组等信息。
3. 机器学习机器学习是指通过训练模型来预测新数据的过程。
在社交网络中,我们可以通过机器学习方法来预测用户的兴趣和行为。
以兴趣预测为例,我们可以通过分析用户的历史行为来预测用户可能感兴趣的话题。
这对于社交推荐来说非常重要。
三、社交网络数据挖掘应用社交网络数据挖掘可以应用于许多领域,下面分别介绍它们的具体内容。
1. 社交推荐社交推荐是指通过挖掘用户在社交网络中的行为数据,提供个性化、精准的推荐服务。
以朋友圈为例,我们可以通过分析用户在朋友圈中发布的内容和与之交互的用户,来向用户推荐他们感兴趣的内容、关注的用户等。
2. 情感分析情感分析是指从文本数据中挖掘出句子或文章的情感(如积极、消极、中立等)。
社交网络中的文本数据非常丰富,通过对用户评论、点赞等行为的分析,我们可以挖掘出用户对某个话题的情感倾向,如用户对某个品牌的态度、对某个事件的反应等。
社交网络数据挖掘技术及应用

社交网络数据挖掘技术及应用随着互联网技术的不断发展,社交网络这一新型网络形态也随之兴起。
社交网络给人们带来了更加精准和快捷的交流方式,同时也使得人们更加容易获取到大量的信息。
在这种大数据环境下,如何利用社交网络进行信息挖掘,已经成为大众关注的焦点话题之一。
社交网络是一个庞大的信息库。
在社交网络中,人们不仅可以发布各种信息,还可以与其他用户进行交互、互动沟通,并通过评论、转发等操作对他人的信息进行评价和传递。
因此,社交网络中的数据具有多样性、复杂性和大量性的特点。
如何利用这些数据进行挖掘和分析,对于提高信息的准确性和实用价值至关重要。
社交网络数据挖掘技术的发展使得社交网络数据的分析变得更为精准和高效。
社交网络数据挖掘技术包括各种算法和模型,例如文本分析、聚类分析、关系网络分析等等。
这些技术可以帮助人们从海量的社交媒体数据中提取出有价值的信息,进行个性化推荐、情感分析、广告定向投放等应用。
其中,文本分析技术是社交网络数据挖掘应用的重要部分。
在社交网络中,用户发布的文字信息包含了大量的语言信息。
这些信息常常有很强的时效性和情感色彩,因此可以用于分析用户情感、关注度和行为等方面。
文本分析技术可以通过自然语言处理的手段将人类语言转化为计算机可以处理的数据形式,并将其进行分析和处理,以获取有价值的信息。
与文本分析技术相比,关系网络分析技术更加侧重于分析用户之间的关系和交互,旨在发现用户之间的共性和差异性,以及用户间的关联规律等。
关系网络分析技术主要包括社区发现、网络中心性、链式关系挖掘等方面。
这些技术可以帮助人们更加深入地了解社交网络中人际关系的复杂性和规律性,对于社交网络的营销、管理和战略决策具有重要意义。
社交网络数据挖掘技术的应用场景非常广泛。
其中,社交网络舆情监测和预警是典型的应用之一。
社交网络上的舆情信息多样化、快速更新、易传播,很容易引发公众关注。
通过舆情监测,单位或个人可以及早发现和解决突发事件、危机事件以及其他公共事件,从而发挥正面效应。
微信社交媒体的网络数据挖掘与分析

微信社交媒体的网络数据挖掘与分析随着网络技术的不断发展,微信这一社交媒体平台已经成为人们生活中不可或缺的一部分。
在这个平台上,人们可以分享自己的生活点滴,与朋友进行交流,还可以接收到最新的资讯信息。
但是,微信平台上产生了大量的用户数据,如何对这些数据进行挖掘和分析成为了一个重要的问题。
因此,本文将对微信社交媒体的网络数据挖掘与分析进行探讨。
一、微信数据挖掘的方法在微信平台上进行数据挖掘需要借助于各种工具和方法,下面列举了一些主要的方法:1. 基于关键词的挖掘:使用主题模型和情感分析等技术挖掘微信用户发布的文章和评论,可以了解到微信用户的兴趣爱好和情感倾向。
2. 基于社交关系的挖掘:通过构建微信用户的社交网络图,可以挖掘出用户之间的社交关系,包括互动频率和影响力等。
3. 基于地理位置的挖掘:通过微信定位技术,挖掘用户所在地域的特点和用户集中的地点,以及用户对不同地点的情感倾向。
以上三种挖掘方法虽然各有不同的特点,但是都可以很好地解释微信用户的行为和心理状态。
二、微信数据分析的应用将数据挖掘出来的信息进行分析,可以得到多种应用。
下面列举了一些主要的应用方式:1. 个性化服务:通过基于关键词的挖掘,可以对微信用户的兴趣爱好进行分析,进而为用户推荐相关的商品或服务,提高用户体验。
2. 舆情分析:通过基于社交关系的挖掘,可以分析微信用户对一些事件和话题的态度,及时发现并处理突发舆情事件。
3. 商业推广:通过基于地理位置的挖掘,可以分析出企业在不同地域消费者的需求和特点,进而制定销售策略和广告营销方案。
以上三种应用方式可以使微信数据分析更加应用化、实用化、精确化。
三、微信数据分析的发展前景数据在当前的信息化社会中越来越重要,微信数据分析也将会有更广阔的应用前景。
下面列举了一些发展趋势:1. 面向个人化:利用数据挖掘技术,分析出每个用户的兴趣和需求,为每个用户提供个性化的服务,进一步提高用户粘性。
2. 全渠道整合:通过将数据整合至多个渠道,包括微信、微博、电商平台等,来更好地整合用户消费数据,以及总结行业数据,驱动企业在商业领域的竞争力。
数据挖掘与社交网络分析

数据挖掘与社交网络分析近年来,随着互联网的迅猛发展,大数据时代的到来使得数据挖掘和社交网络分析逐渐成为热门研究领域。
数据挖掘通过从大规模数据集中发现隐藏模式、关联规则和有价值信息的技术来为决策和预测提供支持,而社交网络分析则对社交网络数据进行建模和分析,以揭示个体行为、社团结构和信息传播等方面的特征。
本文将介绍数据挖掘和社交网络分析的基本概念、方法和应用,并探讨它们对于解决现实问题的潜力和挑战。
一、数据挖掘1.1 概述数据挖掘是从数据中自动发现模式、关联规则和有价值信息的过程。
它涉及机器学习、统计学和数据库系统等领域的技术和方法,其目标是通过分析海量数据来提取知识和提供决策支持。
1.2 方法数据挖掘的方法包括聚类、分类、关联规则挖掘和预测等。
聚类是将数据分组成具有相似特征的类别;分类是根据已知的数据样本对新的数据进行分类;关联规则挖掘是找出数据集中的频繁项集和关联规则;而预测则是根据历史数据来进行未来事件的预测。
1.3 应用数据挖掘在各个领域中都有广泛的应用,例如金融领域的信用评估和欺诈检测、医疗领域的疾病诊断和药物研发、市场营销领域的用户行为分析和推荐系统等。
这些应用可以帮助人们更好地理解和利用大数据。
二、社交网络分析2.1 概述社交网络分析是对社交网络中的个体、社团和信息传播等进行分析的过程。
社交网络是由一组个体和它们之间的关系构成的复杂网络,如Facebook和Twitter等社交媒体平台。
社交网络分析旨在揭示个体之间的社会关系、社团结构和信息传播过程等方面的特征。
2.2 方法社交网络分析的方法包括节点度中心性、介数中心性和社团检测等。
节点度中心性衡量个体在网络中的联系数量,介数中心性衡量个体在网络中作为中介的程度,而社团检测则是识别出网络中的社团结构。
2.3 应用社交网络分析在社会学、心理学和计算机科学领域中都有广泛的应用。
例如,社交网络分析可以帮助了解信息传播的机制,推荐好友和产品,预测社交影响力和用户行为等。
社交媒体领域数据挖掘技术在社交网络中的应用

社交媒体领域数据挖掘技术在社交网络中的应用近年来,随着社交媒体的普及和用户数量的急速增长,社交网络逐渐成为人们沟通交流的重要平台。
然而,这些平台中所产生的庞大数据量却给人们带来了一定的管理和分析困惑。
为了更好地理解和利用这些海量数据,社交媒体领域的数据挖掘技术开始得到广泛应用。
本文将探讨社交媒体领域数据挖掘技术在社交网络中的应用。
一、用户分析社交媒体平台积累了大量用户个人信息和行为数据,通过数据挖掘技术,可以进行用户画像的创建,帮助平台进行优化和个性化推荐。
这些技术可以识别用户的兴趣、喜好、行为模式等,并根据这些信息为用户提供更加精准的服务。
其次,社交网络中用户的社交关系分析也是数据挖掘技术的一个重要应用方向。
通过分析用户之间的互动情况、社交圈子和社交影响力等指标,可以了解用户之间的关系网络,并通过这些数据为用户推荐适合的社交圈子、好友或相关内容。
二、内容挖掘社交媒体平台每天都会产生大量的文本、图片、视频等内容。
通过数据挖掘技术,可以对这些内容进行挖掘和分析,提取出其中的信息和主题。
例如,通过文本挖掘技术,可以自动识别出内容中的情感倾向、关键词和主题等。
这不仅有助于用户更好地了解和筛选社交媒体上的信息,还可以为平台提供更加有效的内容推荐。
三、舆情监测社交媒体平台成为了用户表达观点、分享感受和批评产品的重要场所。
通过数据挖掘技术,可以对社交网络中的舆情进行实时分析和监测。
例如,可以通过情感分析技术,对用户在社交媒体上对产品或事件的态度进行判断,及时发现用户的需求和问题,并进行相应的处理和优化。
四、社交广告社交媒体平台的商业化进程促使了社交广告的兴起。
通过社交媒体的数据挖掘技术,可以对用户的个人信息、行为数据进行分析,实现广告的精准投放。
例如,根据用户的兴趣、地理位置和社交关系等信息,将广告投放给潜在的目标用户,提高广告的效果和转化率。
总结社交媒体领域数据挖掘技术在社交网络中的应用广泛且成效显著。
通过对用户行为、社交关系、内容和舆情等数据的挖掘和分析,可以更好地理解用户需求,优化用户体验,提供个性化的推荐和服务。
数据挖掘在社交网络中的应用分析

数据挖掘在社交网络中的应用分析社交网络已经成为了人们日常生活中不可或缺的一部分,越来越多的人通过社交网络与他人进行沟通交流,分享生活中的点滴。
这些大量的数据给数据分析带来了巨大的挑战和机遇。
数据挖掘技术在社交网络中的应用分析已成为研究热点,可以为社交网络的发展和应用提供有力的帮助。
一、社交网络中的数据挖掘技术社交网络中的数据主要包括用户的个人信息、发布的文本信息、图片和视频等。
数据挖掘在社交网络中的应用需要依赖于大数据技术,包括数据存储、数据预处理、数据分析和数据可视化等。
其中,数据挖掘技术主要包括关联规则挖掘、分类算法、聚类分析、时序分析、异常检测等。
1.关联规则挖掘关联规则是在一组笛卡尔积数据中发现物品间的关联关系,可以用于解释为什么某个事件会发生或某个人会购买某种商品等。
在社交网络中,关联规则挖掘常用于识别某些行为或特征之间的相互依赖性。
例如,挖掘用户的好友之间的关系、用户经常访问的网站等等。
2.分类算法分类算法是将数据集划分为不同类别的方法。
在社交网络中,分类算法应用很广泛,可以应用于用户的性别、年龄、职业、教育程度等多个方面的分类。
例如:用户的爱好细分。
3. 聚类分析聚类分析是将数据按照相似度划分到不同的类别中。
在社交网络中,聚类分析应用广泛,可以将用户分成不同的类别,如活跃用户、沉默用户、高价值用户等等。
还可以将用户的兴趣爱好等信息进行聚类分析,以便于为用户推荐相应的内容或用户。
4. 时序分析时序分析用于监测随时间变化的模式。
在社交网络中,时序分析主要用于研究用户的行为变化和趋势,如某个时间段内用户的访问量和活跃度等等。
5. 异常检测异常检测是识别与一般模型偏离的数据的过程。
在社交网络中,异常检测可以用于识别欺诈用户、识别不适当或有害的内容等。
二、社交网络中的数据挖掘应用案例社交网络中的数据挖掘应用案例主要包括用户行为分析、事件追踪、个性化推荐等等。
下面以微博为例,详细阐述在社交网络中数据挖掘技术的应用。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章
§
现实世界中,充满着各式各样的社会网络,例如,从大规模的电力网络到全国的交通运输网络,从社会下层的人际关系网络到社会上层的政治、经济、科研合作网络,从生态食物链网络到各种生物体内的新陈代谢网络等,可见,社会生活中,社会网络无处不在。社会网络是由一群个体和个体之间的各种关系组成的集合[1],其中这些关系包括朋友关系、亲戚关系、上级与下级的关系、同学关系、师生关系、同事关系、具有共同兴趣爱好的关系以及基于地域的邻居关系等。社会网络可分为真实存在的社会网络和虚拟社会网络,真实存在的社会网络包括:人际关系网、各种生态食物链网、公司内部的人事网、国家部门之间的业务网等;虚拟社会网络包括:万维网、博客、论坛、MSN、Facebook、人人网、开心网等。社会网络具有广泛的应用价值,其一,社会网络提供了许多新的交际方式,比如在虚拟社会网络中,可以通过互联网来交友、分享信息、学习和找工作等;其二,社会网络给商业带来了许多机遇与挑战,利用社会网络分析技术可以进行市场营销,预防计算机病毒的传播,预测恐怖袭击,粉碎犯罪集团,进行疫苗接种等。
学位论文作者签名:
年月日
摘要
现实生活中存在着各式各样的社会网络,例如,人际关系网、万维网、博客、论坛、MSN、Facebook以及生态食物链网等。社会网络是由一群个体和个体之间的各种关系组成的集合,其中这些关系包括朋友关系、亲戚关系、上下级关系、师生关系以及网友关系等。对大型社会网络进行研究,从中挖掘出一些有价值的信息或模式,具有广泛的应用价值。其一,社会网络提供了许多新的交际方式,可以通过互联网进行交友、交流、分享信息、找工作等;其二,社会网络给各个领域带来了许多机遇与挑战,利用社会网络分析技术可以进行市场营销,预防计算机病毒的传播,预测恐怖袭击,粉碎犯罪集团以及进行疫苗接种等。
在对社区进行关键节点挖掘方面,本文提出了一种动态的关键节点挖掘算法——贪婪挖掘算法。与静态挖掘算法相比,该算法在挖掘的每一步动态地确定关键节点,而不是从按影响度降序排序的节点中静态地选择前k个节点作为关键节点。经实验验证,贪婪挖掘算法与静态挖掘算法都能快速收敛,并且运行效率都差不多,但是贪婪挖掘算法挖掘的总影响度要明显高于静态挖掘算法。因此,在本文解决方案的关键节点挖掘部分,采用贪婪挖掘算法进行挖掘。
对社会网络分析技术的研究已有一定的历史积累,主要采用基于图论的分析方法,研究成果有最早的小世界理论、中心性分析、社区分析以及有关社会网络的度量标准等。近年来,随着计算机技术和互联网的迅猛发展,采用数据挖掘分析方法对社会网络进行研究已成为一个热门的研究方向。基于图论的思想,把整个社会网络表示成图的形式,其中,节点代表社会网络中的个体,边代表个体之间的链接。因此,基于社会网络的数据挖掘分析方法[2]包括基于节点的分析(如:关键节点挖掘、节点聚类以及节点的重要程度排序等)、基于链接的分析(如:链接预测和链接发现等)、基于子图的分析(如:社区发现和子图分类等)。
Research DirectionData Mining
SupervisorAssociateProfessorChen Wei
Complete Date December 2011
学位论文版权使用授权书
本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学位论文保留并向国家有关部门或机构送交论文的复印件和电子版。允许论文被查阅和借阅。本人授权上海理工大学可以将本学位论文的全部内容或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。
中图分类号:
TP274
学校代码:10252
学 号:092400354
上ห้องสมุดไป่ตู้理工大学硕士学位论文
基于社会网络的数据挖掘方法研究
姓名陆晓野
系别光电信息与计算机工程学院
专业计算机应用技术
研究方向数据挖掘
指导教师陈玮副教授
学位论文完成日期2011年12月
University ofShanghaifor Science and Technology
本学位论文属于
学位论文作者签名:指导教师签名:
年月日年月日
声明
本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已注明引用的内容外,本论文不包含任何其他个人或集体已经公开发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。
本声明的法律责任由本人承担。
Finally, agreedykey-nodes miningalgorithm,which is a dynamic mining algorithm,proposed in pared with the statickey-nodesmining algorithm, thegreedyalgorithmselect thekey-nodes dynamicallyin each step, rather thanselecting thekey-nodesstatically.The experiments show thattwoalgorithms, which are relatively stable, converge fast and have similar running time.But the greedy algorithmhas asignificantly higheraccuracythan the static algorithm.
在基于社会网络的数据挖掘方法研究方面,数据资源是非常关键的。然而,互联网上海量的数据资源给这方面的研究提供了数据支持。研究人员可从许多渠道来方便的获取大量的数据资源,例如,BBS,基于各类主题的论坛,天涯社区,微博、银行数据、网上的购物数据以及电信数据等。
目前,在基于社会网络的数据挖掘方法研究方面,值得关注和研究的问题包括以下三点: 与传统的数据挖掘方法不同,不仅要考虑单个个体,而且还要考虑个体之间的链接、他们之间的拓扑结构以及相互作用等; 基于社会网络的研究,所涉及的数据量非常庞大,虽然传统的社会网络分析方法已经比较成熟,但是它只是基于小规模的数据量,对于大规模的数据量,还必须研究出新的方法; 在数据挖掘的过程中,还涉及到用户隐私的问题,因此在使用数据时,要提出保护用户隐私的解决方案。
本文主要针对社区发现算法和关键节点挖掘算法展开研究与讨论,所有的工作都是基于这两方面来进行。介绍了社会网络分析技术,例如,中心性分析和社区分析等。介绍了数据挖掘常用的聚类算法,经典的社区发现算法以及关键节点挖掘算法,分析它们的性能、优缺点和适用范围等。当今社会网络规模都很庞大,如果直接基于整个网络进行关键节点挖掘,其效率非常低下,没有应用价值,因此本文结合社会网络的特性,创新性地提出了一种新的解决方案——基于社区进行关键节点挖掘,该方案首先对整个网络进行社区发现,然后基于社区进行关键节点挖掘,再对所有社区的关键节点求并集,得到整个网络的关键节点。由于社会网络规模庞大且具有明显的社区结构,因此可以进行社区挖掘并且可以求得一个近似解。经实验验证,对于规模庞大且具有明显社区结构的社会网络,采用本文提出的解决方案进行挖掘是可行的,虽然准确度略有下降(在可接受的范围内),但运行效率却得到了显著地提高。
Master Dissertation
DataMining Method Based onSocial Networks
Name Lu Xiaoye
DepartmentSchoolofOptical-Electricaland
Computer Engineering
SpecialtyComputer Application Technology
In this paper,we focus oncommunitydetectionalgorithmand key-nodesminingalgorithm.We first introducesocial network analysis techniques,such as, central analysis and community analysis.Thencommonclustering algorithm, the classical communitydetectionalgorithm andkey-nodesminingalgorithmsare presented with theirperformance,advangtageanddisadvantageand the scope of application.Because oflarge-scale social networks, ifweare directlyminingkey-nodesbased on thewholenetworks,theefficiency is very low,andthe value is not applied.SoAccording tothe characteristics of social networks,we propose a new solution,“MiningKey-NodesBased on Communities”.Firstly,discoveringcommunitiesbased on thewholenetworks.Thenminingkey-nodesbased oncommunities, and finallyfindingtheunion of all the key-nodes. The experiments show thatusing the paper’s solutionformininglarge-scale networkswithobvious communitystructureisfeasible.Although thesolutionreduceda little accuracy,the efficiency of thesolutionhas been improved significantly.