社会计算

合集下载

社会计算PPT+

社会计算PPT+

FaceBook用户达到6亿。Twitter用户4亿,新浪微博1.4亿。 FaceBook每天新增的照片数量大约是100万张,每个月人们在Facebook 上分享的内容条数超过了300亿。 每秒需要处理上万次读写请求。用户忍耐时间2秒。 FaceBook每月的页面浏览量超过了6900亿, 流量超过Google。 数据库结构、存储节点的可扩展性。 软件架构实现的节点容错能力。
内容管理(Content Management):Wordpress 文档管理编辑(Document Management and Editing Tool):Google Docs
2.社区发现
社区的定义

Community: “subsets of actors among whom there are relatively strong, direct, intense, frequent or positive ties.”
以节点 为中心
3.社会网络分析
社会系统

从系统论的角度看,人类社会是一个系统,由人群及其社会关系组成。
社会的环境 社会系统
社会的结构:社会网络
社会的边界
社会网络的应用场景(1)——信 息传播

传播网络:信息在社会网络上的传播轨迹,相 当于社会网络之上的一个覆盖网络。 信息传播的相关计算

一个社会事件相关的微博的传播轨迹。
社会网络的应用场景(1)——信 息传播

信息传播最大化研究:(广告传播最大化投放 技术)

可以计算出在社会网络中选取哪些节点投放广告,可以使广告得到 最大化的传播,在广告投入资金固定的情况下,可以帮助用户获得 最大的收益。

信息传播树 (广告效果计量)

机器学习在社会计算中的应用研究

机器学习在社会计算中的应用研究

机器学习在社会计算中的应用研究一、引言机器学习是指利用计算机程序来提高系统性能的一种人工智能方法。

社会计算是指将社会学、社会心理学、社会网络分析等社会科学领域的理论和方法应用到计算机科学中的新兴学科。

本文探讨了机器学习在社会计算中的应用研究。

二、机器学习的基本原理机器学习的基本原理包括监督学习、非监督学习和强化学习。

监督学习是通过学习样本数据的输入输出关系来进行预测或分类的方法。

非监督学习是发现数据的分布规律,从而对数据进行无监督分类或聚类的方法。

强化学习是通过与环境交互,使智能体可以自主学习最优策略的方法。

三、机器学习在社交网络中的应用1.社交网络的挖掘社交网络是指由人们形成的网络,它们通过不同的关系相互连接,如朋友、家庭、同事等。

机器学习在社交网络中的应用主要包括朋友推荐、社交关系发现、群组发现等。

2.社交媒体的分析社交媒体是指通过互联网、移动应用等平台进行信息交流的一种形式。

由于社交媒体具有实时性、互动性和大数据性等特点,因此可以应用机器学习方法对其进行分析和预测。

社交媒体的分析可以帮助企业进行营销策略、政府进行公共管理、个人了解社会趋势等。

四、机器学习在个性化推荐中的应用机器学习在个性化推荐中的应用主要包括基于内容的过滤、基于协同过滤的推荐和基于混合模型的推荐。

在个性化推荐中,机器学习方法可以根据用户的个人信息、历史记录、兴趣和行为等数据进行分析和建模,从而实现对用户需求和偏好的精准预测。

五、机器学习在社会安全中的应用1.犯罪行为的预测和防控机器学习在犯罪行为的预测和防控中发挥着重要作用。

通过机器学习方法对大量相关数据进行分析和建模,可以预测出潜在的犯罪风险,帮助公安机关提前预警和防控。

例如,通过对社交网络上的信息分析,可以发现潜在的犯罪嫌疑人以及犯罪网络。

2.公共安全事件的应急响应机器学习在公共安全事件的应急响应中也表现出了巨大的优势。

通过对历史数据和实时数据的分析,可以快速识别出潜在的安全风险和漏洞,从而提前进行应对和处置。

社会保险计算方法

社会保险计算方法

片:社保计算1、社保按比例分开计算。

养老、医疗、失业、生育、工伤,都要用基数分别乘以各自的比例,如果直接用基数乘以比例总数,会造成一些误差。

2、公司部分,四舍五入到分(四舍五入,保留两位小数)。

举例:基数7069.3来算养老=7069.3×22%=1555.246=1555.25医疗=7069.3×12%=848.316=848.32失业=7069.3×2%=141.39生育=工伤=35.35合计公司需缴纳=2615.66(如果直接用基数7069.3×公司缴纳比例总数37%=2615.64,会有2分钱的误差)3、个人部分,见分进角。

举例,还是基数7069.3养老=7069.3×8%=565.544=565.6医疗=7069.3×2%=141.386=141.4失业=7069.3×1%=70.693=70.7合计个人需缴纳=777.7每个月社保交费通知单上,个人部分是不会有误差的,有误差的是公司缴纳部分(因为计算方式的差异),因此hr在作社保的时候在公司缴纳部分做一下微调。

二,公积金缴纳个人和公司部分都是四舍五入到元。

需要注意的是,公积金必须是基数×7%,四舍五入以后再×2,不可以直接基数×14%,因此,公积金最后缴纳的数字必然是双数以基数4019举例,4019×7%=281.33,四舍五入=281,那么每月应该缴纳281×2=562元(如果直接4019×14%=562.66,四舍五入=563元,单数肯定就不对了)2010年北京社保缴费基数和比例养老,单位20%,个人8%医保,城镇单位10%,个人2%+3块,农民工2%,个人不缴费失业,单位1%,个人0.2%工伤,单位0.8%,个人不交生育,单位0.8%,个人不交外埠农村失业不需要个人负担,其他的和城镇户口一样外埠农村劳动力养老基数1490,失业缴费基数2236,工伤2236,医疗是2236外埠农民工今年1月开始,养老是1490,工伤固定是2236,失业固定是800一、社会保险缴费计算方法2010/7/9来源:诸葛八戒商机网社会保险缴费计算方法及缴费比例如下所示:社会保险缴费公式是:社会保险缴费额=企业社会保险缴费基数*社会保险缴费比例,其中:社会保险缴费标准是(假设社会保险缴费基数1000为例):1、养老保险企业缴费额=1000*20%=200;养老保险个人缴费额=1000*8%=802、工伤保险企业缴费额=1000*1%=103、医疗保险企业缴费额=1000*8%=80;医疗保险个人缴费额=1000*2%=204、生育保险企业缴费额=1000*0.7%=75、失业保险企业缴费额=1000*2%=20;失业保险个人缴费额=1000*1%=10注:1、社会保险缴费基数稽核:每年1月至3月各参保单位按医保中心的要求如实申报上年度工资总额(缴费基数)。

社会计算如何可能?

社会计算如何可能?
1 . 上 乞 H
厶 , ,

■口
所谓“ 社会 的计 算化 ” , 是 指随着 互联 网的普及 , 越来 越 多 的社 会 活动 都通 过互 联 网进 行 , 人类
因此而 在互联 网上 留下 海量 而且相 互关 联 的数据 足迹 , 基于 这些 数 据 足迹 , 大量 原 本不 可 追踪 、 检
t i n g ) 都日 益成为一个热 门话题。在很多人看来 , 利用社会计算 , 能够更好地监测社会运作、 洞察社
会规 律 、 预测社 会趋 势 、 规 划社会 生 活 ; 社会 计算 具有 无 限广 阔的发展 前 景 。单 从技术 的角度来 看 ,
应该 是这 样 。然 而 , 任 何技 术都 是在 特定 的社会 关 系 和结 构 中运 用 的 , 技 术 固然拥 有 巨 大 的力 量 ,
与“ 社会的计算化” 相对应的是“ 计算 的社会化” 。所谓 “ 计算 的社会化” , 是指互联 网创造 了

种环境 、 一个 平 台 , 使群 众 能够广 泛地参 与计 算 过程 , 从 而 使在 数 据 的挖 掘 、 分 析 和应 用 等方 面 ,
充 分集 中群众 智慧 成为可 能 。不言 而喻 , 计算 是社会 分 析 中的一个 必不 可少 的环 节 , 但 在相 当长 的
罗教讲 , 冯仕 政 , 梁玉成 , 陈云松等 : 大 数 据 时 代 的计 算 社 会 科 学笔 谈
时 间内 , 计 算都 是 一个 高度 封闭性 的过程 , 只有 少数 在 才 情或 地 位 上 处 于精 英 水 平 的人 才 能 参 与 。 而互 联 网 , 则创 造 了一个 高 度开放 的环境 , 即使 普 通群 众 也 能 随 时参 与 数 据计 算 。在此 过 程 中 , 尽 管每 个人 的贡 献是 有 限的 , 甚 至是 错误 的 , 但不 断 迭代 和 累积 的效 果 却 是 十分 惊 人 的。易 言 之 , 信 息技 术使 计算 过 程真 正进 入 了众 筹模 式 。 对 于“ 计算 的社会 化 ” , 大家 最熟 悉 的形 式 可能 要 数 人 肉搜 索 和 网络 评 级 。在 人 肉搜 索 中 , 广 大 网 民彼此 素不 相识 , 却 能够不 约 而 同地 参 与对 同一 个 目标 的搜 索 , 不 但免 费 贡 献 自己 的智 慧 , 并 且 相互激 励 、 相互 评鉴 、 相 互启 发 , 其 中有 冲 突 , 有 竞争 , 有合 作 , 参 与 者 可 以 随时 进 入 , 也 可 以随 时 退 出 。搜索 是一 个复 杂 的计算 过程 , 但从 参 与计算 的人数 、 参 与者 的特征 、 工 作 的方式 来看 , 该 过程 具有 强 烈 的社会 性 , 这 是 以往 的计算 过程 所 不具有 的特征 。类 似 的情况 还有 网络 评级 , 即在 消费过 程中, 网 民根 据个 人体 验 给商 品或 商家 打分 , 最后 汇 总 成该 商 品或 商 家 的信 用 评级 。在此 过 程 中 , 网 民们 的意 见相 互参 照 、 相互 引用 , 也具 有强 烈 的社会 性 , 与 以往 的信用 评定 方式 显 然不 同 。 以往在 讨论 社会 计算 时 , 很少 明确 区分 上述 两个 方 面 , 甚 至常 常 只关 注 前一个 方 面而 忽 略后 一 个 方面 。但 从社 会学 角度 来看 , 这 两个 方 面都是 社会 计算 的题 中应 有之 义 , 因为 它们 均对 社会 学 关

社会计算的基本方法与应用

社会计算的基本方法与应用

社会计算的基本方法与应用
社会计算是一种基于计算、数学和统计等科学方法来研究社会现象和社会问题的方法,通常涉及到数据收集、数据分析、模型建立和结果呈现等多个方面。

社会计算的基本方法包括以下几个方面:
1. 数据挖掘:通过分析大量的数据来识别出其中的规律和趋势,从而帮助人们了解社会现象和处理社会问题。

2. 社会网络分析:通过对社会网络中的节点与关系进行建模和分析,以了解不同社会结构之间的互动和影响。

3. 模拟:通过建立数学或计算机模型来模拟社会现象和问题,并通过不同变量的调整来推测其发展趋势和影响。

4. 机器学习:通过让计算机处理数据和学习算法来提高社会预测能力和决策支持能力。

社会计算的应用范围广泛,主要包括以下几个领域:
1. 社交网络分析:通过对社交网络中的用户行为进行分析,从而推断用户喜好、行为模式等信息,以便为用户提供更准确的服务和产品。

2. 舆情分析:通过结合自然语言处理和情感分析技术来分析人们在网上发布的言论和意见,从而了解社会舆情和舆论趋势。

3. 社会动态预测:通过建立社会模型、模拟和预测来预测决策的结果,帮助政府机构、企业等做出更明智的决策。

4. 人群行为分析:通过分析人群的行为模式、消费习惯等信息,帮助企业精准地针对不同人群进行营销、推广和服务等方面的工作。

社会计算概述

社会计算概述

10
研究理论工具
例子: 六度分割(小世界理论) 理论指出:你和任何一个陌生 人之间所间隔的人不会超过六 个,也就是说,最多通过六个 人你就能够认识任何一个陌生 人。这就是六度分割理论, 也叫小世界理论。
11
研究理论工具
六度分割理论的残缺性:关系强弱的计算 肯定了人与人之间的普遍联系,但是没有对这种联系作定量 分析。
14
Thank you!
15
2
研究背景
定义: 到底什么是“社会计算”呢?对于一个新兴的跨学科的研究领域 往往是仁者见仁,智者见智,很难给出一个公认的定义。一 般而言,社会计算是指社会行为和计算系统交叉融合而成的 一个研究领域,研究的是如何利用计算系统帮助人们进行沟 通与协作,如何利用计算技术研究社会运行的规律与发展趋 势。
13
研究理论工具
三是,针对网络时代大数据(big data) 的研究。
电子邮件、电子银行的支付记录、购物网站的消费记录、个 人网页等互联网数据对于研究人类及人类社会具有重要价值 。通过对这些数据进行计算和分析,原本不可捉摸的人类行 为变得可被解析、描述和量化,甚至能够对其进行预测和控 制。美国东北大学教授艾伯特· 巴拉巴西经过十余年的数据分 析发现,如果你知道一个人过去的所有社会数据,那么,预 测其未来行为的准确性将达到93%。
这些互联网平台系统不仅帮助 用户相互沟通联系,更重要的
是将用户组织起来,发挥他们 的群体智慧,以协作的方式一 起创造、加工和分享知识。
9
研究理论工具
社会计算研究所用的理论,主要有三类:
一是从数学和社会心理学在内的其他学科借鉴来的理论。其 中,从数学学科中引入的图论的思想,为社会网络研究提供 了持久的基础。从社会心理学借鉴而来的理论包括平衡论和 社会比较理论。

社会计算驱动的社会科学研究方法

社会计算驱动的社会科学研究方法

社会计算是指利用计算机和网络技术来研究和解决社会科学问题的方法和技术。

随着信息技术的快速发展和普及,社会计算作为一种新的研究方法逐渐受到学者们的关注和重视。

本文将从社会计算驱动的社会科学研究方法的概念、特点和应用等方面进行探讨。

一、社会计算驱动的社会科学研究方法的概念社会计算驱动的社会科学研究方法是指利用大数据、网络科学、计算机模拟等技术手段,对社会科学问题进行建模、分析和解决的方法。

它将社会科学与计算机科学相结合,通过对社会行为和社会系统的数据进行采集、整合和分析,揭示和理解人类社会的规律和特点。

其核心是利用计算机和网络技术,对社会现象进行量化分析和模拟研究,以发现社会规律和提出解决方案。

二、社会计算驱动的社会科学研究方法的特点1. 数据驱动:社会计算方法注重对社会行为和社会系统的数据进行收集和分析。

通过大数据分析、网络挖掘等手段,挖掘数据中的信息,揭示社会现象的内在规律和特点。

2. 跨学科融合:社会计算方法融合了计算机科学、信息技术、统计学、社会学等多个学科的理论和方法。

它借鉴了计算机科学和信息技术在数据处理和分析方面的优势,结合了社会科学对于人类社会行为和社会系统的研究成果。

3. 模型建立:社会计算方法利用计算机模拟和建模技术,对社会现象和社会系统进行量化建模和仿真研究。

通过构建复杂的计算机模型,对社会系统的结构和演化进行模拟和预测,以探索社会系统的内在规律和特点。

4. 解决复杂问题:社会计算方法可以应用于解决社会科学领域中的复杂问题,如社会网络分析、社会动态演化、社会风险评估等。

它能够处理大规模复杂系统所涉及的大量、多样、动态、不确定的数据,为社会科学研究提供了新的思路和方法。

三、社会计算驱动的社会科学研究方法的应用1. 社会网络分析:社会计算方法可以应用于对社会网络的结构和演化进行分析。

通过对社会网络数据的采集和分析,揭示社会网络的形成和发展规律,以及其中的关键节点和结构特点。

2. 社会动态模拟:社会计算方法可以应用于对社会动态演化的模拟研究。

社会计算和网络科学的应用

社会计算和网络科学的应用

社会计算和网络科学的应用随着信息技术的不断发展和计算机算力的增强,社会计算和网络科学的应用越来越广泛,已经变成了跨学科研究的热点,对人们的生产和生活产生了深刻的影响。

本文将分别从社会计算和网络科学两方面分别阐述其应用的现状、特点和未来发展。

一、社会计算的应用社会计算可以理解为利用计算机技术、算法和模型来发现和解决社会现象的方法和手段。

社会计算的应用可以分为以下几个方面:1.社交网络分析社交网络分析(Social Network Analysis)是一种以图论为基础、研究社会关系网络的一种方法。

社交网络分析已经广泛应用于社会认知、政治学、社会学和商业领域等。

在社交网络分析中,可以通过提取网络中的重要人物和社区结构来研究群体之间的关系和影响,重要性分析可以用于领导力分析和传播模型搭建;社区结构分析可以用于社会地位和分工关系的研究。

2.群体行为仿真群体行为仿真(Collective Behavior Simulation)是一种以模拟和模态分析为基础、探究群体行为机制的一种方法。

群体行为仿真已经被广泛应用于交通、运输、城市规划和防灾减灾等领域。

在群体行为仿真中,可以通过连通性、行动方式和交通流量等参数来预测群体的行为和交互情况,在城市规划中可以用于整体规划和增强金融市场对抗风险的能力。

3.自然灾害应对自然灾害应对(Natural Disaster Response)是一种以信息技术和网络应用技术为基础、协助应对自然灾害的一种方法。

自然灾害应对已经被广泛应用于地震、洪水、风暴和火灾等自然灾害的应对和救援中。

在自然灾害应对中,可以通过手机应用软件和互联网平台来提供救援信息和紧急资源的管理,也可以通过数据采集和监控来预测、识别和分析自然灾害。

二、网络科学的应用网络科学可以理解为以复杂网络和计算科学为研究对象、研究网络结构和系统行为的一种学科。

网络科学的应用可以分为以下几个方面:1.生物医学科学生物医学科学(Biomedical Science)是一种以人类健康、疾病和生命过程为研究对象、运用生物学、化学、计算机科学、物理学和数学等多学科的一种研究方法。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

社会媒体一览
类别 社会软件 (社ห้องสมุดไป่ตู้网络)
社会化媒体:示例 即时通讯(Instant Message, IM):MSN、QQ 论坛(Forum):各种各样的主题论坛 博客(Blog):Blogger、新浪博客. 微博(Micro Blogging):Twitter、新浪微博 在线社会网络 (Online Social network):FaceBook、人人网
信息传播的相关计算
一条微博的传播轨迹,是一颗传播树。 一个人物的所有微博的传播轨迹,构成了他的影响力传播。 根据一个社会事件相关的微博的传播轨迹,运用社会情感分析、
舆情分析技术,可了解群体在该事件上的行为、观点。
一条微博的传播轨迹,是一颗传播树。 一个人物的所有微博的传播轨迹,构成了他的影响力传播。
数据库的高可扩展性和高可用性的需求
数据库结构、存储节点的可扩展性。 软件架构实现的节点容错能力。
关系型数据库难以适应数据处理要求。需要云计算平台的NoSql数据 库。例如Hadoop HBase、Google BigTable、 Amazon Dynamo、Facebook Cassandra
基于云计算的社会网络分析
社会系统
从系统论的角度看,人类社会是一个系统,由人群及其社会关系组成。
社会系统
社会的环境
社会的结构:社会网络
社会的边界
社会系统的相关问题
组件性:社会系统的基本组件是人物。
人物的相关信息人物的兴趣分析 人物脸谱
关联性
将社会视为由人群及其社会关系组成的系统,有自己的边界、环境。人 物、社会、环境三者之间存在着广泛的相互作用。
计算节点的度分布 计算网络的聚类系数 计算节点的PageRank 团体挖掘
社会计算的相关研究
现实社会系统的数据是隐性的,大规模社会数据难以观测、获取;
早期的社会学的学者只能以小规模社区人群为研究对象,研究人际关系、 人群结构、信息传播、群体行为等问题。
近年来,随着以微博、社交网站为代表的社会媒体的迅速发展,虚拟 社区大量出现,组成了规模巨大的虚拟社会。
一条广告的传播树的尺寸可作为广告投放效果的计量标准,设计 新媒体的广告计费平台。
信息传播预测研究。(广告精准投放技术)
可以将广告信息精准推荐给兴趣相关的的用户; 可以对舆情扩散的规模预测,为国家调控舆情发展提供帮助。
社会网络的应用场景(2)——人物计算问题
对于一个人物,
节点分析:用户的兴趣分析人物脸谱; 关系分析:用户关系强度计算 人物的朋友圈; 网络分析
社会系统的相关问题
结构性
社会系统的内在结构呈现出社会网络的特性。 社会网络(Social Network):以人物为节点、以人际关系为边,
将人群节点联接起来而构成的网络。
社会系统的相关问题
社会网络:节点(人物)+关系(社交)=网络(社会结构) 你有多少社会网络?
现实的社会网络 你的手机通信网络
虚拟社会的数据特点是:显式、可观测、可量化计算。 虚拟社会的出现,激发了大规模社会计算的研究动力。
QQ
MSN
新浪微博
FaceBook
Twitter
天涯论坛
虚拟社会
社会计算的相关研究
复杂系统的学者以社会媒体的社会网络为研究对象,研究了社会网络 的小世界特性和无标度特性,以及信息传播的动力学特性;他们侧重 于网络结构特性的测量,而没有涉及社会网络的信息服务技术。
虚拟的社会网络 你的聊天好友网络 你的邮件通信网络 你的微博关注网络
社会系统的相关问题
社会网络的结构设计非常重要。结构决定功能。 结构功能。
社会网络 连通性
手机 通信网络 单向同意
微博 关注网络 单向同意
即时通讯 好友网络 双向同意
邮件 通信网络 单向同意
交互性 透明性
双向同意 私密
动态网络,人群节点之间流淌着信息的 河流
Web网络
社会网络
Web1.0 & Web2.0社会媒体
网络分析技术不同
Web1.0
节点分析 网页文本的内容分析 关系分析 超链分析 网络分析 网络拓扑分析网页权威性
Web2.0社会媒体
人物的兴趣分析人物脸谱 人物的关系分析人物的朋友圈
人物的团体分析人物的社交圈 网络拓扑分析人物的影响力 信息传播分析人物的影响力传 播
Google众多的Web服务【前端】
Google Web Search, Google Translate, Google Maps, Google Earth, Google Doc等。
云计算平台
常见的云计算平台
云计算平台 Google Amazon 微软 Hadoop
组件 GFS,MapReduce,BigTable,Chubby Dynamo,EC2,S3,弹性MapReduce,SimpleDB,CloudFront Azure Blub,Fabric,Azure Table, Azure Queue HDFS,MapReduce,HBase,ZooKeeper,Pig, Hive
云计算
云计算
计算平台【云端】:由服务器集群组成的基础设施,被集群计算系统组 织起来,提供一种动态可配置、可扩展、高可用、虚拟化的计算资源。
应用程序【前端】:提供一种Web服务,也称为云服务。
举例: Google是个典型的云计算企业。
Google 云计算平台【云端】
基础设施:廉价的服务器集群组成大规模数据中心,服务器数目 100万台 集群计算系统:GFS、MapReduce、Bigtable。
FaceBook用户达到6亿。Twitter用户4亿,新浪微博1.4亿。 FaceBook每天新增的照片数量大约是100万张,每个月人们在Facebook上
分享的内容条数超过了300亿。
大规模用户的数据库并发访问
每秒需要处理上万次读写请求。用户忍耐时间2秒。 FaceBook每月的页面浏览量超过了6900亿, 流量超过Google。
所研究的问题
根据社会科学理论,以计算技术为工具,研究人类社会的组成、 关系、结构、层次、行为、运动等问题。
研究社会媒体,促进社会人群的交流与合作。
社会媒体(Social Media): Web2.0媒体。
社会软件:利用虚拟社区,帮助社会人群相互交流。 群体智慧:利用社会人群的集体智慧,协同工作。
Web网络
社交圈
Web1.0 & Web2.0社会媒体
应用技术不同
Web1.0
Web2.0社会媒体
应用 技术
网络信息导航。
社会软件、群体智慧。
数据为王。
关系为王?
伟大技术:Google Page Rank。
伟大技术是什么?
Google引领Web1.0媒体的技术潮流。 社会网络照耀互联网。
社会系统的相关问题
运动性
社会系统的结构、状态、行为、功能是动态演变的。 可用一组外化的社会指标反映出来。 这些社会指标的综合指数的走势曲线反映了社会系统的运动轨迹。
分析社会指标走势曲线预测社会未来的趋势
社会计算(Social Computing)
社会计算
是一门计算技术与社会科学之间的交叉学科。
一个社会事件的传播网络
一个社会事件相关的微博的传播轨迹。
社会网络的应用场景(1)——信息传播
信息传播最大化研究:(广告传播最大化投放技术)
可以计算出在社会网络中选取哪些节点投放广告,可以使广告得 到最大化的传播,在广告投入资金固定的情况下,可以帮助用户 获得最大的收益。
信息传播树 (广告效果计量)
基于云计算的社会媒体
所有的社会媒体,本质上都是一种基于云计算的Web应用。
架构:社会媒体=云计算+社交服务。
云计算平台:大规模数据中心、由大量的服务器集群组成,提供了强 大的存储、计算能力。FaceBook云平台有6万台服务器。
前端:基于Web的社交服务。
社会媒体的数据特点
超大规模的结构化数据:用户信息、UGC信息。
Web网络
社会网络
Web1.0 & Web2.0社会媒体
数据类型不同
Web1.0
Web2.0社会媒体
节点 关系 结构
网页文本,基本不更新
超链信息:僵硬的信息管道。 网页之间缺少信息的流动性。 静态网络
用户背景信息 用户发布信息:频繁更新、即时性强。
社交信息:用户之间的信息管道; 交互信息:用户之间的信息河流。
基于云计算的社会媒体
社会媒体是一种云服务。云计算技术广泛应用于社会媒体。 只要设计一种社交服务机制,就可用云计算技术快速实现
一种社会媒体。 绝大多数的社会媒体,选择了开源的Hadoop搭建自己的云
计算平台。
社会网络分析也是一个云计算问题
新浪微博的社会网络 108节点 102边/节点 网络分析超出了单机内存限制。 需要Hadoop MapReduce的分布式计算环境。
总结:人类社会=现实社会+虚拟社会
Web1.0 & Web2.0社会媒体
数据来源不同 数据类型不同 网络结构不同 分析技术不同 应用技术不同
Web网络
社会网络
Web1.0 & Web2.0社会媒体
数据来源不同
Web1.0 :网站编辑人员发布的网页信息 Web2.0社会媒体:用户个性化发布、社会性编辑、分享、传播
信息聚合(Information Aggregating):Netvibes
中间地带 群体智慧
资源分享:YouTub 维基(Wiki):维基百科、维基解密 社会标签(Social Bookmarking):Delicious 社会新闻(Social News):Digg 社会导航(Social Navigation):Trapster 社会问答评论:、口碑网 内容管理(Content Management):Wordpress 文档管理编辑(Document Management and Editing Tool):Google Docs
相关文档
最新文档