大数据研究综述

合集下载

大数据会计文献综述

大数据会计文献综述

大数据会计文献综述一、引言在信息技术高速发展的当今社会,"大数据"这一概念已经成为时代的重要标签。

大数据在众多领域,包括会计行业,都有着深远的影响。

对于会计领域,大数据的出现和应用不仅改变了传统的数据处理方式,更推动了会计工作的革新与发展。

本篇文献综述旨在梳理和总结大数据在会计领域的应用现状与发展趋势,以期为进一步的研究与实践提供有益的参考。

二、大数据与会计的结合点1. 数据处理与分析:大数据技术使得会计数据呈现出海量、高速、多样的特点,为数据处理与分析带来了新的可能。

通过大数据技术,可以实现会计数据的快速整合、实时监控与分析,从而提升会计信息的准确性和时效性。

2. 风险管理:风险管理是会计工作的重要组成部分。

大数据技术可以帮助企业更准确地识别和预测财务风险,如市场风险、信用风险等,从而制定更为有效的风险管理策略。

3. 决策支持:大数据技术能够为企业提供更为全面、深入的财务数据支持,帮助企业做出更为科学、合理的决策。

三、大数据在会计中的应用案例随着大数据技术的发展,越来越多的企业开始将大数据技术应用到会计工作中。

例如:有的企业运用大数据技术实时监控企业财务状况,及时发现和解决财务风险;有的企业利用大数据技术进行市场分析,为企业投资决策提供数据支持;还有的企业通过大数据技术优化内部控制流程,提升企业管理效率。

四、大数据在会计中的挑战与问题虽然大数据技术在会计领域的应用前景广阔,但仍存在一些挑战和问题。

如数据安全问题、数据质量问题、数据处理技术与专业人才的缺乏等。

这些问题的解决需要我们在实践中不断探索和创新。

五、未来展望随着大数据技术的不断发展,我们相信其在会计领域的应用将会更加广泛和深入。

未来的会计工作将更加注重数据分析与运用,而大数据技术无疑将为这一趋势提供强大的技术支持。

我们期待在未来的会计工作中,看到更多创新的实践和应用案例。

同时,也希望学术界和企业界能够加强合作,共同推动大数据技术在会计领域的理论研究与实践发展。

毕业论文文献综述大数据分析在市场营销中的应用

毕业论文文献综述大数据分析在市场营销中的应用

毕业论文文献综述大数据分析在市场营销中的应用随着信息技术的飞速发展,大数据分析在市场营销领域的应用越来越受到重视。

本文将从文献综述的角度,探讨大数据分析在市场营销中的应用,分析其对市场营销决策的重要性和影响。

一、大数据分析在市场营销中的背景和意义随着互联网的普及和移动互联网的快速发展,人们在日常生活中产生了海量的数据。

这些数据包含了用户的行为、偏好、购买习惯等信息,传统的市场调研手段已经无法满足对这些数据进行分析和挖掘的需求。

大数据分析作为一种新型的数据分析方法,可以帮助企业更好地理解消费者,预测市场趋势,优化营销策略,提高营销效果。

二、大数据分析在市场营销中的应用案例1. 用户画像分析通过大数据分析,企业可以对用户进行精细化的画像分析,包括用户的年龄、性别、地域、兴趣爱好等信息。

通过对用户画像的分析,企业可以更好地了解目标用户群体,精准定位市场,制定个性化营销策略。

2. 营销效果评估传统的营销活动往往难以准确评估效果,而通过大数据分析,企业可以实时监测营销活动的效果,包括广告点击率、转化率、用户参与度等指标。

通过对这些数据的分析,企业可以及时调整营销策略,提高营销效果。

3. 市场趋势预测大数据分析可以帮助企业对市场趋势进行预测,包括产品需求量、价格变动、竞争对手动态等方面。

通过对市场趋势的预测,企业可以提前调整产品策略,抢占市场先机。

4. 用户行为分析通过大数据分析,企业可以深入了解用户的行为轨迹,包括用户在网站上的浏览行为、购买行为、留存行为等。

通过对用户行为的分析,企业可以优化用户体验,提高用户满意度,增加用户忠诚度。

三、大数据分析在市场营销中的挑战和展望1. 数据安全和隐私保护在大数据分析的过程中,企业需要处理大量的用户数据,如何保护用户的隐私和数据安全成为一个重要问题。

企业需要建立完善的数据安全体系,遵守相关法律法规,保护用户数据不被泄露和滥用。

2. 数据质量和准确性大数据分析的结果往往取决于数据的质量和准确性,而海量数据的采集和清洗是一个复杂的过程。

计算机科学与技术国内外研究综述范文

计算机科学与技术国内外研究综述范文

计算机科学与技术国内外研究综述范文全文共四篇示例,供读者参考第一篇示例:从20世纪中叶开始,计算机科学与技术在世界范围内快速发展,成为当今国际社会最重要的技术领域之一。

国内外学者们对计算机科学与技术的研究也日益深入,不断推动着这一领域的发展。

本文将综述国内外关于计算机科学与技术的研究进展,以期为读者提供一个全面的了解。

一、人工智能二、物联网技术物联网技术是计算机科学与技术领域的另一个重要研究方向。

国内外学者们在物联网技术领域的研究中,提出了各种创新的理论和方法,推动着物联网技术的发展。

国外的物联网技术主要应用于智能家居、智能交通、智能医疗等领域,融合了传感技术、通信技术、云计算技术等多方面的技术。

国内的物联网技术发展也日益活跃,各种创新应用不断涌现,为我国的工业生产、城市管理等方面带来了巨大改变。

三、大数据技术大数据技术是计算机科学与技术领域的另一个研究热点。

大数据技术的发展为人们提供了更多的数据处理和分析方法,为决策者提供了更准确的数据支持。

国外的大数据技术主要应用于金融、医疗、电商等领域,发挥着重要的作用。

在国内,大数据技术也获得了快速发展,各种大数据平台和工具不断涌现,为我国的经济发展、公共管理等方面提供了强大支持。

计算机科学与技术是一个充满活力的领域,国内外学者们在这一领域的研究中取得了众多重要成果。

希望未来国内外的研究者们能够继续积极探索,共同推动计算机科学与技术领域的发展。

【字数满足要求,结束撰写】。

第二篇示例:计算机科学与技术是一门涉及计算机软硬件系统的学科,随着信息技术的发展和普及,计算机科学与技术在各个领域都有着广泛的应用和影响。

本文将就计算机科学与技术领域的国内外研究现状进行综述,探讨其发展趋势和未来发展方向。

一、国内外研究现状概述在过去几十年中,计算机科学与技术领域取得了巨大的发展,国内外各大高校和科研机构在该领域开展了大量的研究工作,取得了许多重要成果。

在人工智能领域,美国的斯坦福大学、麻省理工学院等世界一流院校一直处于领先地位,他们在深度学习、自然语言处理、计算机视觉等方面取得了突破性进展。

数字经济前沿研究综述

数字经济前沿研究综述

数字经济前沿研究综述一、本文概述随着科技的飞速发展,数字经济已逐渐成为全球经济增长的重要引擎。

作为新时代的产物,数字经济以其独特的魅力和强大的生命力,正在深度影响着全球经济的发展模式和竞争格局。

本文旨在全面综述数字经济的前沿研究,深入剖析数字经济的内涵、特征、发展趋势以及面临的挑战,以期为相关领域的学术研究和实践应用提供参考和借鉴。

在文章结构上,我们将首先界定数字经济的概念,明确其内涵和外延。

接着,我们将从技术创新、产业升级、政策环境等多个维度,深入探讨数字经济的发展现状及未来趋势。

在此基础上,我们还将对数字经济面临的主要挑战进行分析,包括数据安全、隐私保护、数字鸿沟等问题。

我们将对数字经济前沿研究进行展望,提出未来研究的方向和重点。

通过本文的综述,我们期望能够全面展现数字经济的全貌,揭示其发展的内在逻辑和规律,为相关领域的学术研究和实践应用提供有益的启示和借鉴。

我们也期待通过本文的探讨,为推动数字经济的健康发展贡献一份力量。

二、数字经济的关键技术在数字经济的大潮中,技术的革新是推动其发展的重要动力。

其中,有几个关键技术在数字经济中占据了至关重要的地位。

首先是大数据技术。

大数据技术使得海量数据的收集、存储、处理和分析成为可能,为企业提供了深入洞察市场、消费者行为以及业务运营的新视角。

大数据技术不仅改变了企业决策的方式,也为政策制定提供了数据支持。

其次是云计算技术。

云计算为企业提供了弹性、可伸缩的计算资源,使得企业可以更加灵活地应对市场变化。

同时,云计算也降低了企业的IT成本,提高了企业的运营效率。

人工智能技术是数字经济的另一关键技术。

人工智能的发展使得机器可以模拟人类的思维和行为,从而为企业提供更智能的决策支持。

例如,人工智能技术可以用于预测市场趋势、优化供应链管理、提高客户服务质量等。

区块链技术也是数字经济中备受关注的技术之一。

区块链的去中心化、安全性和透明性使得其在金融、供应链、版权保护等领域有着广泛的应用前景。

国内图书情报界大数据研究综述

国内图书情报界大数据研究综述
析和发现工具 , 以及分析性应用 l l _ 。
2 国 内图书情 报界 大数 据研 究 内容分 析
2 . 1 大数据的概念特征及原理
学术界对于大数据的概念 尚未形成统一 的认 识 ,但都认 为
1 国 内图书情 报界 大数 据研 究现 状
从2 0 1 1 年开始 , 国内各大主流报纸和地方报纸 上出现 了大
大数据是 继云计算 、 移动互联 网、 物联 网之后信 息技术领域
的又 一大热门话题 。有关大数据 的话题逐渐转移 到研 究从业务 和应用 出发如何让大数据真正实现其所蕴藏的价值 。2 0 1 3年全
阿帕 比技术有限公司主办 的“ 大数据时代图书馆创新 服务” 研讨
会等[ 。
球在 大数 据技 术和服务上 的投入接近 1 0 0亿美 元 , 而到 2 0 1 6年 将达 到 2 0 0亿美元 。 2 0 1 3年 , 风 险投资更加青 睐面向大数据 的分
等。
检索 系统 提取 了 2 1 篇 图书情报界关 于大数 据的研究文献 , 发表
出版 时间在 2 0 1 1 —2 0 1 3 年 间。这些文献 中主要成果有姜 山等人
的论 文《 大数据对 图书馆 的启示 》 , 王天泥的论 文《 大数据视角下 图书馆 的发 展对策》 , 张兴旺 的论 文《 大数据生 态系统在 图书馆
往往 只有 几 十秒 [ 。
中的应用 》 , 韩 翠峰的文章《 大数据 带给图书馆的影响与挑 战》 和
《 大数据时代 图书馆 的服务创新 与发展 》 , 张文彦等人 的论文《 大
数据 时代 的图书馆初探 》 , 杨海燕 的文章《 大数据 时代 的图书馆
服务 浅析 》 , 樊 伟红等人 的论文 《 图书 馆需要怎样 的“ 大数据 ” 》 , 刘高 勇等人 的论 文 《 大数据时代 的竞争情报发展动 向探 析》 , 李 广建 等人 的论 文 《 大数据 视角下 的情报研究 与情报技术 研究 》

面向大数据的时空数据挖掘综述

面向大数据的时空数据挖掘综述

3.2生态环境
利用时空数据挖掘技术,可以对生态环境的变迁进行监测和分析,为环境保护 和治理提供科学依据。例如,通过分析历史气候数据,可以预测未来气候变化 趋势,为应对全球气候变化提供支持。
3.3社会安全
时空数据挖掘可以帮助政府部门和社会组织分析社会安全问题,如犯罪热点分 析、公共安全事件预测等,从而采取有效的应对措施。
参考内容
基本内容
随着科技的快速发展,大数据技术已经成为现代社会中不可或缺的一部分。大 数据技术主要涉及数据的收集、存储、处理和分析等过程,其中的数据处理和 分析是大数据技术的核心。本次演示将主要讨论面向大数据的数据处理与分析 算法的相关问题。
一、数据处理
大数据处理是一个对大量数据进行处理的过程,主要涉及数据的收集、清洗、 整合和存储等方面。
2.1数据采集
时空数据采集是时空数据挖掘的首要环节,包括空间数据采集和时间数据采集。 空间数据采集可以通过GIS技术、遥感技术、GPS技术等实现,而时间数据采 集则需要收集不同时间点的数据,如历史数据和实时数据。
2.2数据预处理
时空数据预处理主要包括数据清洗、格式转换、投影转换等,旨在提高数据质 量,为后续的数据挖掘打下基础。
谢谢观看
1、研究意义
时空数据挖掘是一种从大量时空数据中提取有用信息的过程,旨在发现数据的 空间和时间关联模式、趋势和异常现象。通过对时空数据的挖掘,可以为城市 规划、交通管理、生态环境、社会安全等领域提供决策支持,从而更好地应对 各种挑战和问题。因此,时空数据挖掘具有重要的理论和应用价值。
2、技术与方法
5、结论
面向大数据的时空数据挖掘在多个领域具有广泛的应用前景,但也面临着一些 挑战和问题。本次演示对时空数据挖掘的技术、应用领域、挑战和解决方案进 行了综述。针对现有的研究不足和未来可能的研究方向,我们提出以下建议: 进一步深入研究时空数据挖掘算法和模型的性能优化问题;加强时空数据挖掘 在实际应用领域的探索和实践;时空数据隐私保护和安全问题;推动时空数据 挖掘技术的普及和应用。

农业大数据文献综述

A R e v o l u t i o n T h a t Wi l l T r a n s f o r m H o w We L i v e ,Wo r k ,a n d T h i n k )一 书 , 这是国外大数据研究 的先河之作 。
2 . 大 数 据 的含 义 .
3 . 农 业 大数 据 含 义
以C N K I( 中国知网 )的中国报纸期 刊 网络 出版总 库为数 据源 。检 索策略为篇名 = “ 大数据 ”进行模糊检索 ,检索 日 期为 2 0 1 4 年1 O月 1 9 日,共检索 出 9 2 2 3条 结果 ,其 中 文献 主要 集 中在 2 0 1 2年 、2 0 1 3年 、 2 0 1 4年这三年 , 2 0 1 2 年共 有文 献 6 9 0篇 ,2 0 1 3年 文献数量 骤增至 3 3 4 3 篇 ,2 0 1 4年文献数量为 4 5 6 0篇 。这 正与上文提 到的 内容 相符 。2 0 1 2年 大数据研究初现端倪 ,文献数量增 多,称 2 0 1 2 年为大 “ 数据启蒙之年 ” 是名副其实 的;2 0 1 3 年各界开始对大 数据 的研 究产 生兴趣 ,文 献骤增 , 由2 0 1 2年的 6 9 0篇增长 至 2 0 1 3年 的 3 3 4 3篇 ,增加 了近 五倍 ,称 2 0 1 3 年为 “ 大数据元年” 不为过 。 然而在 以 “ 篇名 = 农 业大数 据” 进行 模糊 检索 ,检 索 日期为 2 0 1 4 年l O月 1 9日,检索的结果却只有 2 1 篇 ,与 只检测 “ 大数据 ”得 到 的 结果相差悬殊 。2 0 1 2 年的文献只有一 篇 , 2 0 1 3年有 7篇 ,2 0 1 4年有 1 O 篇 。其 中有 5 篇是新 闻报 道 ,研究 性文献 l 6篇 。可见 ,大数 据在 农业 方面 的研究是非常少 的,我 国对 于大数 据在农 业方面应用 的重 视程度还 不够 。 三 、农业大数据应 用研 究综 述

关于大数据背景下公共管理的文献综述

一、概述随着信息技术的飞速发展和互联网的普及,大数据概念已经成为当今社会经济发展的重要驱动力之一。

在这个背景下,公共管理也面临着前所未有的挑战和机遇。

大数据技术为公共管理提供了新的思路和工具,成为了实现政府治理现代化和提升政府效能的重要手段。

针对大数据背景下公共管理的相关研究,本文将从理论探讨、国内外实践经验和发展趋势等方面进行综述,为进一步深入研究和实践提供参考。

二、大数据背景下公共管理的理论探讨1. 大数据概念的理论解析大数据是指由传统的数据管理软件和处理技术难以捕捉、管理和处理的海量数据。

它不仅仅是数据的规模大,更重要的是数据的种类多、速度快、价值密度低。

大数据技术的出现改变了人们对数据的认识和利用方式,也为公共管理带来了全新的思考。

2. 大数据与公共管理的关系大数据技术不仅可以帮助政府更好地了解社会民生状况、把握经济发展态势,还可以提高政府决策的科学性和精准性。

通过大数据分析,政府可以更好地了解民众需求,优化政策制定,提升政府服务水平和效能。

大数据与公共管理之间存在着密切的通联,可以相互促进和支持。

三、国内外大数据背景下公共管理的实践经验1. 国外公共管理的大数据应用在美国、英国、新加坡等国家,政府部门和公共机构早已将大数据技术应用于公共管理中。

美国政府通过分析大数据改善了医疗卫生、教育、社会保障等领域的服务质量,提高了政府治理水平。

2. 国内公共管理的大数据应用我国也在大力推进大数据技术在公共管理中的应用。

北京市政府通过大数据分析,提升了城市交通管理的智能化水平,加强了城市管理和规划。

在教育、环保、公共安全等领域,也都有一系列成功的大数据应用案例。

四、大数据背景下公共管理的发展趋势1. 大数据与人工智能的融合随着人工智能技术的发展,大数据与人工智能的融合将成为未来的趋势。

政府可以通过大数据技术分析出更多有价值的信息,再由人工智能技术进行智能化处理和应用。

2. 隐私保护和数据安全在大数据背景下,隐私保护和数据安全问题备受关注。

互联网大数据文献综述

互联网大数据文献综述大数据分析的趋势亮点大数据分析中的当前的最先进技术的概述。

大数据分析的规模和应用前景趋势。

在硬件上的现况和未来的发展趋势,如何帮助我们解决大规模数据集。

讨论目前采用的软件技术和未来趋势,以解决大数据分析应用。

关键词:大数据分析数据中心分布式系统摘要:大数据分析是并行的分布式系统未来的主要应用之一。

数据仓库目前应用的规模已经超过EB级,并且其规模还在不断增长。

当数据集和相关应用程序超出了他们的规模,给这些的构成要求和软件开发方法的考虑带来了重大挑战。

数据集通常是分布式,它们的大小和安全考虑到分布式技术来得到保证。

数据经常驻留在不同的平台上计算,对网络能力,容错性,安全性和访问控制的考虑是在许多应用中的关键。

在其他应用程序中,分析任务的截止时间主要与数据质量有关。

对于大多数新兴应用程序,数据驱动的模型和方法,能够大规模操作的方法,到目前还未找到。

即使知道可以缩放的方法,验证结果又是一个重大的问题。

硬件平台的特性和软件堆栈从根本上影响数据分析。

在这篇文章中,我们提供了一个概述的最先进的硬件和软件的趋势在大数据分析应用程序前景的应用。

引言随着互联网关键的技术的发展,计算作为一个实用程序的设想在上世纪90年代中期开始形成。

在网格计算时代的早期人们通常认为硬件作为主要资源。

网格计算技术专注于分享、选择和聚合各种各样的地理上分布的资源。

这些资源包括超级计算机、存储和其他设备,用来解决在科学、工程和商业的大规模计算密集型问题。

这些框架的一个关键特性是他们的支持透明跨域管理和资源管理能力。

“数据即资源”的概念被普及在p2p系统。

Napster、Gnutella,和Bit Torrent 允许节点共享多媒体数据内容通常直接彼此以分散的方式。

这这些框架强调互操作性和动态性,降低成本,资源共享特定的沟通和协作,聚集。

然而,在这些平台上,匿名,隐私问题和扩展性问题的考虑是次要的。

最近,云计算环境的可靠性、服务的健壮性被(通常的访问来自客户机的浏览器)来自于客户端,大规模生产的移动设备和通用计算机的访问检验。

大数据背景下国内课堂学习评价研究与发展综述

大数据背景下国内课堂学习评价研究与发展综述随着大数据技术的快速发展和应用,教育领域逐渐走向数字化、智能化及个性化。

在这样的背景下,课堂学习评价成为教育领域中备受关注的话题。

本文就国内课堂学习评价研究与发展进行了综述。

一、国内课堂学习评价研究现状目前,国内课堂学习评价研究已经取得了一定的进展,但还存在一些问题。

首先,传统的课堂学习评价方法主要依靠老师的主观判断和经验。

这种方法容易受到主观因素的影响,评价结果相对不够客观准确、公正合理。

其次,虽然现在有许多评价工具和模型被应用在课堂学习评价中,但其中大部分都是基于定量数据的分析,过于注重考试分数、作业完成情况等简单指标的量化,缺乏对学生认知、情感、态度等方面的综合评价,对个性化评价和反馈也不够充分。

最后,课堂学习评价中还缺乏有效的数据统计、分析和呈现方法,需要更加智能化、动态化。

二、前沿技术在课堂学习评价中的应用面对上述困境,近年来,新技术逐渐被应用到课堂学习评价中,包括机器学习、人工智能、物联网等技术。

1. 机器学习机器学习是指利用计算机处理大量数据,并根据数据对应的模型进行学习和自我适应改进的技术。

在课堂学习评价中,机器学习可以帮助老师快速分析学生的学习状态和表现,并给出针对性的建议。

2. 人工智能人工智能是一种复杂的技术,可以模拟人类的思维方式,解决大数据下复杂的问题。

在课堂学习评价中,人工智能可以发挥学生学习过程中的个性化辅导、智能问答等功能,着重关注每个学生的差异性和特殊需求。

3. 物联网物联网是指通过无线连接,将各种物理设备、传感器等联网形成的一个庞大的数据网络。

在课堂学习评价中,物联网技术可以实时采集学生在课堂上的各种数据,并分析与处理这些数据,用来评价学生的学习状态和表现。

三、课堂学习评价的未来发展趋势在大数据背景下,课堂学习评价正向着数字化、智能化、个性化方向发展。

未来,应注重以下三个方面的发展:1. 数据采集和处理应用新技术,实现对课堂学习过程中所涉及的数据、行为、心理等信息的采集、处理和存储,以便进行深入的分析和反馈。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

- . - -可修编. 大数据文献综述 随着以博客、社交网络、基于位置的服务LBS为代表的新型信息发布方式的不断涌现,以及云计算、物联网等技术的兴起,数据正以前所未有的速度在不断地增长和累积,国际数据公司( IDC) 的数字宇宙研究报告称[1]:2011 年全球被创建和被复制的数据总量超过1. 8ZB,且增长趋势遵循新摩尔定律( 全球数据量大约每两年翻一番) ,预计 2020 年将达到 35ZB.与此同时,数据复杂性也急剧增长,其多样性、低价值密度、实时性等复杂特征日益显著,大数据时代已经来到。学术界、产业界甚至于政府机构都已经开始密切关注大数据问题,并对其产生浓厚的兴趣。 一、大数据国外发展现状 对于学术界,1989 年在美国底特律召开的第 11 届国际人工智能联合会议专题讨论会上,首次提出了“数据库中的知识发现(KDD)”的概念。在1995年召开了第一届知识发现与数据挖掘国际会议,随着与会人员的增加,KDD国际学术成为年会。大数据的兴起,主要是国际顶尖期刊《Nature》早在2008年推出了Big data专刊[2]。计算社区联盟(puting munity consortium ) 在2008年发表了报告“big data puting: creating revolutionary breakthroughs in merce, science and society ”[3],阐述了在数据驱动的研究背景下,解决大数据问题所需的技术以及面临的一些挑战。《science》在2011年2月推出专刊“dealing with data”[4],主要围绕着科学研究数据的问题展开讨论,说明大数据对于科学研究的重要性.美国一些知名的数据管理领域的专家学者则从专业的研究角度出发,联合发布了一份白皮书《challenges and opportunities with big data》[5]。该白皮书从学术的角度出发介绍了大数据的产生,分析了大数据的处理流程,并提出大数据所面临的若干- . - -可修编. 挑战。全球知名的咨询公司麦肯锡(McKinsey )2011年6月份发布了一份关于大数据的详尽报告“big data :the next frontier for innovation ,petiton,and productivity”[6],对大数据的影响、关键技术和应用领域等都进行了详尽的分析。进入2012

年以来,大数据的关注度与日俱增1月份的达沃斯世界经济论坛上,大数据是主题之一,该次会议还特别针对大数据发布了报告“big data,big pat :new possibilities for international development” [7],探讨了新的数据产生方式下,如何更好地利用数据来产生良好的社会效益.该报告重点关注了个人产生的移动数据与其他数据的融合与利用.3月份美国奥巴马政府发布了“大数据研究和发展倡议”[8](big data research and development initiative),投资2亿以上美元,正式启动“大数据发展计划”.计划在科学研究、环境、生物医学等领域利用大数据技术进行突破.奥巴马政府的这一计划被视为美国政府继信息高速公路计划之后在信息科学领域的又一重大举措.与此同时,联合国一个名为“global pulse”的倡议项目在今年5月发布报告“big data for development:challenges or opportunities”[9],该报告主要阐述大数据时代各国特别是发展中国家在面临数据洪流(datadeluge)的情况下所遇到的机遇与挑战,同时还对大数据的应用进行了初步的解读.《纽约时报》的文章“the age of big data”[10]。则通过主流媒体的宣传使普通民众开始意识到大数据的存在,以及大数据对于人们日常生活的影响。 在产业界,经济利益成为主要的推动力,IBM、ORACLE、微软、谷歌、亚马逊、Facebook、Teradata、EMC、惠普等跨国巨头也因大数据技术的发展而更加具有竞争力[11]。仅2009 年一年,谷歌公司通过大数据业务对美国经济贡献540 亿美元;2005 年以来,IBM 投资160 亿美元进行30 多次与大数据相关的收购,使业绩稳定高速增长,2012 年,IBM 股价每股突破200 美元大关,3 年翻了3 - . - -可修编. 番;eBay 通过数据挖掘精确计算出广告中每个关键字带来的回报,2007 年以来,广告费降低了99%,同时顶级卖家占总销售额的百分比上升至32%;2011 年,Facebook 首次公开新数据处理分析平台PUMA,通过对数据多处理环节区分优化,相比之前单纯采用Hadoop 和Hive 进行处理的技术,数据分析周期从2 天降到10 秒以,效率提高数万倍。 与国外相比,我国大数据的发展还稍落后。我国国家自然科学基金于1993 年首次支持对数据挖掘领域的研究项目。1999 年,在召开第三届亚太地区 知识发现与数据挖掘国际会议(PAKDD),收到论文158 篇。2011 年,第十五届PAKDD 在举办,会议就数据挖掘、知识发现、人工智能、机器学习等相关领域的主题进行交流讨论,反响热烈。2012 年5 月,香山科学会议组织了以 “大数据科学与工程——一门新兴的交叉学科?”为主题的第424 次学术讨论会,来自国外35 个单位横跨IT、经济、管理、社会、生物等多个不同学科领域的43 位专家代表参会,并就大数据的理论与工程技术研究、应用方向以及大数据研究的组织方式与资源支持形式等重要问题进行了深入讨论。6 月,中国计算机学会青年计算机科技论坛(CCF YOCSEF)举办了“大数据时代,智谋未来”学术报告会,决定成立大数据专家委员会,就大数据时代的数据挖掘、体系架构理论、大数据安全、大数据平台开发与大数据现实案例进行了全面的讨论。2012 年10月,成立了首个专门研究大数据应用和发展的学术咨询组织--中国通信学会大数据专家委员会,推动了我国大数据的科研与发展。2012 年11 月,“Hadoop 与大数据技术大会”以“大数据共享与开放技术”为主题,总结了八个热点问题:数据科学与大数据的学科边界、数据计算的基本模式与式、大数据的作用力和变换反对、大数据特性与数据态、大数据安全和隐私问题、大数据对IT 技术架构- . - -可修编. 的挑战、大数据的生态环境问题以及大数据的应用及产业链。大会还成立了“大数据共享联盟”,旨在搜集大数据、展示大数据、促进大数据的研究与开发。 在产业界,国主要以百度、腾讯、华为 、淘宝、中国移动等企业为首的大数据布局与商业活动。百度作为中国最大的搜索引擎,在中国和中文互联网领域各项排行中不是最大就是最多。2012年,百度日均抓取约10亿网页,处理超过100PB(1PB=1024TB)的数据。过去10年,百度网页搜索库已从500万猛增到了500亿个页面。从公开的材料看,百度的大数据战略往往与云计算绑定在一起,强调大数据储存与处理能力。2011年8月,百度宣布将用三年的时间建立一个全国最大的数据中心,并且主打“绿色”。通过对大数据流量的把握,百度经过设计,降低设备能耗、减少服务器、日间侧重商业业务、夜间侧重数据业务,从而让“百度的单体十万台服务器的数据中心,PUE每降低0.1,一年就可为百度节省上千万元的成本。”腾讯自称“目前中国最大的互联网综合服务提供商之一,也是中国服务用户最多的互联网企业之一”,拥有超过7.52亿QQ 即时通讯活跃账户,1亿微信用户、4.25亿微博用户和超过1亿的视频用户。在积累了个人用户多方面的海量数据后,2012年腾讯提出了“大数据营销”的概念。腾讯网总编辑菊红表示“将从这些海量数据中挖掘、分辨出用户的行为模式、兴趣偏好等,打造专属于每个人的智慧门户。” 腾讯不仅在各大产品线中都设置了数据挖掘团队,还在和一些第三方数据挖掘公司、营销公司展开合作洽谈,充分挖掘用户在网上的行为、关系、UGC(用户产生的容)等数据,“通过合理的方法找到对企业有帮助的数据,并且将营销预算合理的分配在为数众多的数据来源平台上”,从而提高营销效率。2011年4月腾讯追加在XX的数据中心建设投资,欲建立亚洲最大的数据储备处理中心。相比中国用户最多的两家互联网企业,淘宝在大数据方面的- . - -可修编. 举措丝毫不逊色,因为几乎所有淘宝业务都依赖淘宝数据库。每天大约有6000万用户登录淘宝网,约20亿页面浏览量(PV)。淘宝所使用的OceanBase分 布式数据库,在基准数据和增量数据基础上,实现不同部门对数千亿条记录、数百TB数据上的跨行跨表事务共同完成,并支持每天4000~5000万的更新操作。早在2009年淘宝便自建大型数据库,并通过对全国淘宝购买数据的挖掘发布了2011年淘宝中国地图,对其掌握的大量用户交易数据进行了形象的展示。在利用大数据为提高用户购物体验的旗号下,淘宝根据长尾原理充分利用大数据挖掘技术,建设开放平台,提供各种增值服务。中国移动作为中国最大的移动通讯运营商,截至2012年4月底,中国移动用户数已经达到6.7亿。同时,中国移动正在谋求从移动运营商的管道角色向客户端制造和云端服务两个方向发展。而大数据业务的投入,为此提供了机遇。2011年第四季度中国移动先后与自治区和省签署合作协议,在呼和浩特、建设全国规模最大、技术最先进、能耗最低定在建立西部最大数据中心,完成了其在国数据中心的三大数据基地布局。 通过对国外学术期刊SCI与SSCI检索研究中发现,目前国外对大数据的研究主要集中在如何进行大数据的存储、处理、分析以及管理的技术及软件的应用上,而关于大数据与管理科学的结合几乎很少,国学者对大数据的研究主要集数据的商业模式的探讨、大数据分析处理技术、大数据的应用领域等,而对关于大数据与云计算结合的研究几乎处于理论摸索阶段。 二、大数据的国外研究综述 对于大数据的定义,学术界和产业界目前尚未形成公认的准确定义。维基百科的定义[12]:大数据指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间达到撷取、管理、处理并整理成为帮助企业经营决策目的的信息。

相关文档
最新文档