五问_大数据_唐玮婕

文汇报/2013年/3月/31日/第006版

经济观察?管理商道

五问“大数据”

“大数据”重新定义商业模式

本报记者唐玮婕

“无香乳液、镁、锌，这些购物行为对于懂得‘大数据’的零售商意味着一个推论——这位顾客可能怀孕了”。能帮零售商招揽客户，能预测奥斯卡奖得主……眼下，各种“大数据”的新奇应用，把“大数据”这个概念推上了众人关注的焦点位置。

随着越来越多的商业行为趋于数据化，“大数据”仿佛望远镜，可以拿来预测未来。过去对于数据的分析往往局限于自然科学领域，而在“大数据”时代，社会科学领域的分析和观察都可以量化，于是，“大数据”又成了人类行为的显微镜。

本期文汇-复旦管理学家圆桌谈围绕“大数据”，展开谈论，共同探讨“大数据”带来的全新商业模式和投资机会。

海量数据等于“大数据”吗？

记者：通常人们用3个“V”（V olume、Velocity、Variety）属性来形容“大数据”，即规模性、高速性、多样性。那么，“大数据”具体的定义是什么，有哪些特点？

蒋青云：除了“容量大”的特点外，相对于市场营销上一直提到的统计抽样而言，“大数据”的另一特点在于“全”，不局限于部分数据；同时“大数据”是动态产生的数据，很多时候都是在人与人之间的互动中产生并记录下来；套用一个流行的词语，“大数据”的发展是随时随地、“野蛮生长”的。

凌鸿：理解“大数据”可以从以下三个角度：首先是“多”，可以用海量来形容；其次是“广”，无论是数据来源、格式、乃至种类都很广泛；再次是“深”，用传统思维来看似乎不相关的数据，因为有大数据的记录、处理，就能发现原本很可能被忽略的复杂联系。

“大数据”带来的冲击其实符合“量变引发质变”的哲学原理，导致传统思维数据的方式发生很大变化、乃至生活方式也都可能受到影响。原先，我们合理做事都不仅要“知其然”，还要“知其所以然”。“大数据”时代下，可能我们只需要“知其然”，也能把事情做好。

王晓阳：以前“数据”并不小，但海量数据却并不叫“大数据”，因为过去我们都是小心翼翼地制定计划、采集样本、整理使用，现在是把所有可能采集到的数据全部集中在一起分析处理，这是“大数据”与过去传统意义上的“数据”概念最大的不同。

李焕民：从实际的商业操作层面来看，数据已经不仅仅是经营活动的副产品，对于越来越多的商家而言，它更是一种战略资产和竞争要素。作为一种特殊资产，数据分析挖掘越深，利用它的人越多，其价值就越高。

记者：“数据化”与“数字化”似乎很容易混淆，这两者之间有何差异？

凌鸿：数据是客观存在的，“数字化”就是将许多复杂多变的信息转变为可以电子化存储的数据，把这些数据转变为一系列二进制代码，引入计算机系统，进行统一处理，这就是“数字化”的基本过程。转化为二进制后，一些数据可能具备可计算、可分析、可追踪、可量化的特性，这一连串过程就叫做“数据化”。

“大数据”的前提就是利用这些可追溯、可量化的数据，挖掘数据背后的深刻含义，未来一定会有很大的发展，最终还将提升我们的智慧。人类的智慧正是来源于对数据的接收和对信息的理解。

记者：“大数据”概念的驱动力是什么？它是怎样形成的？

王晓阳：“大数据”形成的原因很复杂。事实上，人们早就开始采集数据，而技术发展使得处理数据的能力不仅在“量”上实现飞跃，处理“速度”也大大加快。所谓的“大量”，指的是一种爆炸性增长，我们现在已经有一些技术手段去处理、总结如此规模的数据。而“速度”指的是，让数据快速地存入系统，快速进行处理，反应速度也非常之快。

在收集方面，传感器几乎无处不在。过去个人要上传一张网页可不是那么简单，但社交网络兴起后，通过微博等平台，每个人“随意”的一句话都能公开发布。于是，采集的数据不再仅仅是商业行为的数据，这些个人信息的“数字化”也能通过技术手段收集起来。

更关键的是，采集、分析之后，一些业内的先锋企业发现，这些数据“有用”。有了技术、有了用处，随之就驱动了“大数据”产业的发展。

数据如何转变为“商业洞察”？

记者：目前“大数据”的商业价值已经显现：帮企业更精准地找到用户，降低营销成本，从而提高企业销售率，增加利润。如何具体应用“大数据”达成这些效果？

蒋青云：通常人们都用“3V”来形容“大数据”，我觉得还要加一个“V”——Value，也就是价值，特别是对于商业的价值。“大数据”记录了人类行为各种信息，而这些信息都是分散的。我们都知道如果拼图的板块越多，拼起来的难度就越大。眼下，涌现出不少专门帮着“拼图”的数据公司，拼得越完整、利用“大数据”更为充分、就能更有效地帮助企业优化商业决策。今天对于“大数据”的利用还处于初级阶段，如果暂时没有能力拼出全部的拼图，那么拼出部分图案也会产生一定的价值。

李焕民：作为一家商业数据处理与分析公司，邓韩贝(dunnhumby)专注于消费者购物行为的分析，通过各种数据（包括EPOS数据、信用卡数据、会员卡数据、在线浏览及购买数据或其它第三方数据等等）分析得出顾客洞察，帮助零售商及品牌商了解谁是最好的顾客、顾客的需求和需要是什么，从而为顾客提供个性化体验，增加顾客忠诚度。比方说，根据购物的频次、每次花费的金额就可以把顾客进行忠诚度的细分：最好的顾客、有价值的顾客、潜在的顾客、非忠诚顾客等。比分说，根据对价格是否敏感，我们就可以知道顾客的生活方式，处于高端、中端还是低端。高端关注商品品质与服务，中端顾客更关注物有所值和便利性，而低端顾客价格敏感度很高。我们还可以从顾客对渠道的偏好、对品牌的忠诚等多个角度、不同维度来对顾客进行认知。

有了对数据的洞察后，更关键的是，如何将这些洞察转变为决策和行动。现实的情况是有些公司自己也有不错的数据分析能力，却无法转变为更好的商业决策，包括智能定价、促销、与客户做个性化沟通等。举个例子，“啤酒和尿布”的营销案例早就广为人知：某零售公司从数据分析中发现，啤酒和尿布两个不同品类的商品具有高度相关性，因为它们经常出现在同一个购物篮里，且这样的购物篮出现的比例很高，倘若把它们联合促销，会不会带来更高的销售？事实是，两者都实现了不可思议的销售增长，这就是利用商品的相关性来进行跨品类促销或追加销售的真实案例，而商品的相关性分析，就是数据分析的洞察之一。

我们可以通过对于海量数据的分析，找到某不同品类的某些产品“高度相关”；同时反过来，我们也可以发现同一品类的某些产品具有高度替代性，即消费者要不购买A，要不购买B，但绝不会同时购买两者。经过对上千万这样的购物篮进行分析，我们就可以了解消费者是怎么样进行购买决策的，从而帮助零售商进行品类管理及货架排面优化决策。

王晓阳：“大数据”技术到底能对商业带来哪些好处？事实上，洞察是做出商业决策的基础，而大数据正提供了这个基础。反过头来，利用大数据带来的洞察去做一些判断、策划、决策的同时，我们可以建立一个反馈机制，包括做哪些促销、网站首页放什么内容，都可以先“试验”一番，实时得到反馈结果，判断效果后及时做出调整，这将是一个很大的改变。

例如，某商家拥有上千万的用户，利用“大数据”的技术手段，挑选其中100万户，测试改变网页对点击造成的影响，动态获取结果，随后再去推广，如果没有“大数据”技术，这种“试

验”我们无法做到。

记者：从市场营销角度来看，“大数据”如何改变企业与客户的关系？

蒋青云：从营销理论出发，“大数据”目前运用最广泛的部分就是客户关系管理（CRM）。

客户关系管理有三大目标，一是“向上销售（up-selling）”，促进客户买更多商品；“交叉销售（cross-selling）”，让客户实现多样组合购买；“口碑营销”，通过现有客户拉到更多的客户。

对于这三大目标，“大数据”都可以帮到忙，其路径如下：通过“大数据”的分析，可以发现某客户的消费行为，商家可以通过这样的刻画更加理解消费者，提供更个性化，更符合消费者需要的销售，从而激发出更多购买行为，提高营销绩效。

记者：除了在零售领域，“大数据”在金融、政府管理、社会管理等方面还有很多应用，它的价值和带来的变革还体现在哪里？

凌鸿：我来举一个开车的例子，假设“大数据”的技术足够强大，我们在车上所有的位置装好传感器，采集包括轮子压力、转速，发动机的状况，甚至开车人表情、姿势、动作等各种信息数据，实时处理、分析后传输到汽车公司，反应出这部汽车的所有状况。在这种状况下，会发生哪些改变？司机要打瞌睡，立马会有提醒；坐得不太舒服，座椅迅速调整；行车速度异常，汽车立刻就“被指导”……到那时候，我们坐上汽车或许根本不需要人来驾驶，实现真正的“无人驾驶”。如此一来，这家汽车公司似乎就演变成了一家数据处理公司。未来企业的能力取决于对数据感知、分析的能力，这都离不开信息技术、算法、系统的支撑，而整个运作流程的关键不再停留在卖车，还是售卖之后的服务上。

“大数据”给生活带来的影响或许就隐含在其中：传统的产品、服务、乃至运作方式将被改变；最终，整个产业、乃至社会运作都会发生变化。

未来“大数据”时代里，通过对数据的洞察，商家所提供的恰恰都是客户所需要的服务，最后很可能都不需要做广告了，因为提供的都是客户所需要的信息和服务，无疑将改变传统的营销方式。

蒋青云：从经济学的角度来看，过去抽样调查更有效率，抓取更多样本意味着过高的边际成本；现在，随着数据记录、处理、分析能力的提高，处理全部数据的边际成本大大降低了，于是“大数据”的价值就体现了出来，具备为商业服务的能力。

但是目前对于“大数据”的应用很多还处于探索的阶段，所谓实时收集、分析、处理还属于假设的理想化状态，何时实现要拭目以待。

过去商业决策都靠人来做判断，以后人们可以通过数据反馈、计算机自动化处理等，来找到更好的决策依据，从而提高商业智能（Business Intelligence）。

“大数据”陷入“过热期”？

记者：社交网络里有很多反馈信息、而且是实时、基于客户的，那么社交化媒体对建立健全“大数据”系统以及应用发挥着哪些作用？

凌鸿：眼下各个渠道都会产生丰富的数据，营销与社会化媒体的结合已经非常密切。客户的基本状况不仅仅反映在产品的购买过程中，社交网站上的种种行为可能会直接影响、直接决定商品的选择。现在很多拥有数据的网站都在向零售企业提供类似的数据，比如企业会关心在某社交网站上，哪些人在议论这家企业的产品、议论哪些与产品相关的话题？从而重新定义该产品性能和服务。事实上，现实中已经有这样的案例，企业从社交网站上获取数据，反馈给工程师，对商品做相应的修改，再重新公布到社交网站上来收集反馈，最终找到适合市场的商品。

随着各类社交网站的兴起，群体行为有了众多电子化的数据，通过分析这些数据，发现其中的商业价值。不少企业已经建立起基于社会化媒体的客户关系管理系统，直接连接各大社交媒体，洞察消费状况的变化，甚至可以通过这些数据分析预测商品未来的流行趋势。社交网络中的数据越来越多，称得上“大金矿”，我们正在思考如何通过分析这些数据支持商业化活动，提升服务质量，例如如何对教学过程产生帮助，应该给学生传递哪些教学内容，都可以在社交网络中找到

大数据处理流程的主要环节

大数据处理流程的主要环节大数据处理流程主要包括数据收集、数据预处理、数据存储、数据处理与分析、数据展示/数据可视化、数据应用等环节，其中数据质量贯穿于整个大数据流程，每一个数据处理环节都会对大数据质量产生影响作用。通常，一个好的大数据产品要有大量的数据规模、快速的数据处理、精确的数据分析与预测、优秀的可视化图表以及简练易懂的结果解释，本节将基于以上环节分别分析不同阶段对大数据质量的影响及其关键影响因素。一、数据收集在数据收集过程中，数据源会影响大数据质量的真实性、完整性数据收集、一致性、准确性和安全性。对于Web数据，多采用网络爬虫方式进行收集，这需要对爬虫软件进行时间设置以保障收集到的数据时效性质量。比如可以利用八爪鱼爬虫软件的增值API设置，灵活控制采集任务的启动和停止。二、数据预处理大数据采集过程中通常有一个或多个数据源，这些数据源包括同构或异构的数据库、文件系统、服务接口等，易受到噪声数据、数据值缺失、数据冲突等影响，因此需首先对收集到的

大数据集合进行预处理，以保证大数据分析与预测结果的准确性与价值性。大数据的预处理环节主要包括数据清理、数据集成、数据归约与数据转换等内容，可以大大提高大数据的总体质量，是大数据过程质量的体现。数据清理技术包括对数据的不一致检测、噪声数据的识别、数据过滤与修正等方面，有利于提高大数据的一致性、准确性、真实性和可用性等方面的质量; 数据集成则是将多个数据源的数据进行集成，从而形成集中、统一的数据库、数据立方体等，这一过程有利于提高大数据的完整性、一致性、安全性和可用性等方面质量; 数据归约是在不损害分析结果准确性的前提下降低数据集规模，使之简化，包括维归约、数据归约、数据抽样等技术，这一过程有利于提高大数据的价值密度，即提高大数据存储的价值性。数据转换处理包括基于规则或元数据的转换、基于模型与学习的转换等技术，可通过转换实现数据统一，这一过程有利于提高大数据的一致性和可用性。总之，数据预处理环节有利于提高大数据的一致性、准确性、真实性、可用性、完整性、安全性和价值性等方面质量，而大数据预处理中的相关技术是影响大数据过程质量的关键因素

大数据实验报告

学生实验报告册（理工类）课程名称：大型数据库技术专业班级：12计算机科学与技术（1）学生学号：学生姓名：所属院部：计算机工程学院指导教师：陈爱萍

2014——20 15学年第2 学期金陵科技学院教务处制

实验报告书写要求实验报告原则上要求学生手写，要求书写工整。若因课程特点需打印的，要遵照以下字体、字号、间距等的具体要求。纸张一律采用A4的纸张。实验报告书写说明实验报告中一至四项内容为必填项，包括实验目的和要求；实验仪器和设备；实验内容与过程；实验结果与分析。各院部可根据学科特点和实验具体要求增加项目。填写注意事项（1）细致观察，及时、准确、如实记录。（2）准确说明，层次清晰。（3）尽量采用专用术语来说明事物。（4）外文、符号、公式要准确，应使用统一规定的名词和符号。（5）应独立完成实验报告的书写，严禁抄袭、复印，一经发现，以零分论处。实验报告批改说明实验报告的批改要及时、认真、仔细，一律用红色笔批改。实验报告的批改成绩采用百分制，具体评分标准由各院部自行制定。实验报告装订要求实验批改完毕后，任课老师将每门课程的每个实验项目的实验报告以自然班为单位、按学号升序排列，装订成册，并附上一份该门课程的实验大纲。

实验项目名称：Oracle数据库安装与配置实验学时： 1 同组学生姓名：实验地点：1316 实验日期：2015/3/27 实验成绩：批改教师：陈爱萍批改时间：

实验1：Oracle数据库安装与配置一、实验目的和要求（1）掌握Oracle数据库服务器的安装与配置。（2）了解如何检查安装后的数据库服务器产品，验证安装是否成功。（3）掌握Oracle数据库服务器安装过程中出现的问题的解决方法。（4）完成Oracle 11g数据库客户端网路服务名的配置。（5）检查安装后的数据库服务器产品可用性。（6）解决Oracle数据库服务器安装过程中出现的问题。二、实验设备、环境设备：奔腾Ⅳ或奔腾Ⅳ以上计算机环境：WINDOWS 7、ORACLE 11g中文版三、实验步骤（1）从Oracle官方网站下载与操作系统匹配的Oracle 11g数据库服务器和客户机安装程序。（2）解压Oracle 11g数据库服务器安装程序，进行数据库服务器软件的安装。

数据库原理实验5

福建农林大学资源与环境学院实验报告系：国土资源专业：空间信息与数字技术年级：2016 姓名：任然学号：3165706014 实验室号____507__ 计算机号44 实验时间：2018年5日指导教师签字：成绩：报告退发(订正、重做) 实验名称：触发器、存储过程操作实验一、实验目的和要求（1）掌握SQL Server中的触发器的使用方法；（2）掌握存储过程的操作方法。二、实验内容和原理 1. 基本操作实验在读者-图书数据库中用Transact-SQL语句描述下列功能：（1）在读者表上建立一个DELETE类型的触发器lianxi_del，触发动作是显示信息（已删除读者表中的数据），执行下列语句： create trigger lianxi_del on 读者 for delete as print ‘已删除读者表中的数据’ （2）建立一个查询指定读者号的阅读信息的存储过程List_jy，输入参数为读者号，如果没有输入读者号，则要输出提示信息。建立这个存储过程的语句如下所示。 create procedure List_jy @p_dzh char(5) = null as if @p_dzh is null begin print ‘请输入一个读者号’ return end else select 编号,姓名,书名,借阅时间 from 读者,借阅,图书 where 读者.编号=借阅.读者编号 and 借阅.书号=图书.书号 and 读者.编号=@p_dzh 2. 提高操作实验在学生-课程数据库中用Transact-SQL语句描述下列功能：（1）为学生表建立一个名TRI_INSERT的INSERT触发器。功能是当用户向学生表添加数据时，同时也把这些数据添加到stu表中。其中：学生表和表stu的结构相同。（2）为学生表建立一个名TRI_DELETE的DELETE触发器。功能是当用户从学生表

黑大数据库实验报告资料

黑龙江大学 “数据库系统原理课程设计”总结报告学院软件学院年级2014级专业软件工程学号20143983 姓名陆芝浩报告日期2016.11.9 成绩黑龙江大学软件学院

1、开发环境操作系统：Windows7 编程语言环境：VC++6.0 2、DBMS系统架构 3、DBMS主要功能模块 1、实现SQL语句中的Create Table建表语句，建立相应的数据库表，并生成相应的数据字典文件和数据文件。 2、实现alter table表模式的修改功能： ①能够为已建立的表添加属性。 ②能够从已建立的表中删除属性。

3、实现drop table删除表功能。 4、实现create index创建索引的功能。 5、实现drop index删除索引的功能。 6、实现insert可以向已经创建的表插入元组。 7、实现delete从已经创建的表中删除元组。 8、实现update修改表中的数据。 9、实现SELECT语句，包括：实现单表全属性查询。实现单表单属性查询。实现多表的连接全属性查询。实现多表的连接和选择条件的全属性查询。实现多表的连接的单属性查询。实现多表的连接和选择的单属性查询。实现单表的选择的单属性查询。实现单表的选择的全属性查询。 10、利用启发式关系代数优化算法进行查询优化。 11、建立访问权限，根据数据字典（DD）实现对数据库的安全性检查和完整性约束的机制。 3.1 SQL语言的词法和语法分析（1）功能介绍通过编译原理的知识对输入的SQL语句进行词法分析,将SQL语句拆分为若干个单词,对其进行语法分析,确定输入的SQL语句的含义. （2）相关理论利用编译原理的相关知识，对输入的SQL语句进行模仿SQL语言的词法及语法结构的分析。

大数据区域市场研究报告33

数据交易的经济价值建立?大数据交易所的可研分析中关村?大数据交易产业联盟副秘书长北京铭科实创科技有限公司CEO 刘铭

?大数据时代背景数据交易所的定位数据交易所的产品与服务数据交易所的建设途径

数据时代?大背景?大数据的资产积累 ?大数据的价值模式 ?大数据的变现途径 ?大数据的?金融属性

2013 年中国产生的数据总量超过0.8ZB （相当于8亿TB ），2 倍于2012 年，相当于2009 年全球的数据总量，预计到2020 年，中国产生的数据总量将是2013年的10倍，超过8.5ZB 数千亿网页几十亿次搜索/天交易数据、商家数据社交、游戏数据用户上传数据 BAT 代表的互联网公司 1000PB 100PB 30PB 100PB 上网记录、通话信息、位置银行开户、交易智能电表、水表电信、金融、电力 10PB 30PB 公共安全、医疗、交通实时摄像 300PB/Y 交通运行调度医疗影像、档案 100PB/Y 气象、教育、地理、政务商业、制造、农业、流通生产数据设计数据监控数据金融税务教育等政府智慧城市卫星预报 200PB 10PB

数据资产蕴涵巨大的商业和社会价值 3000亿美元——美国智慧医疗年度潜在价值 2500亿欧元——欧洲公共管理的潜在年度价值6000亿美元——服务提供者利用全球个人位置数据可获得潜在的消费者年度盈余 60％的增加——零售商利用大数据可获得的运营利润50%的减少——制造业设备装配成本

数据的间接价值通过应用体现数据源（交易、科研、互动、传感）数据获取和治理数据存储计算处理分析和可视化数据驱动的决策数据直接变现

《数据库原理》实验7

实验七：数据库的安全性一、实验目的 1.掌握Windows NT认证模式下数据库用户帐号的建立与取消方法； 2.掌握混合模式下数据库用户帐号的建立与取消方法； 3.掌握数据库用户权限的设置方法； 4.熟悉数据库数据库用户帐号的权限分配、回收等方法； 5.了解数据库角色的分类、作用及使用方法。二、实验环境已安装SQL Server 2005 企业版的计算机；具有局域网环境,有固定IP; 三、实验学时 2学时四、实验要求 1.了解SQL Server 2005系统安全； 2.熟悉数据库用户、服务器角色及数据库角色的用法； 3.完成实验报告；五、实验内容及步骤以系统管理员身份登录到SQL Server服务器，在SQL Server2005界面中实现以下操作，并独立写出部分题目的程序代码； 1.在当前计算机中增加一个用户zhang和cheng，密码为secret。使此用户通过winows nt模式下登录SQL Server服务器，登录名分别为zhang和cheng； 2.新建以混合模式登录SQL Server服务器的用户登录名为stu1、stu2和stu3，登录密码为secret，默认登录数据库为stu； 3.将帐号zhang添加为数据库stu的用户，用户名为zhang； 4.在数据库stu中创建用户stu1、stu2和stu3，登录帐号分别为stu1、stu2 和stu3； 5.给数据库用户zhang赋予创建数据库的权限； 6.给数据库用户stu1赋予对sc表进行插入、修改、删除操作权限； 7.给数据库用户stu2和stu3赋予对student表、course表所有操作权限及查询sc的操作权限，并允许再授权给其他用户； 8.收回数据库用户stu2对student表和course表的删除操作的权限； 9.若一个小组共5个成员，他们对数据库stu具有相同的操作权限，具体权限如下： 1)对于student、course表只能进行数据查询；

大型数据库管理实验报告4

武汉轻工大学经济与管理学院实验报告实验课程名称大型数据库管理实验起止日期2019.11.5至2019.12.10 实验指导教师程红莉实验学生姓名学生班级学号物流管理1702 实验评语实验评分教师签名年月日

实验项目名称数据完整性实验日期2019.12.10 学生姓名班级学号物流管理1702 一、预习报告（请阐述本次实验的目的及意义） 1.熟悉通过SQL对数据进行完整性控制。 2.完成书本上习题的上机练习。二、实验方案（请说明本次实验的步骤和进程） 1.用Constraint和Check建立完整性约束条件教材164页例[7] Student表的ssex 只允许取‘男’或‘女’ create table student1 (sno char(9) primary key, sname char(8) not null, sex char(2) check(sex in('男','女')), sage smallint, sdept char(20) ); 教材164页例[8] create table sc1 (sno char(9), cno char(4), grade smallint check(grade>=0 and grade<=100), primary key(sno,cno), foreign key(sno)references student1(sno), foreign key(cno)references course(cno) ); 教材164页例[7]、例[8]（给学生表的性别增加约束条件，即只允许“男”或“女”。可用语句: alter table student add constraint course1 check(sex in('男','女')) alter table sc add constraint course2 check (score>=0 and score<=100) go

大数据的大价值：大数据五大成功案例深度解析学习资料

大数据的大价值：大数据五大成功案例深度解析 ?作者：Cashcow ?星期四, 四月11, 2013 ?大数据, 航空, 零售 ?暂无评论大数据的热潮并未有消褪迹象，相反，包括航空、金融、电商、政府、电信、电力甚至F1赛车等各个行业的企业都在纷纷掘金大数据。可以看出，在推动大数据企业应用方面，真正看到大数据潜在商业价值的企业比大数据技术厂商还要着急。例如IT经理网曾经报道过沃尔玛大数据实验室直接参与到大数据工具的开发和开源工作中。但是在国内，虽然管理学界和财经媒体对大数据推崇备至，认为大数据是信息技术改变商业世界的杀手应用，但是关于大数据中国企业的成功案例的报道却出奇地少。最近《中国企业家》的“大数据专题”特别报道采访了农夫山泉、阿迪达斯中国和数家航班信息移动服务商（前两家为SAP客户），为我们带来了详实的大数据案例报道，非常有参考价值，原文转载如下：就在制作这期“大数据专题”时，编辑部发生热烈讨论：什么是大数据？编辑记者们旁征博引，试图将数据堆砌的商业案例剔除，真正的、实用性强的数据挖掘故事留下。

我们报道的是伪大数据公司？我们是否成为《驾驭大数据》一书的作者Bill Franks所称的“大数据骗局”中的一股力量？同样的质疑发生在阿里巴巴身上。有消息称，3月23日，阿里巴巴以7000万美元收购了一家移动开发者数据统计平台。这引发了专家们热烈讨论，它收购的真是一家大数据公司吗？这些质疑并非没有道理。中国确实没有大数据的土壤。“差不多先生”、“大概齐”的文化标签一直存在。很多时候，各级政府不太需要“大数据”，形成决策的关键性数据只有一个数字比率（GDP）而已；其二，对于行业主管机构来说，它们拥有大量原始数据，但它们还在试探、摸索数据开放的尺度，比如说，是开放原始数据，还是开放经过各种加工的数据？是转让给拥有更高级计算和储存能力的大型数据公司，还是将数据开源，与各种各样的企业共享？其三，数据挖掘的工具价值并没有完全被认同。在这个领域，硬件和软件的发展并不十分成熟。即便如此，没有人否认数据革命的到来，尤其在互联网行业。阿里巴巴的马云将大数据作为战略方向，百度的李彦宏用“框计算”来谋划未来。即便是CBA（中国男子篮球职业联赛）也学起了NBA（美国男篮职业联赛）五花八门的数据统计、分析与挖掘。在过去两年间，大量的资本投资一些新型数据工具公司，根据美国道琼斯风险资源（Dow Jones VentureSource）的数据，在过去的两年时间里，11.7亿美元流向了119家数据库软件公司。去年，SAP 市值已经超过西门子，成为德国市值最高的上市公司，而这样的业绩部分得益于其数据库软件HANA的商业化，去年一年时间里HANA带给SAP3.92亿欧元的收入，增长了142%。但是，大数据还没法分析、挖掘出自己的直接变现能力。在截稿日时，我们再重新读维克托·迈尔-舍恩伯格（Viktor Mayer-Sch鰊berger）的《大数据时代：生活、工作与思维的大变革》一书，作者相信，未来，数据会成为有价值的资产。假以时日，它会大摇大摆地进入资产负债表里。案例1：农夫山泉用大数据卖矿泉水

大数据时代数据资产管理“五星模型”

大数据时代数据资产管理“五星模型” 作者：于雪伴随着大数据时代的悄然来临,数据的价值得到人们的广泛认同,对数据的重视提到了前所未有的高度。数据已经作为企业重要资产被广泛应用于盈利分析与预测、客户关系管理、合规性监管、运营风险关理等业务当中。大数据与数据资产管理数据就像企业的根基。然而并非所有数据都可能成为资产。如果没有将数据视为资产加以有效管理，即使数据再多，对于企业来说也只是垃圾和负担。在传统企业数据资产管理的过程中，以下六类问题非常普遍： 1.数据架构失控; 2.元数据管理混乱; 3.数据标准缺失; 4.数据质量参差不齐; 5.数据增长无序; 6.数据安全问题突出导致这些问题的根本原因是数据资产管理与企业IT信息化的过程紧密相连。企业的IT建设过程不可能一蹴而就，而是通过长期不断的迭代演进而来。在这个过程中，大量数据沉睡在企业IT系统的存储介质中，没有得到充分发挥其价值的机会。数据资产管理的核心

究竟具备什么样的特性，才可以将数据定义为资产呢?我们可以通过以下三个标准判断：可控制，可量化、可变现。对于如通过高效的数据资产管理,帮助企业凭借高质量的数据提供更精准的产品和服务、降低成本并控制风险，从而提升企业的核心竞争力，新炬网络董事EVP、新炬软件董事CEO 程永新提出了由“三个基础”和“两个飞轮”组成的“数据资产管理五星模型”。三个基础： 1.数据架构：驱动企业架构成熟度 “数据驱动一切”，对于大数据时代的企业发展来说，一点也不过分。在企业中，我们不难看到ERP、CRM、财务系统、技术架构、数据中心的运营和维护……，这些资源都有专人负责管理。而当数据成为企业核心资产后，又由谁来负责呢? IT应该只负责How to Do的问题。改变架构，应该先从人改变;企业的变革，应该先从组织变革做起。当数据成为核心资产，企业应该设立专业责数据架构和管理的跨项目的专业数据管理实体化，或是虚拟的组织，不断完善数据架构，提升企业在数据规划、设计、开发和交付的质量，将IT系统建设生命期从头到尾管理起来。

数据库原理实验报告分析

2013级数据库原理实验报告专业：_______计算机___ 班级：________________ 学号：______________ 姓名：_______________ 2015年5月

实验一 SQL Server 2005基本操作一、实验目的了解SQL Server 2005组件；了解SQL Server数据库组成；掌握SQL Server 2005界面基本操作。二、实验内容（1）开始->程序->Microsoft SQL Server 2005-> SQL Server Management Studio，打开后进入到SQL Server 2005主体界面（2）点击?数据库?前面的?+?，可以展开查看数据库，并且可以继续展开下级目录，查看数据库中的表、视图等。（3）了解SQL Server 2005菜单栏的一些主要工具的使用。（4）学生动手操作SQL Server 2005，打开数据库，打开表，打开查询界面；查看数据库的属性、表的属性等。三、实验总结进行这次实验有遇到什么问题？怎么解决的？答：此次实验我们一步一步按照实验内容操作的，基本上没有遇到问题。

实验二数据定义一、实验目的掌握SQL Server 2005的数据库创建；掌握SQL Server数据定义语言；掌握SQL Server 2005数据定义的SQL语言定义与管理器定义两种方式。二、实验内容（1）创建、修改、删除数据库。创建要求：数据库Employee中包含一个数据库文件Empdat1.mdf和一个日志文件Emplog.ldf。其中，数据文件大小为10MB，最大为50MB，以5MB速度增长；日志文件大小为5MB，最大为25MB，以5%速度增长。修改要求：增加第二个数据库文件Empdat2.ndf，其中，数据文件大小为5MB，最大为25MB，以2MB速度增长。（2）利用SQL创建人员表person、月薪表salary及部门表dept。见上页图要求：按表2-1、表2-2及表2-3中的字段说明创建。

大型数据库实验报告

中南大学大型数据库实验报告课程名称大型数据库技术指导教师姓名学号专业班级

《大型数据库技术》实验三 1．写一个PROC程序，查询并显示表Agents的所有记录。要求定义一个数组类型的宿主变量，一次性把所有记录从服务器端传送到客户端，然后逐行显示。 Java代码如下： public void selectAgents() throws Exception { Connection conn = this.getConnection(); Statement stmnt = conn.createStatement(); ResultSet set = stmnt.executeQuery("select * from Agents"); System.out.println("查询结果如下：\n"); while (set.next()) { String id = set.getString("AID"); String name = set.getString("ANAME"); String city = set.getString("CITY"); int percent = set.getInt("PERCENT"); System.out.println("aid:"+ id + " aname:"+ name + " city:" + city + " percent:" + percent); } set.close(); stmnt.close(); conn.close(); } 测试代码： public static void main(String[] args) throws Exception { String url = "jdbc:oracle:thin:@localhost:1521:ORCL"; String user = "jelly"; String pwd = "csusoft"; DBOpers db = new DBOpers(url, user, pwd); db.selectAgents(); } 测试结果： 2．写一个PROC程序，根据用户输入的城市，查询并逐行显示该城市所有顾客的编号、名称和折扣。如果该城市中不存在任何顾客，则调用一个错误处理函数，函数中显示错误信息：“该城市中不存在顾客”。 Java代码如下：

数据库原理实验报告(5)

南京晓庄学院《数据库原理与应用》课程实验报告实验五嵌套子查询设计实验所在院(系):数学与信息技术学院班级：学号：姓名：

1.实验目的 (1)掌握多表查询和子查询的方法。 (2)熟练使用IN、比较符、ANY或ALL和EXISTS操作符进行嵌套查询操作。 (3)理解不相关子查询和相关子查询的实现方法和过程。 2.实验要求 (1)针对“TM”数据库，在SQL Server查询分析器中，用T-SQL语句实现以下查询操作： a)查询选修了数据结构与算法的学生学号和姓名。 b)查询07294002课程的成绩低于孙云禄的学生学号和成绩。 c)查询和孙云禄同年出生的学生的姓名和出生年份。 d)查询其他系中年龄小于数学与信息技术学院年龄最大者的学生。 e)查询其他系中比数学与信息技术学院学生年龄都小的学生。 f)查询同孙云禄数据库原理与应用课程分数相同的学生的学号和姓名。 g)查询选修了07294002课程的学生姓名。 h)查询没有选07294002课程的学生姓名。 i)查询同时选修了07295006和07295007课程的学生的学号。 j)查询所有未授课的教师的工号、姓名和院系，结果按院系升序排列。扩展实验： a)查询和10060101选修的全部课程相同的学生的学号、课程号、期末考试成绩。 b)查询至少选了10060101选修的全部课程的学生的学号。 c)查询年龄比所在院系平均年龄小的学生的学号、姓名、年龄、院系，按院系和年龄升序排列。 d)查询每门课都在80分以上的学生的学号和姓名。 (2)在SQL Server Management Studio中新建查询，尽可能用多种形式表示实验中的查询语句，并进行比较。 (3)按要求完成实验报告。 3.实验步骤、结果和总结实验步骤/结果将调试成功的T-SQL语句写在下方（标明题号）。

大数据时代案例：亚马逊推荐系统机制

案例：亚马逊推荐系统机制推荐机制作为成熟的技术用到网站的各个方面，譬如内容网站推荐机制可以为用户作个性化的网页内容定制，电商网站可以为用户作商品推荐，客户中心、柜面可以利用推荐机制为用户提供个性化服务。电商网站被大家提得最多的商品推荐要属Amazon。一个好的推荐系统，对于电子商务网站来说：1、提高用户体验，好的个性化推荐，更好的向顾客展示商品以提高转换率。2、发现顾客的潜在需求，提高客单价。电商商务的先驱－亚马逊号称推荐系统提高了其30%的销售。但一个好的推荐系统地建立不是一挥而就的，就像一个好的“导购员”，需要不断的进行经验积累、需要参加多种培训，以提高销售技能一样。需要不断的迭代、优化，不仅需要从算法上、计算效率上提高，现在更多加入了许多数据分析师日常工作中发现的规律，（例如：通过顾客的人口统计学对顾客进行了细分，在细分好的基础上，再利用推荐系统的相关算法，可有效的提高系统的准确性。）建立一个类似于专家库，把这些知识结合进入推荐系统中。推荐形式包括三种：1）针对用户的浏览、搜索等行为所做的相关推荐；2）根据购物车或物品收藏所做的相似物品推荐；3）根据历史会员购买行为记录，利用推荐机制做EDM或会员营销。前面2种表现形式是大家可以在网站上看到，而第3种表现形式只有体验后才能知晓，一封邮件，一条短信，一条站内消息都是它的表现方式。

对于非登录用户，亚马逊中国在网站首页和类目栏，会根据各个类目畅销品的情况做相应的推荐，其主要表现形式为排行榜。搜索浏览页面以及具体的产品页面的推荐形式的有关联推荐（“经常一起购买的商品”）和基于人群偏好的相似性推荐（“购买此物品的顾客也购买了”、“看过此商品的顾客购买的其他商品”）。对于登录用户，亚马逊中国则给出了完全不同的推荐方式，网站会根据用户的历史浏览记录在登入界面首屏展现出一个今日推荐的栏目，紧接着是最近一次浏览商品的记录和根据该物品所给的产品推荐（“根据浏览推荐给我的商品”、“浏览XX产品的用户会买XX的概率”），值得注意的是，每个页面最下方网站都会根据用户的浏览行为做响应推荐，如果没有浏览记录则会推荐“系统畅销品”。亚马逊总裁杰夫·贝佐斯曾说过这样一句话：“如果我的网站有一百万个顾客，我就应该有一百万个商店”。这或许就是推荐的极致，而这样一个系统必定是以用户为中心的，有记忆、进化功能的。个性化是一个永无止境的进程，它的效用可以被无穷放大。对于电商网站而言，如果推荐的页面上全是用户喜欢的物品，连Size、颜色、付款方式、物流等细节都给处理好了，或许就是对用户最好的“个性化”。作者張文升介绍：上海蓝草企业管理咨询有限公司首席研究员北京维沃联合品牌设计顾问有限公司总经理多家知名企业特聘高级管理顾问国内著名实战型营销专家，品牌建设专家

中国行业大数据应用市场专题研究报告2015(简版)

中国行业大数据应用市场专题研究报告2015 （简版）
本产品保密并受到版权法保护
Confidential and Protected by Copyright Laws

易观智库长期致力于互联网、物联网、大数据、云计算、制造业等的深度研究，新一代信息技术行业是其中最为重要的研究领域之一。研究报告包括以下：
我们已产出本行业报告：
? ? ? 中国大数据市场年度综合报告（2014）中国行业大数据应用市场专题研究报告2015 中国移动云计算平台市场专题研究报告2015
2015/7/23
欲了解新一代信息技术行业的更多内容，请访问易观智库官网：https://www.360docs.net/doc/4210379180.html, 或致电客服：4006-515-715
大数据大价值
2

目录
1 2
中国行业大数据应用市场概况重点行业大数据应用现状大数据行业化应用趋势与看点
3
2015/7/23
大数据
大价值
3

2011-2018年中国大数据市场规模发展
2015-2018年中国大数据市场营收规模预测
营收规模（亿元人民币） 300 250 26.7% 200 150 24.7% 137.9 34.7% 28.4% 188.5 35.2% 36.1% 环比增长率 36.7% 37.2% 40% 35% 30% 25% 20% 15% 10% 5% 0% 2011 2012 2013 2014 2015F 2016F 2017F 2018F
258.6
2014年大数据市场驱动力： ? 来自于线下大数据市场（ IT企业的大数据应用及大数据平台业务市场）中IT巨头和单一大数据业务的厂商开始行动，优化产品和服务路线图。
102.0 100
50 0 37.4 47.3 59.0 75.7
? Analysys 易观智库
https://www.360docs.net/doc/4210379180.html,
? 来自于线上大数据市场（互联网用户数据市场，以及以互联网金融为主的线上金融市场）的成熟度逐渐提高，以金融和零售为核心的线上大数据应用走向成熟，市场体量进一步扩大。 ? 企业着力培育数据资产，积极探讨数据变现，行业大数据多集聚、少融合。 ? 大数据产业集群逐渐形成，即针对企业而言，以云端大数据集聚为前提条件，以行业云服务为平台，共享企业间核心竞争力。
2015/7/23
大数据
大价值
4

大数据变现的九种商业模式

大数据变现的九种商业模式大数据已经从论坛串场、浮躁的观点逐步走向国家治理体系建设、营销管理、生产管理、证券市场等方面，其商业模式也多种多样。大数据变现的九种商业模式在大数据成为趋势，成为国家战略的今天，如何最大限度发挥大数据的价值成为人们思考的问题。无论是对于互联网企业、电信运营商还是数量众多的初创企业而言，大数据的变现显得尤为重要。谁最先一步找到密码，谁就能够抢占市场，赢得发展。大数据产业具有无污染、生态友好、低投入高附加值特点，对于我国转变过去资源因素型经济增长方式、推进“互联网+”行动计划、实现国家制造业30年发展目标有战略意义。前几年，国内大数据产业讨论较多、落地较少，商业模式处于初探期，行业处于两种极端：一种是过热的浮躁带来了一定的泡沫和产业风险；一种是怀疑大数据只是炒作，依然坚持传统管理理念、经营模式。但是进入2015年之后，大数据产业告别了泡沫，进入更务实的发展阶段，从产业萌芽期进入了成长期。当前，如何将大数据变现成为业界探索的重要方向。 1B2B大数据交易所国内外均有企业在推动大数据交易。目前，我国正在探索“国家队”性质的B2B大数据交易所模式。 2014年2月20日，国内首个面向数据交易的产业组织—中关村大数据交易产业联盟成立，同日，中关村数海大数据交易平台启动，定位大数据的交易服务平台。2015年4月15日，贵阳大数据交易所正式挂牌运营并完成首批大数据交易。贵阳大数据交易所完成的首批数据交易卖方为深圳市腾讯计算机系统有

限公司、广东省数字广东研究院，买方为京东云平台、中金数据系统有限公司。2015年5月26日，在2015贵阳国际大数据产业博览会暨全球大数据时代贵阳峰会上，贵阳大数据交易所推出《2015年中国大数据交易白皮书》和《贵阳大数据交易所702公约》，为大数据交易所的性质、目的、交易标的、信息隐私保护等指明了方向，奠定了大数据金矿变现的产业基础。 2咨询研究报告国内咨询报告的数据大多来源于国家统计局等各部委的统计数据，由专业的研究员对数据加以分析、挖掘，找出各行业的定量特点进而得出定性结论，常见于“市场调研分析及发展咨询报告”，如“2015～2020年中国通信设备行业市场调研分析及发展咨询报告”、“2015～2020年中国手机行业销售状况分析及发展策略”、“2015年光纤市场分析报告”等，这些咨询报告面向社会销售，其实就是O2O的大数据交易模式。各行各业的分析报告为行业内的大量企业提供了智力成果、企业运营和市场营销的数据参考，有利于市场优化供应链，避免产能过剩，维持市场稳定。这些都是以统计部门的结构化数据和非结构化数据为基础的专业研究，这就是传统的一对多的行业大数据商业模式。 3数据挖掘云计算软件云计算的出现为中小企业分析海量数据提供了廉价的解决方案，SaaS模式是云计算的最大魅力所在。云计算服务中SaaS软件可以提供数据挖掘、数据清洗的第三方软件和插件。业内曾有专家指出，大数据=海量数据+分析软件+挖掘过程，通过强大的各有千秋的分析软件来提供多样性的数据挖掘服务就是其盈利模式。国内已经有

《数据库原理》实验4

实验四：数据库综合查询一、实验目的 1.掌握SELECT语句的基本语法和查询条件表示方法； 2.掌握查询条件种类和表示方法； 3.掌握连接查询的表示及使用； 4.掌握嵌套查询的表示及使用； 5.了解集合查询的表示及使用。二、实验环境已安装SQL Server 2008 企业版的计算机；具有局域网环境,有固定IP; 三、实验学时 2学时四、实验要求 1.了解SELECT语句的基本语法格式和执行方法； 2.了解连接查询的表示及使用； 3.了解嵌套查询的表示及使用； 4.了解集合查询的表示及使用； 5.完成实验报告；五、实验内容及步骤以数据库原理实验2数据为基础，请使用T-SQL 语句实现进行以下操作： 1.查询以‘DB_’开头,且倒数第3个字符为‘s’的课程的详细情况； 2.查询名字中第2个字为‘阳’的学生姓名和学号及选修的课程号、课程名； 3.列出选修了‘数学’或者‘大学英语’的学生学号、姓名、所在院系、选修课程号及成绩； 4.查询缺少成绩的所有学生的详细情况； 5.查询与‘张力’(假设姓名唯一)年龄不同的所有学生的信息； 6.查询所选课程的平均成绩大于张力的平均成绩的学生学号、姓名及平均成绩； 7.按照?学号，姓名，所在院系，已修学分?的顺序列出学生学分的获得情况。其中已修学分为考试已经及格的课程学分之和； 8.列出只选修一门课程的学生的学号、姓名、院系及成绩； 9.查找选修了至少一门和张力选修课程一样的学生的学号、姓名及课程号； 10.只选修?数据库?和?数据结构?两门课程的学生的基本信息；

11.至少选修?数据库?或?数据结构?课程的学生的基本信息； 12.列出所有课程被选修的详细情况，包括课程号、课程名、学号、姓名及成绩； 13.查询只被一名学生选修的课程的课程号、课程名； 14.检索所学课程包含学生‘张向东’所学课程的学生学号、姓名； 15.使用嵌套查询列出选修了?数据结构?课程的学生学号和姓名； 16.使用嵌套查询查询其它系中年龄小于CS系的某个学生的学生姓名、年龄和院系； 17.使用ANY、ALL 查询，列出其他院系中比CS系所有学生年龄小的学生； 18.分别使用连接查询和嵌套查询，列出与‘张力’在一个院系的学生的信息； 19.使用集合查询列出CS系的学生以及性别为女的学生名单； 20.使用集合查询列出CS系的学生与年龄不大于19岁的学生的交集、差集； 21.使用集合查询列出选修课程1的学生集合与选修课程2的学生集合的交集； 22.思考题：按照课程名顺序显示各个学生选修的课程（如200515001 数据库数据结构数学）；六、出现问题及解决办法如：某些查询操作无法执行，如何解决？ 1、查询以‘DB_’开头，且倒数第三个字符为‘s’的课程的详细情况 select * from course where cname like 'DB\_%s__' 2、查询名字中第二个字为“阳”的学生姓名和学号及选修的课程号、课程名 select student.sno ,student.sname ,https://www.360docs.net/doc/4210379180.html,o,cname from student,course,sc where sname like '_阳%'and student.sno=sc.sno and https://www.360docs.net/doc/4210379180.html,o=https://www.360docs.net/doc/4210379180.html,o 3、列出选修了‘数学’或‘大学英语’的学生学号、姓名、 select student.sno,sname,sdept,https://www.360docs.net/doc/4210379180.html,o,cname,grade from student,sc,course where student.sno=sc.sno and https://www.360docs.net/doc/4210379180.html,o=https://www.360docs.net/doc/4210379180.html,o and sc.sno in(select sc.sno from sc,course where (cname='大学英语'or cname='数学')and https://www.360docs.net/doc/4210379180.html,o=https://www.360docs.net/doc/4210379180.html,o group by sc.sno) select student.sno,sname,sdept,cno,grade from student,sc where Cno in (select Cno from course where cname='数学'or cname='大学英语')and sc.sno=student.sno 4、查询缺少成绩的所有学生的详细情况； select * from student,sc where Grade is null and student.sno=sc.sno 5、查询与‘张力’(假设姓名唯一)年龄不同的所有学生的信息； select * from student where sage <>(select sage from student where sname='张力') 6、查询所选课程的平均成绩大于张力的平均成绩的学生学号、姓名及平均成绩 select student.sno,sname,平均成绩=A VG(grade) from student ,sc

数据库实验报告(一)

滨江学院题目数据库实验报告（一）学生姓名学号系部电子工程系专业通信工程指导教师林美华二Ｏ一三年十二月十八日

实验一数据库的定义实验本实验需要2学时。一、实验目的要求学生熟练掌握和使用SQL、SQL Server企业管理器创建数据库、表、索引和修改表结构，并学会使用SQL Server 查询分析器接收语句和进行结果分析。二、实验内容 1 创建数据库和查看数据库属性。 2 创建表、确定表的主码和约束条件。为主码建索引。 3 查看和修改表结构。 4 熟悉SQL Server企业管理器和查询分析器工具的使用方法。三、实验步骤 1 基本操作实验 (1) 使用企业管理器按教材中的内容建立图书读者数据库。（2）在企业管理器中查看图书读者数据库的属性，并进行修改，使之符合要求。（3）通过企业管理器，在建好的图书借阅数据库中建立图书、读者和借阅3个表，其结构为；图书（书号,类别,,作者,书名,定价,作者）. 读者(编号，,单位,性别,)．借阅(书号,读者编号,借阅日期) 要求为属性选择合适的数据类型，定义每个表的主码.是否允许空值和默认值等列级数据约束。（4）在企业管理器中建立图书、读者和借阅3个表的表级约束．每个表的主码约束．借阅表与图书表间、借阅表与读者表之间的外码约束，要求按语义先确定外码约束表达式．再通过操作予以实现．实现借阅表的书号和读者编号的惟一性约束：实现读者性别只能是“男”或“女”的Check(检查)约束。 2 提高操作实验 (一) 将教材中用SQL描述的建立学生--课程操作．在SQL Server企业管理器中实现。库中表结构为：学生（学号,,年龄,性别,所在系）．课程（课程号,课程名,先行课）．选课（学号,课程号,成绩）要求: 1)建库、建表和建立表间联系。， 2)选择合适的数据类型。 3)定义必要的索引、列级约束和表级约束．四、实验方法 l创建数据库（1）使用企业管理器创建数据库的步骤 1)从“开始”菜单中选择；“程序”“Microsoft SQL2000”“企业管理器”.

创建大数据项目的五大步骤

创建大数据项目的五大步骤企业需要积极的提升他们的数据管理能力。这并非意味着他们应该制定繁琐的流程和监督机制。明智的企业会配合他们的数据活动的生命周期制定灵活的流程和功能：根据业务需求启动更轻更严格、更强大的功能，并根据需求的增加来提升质量或精度。一些企业正在利用新兴技术来应对新的数据源，但大多数企业仍然面临着需要努力管理好他们已经掌握或者应当掌握的数据信息的困境，而当他们试图部署企业大数据功能时，发现自己还需要面对和处理新的以及当下实时的数据。为了能够实现持久成功的大数据项目，企业需要把重点放在如下五个主要领域。 1、确立明确的角色分工和职责范围。对于您企业环境中的所有的数据信息，您需要对于这些数据信息所涉及的关键利益相关者、决策者有一个清晰的了解和把控。当数据信息在企业的系统传输过程中及其整个生命周期中，角色分工将发生变化，而企业需要对这些变化有一个很好的理解。当企业开始部署大数据项目之后，务必要明确识别相关数据的关键利益相关者，并做好这些数据信息的完善和迭代工作。 2、加强企业的数据治理和数据管理功能。确保您企业的进程足够强大，能够满足和支持大数据用户和大数据技术的需求。进程可以是灵活的，并应充分考虑到业务部门和事务部门的需求，这些部门均伴有不同程度的严谨性和监督要求。确保您企业的参考信息架构已经更新到包括大数据。这样做会给未来的项目打好最好的

使用大数据技术和适当的信息管理能力的基础。确保您企业的元数据管理功能足够强大，能够包括并关联所有的基本元数据组件。随着时间的推移，进行有序的分类，满足业务规范。一旦您开始在您企业的生产部门推广您的解决方案时，您会希望他们长期持续的使用该解决方案，所以对架构功能的定义并监督其发挥的作用是至关重要的。确保您企业的治理流程包括IT控制的角色，以帮助企业的利益相关者们进行引导项目，以最佳地利用这些数据信息。其还应该包括您企业的安全和法务团队。根据我们的经验，使用现有的监督机制能够达到最佳的工作状态，只要企业实施了大数据应用，并专注于快速在进程中处理应用程序，而不是阻碍进程的通过。 3、了解环境中的数据的目的和要求的精度水平，并相应地调整您企业的期望值和流程。无论其是一个POC，或一个已经进入主流业务流程的项目，请务必确保您对于期望利用这些数据来执行什么任务，及其质量和精度处于何种级别有一个非常清晰的了解。这种方法将使得企业的项目能够寻找到正确的数据来源和利益相关者，以更好地评估这些数据信息的价值和影响，进而让您决定如何最好地管理这些数据信息。更高的质量和精度则要求更强大的数据管理和监督能力。随着您企业大数据项目的日趋成熟，考虑建立一套按照数据质量或精确度分类的办法，这将使得数据用户得以更好的了解他们所使用的是什么，并相应地调整自己的期望值。例如，您可以使用白色、蓝色或金色来分别代表原始数据、清理过的数据，经过验证可以有针对性的支持分析和使用的数据。有些企业甚至进一步完善了这一分类方法：将数据从1到5进行分类，其中1是原始数据，而5是便于理解，经过整理的、有组织的数据。 4、将对非结构化的内容的管理纳入到您企业的数据管理能力。非结构化数据一直是企业业务运营的一部分，但既然现在我们已经有了更好的技术来探索，分析和这些非结构化的内容，进而帮助改善业务流程和工业务洞察，所以我们最终将其