读徐子沛《大数据》有感

合集下载

徐子沛《大数据》读后感

徐子沛《大数据》读后感

徐子沛《大数据》读后感在还没接触《大数据》这本书之前,便已经听说过”数据便是财富“的说话。

可谓在当代,谁掌握了数据谁便掌握了世界。

当然,运用好这些数据是征服世界征服革命的关键。

在徐子沛这本书中,我赞赏摩斯这个人。

他提倡的《信息自由法》最终推动了世界的发展,对美国的影响尤为明显。

从一次次的《信息自由法》要求政府信息公开受挫的情况下,摩斯没有放弃而是一如既往的推行,一如既往的坚持。

最终,《信息自由法》进入了国民的生活中,进入了美国政府的府邸,进入了全世界的影响中。

如今,美国新一届的政府领导人奥巴马就提倡信息公开,旨在将政府的信息公开,让一切的信息运行在阳光下。

这样的信息公开共享能够促进各行各业清晰的找准他们切实需要的数据,有利于整个国民的经济发展。

当然,英特尔的创始人之一的摩尔的摩尔定律也影响了整个世界。

而目前计算机硬件的性能发展印证了摩尔定律。

信息化的发展,数据化的发展是挡不住的,世界也正被这些推着向前。

刚开始由美国布局在海洋上用于监测风浪并收集相应的海洋风浪信息的数据应用方式,随着科技的发展,数据的流通越来越快速有效。

期间通过传感器的布局以及数据的采集,更实现了各式各样数据的分类和归集。

通过这些数据的分析运用,将受益于各个不同的知识领域。

美国之所以称之为大国,其实真正意义上来说,美国掌握了大量的数据,大量有效的数据,尤其是美国的情报部门。

通过研究这些数据,美国再利用这把利刃霸权天下。

所以,我们要努力发展数据治国,数据治企的精神。

而我司的数据归集、效益分析、车辆监控等管理服务就是真正建立在数据上面的服务,真正通过这些数据的反馈来实现为客户谋发展的目的,最终取得精细化综合管理服务的层层突破,让客户真正的放心加入我们的团队。

公司的这一系列的产品,各个相互关联,并将数据汇聚在车智汇平台上,通过这个平台的管理和运用,不仅我司能了解和掌握客户的需求,客户也能通过该平台获取有利于其自身发展的信息数据,为其自身带来意想不到的潜在收益。

西埠小学魏桂霞读涂子沛的《大数据》有感

西埠小学魏桂霞读涂子沛的《大数据》有感

涂子沛的《大数据》读后的几点思考田庄镇西埠小学魏桂霞2014黄金季度里,有幸捧到了涂子沛著的《大数据》这本书进行拜读。

最让我眼睛发亮的一句话——除了上帝,任何人都必须用数据说话。

毋庸置疑,我们正处在一个真正的大数据时代,信息技术的挑战、无限商机的择临,这些既便利了而又危机了我们每个人的生活。

对于该书的思考有如下几点:《大数据》是一本视觉独特的书,他以数据为轴线,描绘了美国这个国家走过的开放创新历程。

大数据浪潮,已经席卷全球,与互联网的发明一样,这绝不仅仅是信息技术领域的革命,更是在全球范围内启动的透明政府、加速企业创新、引领社会变革的利器。

现代管理学之父德鲁克有言:预测未来是最好的方法,就是创造未来。

而大数据战略是当今领航全球的最佳先机。

《大数据》这本书的第四章——商务智能的前世今生,描述了商务智能的起源、结蛹、蚕动、破蚕、化蝶,分别阐述了从数据到知识的挑战和跨越、数据仓库的厚积薄发、联机分析的惊艳、数据挖掘中智能生命的产生、数据可视化的华丽上演。

数据挖掘,数据仓库、联机分析技术的发展和成熟,为商务智能奠定了框架,但真正给商务智能赋予“智能”生命的是它的下一个产业链:数据挖掘。

一开始,数据挖掘曾一度被称为“基于数据库的知识发现”。

随着数据仓库的产生,“数据挖掘”的叫法开始被广泛接受。

也正是因为有了数据仓库的依托,数据挖掘如虎添翼,在实业界不断创造点“数”成金的故事。

其中,最为经典的例子当属啤酒和尿布。

1989年,高德纳咨询公司的德斯纳在商业为“商务智能”给出了一个正式的定义:“商务智能,指的是一系列以事实为支持、辅助商业决策的技术和方法。

”数据挖掘是指通过分析大量的数据来揭示数据之间隐藏的关系、模式和趋势,从而为决策者提供新的知识。

之所以称之为“挖掘”,是比喻在海量数据中寻找知识,就象从沙里淘金一样困难。

这种点“数”成金的能力,是商务智能真正的“灵魂”和魅力所在。

如果说联机分析是对数据的一种透视性的探测,数据挖掘则是对数据进行挖山凿矿式的开采。

大数据时代读后感

大数据时代读后感

大数据时代读后感篇一:[大数据时代读后感]《大数据时代》读后感我们生活在一个“概念”纷飞的年代,先前只有IBM熟谙的招数,如今已经“飞入平常百姓家”。

“移动互联网”、“云计算”的概念刚刚消停,业界的专家又送来了“大数据”的概念,一时间似乎人人都变成了“大数据”专家,见面要是不提“大数据”都不好意思跟人打招呼!玩笑归我们生活在一个“概念”纷飞的年代,先前只有IBM熟谙的招数,如今已经“飞入平常百姓家”。

“移动互联网”、“云计算”的概念刚刚消停,业界的专家又送来了“大数据”的概念,一时间似乎人人都变成了“大数据”专家,见面要是不提“大数据”都不好意思跟人打招呼!玩笑归玩笑,当我们的存储能力、计算能力和网络带宽变得充裕之后,我们先前对待数据,尤其是原始数据的态度和思维方式,将面临着很大的改变!其实,作者的主要观点,已经在翻译者的译者序中进行了总结:“大数据时代处理数据理念上的三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果”。

如作者所言,“采样分析是信息缺乏时代和信息流通受限制的模拟数据时代的产物”。

如果可以,我们当然会使用“全体数据”而不是“抽样数据”。

读到这里,我估计大学里正在绞尽脑汁设计样本抽样方法的学生、教授们,连哭的心都有!数据分析的及时性,在很多情况下比精确性更加重要,尤其是在商业领域。

想想看,如果需要两周时间才能计算出明天某个航班的满座率,那还有什么意义?大数据计算技术,适用的不是像卫星发射、开具银行账户这样的工作,而是不要求极端精确的情况,其核心是“预测趋势”,况且原始数据也可能出现差错。

过往千年,探究因果关系几乎是所有科学研究的原动力。

甚至,这已经通过语言,融入我们的思维方式和哲学思想:“因为……所以……”,凡事都要问“为什么”。

但是,在大数据的范畴里,关注的却是相关性,而不是因果关系,或者其次才是因果关系。

超市只用关心把啤酒和尿不湿放在一起,会帮助提高销售额,而不用关心其中的奥秘。

大数据读后感

大数据读后感

读《大数据》有感(赵元)最近闲暇之余我读了徐子沛先生的《大数据》一书,真是让我受益匪浅。

《大数据》又叫做《大数据:正在到来的数据革命》。

全书通过讲述美国在过去的半个世纪里所发生的关于信息、技术方面的典型案例,来为读者剖析出一个浅显易懂的“大数据”。

《大数据》一书,之所以珍贵、便于阅读,在于徐子沛先生在写作过程之中,将原本高、精、尖的数据专业的专业术语,转而用浅显易懂的话语来表现,使得本书成为了一本平易近人的科普读物。

使得阅读此书的读者无论年龄、专业、学识,都能最大限度的接触到书中所阐释的基本知识。

而我作为一个农行从业四年的员工,当然也有属于我自己的一些感想:《大数据》一书之中,所提出的一个关键性的问题就是为什么在近几年出现了“大数据”这一词语?作者举出了美国在2009年的相关数据,我从中发现了对该问题给出的一些答案。

书中举例,麦肯锡《大数据:下一代创新,竞争和生产率的前沿》报告中进行估算,政府848PB,传媒行业715PB,离散制造业966PB。

正是针对相关数据指标的增长,以及当前以全球化为背景的数据信息开放化,各类信息的自由化等原因,导致了面对数据的分析,以及数据的处理,数据的预测和数据的决策都有了更高的要求。

这些要求导致我们在针对经济全球化,交流多元扩大化,各个专业管理与发展的精细化必须有一个相对宏观的经济分析头脑。

书中使我感触最深的是,针对美国目前发展中的大事件以及现象,例如,美国矿难的悲情历史,街头警察的创新创奇,美国最热的交友信息平台FACEBOOK与推特,以及美国纠结百年的统一身份证的问题等,都一一分析了其背后所蕴含的经济学、金融学道理,以及这些时间的背后数据对于美国政府,公民以及社会的种种挑战。

书中针对美国半个世纪的发展历程,逐一的分析其内涵,并将美国的发展与进步的基本原因归结为开放和创新。

正是因为在这个时代美国强调对于互联网的最大利用化,才有了即使面对压力和强大的经济困难还在稳步前进的现代美国。

大数据读后感

大数据读后感

大数据读后感《大数据》强调今天是一个大量数据公开于大众的时代。

自从资讯革命以来,资讯工具、硬件、软件,平行发展、与时俱进。

第一文档网今天为大家精心准备了《大数据》读后感,希望对大家有所帮助!《大数据》读后感按:相对而言,在极权的国家,他们手上拥有足够的资讯,足以利用这资讯,掌握每一个人的日常生活;“老大哥”的影子,可以无所不在。

大数据:为华文世界提出一个重要话题许倬云涂子沛先生的新著《大数据》,已经完成,是一部300多页的大作。

最近他将这本书的打样稿送来给我看,并且要求我作序文。

可惜的是,我将要远行,而他索序甚急,我只能在浏览一遍之后,发抒自己一些感想。

至于细细咀嚼和消化这本有趣作品的内容,必须要在一两个月以后,也就赶不上涂先生大作的出版时间。

我事先声明,这些只是我浏览他大作以后的一些感想,非常立即的直觉,也一时谈不上深刻的见解。

这本书的内容,强调今天是一个大量数据公开于大众的时代。

自从资讯革命以来,资讯工具、硬件、软件,平行发展、与时俱进。

数据在我们生活之中,日常接触,已是处处可见的现象。

收集数据,当然是靠电脑的快速分类和记录,然而更重要的是搜索引擎的进步,与网络之间网际的交流。

到今天,一个一个网,不但可以串连在一起,互相沟通,而且“云端”(云计算)的设计,可以将每一个地区个别数据,储成一个大的数据库,有助于我们更迅速广泛地搜索。

这些现象,20世纪最后四分之一以来,已经呈现加速度发展的新事物,在21世纪进展速度之快,更是铺天盖地、无所不在。

涂先生在这本书里强调:不仅数据经过管理而大量地存在,而且,在现代的国家,尤其是民主社会,开放的社会与政府之间,经由数据,彼此一目了然、无所隐瞒。

一个自由的社会,掌握公权力的政府,跟任何其他政府一样,有压倒社会的庞大力量,因为他们手上掌握了人生需要的许多数据。

不过,这些数据,在自由的社会,公民也可以一样取得,使政府所作所为,可以摊开在天地之间,让我们检验。

过去封建专制和集权各种政体,其执政者能压迫老百姓,而老百姓没有办法回制公权力的压迫。

涂子沛《大数据》读后感

涂子沛《大数据》读后感

涂子沛《大数据》读后感博山区双语学校翟俊杰用了几个月的时间《大数据》一书总算是慢慢地看完了。

拿到这本书,真的是一无所知,硬着头皮去读的,为了完成任务去读,可是阅读越觉得,这是一本有趣的书籍,通过政治、经济的博弈对数据进行了生动的描述。

简单总结一下:1. 政府要尽最大能力公开各项数据,如环保、天气、收支等,这些是影响民生、民主及社会效益的数据,而且可以让第三方或相关人员来利用,让全社会都能受益;2. 要制定相关的技术标准、技术规范来规范公开的数据,由于数据种类非常多,相关的标准和规范就特别重要,当然,最常见的是使用CSV来公开数据;3. 公开数据需要有标准,最小信息量是什么,哪些数据最少要提供哪些字段才能让公众或相关人员了解到真实的意义,这些标准和接口同时也能在各个部门和团体之间形成标准接口,降低数据使用的成本;4. 保证数据是原始格式的,能让大众了解到最原始的信息,抽象和汇总后的数据可以提供,但最原始的才能反映事实;5. 数据的使用:由于政府本身是服务机构和替大众服务,因此大部分数据的公开是有必要的,这是监督和民主需要的;6. 针对某些数据,如电厂、水厂、核电站等涉及公众安全的数据,可需要定向公开或是特殊处理,以防止恐怖主义的发生;美国有句谚语叫“除了上帝,任何人都必须用数据来说话”。

毫无疑问,我们正处在一个真正的大数据时代:数据作为新一轮信息战的主角,将创造无限商机,既便利又触及着每个人的生活。

《大数据》是一本视角独特的书,它以数据为轴线,描绘了美国走过的开放创新历程。

何为大数据?简单理解就是超大量的数据。

全书以别开生面的经典案例——奥巴马建设“前所未有的开放政府”的雄心、全民医改法案的波澜、统一身份证的百年纠结、街头警察的创新传奇、美国矿难的悲情历史,以及商务智能的前世今生、数据开放运动的全球兴起等等,为我们一一细解数据创新给公民、政府、社会带来的种种挑战和变革。

有意思的是,美国政治的发展,公民权利的实现,以及各种自由与福利的保障,都和对数据的创造性应用密切相关,大数据开放的商机在哪里?作者写到,以前小数据时代,可以研究个体但不能研究群体,因为只有关于个人的数据。

涂子沛大数据的读后感

涂子沛大数据的读后感《涂子沛大数据》是由涂子沛撰写的一本探讨大数据背后知识的著作。

这本书以通俗易懂的语言,深入浅出地介绍了大数据的概念、原理、应用及其对社会的影响。

通过阅读《涂子沛大数据》,我对大数据有了更全面的了解,并且对大数据的未来发展充满了期待和憧憬。

在书中,涂子沛首先从什么是大数据开始讲解,他指出大数据不仅是指数量庞大的数据,更是一种分析和利用这些数据的方法。

他通过生动形象的例子,比如高速公路上的车流量、电商平台的交易数据等,让我们能够直观地理解什么是大数据,以及大数据为我们带来的巨大价值。

随后,涂子沛详细介绍了大数据分析的原理和方法。

他提到了数据挖掘、机器学习、人工智能等技术,这些技术不仅能够帮助我们从大数据中发现有价值的信息,还能够预测未来的趋势和规律。

我特别对机器学习和人工智能这两个技术产生了浓厚的兴趣,我想进一步学习和研究这些领域的知识。

书中还提到了大数据在各个领域的应用。

比如在商业领域,大数据可以帮助企业了解消费者需求,优化产品和服务;在医疗领域,大数据可以帮助医生提高诊断和治疗的准确性;在城市管理领域,大数据可以帮助政府更好地规划城市发展。

这些应用让我看到了大数据对社会发展的巨大潜力,也让我对大数据的前景充满了信心。

此外,涂子沛还对大数据对社会的影响进行了深入的探讨。

他指出,大数据不仅可以创造价值,还会带来一些风险和挑战。

比如个人隐私问题、数据安全问题等。

他呼吁大家要在享受大数据带来便利的同时,也要关注这些问题,并采取合适的措施来解决。

对此,我完全赞同,我认为社会应该在大数据的发展过程中,积极探索解决方案,保护个人隐私和数据安全。

通过阅读《涂子沛大数据》,我对大数据有了更加深入的了解。

我认识到大数据不仅仅是一种技术,更是一种思维方式。

大数据不仅可以改变商业模式,也可以改变社会运行方式。

我对大数据的未来发展充满了期待和憧憬,我相信大数据会为我们带来更多的机遇和挑战。

因此,我决定进一步学习和研究大数据相关的知识,争取在未来能够做出自己的贡献。

《大数据》读后感读后感

《大数据》读后感读后感现代社会是一个技术奔腾、信息爆炸的社会,大数据这个新概念一出现就受到了人们极大的热捧。

每天都身处网络的信息海洋中,常常会有被数据、信息“淹没”的窒息感和无力感。

涂子沛的《大数据》一书,通过讲述美国半个多世纪信息开放、技术创新的历史,以别开生面的经典案例——奥巴马建设“前所未有的开放政府”的雄心、公共财政透明的曲折、背后的隐情、全民医改法案的波澜、统一身份证的百年纠结、街头警察的创新传奇、美国矿难的悲情历史、商务智能的前世今生、数据开放运动的全球兴起,以及云计算、Facebook和推特等社交媒体、先生想在A地购置房产(普通住房),若是首次购房,那么根据税法规定,该项经济活动买方将涉及契税优惠,但是必须要求M先生提供房产局出示的家庭唯一住房证明。

漏洞便出现了:假设M先生已经在B地事先拥有一套房产,而M先生身份证件登记在A地,那么M先生便有了在A地成功领取家庭唯一住房证明的可能(前提是A、B两地房产部门信息无法共享)。

这样,“聪明”的M先生在已拥有一套房产的前提下,再次在异地购房仍可享受契税优惠。

这将直接导致税款的流失和税赋的不公平,不利于我国税收征管工作,不利于“两度”的提升。

堵住这一漏洞的前提条件只有一个房产部门全国信息联网。

然而,现实并非如此。

举例二:我国正大力兴起的“全民医保”在大数据时代同样不尽如人意。

医保卡无法在全国通用,甚至无法在本省内、本市(州)内通用,仍然存在指定医院刷卡。

这直接给一些出差在外的居民,亦或是离指定刷卡医院较远的居民带来不便。

四、__面临发展的机遇与挑战。

问题与机遇并存。

__在大数据时代中正面临着巨大的挑战和重大的机遇。

问题的存在和挑战的并行必然构成我们在这个时代迎头追赶的机遇:第一、体制条件。

我国是社会主义国家,我国采取的是民族集中制。

也就是说,在绝大多数公民认可的良法在立法过程中不会出现像美国那样的利益集团间的博弈,或是“掺沙子”。

亦即,被广泛民众认可的良法在我国立法过程中受到的阻碍相对较小。

《大数据》读后感_读后感_模板

《大数据》读后感_读后感_模板《大数据》读后感现代社会是一个技术奔腾、信息爆炸的社会,大数据这个新概念一出现就受到了人们极大的热捧。

每天都身处网络的信息海洋中,常常会有被数据、信息“淹没”的窒息感和无力感。

涂子沛的《大数据》一书,通过讲述美国半个多世纪信息开放、技术创新的历史,以别开生面的经典案例——奥巴马建设“前所未有的开放政府”的雄心、公共财政透明的曲折、背后的隐情、全民医改法案的波澜、统一身份证的百年纠结、街头警察的创新传奇、美国矿难的悲情历史、商务智能的前世今生、数据开放运动的全球兴起,以及云计算、Facebook和推特等社交媒体、Web3.0与下一代互联网的未来图景等等,详细诠释了数据技术变革与权力合法性、执政正义以及公民社会之间的关系。

全面阐述了信息时代数据的重要性,如何加强数据的收集、分析和使用以及通过数据开放改进政府治理等问题。

这本书给了我一个全新的阅读主题,让我感受到了作为一名教师必须拥有但却正是我们目前缺乏的两种态度。

目前,人类已进入信息社会。

人类文明已处于信息时代,人们在因特网上传和下载数据,传统的台式电脑上网更新成了移动终端浏览和传播信息。

QQ、微信等通讯软件已然实现手机版,人人、微博、脸谱能够分享即刻心情,电讯服务商正大张旗鼓地争夺客户资源,网络通讯商也大力渲染云服务和大数据时代。

不管你愿不愿意,我们已经处在大数据时代。

如何在新的时代争取话语权,如何在新的时代维护自身权益,如何在新的时代实现利益最大化,必将成为这个时代中每个国家,甚至每个公民应当思考并付诸实践的重大问题。

一、从美国的发展看美国发展的不足。

美国,世界最大的发达国家,借助其自身的优势,已然处于信息时代的领头羊位置。

到底是什么原因使得这个建国才两百多年的年轻国家具备如此强大的实力和创新的活力呢?他们具备什么优势?他们成功的秘诀是什么?结合书中分析和历史实践不难得出:适合自身的体制制度、法律、科技、人才、监督是这个年轻国家领跑世界的关键因素。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

读徐子沛《大数据》有感
如果要问当今什么技术最为火热,我想毫无疑问大数据必然是热门答案之一。
那么什么是大数据呢?
大数据(bigdata),指无法在一定时间范围内用常规软件工具进行捕捉、
管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力
和流程优化能力来适应海量、高增长率和多样化的信息资产。(摘自百度百科)
大数据之所以产生,是因为今天无处不在的传感器和微处理器。我们正在迈
进普适计算的时代。
数据正在里指数级增长。之所以增长速度如此之快,背后有许多原因。现在
几乎所有数据的产生形式,都是数字化的。各种传感器的剧增,高清晰度的图像
和视频,都是数据爆炸的原因。如何处理这样海量的数据,并且从其中挖掘出有
价值的内容是摆在科技公司和政府面前的一道难题。
任何一个组织,要抓住大数据的机遇,就必须做好几个方面的工作。从技术
角度来看,首先要收集并且开发特定的工具,来管理大规模并行服务器产生的结
构化和非结构化数据,这些数据,可能是自己专有的,也可能来源于"云"。其次,
每一个组织都需要选定分析软件,用它来挖掘数据的意义。但可能最重要的是,
任何组织都需要人才来管理和分析大数据。这些人被称为"数据科学家他们集黑
客和定量分析员的优势和特长于一身,非常短缺。聪明的领导人,将想方设法留
住这类人才。与此同时大量的基础设施建设一样重要,且不提大数据的处理需要
大量高性能的计算机,光是储存这些数据就需要极为大量的存储设备,所以基建
也是极为重要的一个环节。
在徐子沛老师的《大数据》一书中从美国政府的角度作为切入点,通过一系
列实例深入分析了大数据的政府运作、实践成果。
书中首先提到了奥巴马政府倡导信息公开透明,在上任之初便大力推行信息
的公开化和透明化。信息之与民主,就如货币之于经济。受美国国家文化影响,
美国人民对于信息的知情权的重视程度几近对于枪支自由的执着。
在2010年的<<规划数字化的未来:美国总统科学技术顾问委员会给总统和
国会的报告》中提到:如何收集、管理和分析数据正在日渐成为我们网络信息技
术研究的重中之重。以机器学习,数据挖掘为基础的高级数据分析技术,将促进
从数据到知识的转化、从知识到行动的跨越。联邦政府的每一个机构和部门,都
需要制定一个应对"大数据"(BigData)的战略。
对于具体如何处理数据方面而言,必然离不开两个方面,一个是数据本身,
另一个则是处理这些纷杂数据的程序。程序和数据的关系,就好像发动机和燃料,
所有的程序,都是靠数据驱动的;数据之于程序,又好比血液之于人体,一旦血
液停止流动,人就失去了生命,代码也将停止运行。数据的生命力,甚至比程序
更持久。程序可以不停地升级、换代甚至退出使用,但保存数据的数据库却会继
续存在,其价值很可能与日俱增、历久弥新。
书中提到一个非常有意思的例子:劳工统计局在1997年开展的青少年纵向
调查。它眼踪调查的对象虽然是青少年本身,但受访人、问卷人却可以是家长、
老师、雇主等等和该青少年密切相关的个人和群体,每次问卷都有数十个问题,
需要受访人1小时左右才能完成。因为付出了时间,受访人在完成问卷之后,
能获得8到20美元不等的报酬。同样的问题,也可能在不同的年份、在相同
受访人员的问卷中重复出现,以测试受访人态度的变化。
随着数据的积累,一幅以个人成长为中心、越来越大的社会画卷也开始展开。
这种以一个国家为单位的大型社会调查,是研究一个社会长期变迁不可或缺的重
要资源,也为政策的制定、调整和评价提供了重要的参考和依据。
这些原始的数据积累,不但在时间的横向上具有相当高的参考价值,在个人
为背景的纵向上也可以一定程度上展示社会的经济,教育等方面的长期变迁。通
过不同的数据组合对比可以得出多样化,多层次,多角度的综合结论,这对于政
府在政策制定和规划上有着极为重要的促进作用。
仅仅在2000年的时候,全世界全部的存储信息中还只有1/4是数字化的,
其余的都保存在纸张、胶片和其他模拟介质上。但是由于数字数据数量的增长十
分迅速——几乎每三年就翻一番,这种情形很快发生了逆转。今天,在所有存储
信息中只有不到2%是非数字化的。
可以用数据爆炸来形容目前的数据增长情况。数据爆炸体现在三个方面:一
是同一类型的数据量在快速增大;二是数据增长的速度在加快;三是数据的多样
性,即新的数据来源和新的数据种类在不断增加。
对于爆炸的数据急需国家层面出台相关政策引导发展已经成为共识。大数据
已经成为国家和政府层面的发展战略,通过大数据的交换、整合、分析和使用,
人类可以发现新的知识和规律,创造新的价值和内容,带来“大知识”、“大科技”、
“大利润”和“大发展”。
爱德华·戴明是享有世界声誉的美国统计学家、管理学家,也是质量管理理
论的奠基人。曾为日本的经济崛起立下了丰功伟绩。他有一句名言说:"我们信靠
上帝。除了上帝,任何人都必须用数据来说话。"随着大数据时代的不断深入,
各个政府部门都在尝试"用数据来决策"、"用数据来管理"、"用数据来创新”。
最直接的成果是:通过数据的分析、收集以及发布,美国建立起了一套高效
的交通安全系统,最直接的结果就是:从1966年美国仅有1.01亿注册驾驶员、
0.94亿机动车辆到2009年,驾驶员上升到2.1亿,机动车量增加到2.46亿,
人口和车辆的数量、密度都成倍增长,车辆的使用频率也大幅增加,但交通事故
的死亡人数却不升反降,而且幅度显著:由5万多人下降到3万多人。
与此同时,大数据的应用,不仅仅是在交通方面大展拳脚,在数据打假,医
疗统计,治安管理,商务智能,数据仓库上也颇有效果。以数据仓库为例,数据
仓库是商务智能的依托,是对海量数据进行分析的核心物理构架。它可以形象地
理解为一种格式一致的多源数据存储中心,数据源可以来自多个不同的系统,如
企业内部的财务系统、客户管理系统、人力资源系统,甚至是企业外部的系统;
这些系统,即使运行的平台不同、编制的语言不同、所处的物理位置不同,但其
数据可以按统一定义的格式被提取出来,再通过清洗、转换、集成,最后百流归
海,加载进入数据仓库。使用数据仓库对于企业、政府来说每年节省的经费都是
上千万、上亿级别的。
然而,虽然大数据的广泛研究与应用有着无可比拟的优势,但是一个硬币必
然有两面。相信、使用数据已经成为联邦政府(美国)的共识,在一些法则和制
度之下,美国将这些数据行之有效地利用起来。然而所有事情必然有其两面性,
数据被广泛利用所带来的负面影响:《数据质量法》被不法分子滥用,被商业公
司用作保障利益的工具。
同样的问题也体现在个人隐私问题上。911事件发生前,美国民众对政府侵
犯隐私极为敏感,一战之后政府曾多次提出制定公民身份识别系统,除一战爆发、
珍珠港事件爆发后的短期内,民众予以支持外,其他时间均受到民众极力地反对,
仅通过了战时对个别族裔、外国人身份的监管方案。然而在911事件发生后,布
什政府于2001年9月24日向国会提交《爱国者法案》,该法案要求限制公众获
取政府信息的广度,提高政府控制、检查个人信息的范围。该法案的通过使得警
察、情报机关有权在未经法院许可的情况下窃听公民电话、检查公民电子邮件、
财务信息甚至图书馆借阅纪录。2002年11月,《2002国土安全法》通过,该法
案中重新提出了中央数据银行计划——万维信息触角计划,为执行该法案,首期
拨款2亿美元,并设立了专门的机构负责实施。此后该系统常被滥用于非反恐事
项,累计90余名警察因此被捕。2003年2月23日,国会对年度拨款进行投票,
一名参议院要求国防部、国家安全局、司法部对该项目进行调查并提交联合调查
报告,否则终止对该项目的拨款。期间美国公民自由联盟ACLU公布独立调查报
告称:911的发生,并非政府缺乏信息,而是政府部门间信息沟通不畅,对情报
的分析能力不强。2003年8月,国会通过新法案,终止该项目的开发,还规定
没有国会授权,不得对美国公民的数据进行挖掘,只能使用外国人的数据和信息。
在中央数据银行的问题上分为鲜明的两派,一派支持对建立中央数据银行,认为
统一管理数据不仅能节省运营成本、提高数据的准确性和查询的效率,还将更好
地保障数据安全;二另一派则强烈反对数据银行,正如《纽约时报》著名记者者、
隐私权专家帕卡德(VancePackard)的文章《不能告诉计算机)),他写道:“当
政府把我们每一个人的信息和日常生活的细节都装进一个中央级的数据银行,我
们将受控于坐在电脑机器前面的那个人和他的按钮。这令人不安,这是一种危
险。”
互联网重塑了人类交流的方式。大数据则不同:它标志着社会处理信息方式
的变化。随着时间的推移,大数据可能会改变我们思考世界的方式。随着我们利
用越来越多的数据来理解事情和作出决定,我们很可能会发现生活的许多层面是
随机的、而不是确定的。

相关文档
最新文档