大数据发展的三大问题

合集下载

提高统计数据质量需解决三大“瓶颈”问题大数据瓶颈

提高统计数据质量需解决三大“瓶颈”问题大数据瓶颈

提高统计数据质量需解决三大“瓶颈”问题:大数据瓶颈统计数据质量是统计工作的生命。

为搞准统计数据,各级统计部门和广大统计工作者付出了艰辛的努力,并取得了很大成绩。

为使统计数据更加客观、准确和权威,有必要对影响统计数据质量的各种原因进行认真深入分析^p ,不断更新观念,改革统计调查方法和手段,使统计的功能得到更好的发挥。

影响统计数据质量的原因很多,站在基层政府统计部门的角度看,重点必须解决三大“瓶颈”问题。

一、解决非公有制经济的数据质量问题非公有制经济的规模越来越大,在经济总量中所占的比例愈来愈高,部分行业非公经济已占垄断地位。

非公经济发展迅猛,但统计基础却相对薄弱。

从20__年第一次全国经济普查的过程和结果看,非公经济的统计难度最大。

在非公经济中尤其以私营、个体经营户的数据情况最难把握。

究其原因,一是私营业主和个体经营者的法律意识不强,没有意识到瞒报、拒报统计数据是违法行为。

这与统计部门平时宣传贯彻《统计法》的力度不够有关系,同时也与我国没有真正成为一个法治社会的现实状况有关系。

二是业主顾虑多。

作为私营、个体经营户普遍不愿意暴露自己的家底,怕露富,怕多征税,怕惹麻烦,顾虑很多,瞒报甚至拒报统计数据的现象十分严重。

三是客观条件的制约。

绝大多数个体经营户规模小、人数少,属于夫妻店、家庭作坊的居多,在财务上没有正式的账目体系和专职负责人,资金在不断周转,业主对总收入、总支出等指标确实难说清楚。

要解决非公经济统计数据的质量问题,需要采取多种措施。

除大力宣传贯彻《统计法》,让广大人民群众明确如实申报统计数据是每一个公民应尽的义务这一法律常识以外,还必须改革和完善现有的统计方法制度。

如在非公经济中部分地推行统计代理制就是一个切实可行的办法。

统计代理制就是政府统计部门委托具有统计代理从业资格的人员或中介机构对统计对象的统计工作进行全面代理的制度。

这项工作在我国部分地方已经开展并取得良好效果。

此外,对抽样调查的样本要进行长期深入监测,全面了解与分析^p 其业务经营情况,及时修正样本数据,真正让抽样调查的科学性得到发挥。

大数据与文化变革试题及答案

大数据与文化变革试题及答案

大数据与文化变革试题及答案集团标准化工作小组 [Q8QX9QT-X8QQB8Q8-NQ8QJ8-M8QMN]1.单选题(本题总分分,本大题包括25小题,每题2分,总计分)1.(本题分值:2)本讲中提到,到目前为止,美国政府已开放了()万个数据集,超过40个州及地方政府建立了独立的数据门户开放网站。

标准答案:D用户答案: A本题得分:02.(本题分值:2)属于主动公开范围的政府信息,应当自该政府信息形成或者变更之日起()工作日内予以公开。

标准答案:A用户答案: A本题得分:23.(本题分值:2)《开放数据宪章》原则中最重要的一条是()。

A.注重质量和数量B.让所有人可用C.为改善治理发布数据D.开放数据为默认标准答案:D用户答案: A本题得分:04.(本题分值:2)《中华人民共和国政府信息公开条例》各级人民政府应当建立健全政府信息公开工作考核制度、社会评议制度和()。

A.责任追究制度B.信息公开制度C.工作监督制度D.个人负责制度标准答案:A用户答案: A本题得分:25.(本题分值:2)截至2014年底,()个国家加入了G8。

标准答案:C用户答案: A本题得分:06.(本题分值:2)2011年9月,在()市8个国家发起了开放数据联盟A.里约热内卢B.伦敦C.纽约D.巴黎标准答案:C用户答案: A本题得分:07.(本题分值:2)()年6月,八国签署了《开放数据宪章》。

标准答案:B用户答案: A本题得分:08.(本题分值:2)美国总统奥巴马签署了《开放透明政府备忘录》后,美国政府首批开放了()个数据集。

标准答案:B用户答案: A本题得分:09.(本题分值:2)行政机关不能当场答复的,应当自收到申请之日起()工作日内予以答复。

标准答案:C用户答案: A本题得分:010.(本题分值:2)摩尔定律是()先生提出来的。

A.黛米摩尔B.戈登摩尔C.弗兰格摩尔D.张摩尔标准答案:B用户答案: A本题得分:011.(本题分值:2)摩尔定律揭示:当价格不变时,集成电路上可容纳的晶体管数目,约每隔()便会增加一倍。

中国数据要素市场发展现状与问题研究综述

中国数据要素市场发展现状与问题研究综述

中国数据要素市场发展现状与问题研究综述作者:刘子妮刘雪婷张若愚臧翌希全祎王塽来源:《中国市场》2024年第13期摘要:数字经济时代背景下,构建成熟的数据要素市场成为各行业关注的热点话题。

文章基于大量的文献分析,对国内数据要素市场的发展现状进行了总结,系统梳理了国内外学者对数据要素市场中数据信息安全、數据确权、数据定价三大问题及其对策的研究,并在此基础上指出了现阶段研究的不足之处。

关键词:数据要素市场;数据安全;数据确权;数据定价中图分类号:F49文献标识码:A文章编号:1005-6432(2024)13-0021-04DOI:10.13939/ki.zgsc.2024.13.0021引言在第四次工业革命的背景下,数字经济已成为我国经济增长的核心动力,数据资源作为一种重要的生产要素,受到了政府和企业的高度重视。

2022年1月,在《“十四五”数字经济发展规划》中提出,到2025年,要初步建立数据要素市场体系。

但国内数据要素市场存在理论滞后于实践的现象,相关法律法规以及监管制度尚未成体系,数据要素市场的发展受到诸多限制。

2020年后知网中检索到的数据要素市场相关文献数量明显增加,学者就数据要素市场的发展现状、建设中存在的问题以及对策进行了大量研究。

但是,尚未有学者对国内数据要素市场发展的相关文献进行梳理和系统的分析。

文章基于对相关领域文献的整理,对国内数据要素市场发展状况进行总结,并对数据隐私安全、数据确权和数据定价三大问题进行评述,分类归纳相应对策,最后基于现阶段研究的不足对该领域未来的研究进行展望。

2数据要素市场的发展现状2.1数据要素市场的内涵《中华人民共和国数据安全法》中,将数据定义为任何以电子或者其他方式对信息的记录[1]。

“要素”是一个经济学概念,代表生产经营中所需要的资料,传统的生产要素包括资本、劳动、技术。

数据要素作为一种新型的生产要素,具有非竞争性、融合性、衍生性和外部性的经济特征[2]。

请简要说明大数据的发展趋势及存在的问题

请简要说明大数据的发展趋势及存在的问题

大数据的发展趋势及存在的问题一、大数据的发展趋势1. 大数据的定义和特点大数据指的是规模巨大、类型繁多的信息资源,这些信息资源可以来自于各种来源,包括但不限于社交媒体、传感器、移动设备和互联网。

大数据具有三大特点,即“3V”:数据量大(Volume)、数据类型多样(Variety)、数据处理速度快(Velocity)。

2. 发展趋势随着互联网、移动互联网、物联网和人工智能等技术的快速发展,大数据的应用场景也变得越来越广泛。

在商业领域,大数据被广泛应用于市场营销、风险管理、客户服务和产品创新等方面。

在政府领域,大数据被用于城市管理、健康管理、环境保护等方面。

在科研领域,大数据被用于天文学、气象学、地质学等方面。

可以预见,未来大数据的应用场景将会更加多样化和深入化。

3. 技术发展趋势随着人工智能、云计算和物联网等技术的快速发展,大数据技术也在不断进化。

未来,大数据技术将更加智能化、自动化和实时化。

大数据评台也将更加开放和标准化,使得大数据应用的门槛降低,更多的行业和企业可以受益于大数据技术。

二、大数据存在的问题1. 数据安全和隐私保护随着大数据的广泛应用,数据安全和隐私保护问题日益突出。

大数据的采集、存储、传输和处理过程中存在着数据泄露、数据篡改和数据滥用等风险。

个人隐私数据被滥用的现象也时有发生,造成了社会不良影响。

如何加强大数据的安全性和隐私保护是当前急需解决的问题。

2. 数据质量问题在大数据时代,数据质量直接影响着数据分析的结果和决策的准确性。

然而,由于大数据的复杂性和多样性,数据质量问题也日益严重。

数据来源的不确定性、数据重复和数据冗余等现象都会影响数据的质量,进而影响数据分析的准确性。

如何提高大数据的质量也是当前亟待解决的问题。

3. 治理和规范问题在大数据时代,数据的规模和复杂性使得数据治理和规范变得异常困难。

大数据的采集、存储、处理和分析需要有一套科学的规范和治理机制来进行指导和监管。

然而,目前的大数据治理和规范工作还存在一定的滞后性,如何更加科学地进行大数据治理和规范也是当前需要解决的问题。

大数据运营分析___大数据市场

大数据运营分析___大数据市场

大数据运营分析___大数据市场大数据运营分析——大数据市场在当今数字化的时代,大数据已经成为了企业和社会发展的重要驱动力。

大数据运营分析作为挖掘和利用大数据价值的关键手段,对于洞察市场趋势、优化业务流程、提升决策效率等方面具有不可忽视的作用。

而大数据市场作为大数据运营分析的支撑和基础,其发展态势和特点也备受关注。

大数据市场的规模正在以惊人的速度增长。

随着企业数字化转型的加速,越来越多的组织意识到数据的重要性,并愿意投入大量资源来收集、存储和分析数据。

据相关研究报告显示,全球大数据市场规模预计将在未来几年内持续保持两位数的增长率。

这种增长不仅体现在数据量的增加上,还包括数据处理技术的不断创新和应用场景的不断拓展。

从市场结构来看,大数据市场可以分为硬件、软件和服务三大领域。

硬件方面,包括服务器、存储设备等基础设施的需求持续增长,以满足海量数据的存储和处理要求。

软件领域,数据分析工具、数据管理平台等产品层出不穷,为企业提供了丰富的选择。

服务方面,专业的数据咨询、数据托管等服务逐渐兴起,帮助企业更好地应对数据处理和分析中的各种挑战。

在大数据市场中,数据的来源和类型也日益多样化。

除了传统的企业内部业务数据,社交媒体数据、物联网数据、卫星图像数据等新兴数据源不断涌现。

这些多样化的数据为企业提供了更全面、更深入的洞察视角,但同时也对数据处理和分析技术提出了更高的要求。

例如,社交媒体数据的实时性和非结构化特点,需要先进的技术来进行快速处理和分析;物联网数据的海量性和复杂性,需要强大的存储和计算能力来支撑。

大数据市场的竞争也异常激烈。

众多科技巨头纷纷布局大数据领域,通过收购、合作等方式不断扩充自身的技术实力和市场份额。

同时,也有大量的创新型中小企业凭借其在特定领域的技术优势和创新能力崭露头角。

在这样的竞争环境下,企业需要不断提升自身的技术创新能力和服务质量,以满足客户日益多样化和个性化的需求。

大数据市场的发展也面临着一些挑战。

大数据基础练习

大数据基础练习

选择题1、大数据技术的基础是由哪个公司首先提出的。

(B)A:微软 B:谷歌 C:腾讯 D:IBM2、大数据最显著的特征是什么。

(A )A:数据规模大 B:数据处理速度快 C:数据类型多 D:数据价值密度高3、下面哪个程序负责 HDFS 数据存储。

(C)A:NameNode B:Jobtracker C: Datanode D:secondaryNameNode4、HDFS 中的 block 默认保存几个备份。

(A)A:3 份 B:2 份 C.:1 份 D:不确定5、HDFS1.0 默认 Block Size大小是多少。

(B)A:32MB B:64MB C:128MB D:256MB6、以下哪一项属于非结构化数据。

(C)A:企业ERP数据 B:财务系统数据 C:视频监控数据 D:日志数据7、HBase是分布式列式存储系统,记录按什么集中存放。

(A)A:列族 B:列 C:行 D:不确定8、客户端首次查询HBase数据库时,首先需要从哪个表开始查找。

(B)A:.META. B:–ROOT- C:用户表 D:信息表判断题1、当前,企业提供的大数据解决方案大多基于Hadoop开发项目。

(是)2、第二名称节点可以作为热备份使用。

(否)3、NoSql数据库能够完全取代传统关系型数据库。

(否)4、Hadoop 支持数据的随机读写。

(否)5、MapReduce适于PB级别以上的海量数据在线处理。

(否)6、HBase对于空(NULL)的列,不需要占用存储空间。

(是)7、HBase可以有列,可以没有列族。

(否)8、HDFS HA 可以有效解决单点故障问题。

(是)填空题1、第三次信息化浪潮到来的时间 2010年2、大数据时代的三大技术支撑:存储设备容量增加、CPU计算能力大幅增加、网络带宽不断增加3、数据产生方式的三个阶段运营式系统、用户原创内容、感知式系统4、云计算的三种服务模式 IaaS、PaaS、SaaS5、云计算的关键技术:虚拟化、分布式存储、分布式计算、多租户6、HDFS1.0中一个块默认大小:64M7、1PB = 1024TB8、HBase 中表的索引由哪几部分组成行键、列族、列限定符、时间戳根据下面这段shell命令,分析该段代码的具体功能。

2022年专技公共课培训:数字经济技能培训专题 测验题目及答案(一)

数字经济技能培训专题测验题目及答案(一)1/50、我国大数据中心发展面临哪些问题与挑战?A规模优势不明显,供需结构性失衡B人才储备不足,财政支持力度不够C数据中心能耗大,PUE提升空间较大D关键技术受制于人,缺乏全球竞争力E缺乏大数据中心建设标准,运维管理能力相对滞后正确答案ACDE2/50、信息资源日益成为重要生产要素和社会财富,信息掌握的多寡成为国家软实力和竞争力的要标志。

A正确B错误正确答案正确3/50、国际格局的深刻调整给我国大数据产业链稳定发展带来了不确定风险,但同时也孕育着新的机遇。

必须站在国家战略安全的高度,做大做强优势领域,聚焦薄弱环节补足短板,防范和化解可能面临的挑战,保障大数据产业链安全稳定高效。

A正确B错误正确答案正确4/50、截至()年年底,我国数据中心市场规模为1958亿元。

A2020B2019c2021D2018正确答案A5/50、软件是数字经济的基础,是()建设的关键支撑。

A文化强国B科技强国C制造强国D网络强国E数字中国正确答案CDE6/50、在“十四五”规划中,“大数据”出现过( 次。

A10B20C43D53正确答案C7/50、大数据已跨过基础设施建设带来的规模性高速增长阶段,进入应用发展阶段。

A正确B错误正确答案正确8/50、预计到2030年,我国的数据量将增至48.6ZB,将占全球总量的27.8%,成为全球占比最高的国家。

A正确B错误正确答案错误9/50、《“十四五”软件和信息技术服务业发展规划》的重点任务关键词是()。

A产业链B产业基础C创新能力D需求牵引E产业生态正确答案ABCDE10/50、到2025年,大数据产业测算规模突破3万亿元,年均复合增长率保持在()左右,创新力强、附加值高、自主可控的现代化大数据产业体系基本形成。

A20%B25%C30%D35%正确答案B11/50、在全球云服务市场,排名前三的是( )。

A亚马逊B腾讯C百度D微软E谷歌正确答案ADE12/50、下列选项中,不属于夯实“四大基础的具体内容。

大数据时代所需的三大技术

大数据时代所需的三大技术在大数据时代,随着各行各业数据量的急剧增长,如何高效地管理、分析和应用这些海量数据成为了当前亟待解决的问题。

为了满足这一需求,大数据时代所需的三大技术应运而生。

本文将从数据存储技术、数据处理技术和数据安全技术三个方面进行探讨。

一、数据存储技术在大数据时代,数据存储是首要的问题。

传统的关系型数据库已经无法满足大规模数据的存储需求,因此出现了各种新型的数据存储技术,如分布式文件系统和NoSQL数据库。

分布式文件系统将数据分布到多个节点上,实现了数据的高可靠性和可扩展性。

NoSQL数据库采用非关系型的存储方式,具有高性能和高扩展性的优势。

此外,还有基于云计算的对象存储技术和列存储技术等新兴的数据存储技术,都为大数据时代的数据存储提供了多种选择。

二、数据处理技术大数据要发挥作用,还需要进行有效的数据处理。

传统的数据处理方式已经无法适应大数据的复杂性和高速性,因此需要引入新的数据处理技术。

其中,最重要的一项技术是分布式计算技术。

分布式计算将任务分解为多个子任务,并将其分配给多个计算节点进行处理,从而实现了任务的并行处理和加速。

常见的分布式计算框架有Hadoop和Spark等。

此外,还有基于图计算的技术用于处理复杂的图结构数据,实现图分析和挖掘。

三、数据安全技术随着大数据的广泛应用,数据安全问题越来越被重视。

在大数据时代,数据安全技术是保障数据安全的关键。

首先,数据加密技术能够将敏感数据进行加密,保护数据的隐私性。

其次,访问控制技术在数据使用和共享过程中起到了重要作用,能够限制和控制不同用户对数据的访问权限。

此外,还有数据脱敏技术用于隐藏敏感信息,数据备份和灾备技术用于保障数据的可靠性和可用性。

综上所述,大数据时代所需的三大技术包括数据存储技术、数据处理技术和数据安全技术。

这些技术的应用使得我们能够更好地管理和应用海量的数据资源,在大数据时代中不断探索和创新。

随着技术的不断进步和发展,相信大数据技术将为各个行业带来更多的机遇和挑战,推动社会进步与发展。

中国工程院院士徐宗本:大数据的挑战和问题

中国工程院院士徐宗本:大数据的挑战和问题佚名【期刊名称】《中国教育网络》【年(卷),期】2016(000)004【总页数】2页(P29-30)【正文语种】中文在方法论方面,大数据带来了三大挑战。

第一,是分析基础;第二,计算的模式与计算方法需要推倒重来;第三,根本性判定需要条件。

谈论大数据是时代话题,拥有大数据是时代特征,解读大数据是时代任务,应用大数据是时代机遇。

这四句话概括出大数据时代。

从本质上说,数据,就是指资料的信息化、数字化,大数据的复杂性体现在四个方面,第一,海量性;第二,实践性;第三,异构性;第四,分布性。

这是大数据区别于传统数据的四个特点。

什么是大数据技术?严格地讲,是没有定义的。

目前,有关大数据搜集、整理、成熟、解读或应用的技术,我们统称为大数据。

在日常生活中,大数据的价值到底在哪里?需要强调四个方面。

第一,提供社会科学的方法论,实现基于数据的决策,助推管理革命。

这也正是目前大数据最热的领域是在社会科学方面的原因所在。

大数据改变了人们对文科、理科的认识。

社会科学最大的问题在于没有一个可普遍遵循的、可重复和被所有人接受的公共方法论,而利用大数据,弥补了这个缺憾。

第二,形成科学研究的新范式,支持基于数据的科学发现,减少对精确模型与假设的依赖,使过去不能解决的问题变得可能解决。

也就是说,我们有一种方法能够较小地依赖于模型和依赖于假设,形成了第四种科研范式。

第三,形成高新科技的新领域,推动互联网、物联网、云计算等行业深入发展,形成大数据产业。

互联网能实现如何把信息技术中的人、环境、机器,沟通在一起来处理问题,这是未来的发展。

而大数据,则是实现信息化的组成,换句话说,即实现机器和机器的交换、人和机器的交换,是以数据的形式来沟通、来交换的。

第四,大数据成为社会进步的新引擎,深刻改变人类的思维、生产和生活方式,推动社会变革和进步。

信息技术革命与经济社会活动的交融催生了大数据。

大数据是经济社会、现实世界、管理决策的片断记录,蕴含着碎片化信息。

大数据时代的数据治理

大数据时代的数据治理随着科技的不断发展,我们的生活中都离不开数据。

在这个数据迅速增长的时代里,大数据成为了各行业的关键因素之一,而数据治理也变得尤为重要。

因此,大数据时代的数据治理也成为了许多企业和组织迫切需要面对的问题。

一、大数据时代的数据治理概述数据治理是一种管理和监督数据相关事务的过程,旨在确保数据管理的质量和价值。

在这个过程中,数据被分类、评价和批准,然后被监控、保存、维护和优化。

在大数据时代,数据治理是由数据分析、评估、批准和管理等一系列流程构成的综合性过程,数据治理的核心目的是通过数据的质量、可用性、准确性和一致性提高组织的信息资源管理能力。

数据治理的过程包括数据收集、数据存储、数据管理、数据安全、数据分析和数据共享等多个维度。

在进行数据治理的过程中,企业应建立从数据收集到数据应用全流程的数据管理规范,包括数据的源头、传输、存储、处理和使用等方面。

二、大数据时代的数据治理挑战由于大数据时代的数据规模、速度、种类和来源都十分复杂,因此数据治理也遇到了前所未有的挑战。

其中,最主要的挑战包括以下几个方面:1、数据隐私问题。

在数据采集和共享的过程中,个人隐私的泄露是令人担忧的问题。

在数据治理的过程中,要确保数据的安全、隐私和合法性,这对数据的收集、共享、存储和使用,都提出了更高的要求。

2、数据质量问题。

由于大数据量和多样性,数据的质量可能难以保证,经常出现数据不准确、重复、不完整等问题,影响了数据治理的效果。

3、数据保护问题。

在大数据时代,数据的保护是关键的问题。

在数据治理的过程中,企业必须确保数据受到保护,避免数据泄露和数据失控的情况发生。

三、建立一个有效数据治理体系面对大数据时代的三大挑战,建立一个有效的数据治理体系是关键。

将数据治理体系应用于实践中,可以帮助企业在数据的采集、分析、存储、共享、追踪和管理过程中进行规范并推进信息化和数字化。

1、明确数据治理的目标和意义在实施数据治理之前,企业应先明确数据治理的目标和意义,确保数据治理能够推进业务和组织管理的有效运转,帮助企业走上数字化转型之路。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大数据发展的三大问题
作者:杨学山
来源:《软件和集成电路》2016年第08期
大数据在中国经历了五年的发展。

这五年来,我一直在关注着大数据、观测着大数据、研究着大数据,我认为有三个问题值得我们研究、思考和解决。

这三个问题总结为六个字—“价值”、“工具”、“理论”。

先讲价值。

针对这一点,我们大体上可以从三方面分析:
第一方面,我们拥有一些称之为“大数据”的数据,那么,如何将其中的价值充分地挖掘出来?
第二方面,我们要解决一个与数据相关或信息相关的问题,需要将能够解决这一问题所需要的数据或信息的价值挖掘出来;
第三方面,我们需要有一些工具和服务,利用工具和服务挖掘实现数据的价值。

关于数据的两个价值观:现在很多大数据企业以及学会和科研单位,都把眼光放在实现数据间的结合,最充分地挖掘数据结合中的价值。

这也是我们研究的主要方向。

我们回过头来想一想,当我们对数据进行价值挖掘时,这个价值都是针对特定的经济、社会、生活或是相关领域问题的解决。

之所以要挖掘、分析出有价值的数据,是因为这些数据对于问题的解决有价值。

所以说数据的价值就是问题本身。

大家都知道手机上的地图,我们通过使用地图相关的各种应用和数据来解决出行问题。

但出行问题是不是有一个地图就够了,是不是有一个相关的数据结合就够了?要围绕出行问题,围绕结合去发挥作用,这是一个问题的两面。

如今,无论是经济新常态的“三个转变”,还是社会服务、公共服务的社会管理,以及老百姓生活要解决的问题,都需要足够的数据作支撑。

从这个角度看,我们今天为解决这个问题是不是有了足够的数据或信息,是不是能够和解决问题的相应系统,很好地、及时地对接。

大数据的第一个价值链,应该是围绕着“解决问题”—交通问题的解决、信用问题的解决、宏观问题态势分析的解决,即数据围绕问题形成数据价值链。

过去,在第一个价值链,我们在很多关注点上取得了大量的成绩,但我们对第二个价值链的关注、分析还不够。

未来,大数据在经济社会发展中的作用将愈加明显。

但两个价值链采取的分析文件和方法不一样,所以我希望我们能把握住大数据三个方向的价值。

在已经取得进展的基础之上,我们还要考虑另外一个问题,这个问题对于利用大数据促进经济社会发展,对于我们利用大数据来解决今天社会面临的问题更加重要。

这个问题就是工具,工具十分重要,可以说,大数据产品的价值是工具。

现在成千上万的工具被使用,大数据发展究竟需要哪些工具,这些工具是不是把问题解决了?
我的答案很清楚:我们的大数据需要工具,但现有的成千上万的工具,离真正能解决大数据问题的工具还有非常大的差距。

为什么这样说?
30年以前,数字型数据库正值发展期。

今天,数字型数据库管理系统工具已十分完善,基于该系统的应用也已十分完美。

那么,我们今天的工具,是不是能达到数字型数据库管理系统工具的水平?
大家的回答是“相差甚远”。

差在什么地方?在数字型数据库中,每一个数据单元,每一个值都是在控制体系之下,在这个之上可以形成不同算法和函数,可以在此基础之上构建应用系统。

要达到这样的程度,核心的问题是非结构数据的结构化的颗粒度和它融解的完美性和应用。

即使在数字型数据库中,我们也要对数据进行质量管理,按照我们确定的数据质量,让数据到该到的地方。

今天,这样的工具不能说没有,但是还没有形成体系,所以第一类工具就是解决我们对大数据的组织和管理。

第二类工具,要真正充分利用大数据,核心的问题是结构数据的结构化。

关于结构化,我们通常有两条路径:一条路径是根据数据本身内涵的结合意义来做,第二条路径是根据应用来做。

不管是按照语意来做,还是意义来做,我们都要确定单元和标识,让数据按照定义的单元和标识进行结构化。

对此,我们需要一系列模型、算法和函数,以构造一个好的工具序列。

第三类工具,我们要与解决问题的系统连接起来。

而我们和解决问题的系统之间,有一座很好的桥,这个桥就是工具。

第四类工具,从理论角度看,到今天为止,我们做的最好的、用的最好的还是数字型的数据库。

当我们需要数字型数据库或其他数据库支持时,当我们将数字型的系统和其他数据库连接起来,为同一个问题的决策或服务时,这个工具适不适用。

从产业生态链的角度看,要为使用者提供工具,要为解决问题的客户系统提供服务,我们需要更加商业化的管理。

在工具这个问题上,需要回到问题的本源,也需要系统地思考:我们到底需要什么样的工具?这些工具如何形成?这些工具如何改造和使用?而不是把目光盯在已经有的工具上。

这就隐含着另一个问题:已有的工具所形成的思维方法、演进路径,与解决大数据问题需要的工具的路径不对时,怎么办?所以我们需要又回归到本源—我们如何来利用和创新工具?
第三个问题是理论,也就是说大数据在整个信息技术、信息经济、信息社会中的位置和属性究竟是什么?
我们对大数据有很多定义,也有很多关于特征的讨论,但有一个结论是清晰的,没有一个大数据不是信息,当然,信息不一定都是大数据。

所以当我们从IT时代到新的IT时代,从IT时代到DT时代,从工业社会到信息社会、从工业经济到信息经济的发展和整个形态中,不变的东西是信息。

所以说,大数据是对“信息”这个词的一个代表性的称谓,因为在这个阶段,信息有它的特殊性。

所以,我们在研究大数据的整个技术系列,和社会演进过程中的定位和属性时,应该把它看作是信息在当前阶段的一种称呼和标签,不能将它和信息相关的研究区分开来。

在理论上,大数据具有两个属性—经济属性和社会属性。

首先,大数据具有经济属性。

今天经济社会发展面临着一个重要的变革—信息成为整个生产过程中的要素,信息提供了产品。

这样的要素和产品,和它原来的材料、能源在整个经济运行过程中的性质不同:它不遵循材料能源的基本规律,这才有了我们今天的零边际经济、共享经济等一系列的经济模式。

所以,在理论上,大数据拥有一种经济属性。

我们还要研究信息的社会属性。

信息的获取、处理和利用模式的改变,也改变着社会发展中的每个成员和每个功能系统的发展轨迹。

在这一点上,我们虽然已有很多的研究,但仍需要认真研究。

我刚才讲了价值、工具和理论,与其说提出了一些看法,不如说是想引起大家对这三个方面的重视。

其实我们讲价值时,是在讲商业模式的价值。

商业模式是什么东西?你发现价值,并让这个价值实现,让获取价值的人和你本人在其中获利。

而商业模式创新不一定建立在价值链方向。

我讲工具其实是在讲技术创新。

中国人多、经济发展规模大。

因此,当万物互联或互联网与人互联时,我们天然拥有数据的优势,而这种优势为什么不能转变为我们科技创新的优势,成为工具创新的优势呢?
我们再回顾过去的历史:我们一直强调高端市场、先进市场,要培育高端和先进的技术。

在这一轮变革中,中国有什么理由不产生新一代大数据的供应体系呢。

我们一直在讲理论创新。

当中国从跟随者走向并肩者、领先者时,当中国真正进入发达国家的第一阵营时,如果没有理论创新那是说不过去的。

所以我们需要加强理论创新。

当我们的理论创新真正取得成果时,我相信中国民族的伟大创新就为之不远了!(根据演讲内容整理,未经本人审核)。

相关文档
最新文档