大数据与宏观经济分析研究综述_刘涛雄

合集下载

大数据时代与社会科学研究范式变革

大数据时代与社会科学研究范式变革

开展的研究得以开展,同时也带来新的挑战。大数据 可揭示一切问题,理论变得可有可无。这一观点撼动
其量之大超出一般传统统计软件所能处理的范围, 了不少社会科学研究者,使他们开始憧憬“传统方法
而且解释变量增加会导致高维数据中的“维数灾 的终结”。此外,不少研究者至今仍然认为大数据虽
难”,解决这些问题需要新的分析方法和工具。三是 然不是绝对精确,但由于数据量极大,所以误差必然
〔收稿日期〕2017-09-10 〔基金项目〕国家社会科学基金重大项目“基于大数据的中国宏观经济景气衡量方法研究”(16ZDA008),负责人刘涛雄。 〔作者简介〕刘涛雄(1973-),男,湖北崇阳人,清华大学社会科学学院教授、博士生导师,主要研究方向为宏观经济、大数据
经济分析、产业经济等。 尹德才(1982-),男,山东临沂人,清华大学社会科学学院博士后,主要研究方向为宏观经济、大数据。
析人员和技术实践者对大数据有不同的定义。从狭 所带来的无意的或未经设计的结果。”〔5〕7 各种社会
义上讲,大数据是指数据量的大小超过了传统意义 现象可视为已发生的不可控试验,其背后存在某种
上的尺度,一般的工具难以进行捕捉、存储、管理和 潜在的本质规律或因果关系。考虑到因果联系的普
分析。〔1〕该定义仅仅描述了大数据的“大”,没有涉及 遍性和复杂性,数据作为对不可控试验的特殊描述
改进加快了大数据的处理速度。社会科学研究如何 具有理论意义和理论突破的研究,小数据可能比大
吸收和利用这些强大的技术手段,使之成为社会科 数据更适合〔9〕。另外,很多时候我们采集到的大数据
学家工具箱中的利器是未来社会科学家们必须面对 并非真正的全样本数据,它可能是总体中某一部分
的问题。〔 4〕
的数据,比如就互联网上的在线数据而言,网民并不

基于大数据技术的宏观经济分析

基于大数据技术的宏观经济分析

基于大数据技术的宏观经济分析随着信息技术的不断发展,大数据技术已经在许多领域得到应用。

它的应用对于宏观经济分析来说也是很重要的,因为这种技术可以帮助我们更好地理解和预测经济变化。

本文将介绍一些基于大数据技术的宏观经济分析方法及其应用。

一、宏观经济模型的构建宏观经济模型是一种用来预测经济变化的工具。

这些模型通常基于经济学理论,可以用来分析货币、物价、就业等各种经济指标。

最近,大数据技术已经开始被应用到宏观经济模型的构建中,以解决传统方法中存在的某些问题。

例如,基于大数据技术的宏观经济模型可以考虑更多的因素,比如社交媒体、电子商务和搜索引擎等,这可能会导致更精准的预测结果。

同时,这种模型还可以更好地处理经济变化的不确定性,因为它可以更快地获取和分析新的数据。

二、网络分析网络分析是一种将数据转换为网络结构的技术。

通过这种方法,我们可以更好地理解不同数据之间的联系,并且可以更好地预测宏观经济指标的变化。

例如,我们可以将生产商、供应商和消费者之间的关系转换为一个网络图表,以更好地了解不同企业之间的联系,并理解它们对整个经济体系的影响。

另外,网络分析也可以用于预测企业破产或财务危机。

通过分析经济体系中的人际关系网络,我们可以识别可能出现破产的企业,并监测它们的财务状况。

这种分析方法可能会比传统的财务分析更高效、更准确。

三、情感分析情感分析是一种根据文本数据中的情感内容来判断人们对某一事物的看法和态度的技术。

这种技术在宏观经济分析中也有很多应用。

例如,我们可以分析新闻报道、社交媒体和博客等数据,以评估人们对某个国家、行业或企业的信心水平。

这种方法可以帮助我们更好地预测经济趋势,并提前发现经济危机。

四、时空数据分析时空数据分析涉及到一种基于地理位置信息和时间的数据分析。

通过这种技术,我们可以更好地理解人们的生活方式和行为,并更好地预测市场需求和供应。

这种分析方法可以使用地理信息系统(GIS)工具,以帮助我们更好地理解消费群体的行为,预测他们的需求,更好地布置商业场所的位置,以确保商业场所在目标市场中最具竞争力。

一种基于在线大数据的高频CPI指数的设计及应用

一种基于在线大数据的高频CPI指数的设计及应用

Design and Application of Novel CPI Based on
Online Big Data
作者: 刘涛雄[1,2];汤珂[1,2];姜婷凤[3];仉力[4]
作者机构: [1]清华大学社会科学学院经济学研究所;[2]清华大学创新发展研究院;[3]对外经济贸易大学金融学院;[4]中国社会科学院世界经济与政治研究所
出版物刊名: 数量经济技术经济研究
页码: 81-101页
年卷期: 2019年 第9期
主题词: 在线大数据;iCPI;实时高频指标;宏观现时预测
摘要:在数字经济时代探索如何运用在线大数据编制实时高频物价指标。

研究方法:设计了中国第一套基于互联网在线大数据的居民消费价格指数,从多方面分析指数质量及其应用。

研究发现:在线iCPI可实现各层次类别的日、周、月指数无滞后实时更新;指数数据从采集、清洗到加工和发布均由计算机自动进行,既节省人力又减少人为干预因素;指数在代表一般物价变化、精准捕捉典型事件影响、现时预测通货膨胀、实时监测宏观经济形势等方面表现突出。

研究创新:首次采用在线大数据编制CPI,弥补了中国尚无实时高频物价指标的空白。

研究价值:在线iCPI是传统CPI的有益补充,其编制思维和方法可用到更多高频宏观经济指标的构建上。

基于大数据平台的宏观经济分析

基于大数据平台的宏观经济分析

基于大数据平台的宏观经济分析随着信息化、智能化的快速发展,基于大数据平台的宏观经济分析也越来越受到重视。

大数据技术的应用,使得以前很难收集、整理的数据现在可以被快速获取和处理,从而改善了宏观经济分析的可行性和精度。

本文将从大数据平台的构建、数据处理、模型建立三个方面来探讨基于大数据平台的宏观经济分析。

一、大数据平台的构建大数据平台是通过一系列技术手段,对数据进行收集、存储、处理、分析和应用的支撑平台。

要构建一个高效的大数据平台,需要有以下几个关键组件。

首先是数据收集组件。

数据收集组件主要负责采集各种类型的数据,包括结构化和非结构化数据。

结构化数据包括数据库中存储的数据、各种业务系统生成的数据等,而非结构化数据包括社交媒体数据、新闻数据、图片、音频、视频等。

数据收集组件需要具备高效的数据采集能力,快速处理大规模数据的能力,以及与数据源实时交互的能力。

其次是数据存储组件。

数据存储组件负责将采集到的数据持久存储下来,以便后续的数据处理和分析。

此外,数据存储组件还要支持数据的备份和恢复,保证数据的安全性和可靠性。

数据存储组件可以采用关系型数据库、分布式文件系统等多种技术进行搭建。

最后是数据处理和分析组件。

数据处理和分析组件负责对存储在平台中的大数据进行挖掘和分析。

这部分工作涉及到数据清洗、数据统计、数据关联等多种技术手段,并且需要具备较高的计算能力和算法支持。

二、数据处理经济数据在大数据平台中具有多样性和复杂性,因此需要对数据进行有效的处理和加工。

数据的处理流程一般包括以下步骤。

首先是数据清洗。

数据清洗是指对数据中存在的噪声、不完整性、重复性、冲突性等进行清理和去除。

通常需要借助人工审核和算法审核来完成。

数据清洗的目的是保证数据的准确性和完整性。

其次是数据集成。

数据集成是指将来自不同数据源的数据进行整合和融合。

在宏观经济分析中,需要将来自国家统计局、财政部、人力资源和社会保障部等多个部门的数据进行整合,以形成更全面和准确的宏观经济分析报告。

新常态下中国经济增长需警惕哪些风险

新常态下中国经济增长需警惕哪些风险

新常态下中国经济增长需警惕哪些风险
刘涛雄
【期刊名称】《人民论坛》
【年(卷),期】2016(0)16
【摘要】随着中国经济进入新常态,长期增长速度放缓.长期增长放缓的总背景既会滋生风险,也会导致抗风险能力的下降.经济结构调整进展不畅,创新驱动没有达到预期,以及金融体系的系统性风险、政府债务与财政风险、政策逆转与官员不作为的风险,这些方面是值得高度重视的主要风险来源.
【总页数】3页(P66-68)
【作者】刘涛雄
【作者单位】清华大学经济所
【正文语种】中文
【中图分类】F120
【相关文献】
1.新常态下国企需健全法律风险防范机制r——以杭州市属国企为例
2.经济新常态下需防范风险
3.疫情时期需警惕的网络安全风险及相关启示
4.对产业链转移风险需保持警惕
5.经常心慌?需警惕脑梗风险
因版权原因,仅展示原文概要,查看原文内容请购买。

大数据的经济学研究文献综述

大数据的经济学研究文献综述

大数据的经济学研究文献综述学院:金融学院班级:13金融学硕姓名:熊美兰摘要:本文从传媒经济本体研究、产业经济学视角下的传媒经济研究、传媒经济研究工具的创新等方面来管窥近年来该领域的主要关注点以及新趋势和新突破,同时关注传媒经济学科体系研究的最新发展。

本年度传媒经济研究主题较为集中,主要是探讨传媒产业的数字化生存、全媒体转型策略与路径。

演化经济学、制度经济学、计算机和通信技术等视角和方法的引人,更加凸显了传媒经济学“跨学科”和“融合”的特征。

关键字:全媒体;三网联合;大数据;云计算;传媒经济学一、引言2012年,Twitter上每天发布超过4亿条微博,Facebook上每天更新的照片超过1000万张,Farecast公司用将近10万亿条价格记录来预测机票价格,准确率高达75%,采用该系统购票,平均每张机票可节省50美元Gartner 预测未来5年全球大数据将会增加8倍,其中80%是非结构化数据2013年世界上存储的数据将达到1.2ZB(1ZB=1024EB,1EB=1024PB,1PB=1024TB,1TB=1024GB),如果将这些数据刻录到CDR只读光盘上,并堆起来,其高度将是地球到月球距离的5倍2011年,麦肯锡公司对全世界大数据的分布作了一个研究和统计,中国2010年新增的数据量约为250PB,而欧洲约为2000PB,美国约为3500PB,大数据已经深深地充斥了人类经济社会的许多角落。

著名未来学家阿尔文托夫勒(1980)[1]很早就在其经典著作《第三次浪潮》中,将大数据热情地赞誉为第三次浪潮的华彩乐章,但是大数据成为高频词是最近一两年的事情。

随着社交网络“物联网”云计算的兴起,数据规模越来越大,2011年5月,全球知名咨询公司麦肯锡(Mckinsey andCompany)发布了《大数据: 创新、竞争和生产力的下一个前沿领域》[2]报告,标志着“大数据”时代的到来,指出数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素; 而人们对于海量数据的运用,将预示着新一波生产率增长和消费者盈余浪潮的到来,2012年世界经济论坛发布了《大数据、大影响》[3]的报告,从金融服务、健康教育农业、医疗等多个领域阐述了大数据给世界经济社会发展带来的机会。

基于大数据的宏观经济分析研究

基于大数据的宏观经济分析研究

基于大数据的宏观经济分析研究在当今全球化、信息化的时代,经济发展的速度越来越快,经济变化的幅度也越来越大。

因此,了解和分析宏观经济变化的趋势和规律,对于政府、企业以及个人都至关重要。

随着互联网和移动互联网技术的发展,大数据分析逐渐成为研究宏观经济的有效工具。

本文将探讨基于大数据的宏观经济分析研究的现状和未来发展趋势。

一、大数据在宏观经济分析中的应用大数据分析是指通过各种技术手段,对海量数据进行多维度分析、挖掘和应用。

它能够帮助我们更加全面、准确地了解宏观经济的状况和变化趋势。

目前,大数据在宏观经济分析中已经有了广泛的应用,主要包括以下几个方面。

1. 用大数据分析宏观经济形势宏观经济形势是指一个国家或地区的总体经济状况,它的变化对于政府的宏观调控和企业的战略决策都有着重要的影响。

采集、整合和分析大量的社会经济数据,可以更加客观、准确地反映宏观经济形势,为制定经济政策和战略提供依据。

2. 用大数据分析宏观经济结构宏观经济结构指的是一个国家或地区的经济产业结构、用工结构、消费结构等方面的特征和变化。

通过分析大数据,可以更加深入地了解宏观经济的结构特征和演变趋势,发现不同行业和群体之间的联系和规律,提供更为精准的政策建议和商业决策支持。

3. 用大数据分析宏观经济风险宏观经济风险是指某一时期内宏观经济运行中存在的各种不确定性和潜在的危险因素,如金融风险、环境风险、地缘政治风险等。

通过分析大数据,可以预测和评估宏观经济风险,提前制定应对措施,降低风险对经济运行的不利影响。

二、基于大数据的宏观经济分析面临的挑战尽管大数据分析在宏观经济研究中具有巨大的潜力和优势,但也面临着一些挑战和限制。

1. 原始数据质量不高大数据需要收集和整合大量的原始数据,但是这些数据质量良莠不齐,有些数据可能存在错误或者缺失,或者数据来源不可靠。

因此,对于原始数据的质量控制和处理成为了大数据分析面临的一个问题。

2. 难以建立量化模型相比于传统的统计分析方法,大数据分析更加依赖数据挖掘和机器学习等技术,难以建立精准的量化模型。

基于大数据技术的宏观经济分析应用研究

基于大数据技术的宏观经济分析应用研究

基于大数据技术的宏观经济分析应用研究当前,计算机和互联网等信息技术正在改变着世界。

借助云计算和大数据方式,生产和生活方式、经济流动和消费过程中的线上交易与资金结算量呈迅猛增长之势。

从目标上看,宏观经济分析旨在通过深入把握和分析研究财政、投资、金融、消费等数据指标,并针对指标变化特点,研判经济发展趋向,预测宏观经济未来,从而为政府提前制定对应经济对策提供参考。

大数据背景下,传统的宏观经济分析方法因其时效性、关联度欠缺而难以满足社会经济发展需求。

而基于大数据技术的宏观经济分析方法,则恰巧弥补了这一不足。

现代信息技术在旅游、农业、医疗、交通等领域的广泛应用,客观上也推动了大数据在宏观经济分析研究工作中的应用,提高了宏观经济分析的参考价值。

一、宏观经济分析中的大数据技术价值大数据以其时效、海量、关联的特性,赋予了宏观经济分析更多元的价值。

(一)基础数据详实而保真宏观经济分析工作对基础数据的依赖性极强,但在实际研究过程中,由于涉及范围广、类别杂、干扰因素多,基础数据的客观全面性和准确度、时效性难以得到保证。

而大数据应用,则是凭借计算机网络技术,把传统人工的方式难以获得的数据信息,在短时间内,科学地搜集、分类、处理具体数据,迎合了宏观经济分析对基础数据的严格要求,对宏观经济分析结果的科学性、有效性、权威性起到了关键作用。

(二)分析手段丰富而有效传统的宏观经济分析,多采用统计分析建模形式,它总体是根据抽取的样本数据开展分析。

虽然样本分析具有一定的实用性,但如果样本或者取样过程出现问题,容易造成分析结果和客观事实之间相互矛盾的问题。

而应用大数据技术,则可以搜集到庞大的基础数据量,通过构建完善的分析模型和引进先进的识别技术,在数据之间关联起共性,进而快速分析研判具体行业行情,为宏观经济分析提供更加准确、科学的建议。

(三)信息关联科学而迅速在海量信息面前,传统的统计分析方式常常束手无策。

而根据实际需求将庞大的数据量进行运算处理和分析,通过特定规则对其进行管理,使碎片化信息之间建立起强大的关联,是大数据技术的特长所在。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大数据与宏观经济分析研究综述*刘涛雄徐晓飞[内容提要]大数据对宏观经济分析具有革命性的意义。

在大数据时代,纷繁复杂的数据实时可得,整个社会经济产生了根本的变化。

大数据在宏观经济分析应用中最活跃也是最重要的四个领域为:宏观经济数据挖掘、宏观经济预测、宏观经济分析技术和宏观经济政策。

本文对大数据背景下宏观经济数据挖掘的来源和宏观经济预测方法进行了评述,探讨了大数据分析技术如何将机器学习算法引入宏观经济分析,利用LASSO 算法解决“维数灾难”。

本文还研究了大数据对宏观经济政策制定的影响,并在此基础上对大数据背景下的中国宏观经济分析提出了对策建议,认为政府应加大扶持力度,搭建平台,及早建立基于大数据的宏观经济分析模型,并加强学科和专业教育。

[关键词]大数据宏观经济数据挖掘机器学习算法预测*本文为中国博士后科学基金面上项目“大数据与宏观经济现时预测研究”(2014M560068)的阶段性成果。

一、引言随着互联网的普及,信息总量正以空前的速度爆炸性增长,人类社会进入了一个以“PB ”(1PB =1024TB ,1TB =1024GB )为单位的数据信息新时代,即大数据时代。

大数据,是指巨大而多样化的数据集①,这些数据的处理超出了目前主流软件的能力,因此必须改进处理数据的工具。

“大数据”术语最早可以追溯到Apache 公司的开源项目Nutch (一个开源软件实现的搜索引擎),伴随谷歌的Ma-pReduce (映射和归约,是一种编程模型,用于大规模数据集的并行运算)和GFS (可扩展的Google 文件系统),大数据不仅代表着数据规模,而且包含了数据处理的速度。

②目前一般认为,大数据的典型特点可以用“4V ”即大量化(Vol-ume )、快速化(Velocity )、多样化(Va-—75—学科前沿riety)和价值化(Value)来概括。

一是数据体量巨大。

据估计,人类至今生产的所有印刷材料的数据量大约为200PB,而历史上全人类说过的所有的话的数据量大约为5EB(1EB=1024PB)。

当前互联网上的数据以每年50%左右的速度增长,人类90%以上的数据都是最近几年产生的,到2013年,全球存储的数据预计能达到约1.2ZB(等于270个字节,约10亿TB)。

二是处理速度快。

在如此海量的数据面前,处理数据的效率就是企业的生命。

社交媒介、移动设备、网上交易和网络设备更新的速度非常快,巨大的数据流会导致传统数据分析的软硬件被淘汰,产生从快速生成数据中实时获取价值的专门技术和数据分析系统。

三是数据类型繁多。

构成大数据的信息类型来源不同,包括网络日志、音频、视频、图片、地理位置信息等。

其中大概只有约10%属于结构化数据适合整齐地进入相关数据库的行和列,其余90%是非结构化数据。

四是价值密度低。

价值密度的高低与数据总量大小成反比。

例如,一部1小时的视频,在连续不间断监控过程中,可能有用的数据只占一两秒时间。

如何通过强大的机器算法更迅速地完成数据的价值“提纯”变得十分重要,也是数据挖掘的关键。

③大数据正在深刻地影响着整个社会和经济的发展。

从经济分析的角度看,国际上的大数据研究首先在行业研究、商务分析和企业应用层面快速发展,并逐渐影响到经济分析的各个领域。

当前,在宏观经济分析中如何充分利用大数据方法和技术已经开始在国际上引起重视,从国内的情况来看,将大数据与宏观经济联系起来的研究还鲜有见到,宏观经济政策制定者对此也重视不够,而这正是本综述的目的和意义所在。

二、大数据对宏观经济分析的革命性意义大数据开启了巨大的时代转型,就宏观经济分析而言,大数据时代带来的转变是重大且具有革命意义的。

首先,大数据极大地拓宽了信息来源。

大数据时代的重大变化是海量的可得数据。

传统经济分析依靠的数据主要是样本,而在大数据时代,得到的数据可能就是总体本身,例如就物价而言,每一笔在电子商务网站成交的交易信息都能记录在案。

大而全的可得数据对宏观经济分析是极其重要的,可以准确了解宏观经济形势,正确做出宏观经济发展预测,合理制定宏观经济政策。

这些优势是传统经济分析方法无法想象和实现的。

其次,大数据时代信息获得的速度大大提高,很多信息实时可得。

传统的经济分析主要依靠结构化数据,这些数据最明显的缺陷就是具有很强的时滞性。

例如,政府公布的季度GDP往往会有1个月的滞后期,而反映全面经济社会状况的统计年鉴的滞后期会达到3个月左右,这对及时了解宏观经济形势、预测与预警都是非常不利的。

大数据时代信息产生和传递的速度空前加快,如互联网上的大量信息是实时的,移动互联网和物联网使每个人随时随地都可能制造数据。

大数据经济模型可以充分利用数据的实时性,提高分析或预测的时效性,为经济预警和政策制定提供最快速的资料和依据。

第三,大数据带来宏观经济分析的方法论变革。

传统的经济计量模型建立在抽样统计学的基础上,以假设检验为基本模式。

随着信息量的极大拓展和处理信息能—85—国外理论动态·2015年第1期力的极大提高,经济分析可能从样本统计时代走向总体普查时代。

这一点对宏观经济分析意义重大,因为宏观经济系统纷繁复杂,如果能将对整体宏观经济变量的分析建立在尽可能多的关于经济主体行为的信息以及其他诸多经济变量的信息的基础上,甚至抛弃原有的假设检验的模式,无疑将会极大地提高宏观经济分析的准确性和可信度。

同时,经典计量模型以因果检验为核心,而大数据分析则往往将相关性发掘作为首要任务。

在复杂的宏观经济系统中,当许多宏观经济中的因果关系往往难以准确检验、因果结论经常广受质疑时,更重视可靠相关关系的发掘,充分利用相关关系对于经济预测、政策制定与评估的作用,无疑为宏观经济分析打开了另一片广阔的空间。

正因为如此,维克托·迈尔-舍恩伯格(Victor Mayer-Schon-berger)与肯尼思·库克耶(Kenneth Cukier)认为建立在相关关系分析基础上的预测是大数据的核心。

第四,大数据促进了宏观经济分析技术的革新。

传统的分析技术基于关系型宏观经济数据,而分析模型主要基于统计数据,而大数据中的大量信息是非结构化的,数据的来源和形式复杂多样。

如互联网信息包含文本、图片、影音等多种形式,在此状况下进行宏观经济分析,有必要借鉴计算机领域已经出现、但在现有经济领域还少有应用的数据处理技术,例如机器学习。

机器学习已经在图像识别、语音识别、自然语言处理、智能机器人等领域取得了巨大成功,是当前进行大数据分析的基本手段。

此类技术在宏观经济领域的应用会极大地提高经济分析的能力,改进分析结果、提升分析价值。

另外,传统的经济计量对海量数据难以分析,发展适合大数据的分析模型是经济计量面临的重大挑战。

④国际学术界和宏观经济政策制定者已经意识到大数据对宏观经济分析的革命性影响,将大数据的概念、方法、技术和宏观经济分析结合起来的做法正逐步得到重视,一些意义深远的研究工作逐步兴起。

综合起来看,这些研究主要集中在宏观经济数据挖掘、宏观经济预测、宏观经济分析技术和宏观经济政策四个领域。

三、宏观经济数据挖掘数据挖掘正在成为一个热门行业。

简单地说,数据挖掘就是大数据时代的统计调查。

随着互联网信息技术的逐步发展,获取的数据种类越来越多,数量越来越庞大,更新速度越来越快,数据中有大量“噪声”存在。

显然,传统的统计调查方法不能适应大数据时代信息收集的需要,比如在内容形式上,互联网上的诸多信息是以多媒体方式存在的,统计调查无从下手;面对海量信息,统计调查速度慢,效率低。

因此,充分依靠计算机进行信息收集的各种新技术应运而生,被称为“数据挖掘”。

数据挖掘多在利用网络爬虫软件的基础上建立机器学习模型。

其过程一般包括:先利用网络爬虫软件将原始信息从网上抓取下来;然后通过一定方法对这些数据进行清洗,将大量内容无用的“噪声”过滤掉,保留值得加工的信息;最后对剩下的内容进行加工提取,并转化为一定程度结构化的可用数据,如标准化为时间序列等。

这一过程已经成为大数据方法中的标准程序之一。

从宏观经济分析的角度,根据信息来源的种类,数据挖掘大体可分为两类。

—95—学科前沿第一类是对数量信息的收集整理。

这一类工作要解决的问题是信息来源量大面广和快速更新的问题,比如麻省理工学院的“10亿价格项目”(The Billion Prices Project,BPP)。

研究团队在经济学家阿尔伯托·卡瓦洛(Alberto Cavallo)和罗伯托·瑞格本(Roberto Rigobon)的带领下,通过“网络抓取技术”(web scrap-ing),利用网上购物交易数据计算日常通胀指数,收集世界来自70个国家、300个零售商、共500万种在线商品的价格,建立了通胀指数的日发布系统。

相比传统CPI的月发布机制,“10亿价格项目”仅有3天的滞后期,几乎实现了通货膨胀的实时预测。

第二类是对非数量信息的收集整理。

比如如何从文本、图片、视频等素材中挖掘出结构化、数量化的信息。

这类工作除了要解决前述问题,还面临将非结构化数据转化为结构化数据这一更困难的艰巨任务。

对一项典型的文本数据挖掘工作而言,假定任务是从日常的新闻报道中挖掘出媒体对经济的信心指数,那么基本过程包括四步。

⑤第一步是选取部分文本,请专业人士进行标注以便分类,如可分类为“乐观、中性、悲观”三类,同一个文本可由三人分别标记,然后采取一定方法来计算语料标注的一致性,只有通过,方能被用于观点分类。

第二步是对文本进行特征抽取和选择,特征抽取方法包括基于规则的特征抽取和基于统计的特征抽取。

第三步是在特征抽取信息的基础上建立分类器,可同时考虑来源单位、作者身份、文本性质这三类信息,对已标注文本通过机器学习(如采用支持向量机算法)建立分类器。

第四步是将此分类器应用于分类未标注文本,并将分类结果转化为时间系列数据。

数据挖掘是在借鉴众多领域研究思想的基础上逐步发展的,借鉴了统计学的抽样估计、人工智能和机器学习的搜索算法、建模技术和学习理论,还借鉴了信息论、最优化、可视化、信号处理和信息检索等思想。

目前广为接受的数据挖掘处理模型是法耶德(Usama Fayyad)等人设计的多处理阶段模型。

利用该模型数据挖掘,意在集中寻求数据挖掘过程中的可视化方法,便于人机交互;利用该模型也可以增强对多媒体数据、文本数据和图像数据等各种非结构化或半结构化数据挖掘的准确性。

四、大数据与宏观经济预测大数据时代信息的实时和快速为及时高效的预测提供了可能,信息的规模庞大为准确合理的预测提供了机会。

大数据背景下的宏观经济预测将更加有效、实用。

国际上利用大数据进行经济分析与预测取得了一定的进展。

BPP项目利用网上购物交易数据计算日常通胀指数。

例如,BPP的数据显示,在雷曼兄弟公司2008年9月倒闭后,大部分美国企业几乎立刻开始削减价格,这表明总需求已经减弱。

相关文档
最新文档