计算机新技术报告

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计算机新技术专题课程报告

课题名称:计算机新技术

课题负责人名(学号):

同组成员名单(角色):

指导教师:

评阅成绩:

评阅意见:

提交报告时间:2013年 11月 4日

计算机新技术

计算机科学与技术专业

学生

[摘要]大家应该还记得《黑客帝国》里面Neo躲避枪林弹雨的高难度动作,这部电影,充满了大数据与人工智能的色彩。算法师通过对数据库的标记、对数据库的检测、编排,甚至对敌人发出攻击,当时看起来相当科幻的镜头,如今已经是被广泛运用的技术。

关键词:人工智能神经网络物联网

大家应该还记得《黑客帝国》里面Neo躲避枪林弹雨的高难度动作,这部电影,充满了大数据与人工智能的色彩。算法师通过对数据库的标记、对数据库的检测、编排,甚至对敌人发出攻击,当时看起来相当科幻的镜头,如今已经是被广泛运用的技术。

所谓大数据,即是从各种各样类型的数据中,快速获得有价值信息的能力。明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。

从亚马逊的比价推荐,到微软纽约研究院的经济学家对奥巴马政府、奥斯卡颁奖礼和NBA联盟数据的精准预测,已充分证明这不是一项噱头技术。

大数据有四个明显的优势:第一,数据体量巨大。从TB级别,跃升到PB级别;第二,数据类型繁多。如网络日志、视频、图片、地理位置信息等等。第三,价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。第四,处理速度快。

人工智能是一个非常复杂的方向,也是一个跨学界的计算机学科,涉及到其他方面的知识,主要内容在于计算机学习人类的自然语言处理。我们无需去遐想如智能终结者这样科幻的画面,那是科学家要研究的事。现实生活中,我们已经看到越来越多的大数据与人工智能结合的产品,如苹果的Siri,它包含的语音识别(Speech Recognition),是自然语言处理(Natural Language Processing)的一部分。在实际的应用中,起到了不少作用,包括智能手机上的服务调配,能解决用户日常的需求。

热炒大数据并不是纯粹跟风,其重点是要解决人工智能的扩展性和成长问题。传统人工智能走过了漫漫几十年路程,近三十年的变化尤其缓慢。这是因为虽然对任何给定的确定问题和场景,传统人工智能都可以解决,但尴尬的是,人们不可能预先穷举出所有例子和参数,因此人工智能已有的模型和算法很难跨系统复制。

众多学者、产业精英赋予了基于大数据的智能分析以美好的愿景,即数字化

社会一旦形成,生活中的一切都可以基于数据来描述。这些描述出来的信息将成为智慧成长和决策判断的依据。如果计算机能够找出其背后的学习规律和方法,人类智慧的跨领域扩展性就能在计算机的虚拟世界中得到体现,并能做出模糊判断。更重要的是,这样的分析系统将具备人工智能前所未有的基础能力——学习能力,还可以根据环境(数据)变化而不断地增长其智能性,甚至具备推而广之的扩展性。

从理论上说,一旦机器具有学习能力,计算机系统就将具备人的典型特质——创造力。如果沿着这个思路扩展,基于大数据的智能分析,将进一步替代传统服务体系中必须由人来完成的工作,特别是最高成本的部分。

不过,大数据的智能分析是否真的能够达到梦想的高度,还存在很大的不确定性,而且全数字化社会的形成也还需要时间。

大数据的前景大方向是符合趋势的,但具体产品和数据处理能力,可能是最终成败的因素。如何获得大量数据,数据的质量、相关性以及是否有好的处理能力和技术,最终应用的方向是商业化的关键。

那么这是否就是大数据与人工智能结合的切合点?我们来看看简单原理:在《大数据时代:生活、工作与思维的大变革》一书中,作者维克托·迈尔-舍恩伯格提到,现在的电脑系统是根据编写程序时明确要求它们遵循的规则来进行运算的。因此,当一个结果偶尔无可避免地出错的时候,我们可以回过头重新编码。比如,我们可以问“为什么外部传感器发现湿度突然大幅上升时,自动驾驶系统会将飞机抬高五度?”今天的电脑代码可以被打开检查,人们可以追踪并理解运算的基础,无论这个基础如何复杂。

但是,有了大数据分析之后,这种追踪就会变得困难许多。算法预言的基础可能会复杂得让常人难以理解。大数据具有“不可解释性”。当电脑根据程序编写的明确要求遵循系列指令,比如IBM在1954年发展的将俄语翻译为英语的程序,人可以轻易理解为什么软件会用一个词代替另一个词。但谷歌翻译在判断英语单词“light”是该翻译成法语的“lumière”还是“léger”时(即描述“光”还是“重量”),却动用了数十亿页的翻译资料。一个人不可能追踪到程序作出最后选择的准确原因,因为这些选择是基于海量的数据和大量的统计运算的。同时,由于大数据的规模体量,其运作的规模也超乎我们的想象。比如,谷歌分辨几个搜寻关键词和流感的关联是测试4.5亿个数学模型的结果。相对地,MIT统计学助理教授辛西娅·鲁丁,为检修孔是否会着火设计了106个预测指标,而且她可以向联合爱迪生电力公司的经理们解释,为什么她的程序优先了某些检查位置。

人工智能界所说的“可解释性”,对于我们常人来说是很重要的,我们总是想知其所以然,而不仅是知其然。可是,如果系统自动生成了601个预报,而不是106个呢?如果这601个中大多数都不是特别重要,但把它们放在一起,就会提升模型的精确性?任何预报的基础都可能非常复杂。要说服经理们重新分配有限的预算,她该告诉他们什么呢?

在这个情景中,我们可以看到,大数据预报的风险,及其背后的算法和数据集,可以变成不可说明、不可追踪,甚至不可信的黑匣子。要防止这样的事情发生,大数据需要监控和透明,这就要求新的专业知识和机构。这些新成员会帮助社会仔细检查某些领域的大数据预报,会让被数据伤害的人得到平反。

算法师因此而崛起。在社会上,当一个特定领域的复杂性和专业性大幅上升,因而对管理新技术的专家产生紧急需求时,我们常会看到这些新实体出现。法学、医学、会计和工程学的专业人才在超过一世纪前就经历了这种巨变。最近,电脑

相关文档
最新文档