2017年计算机视觉领域前沿展望报告

合集下载

计算机视觉技术的未来发展方向及前景展望

计算机视觉技术的未来发展方向及前景展望

计算机视觉技术的未来发展方向及前景展望计算机视觉是指利用计算机科学和技术,使计算机系统能够模拟人类的视觉功能和处理视觉信息的能力。

近年来,随着计算机技术的不断发展和性能的提升,计算机视觉技术也取得了巨大的进步。

从最早的简单图像处理到现在的深度学习和机器视觉算法,计算机视觉已经应用于许多领域,如人脸识别、智能安防、无人驾驶等。

那么,计算机视觉技术的未来发展方向又是什么?它的前景如何展望呢?一、深度学习的进一步发展深度学习是计算机视觉领域目前最热门的技术之一。

它通过神经网络的构建和训练,使计算机能够从海量数据中学习、理解和处理图像信息。

未来,深度学习在计算机视觉中的应用将进一步发展。

一方面,深度学习模型将会变得更加复杂和精确,能够更好地识别和区分不同的对象和场景。

另一方面,深度学习算法将会更加高效,并且能够在不断增长的数据量下保持良好的性能。

这将进一步推动计算机视觉技术的发展。

二、多模态融合的发展除了靠视觉信息,人类感知和理解世界还依赖于其他感官信息,如声音、触觉等。

在未来,计算机视觉技术将会与其他感知技术进行融合,实现多模态的信息处理和理解。

例如,图像识别和语音识别可以结合,实现更加准确和智能的智能助理系统;图像识别和触觉传感器可以结合,实现智能机器人的精准操作和控制。

多模态融合将会使计算机视觉技术具备更加全面和深度的应用能力。

三、视觉增强和增强现实的应用在未来,计算机视觉技术将进一步应用于视觉增强和增强现实领域。

视觉增强技术通过虚拟图像的投影和实际物体的融合,使用户能够看到超过人眼能力的视觉信息,从而实现对现实世界的增强感知。

增强现实技术则将虚拟信息与现实场景相结合,使用户能够在现实环境中与虚拟对象进行互动。

这些应用除了在娱乐和游戏领域有广泛应用外,还可以被用于医疗、教育等各个领域,提供更加丰富和沉浸式的体验。

四、自主感知和理解能力的提升计算机视觉技术在未来还将与其他人工智能领域相结合,实现计算机的自主感知和理解能力的提升。

计算机视觉技术应用的前景展望

计算机视觉技术应用的前景展望

计算机视觉技术应用的前景展望随着科技的发展,计算机视觉技术也随之飞快地发展。

作为人工智能的领域之一,计算机视觉技术的应用范围非常广泛,包括影视制作、医学诊断、安全监控、智能家居等多个领域。

那么,计算机视觉技术的前景展望是什么呢?让我们一起来深入探讨。

一、计算机视觉技术发展现状随着深度学习技术的不断成熟,计算机视觉技术在图像识别、物体检测、图像分割、图像生成等领域都取得了很大的进展。

深度神经网络模型也不断推陈出新,从最早的LeNet、AlexNet到现在的ResNet、Inception等模型,不断提高着计算机视觉技术的表现能力。

目前,计算机视觉技术在各个领域的应用也越来越广泛。

在自动驾驶领域,无人驾驶汽车依赖于计算机视觉技术识别道路标志、行车线、障碍物等信息实现驾驶;在医学诊断领域,计算机视觉技术可以辅助医生进行疾病诊断,如癌症筛查、CT扫描等;在智能家居领域,计算机视觉技术可以识别家中的人脸、智能家居设备等,实现智能化的家居管理。

二、计算机视觉技术的应用前景1、自动驾驶自动驾驶是计算机视觉技术在未来应用前景最为广阔的领域之一。

当前自动驾驶技术已经逐步进入到了商用化阶段,越来越多的汽车制造商和科技公司开始推出自己的自动驾驶汽车产品。

计算机视觉技术在自动驾驶领域中的应用主要包括了自动驾驶控制系统、智能交通管理系统、车与车之间的协同合作等。

未来,随着自动驾驶技术的不断发展,人们甚至可以在车内完成工作、学习、休闲等活动。

2、智能安防随着社会治安问题的日益突出,智能安防也正在成为计算机视觉技术的一个重要应用领域。

计算机视觉技术可以识别并记录场景中的人、车、物信息,对于异常情况可以及时进行报警,并对录像进行存储和管理。

未来,随着智能安防需求的不断增加,计算机视觉技术的应用范围和精度也将不断提升。

3、医学影像诊断计算机视觉技术不仅可以辅助医生进行疾病诊断,还可以为大规模的医学影像数据提供全面性的诊断结果,对于疾病早期诊断和防范具有重要意义。

计算机视觉领域的现状和发展趋势

计算机视觉领域的现状和发展趋势

计算机视觉领域的现状和发展趋势计算机视觉(Computer Vision)领域是人工智能领域的一个分支,是指让计算机像人类一样能够“看懂”图像和视频的技术。

计算机视觉是目前人工智能领域中最快发展的分支之一,已成为工业界和学术界的研究热点。

本文将从以下三个方面介绍计算机视觉领域的现状和发展趋势:技术现状、应用现状和未来发展趋势。

一、技术现状1.1 研究成果计算机视觉领域取得了许多重要的研究成果。

其中,深度学习(Deep Learning)是最具代表性的技术之一。

深度学习是一种基于多层神经网络的机器学习算法,其在计算机视觉领域的应用非常广泛。

例如,图像分类、目标检测、物体跟踪、语义分割等领域。

此外,计算机视觉领域的其他技术如光流估计、立体视觉、图像增强等也在不断发展。

1.2 研究方向计算机视觉领域的研究方向包括但不限于以下几个方面:(1)目标检测:目标检测是计算机视觉领域中的一个重要问题。

目前,最先进的目标检测算法都基于深度学习技术,如Faster RCNN、YOLO、SSD等。

(2)语义分割:语义分割是指将一张图片中的每个像素标注出其所属的类别,通常用来分割出目标物体。

语义分割在自动驾驶、医疗影像等领域有着广泛应用,如Mask RCNN算法。

(3)三维重建:三维重建是将二维图像转换为三维模型的过程,它在VR/AR、数字化重建等领域有着广泛应用。

(4)人脸识别:人脸识别是计算机视觉领域一个相对成熟的研究方向,包括人脸检测、人脸识别、人脸表情识别等,应用范围包括智能安防、手机解锁等方面。

1.3 研究挑战计算机视觉领域研究存在着许多挑战。

其中最主要的挑战之一是数据不足。

许多计算机视觉算法都需要大量的训练数据,但由于数据缺乏,导致算法的准确性受到限制。

此外,计算机视觉领域还存在诸如光照、姿态、遮挡等问题,这些问题也给算法的研究和应用带来了挑战。

二、应用现状计算机视觉技术在物体识别、图像分析、机器人视觉、智能家居、无人驾驶等领域得到了广泛的应用。

2017年计算机视觉行业市场调研分析报告

2017年计算机视觉行业市场调研分析报告

2017年计算机视觉行业市场调研分析报告目录第一节计算机视觉的诞生、发展与繁荣 (5)一、计算机“睁眼看世界” (5)二、计算机视觉的前世今生 (6)三、多因素共振,引爆计算机视觉市场 (11)第二节云和端再平衡,计算机视觉加速普及 (15)一、计算机视觉终端化促进实时监控 (15)二、计算机视觉结构化数据加速智能大数据分析 (19)三、计算机视觉为空间识别提供关键技术 (21)四、计算机视觉API普及生物特征识别服务 (22)第三节计算机视觉引爆人工智能应用场景 (26)一、智能驾驶生态逐渐成型 (26)二、智能安防带来无忧用户体验 (28)三、视觉技术活体检测实现安全加密 (28)四、智慧医疗大幅提升诊断效率 (30)五、增强现实扩展用户交互维度 (31)图表目录图表1:人类视觉系统与计算机视觉系统对比 (5)图表2:计算机视觉应用层次结构 (5)图表3:人工智能之父——马文•明斯基 (6)图表4:卷积神经网络典型结构 (8)图表5:特征提取与图像搜索系统 (8)图表6:历年ImageNet识别正确率 (9)图表7:机器学习/深度学习发展简史 (10)图表8:深度学习技术发展 (11)图表9:大数据存储量规模走势 (11)图表10:截至2015年人工智能创业公司数量(家) (13)图表11:截至2015年全球人工智能创业公司融资(百万美元) (13)图表12:全球计算机视觉市场规模. (14)图表13:中国视频监控市场规模 (14)图表14:结构化数据与非结构化数据 (15)图表15:通过图像分割提取图片特征 (15)图表16:海康威视智能交通摄像机 (16)图表17:iDS-2CD9365-SZ部分参数 (17)图表18:比亚迪疲劳驾驶预警系统摄像机 (18)图表19:比亚迪疲劳驾驶预警系统ECU (19)图表20:大华监控平台一体机服务后台数据处理 (20)图表21:大华智能公安管理平台 (20)图表22:新一代金融集中监控一体化平台 (20)图表23:FaceID技术特性 (23)图表24:HMI汽车互联网解决方案 (27)图表25:Road Hackers平台 (27)图表26:Biomio认证平台 (29)图表27:Biomio所提供的解决方案 (29)图表28:医疗成像 (30)图表29:2025年VR/AR软件规模及细分结构(10亿美元) (31)图表30:增强现实技术流程 (32)图表31:HoloLens计算机视觉硬件 (32)图表32:光学透视式现实增强系统 (33)图表33:HoloLens部分应用场景 (33)表格目录表格1:计算视觉理论三阶段 (7)表格2:深度学习主要模型 (10)表格3:近年成立的部分主要计算机视觉企业 (11)表格4:计算机视觉相关政策 (12)表格5:主流疲劳驾驶监测方式 (18)表格6:大华股份平台产品 (19)表格7:智能机器人关键技术 (21)表格8:阅面科技空间识别技术主要功能 (22)表格9:FaceID合作企业及业务 (23)表格10:商汤科技B轮融资 (24)表格11:人脸识别部分细分领域领先企业 (24)表格12:商汤科技人脸识别服务 (25)表格13:商汤科技合作企业及业务 (25)表格14:百度阿波罗计划 (26)表格15:自动驾驶技术排名 (27)第一节计算机视觉的诞生、发展与繁荣一、计算机“睁眼看世界”计算机视觉(Computer Vision, CV)是一门研究如何让计算机实现人类视觉系统功能的学科。

计算机视觉技术发展调研报告

计算机视觉技术发展调研报告

计算机视觉技术发展调研报告一、引言计算机视觉技术是计算机科学与人工智能领域的重要研究方向,它致力于让计算机能够模仿人类的视觉系统,通过图像和视频处理实现感知、理解和分析的能力。

本报告旨在对计算机视觉技术的发展进行调研分析,探讨其在各个领域的应用和未来发展方向。

二、计算机视觉技术的概述计算机视觉技术是通过利用计算机算法以及图像和视频处理技术,实现对图像和视频的感知、理解和分析。

它集合了计算机图像处理、模式识别、计算机图形学等多个学科的理论和方法,通过对图像的数字化处理,实现对图像特征的提取和识别,从而达到对图像内容的分析和理解的目的。

三、计算机视觉技术的应用领域1. 无人驾驶计算机视觉技术在无人驾驶领域有着广泛的应用。

通过对车辆周围环境的感知和分析,无人驾驶汽车可以实现自动行驶、智能导航等功能,提高行车安全性和驾驶效率。

2. 精准医疗计算机视觉技术在医疗领域有着巨大的潜力。

通过对医学图像的处理和分析,可以实现对疾病的早期诊断、手术导航和精准治疗等,大大提高医疗效率和准确性。

3. 工业自动化计算机视觉技术在工业自动化领域起到了关键作用。

通过对生产过程中的图像和视频数据的处理和分析,可以实现对产品质量的自动检测和控制,提高生产效率和产品质量。

4. 安防监控计算机视觉技术在安防监控领域有着广泛应用。

通过对监控视频的处理和分析,可以实现对异常行为的自动识别和报警,提高安全防范能力。

5. 增强现实计算机视觉技术在增强现实领域有着广泛的应用。

通过对真实世界的图像和视频的处理和分析,可以实现对虚拟信息的实时叠加和展示,提供更丰富、更直观的用户体验。

四、计算机视觉技术的发展趋势1. 深度学习的应用深度学习是计算机视觉技术的重要发展方向。

通过建立深度神经网络模型,可以实现对图像和视频特征的自动学习和提取,提高计算机视觉算法在各个领域的准确率和鲁棒性。

2. 高性能硬件的发展随着计算机硬件的不断发展,如GPU和FPGA的性能提升,计算机视觉技术的计算速度和处理能力将会大大提高,进一步推动技术的应用和发展。

计算机视觉的前景展望

计算机视觉的前景展望

计算机视觉的前景展望随着科技的不断进步,计算机视觉技术正在以惊人的速度迅猛发展,为各个领域带来了革命性的影响。

计算机视觉是一门涉及计算机和人工智能领域的交叉学科,致力于使计算机能够理解和解释图像和视频数据。

本文将探讨计算机视觉的当前发展状况以及它在未来的前景展望。

一、计算机视觉的当前应用1.1 自动驾驶汽车自动驾驶汽车是计算机视觉领域的一个重要应用领域。

通过计算机视觉技术,自动驾驶汽车可以通过感知环境中的交通标志、车辆和行人来做出决策,并自动驾驶。

这项技术正在改变人们对驾驶的认识,并有望在未来减少交通事故和提高交通效率。

1.2 人脸识别技术人脸识别技术是计算机视觉的又一个重要应用。

通过分析人脸图像中的特征点和面部轮廓, 计算机视觉可以精准地判断一个人的身份。

这项技术已广泛应用于安全领域,如人脸解锁、身份验证等,并且正在逐渐渗透到其他领域,如金融、医疗等领域。

1.3 视频监控与分析视频监控系统已经普遍存在于各个城市的公共场所。

计算机视觉技术可以对视频数据进行实时监控和分析,如异常物体检测、行为分析等。

这项技术的应用可以大大提高社会治安水平,减少犯罪事件的发生。

二、计算机视觉的未来发展2.1 增强现实技术随着计算机视觉技术的进一步发展,增强现实技术将会成为一个重要的应用方向。

通过结合计算机视觉和虚拟现实技术, 增强现实技术可以将虚拟对象与现实世界进行实时互动。

这种技术有望应用于游戏、教育、医疗等领域,为用户提供更加沉浸式和交互式的体验。

2.2 智能城市计算机视觉技术的发展也将推动智能城市建设的进程。

通过智能感知和分析,计算机视觉可以帮助城市管理者更好地监控和管理城市的交通状况、环境污染等问题。

这将有效提高城市的运行效率,提升人们的生活质量。

2.3 医疗领域计算机视觉技术在医疗领域的应用也将取得突破性的进展。

通过对医学图像的分析和解释,计算机视觉可以帮助医生提高疾病的诊断准确性。

此外,计算机视觉还可以用于手术辅助和智能医疗设备的研发,为患者提供更加安全和高效的医疗服务。

计算机视觉技术的发展趋势与前景展望

计算机视觉技术的发展趋势与前景展望

计算机视觉技术的发展趋势与前景展望近年来,计算机视觉技术在人工智能领域得到了广泛的应用,并取得了长足的发展。

计算机视觉技术,作为一种能够模拟和实现人类视觉功能的人工智能技术,已经在图像识别、目标检测、行为分析等领域取得了非常重要的成果。

本文将探讨计算机视觉技术的发展趋势,并展望其未来的前景。

计算机视觉技术的发展趋势如下:1. 深度学习的应用:深度学习是计算机视觉技术取得突破性进展的重要驱动力。

通过深度学习技术,计算机可以从海量的数据中学习和推断,实现图像识别、目标检测等复杂任务。

未来,随着深度学习算法的不断完善和硬件计算能力的提升,计算机视觉技术将迎来更广阔的应用领域。

2. 端到端的系统:传统的计算机视觉系统通常包含多个阶段,如特征提取、目标识别、检测与跟踪等。

然而,端到端的系统能够直接从输入图像中获得目标的输出,极大地简化了计算过程。

未来,端到端的系统将成为计算机视觉技术的发展方向,提高处理效率和准确度。

3. 多模态融合:计算机视觉技术通常通过分析图像来理解场景,但是图像信息是有限的,难以获取全面的场景信息。

多模态融合技术可以将图像、语言、声音等多种信息融合在一起,提供更全面的场景理解和分析能力。

未来,多模态融合将成为计算机视觉技术研究的重点之一。

4. 边缘计算的应用:边缘计算是指将计算、存储和网络等资源迁移到离数据源近的边缘节点上进行处理的技术。

在计算机视觉领域,边缘计算可以提高系统的实时性和响应速度,降低网络传输带宽和延迟。

未来,随着智能设备的普及和边缘计算技术的成熟,边缘计算将成为计算机视觉技术的重要应用方向。

计算机视觉技术的前景展望如下:1. 智能交互:计算机视觉技术可以使计算机具备与人进行自然交互的能力。

未来,随着计算机视觉技术的进一步发展,我们将看到更多的智能交互场景的出现,如人脸识别门禁系统、手势识别控制等,进一步提高人机交互的便捷性和智能性。

2. 智慧城市:计算机视觉技术在智慧城市建设中发挥着重要的作用。

计算机视觉技术发展现状与展望

计算机视觉技术发展现状与展望

计算机视觉技术发展现状与展望计算机视觉技术是近年来发展迅速的一项技术,其将图片或视频等视觉数据转化为数字信息,通过计算机自动识别、分析和理解这些数据,从而产生智能化的视觉应用。

计算机视觉涉及到许多领域,如图像处理、模式识别、机器学习等,并广泛应用于人工智能、自动驾驶、智能监控、医疗诊断等领域。

本文将从技术发展现状、应用场景、挑战与未来前景等角度,对计算机视觉技术进行分析和展望。

技术发展现状随着计算机科学与工程发展,计算机视觉技术也在不断突破,从最初的图像处理到今天的图像识别、物体跟踪、人脸识别等。

具体来说,计算机视觉技术发展至今已经有了以下几个发展阶段。

第一阶段是传统计算机视觉阶段。

在这一阶段,主要利用数字图像处理技术对图像进行滤波、增强、分割等处理,实现了如数字水印、人脸识别等技术。

第二阶段是基于特征学习的计算机视觉技术。

机器学习在这一阶段发挥了重要作用,以卷积神经网络(CNN)为代表的深度学习技术不断提升其性能,让计算机视觉逐渐具备“识别能力”,如对象物体检测、语义分割等。

第三阶段是基于深度强化学习的计算机视觉技术。

这一阶段的学习方式更接近于人类学习的方式,主要解决图像自动问答、场景理解等问题。

随着深度学习的发展,计算机视觉的应用范围也在不断扩展,如人脸识别、军事安防、智能交通、智能医疗等。

应用场景随着计算机视觉技术的不断发展,其应用场景也越来越广泛。

以下是计算机视觉在不同领域的应用场景:1. 人脸识别。

通过计算机分析人脸的特征,可以实现人脸识别。

这项技术广泛应用于身份验证、考勤管理等领域。

2. 智能安防。

计算机视觉技术可以通过视频监控实现智能安防,如视频监视、流量分析等,提高安全防范能力。

3. 自动驾驶。

计算机视觉技术在自动驾驶中也起着至关重要的作用,如车辆在行驶过程中识别路标、跟踪行人等。

4. 医疗诊断。

计算机视觉技术可以通过医学影像处理实现医疗诊断,如乳腺癌检测、X光诊断等。

挑战与未来前景计算机视觉技术的应用前景看似光明,但实际上其仍面临着不少挑战。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2017年计算机视觉领域前沿展望报告(此文档为word格式,可任意修改编辑!)2017年8月正文目录一、计算机视觉的发展现状与应用 (4)1.1 从传统图片处理方法跨入人工智能处理时代 (5)1.2 海量训练数据集解决计算机视觉瓶颈 (5)1.3 深度学习方法提升计算机视觉准确度 (6)1.4 计算机视觉在众多领域得到应用 (6)二、知名研究机构和创业团队 (7)2.1 国外研究机构和学术达人 (7)2.2 国内知名创业团队 (8)三、两大挑战赛 (10)3.1 ImageNet (10)3.2 MS COCO (16)四、三大顶级会议 (18)4.1 三大会议的介绍 (18)4.2 会议亮点回顾 (19)风险提示 (24)图表目录图1:计算机视觉与其他学科的相互关系 (4)图2:ImageNet竞赛 (11)图3:目标检测 (12)图4:目标定位 (13)图5:视频中的目标物体检测 (14)图6:场景分类 (15)图7:场景分割 (16)图8:目标检测和分割 (17)图9:关键点检测 (17)图10:图片描述 (18)图11:给机器“看电视剧”预测人类行为 (20)图12:基于深度学习的手势识别 (21)图13:微软全息“穿越”技术:HoloPortation (22)图14:人工智能为视频配音 (23)图15:深度学习识别YouTube视频内容 (23)图16:社会化行走机器人Jackrabbot 懂礼貌会排队 (24)表格目录表1:2012年以来ImageNet图像分类大赛冠军成绩 (6)表2:计算机视觉技术在众多领域得到应用 (7)表3:国外著名高校计算机视觉相关实验室 (8)表4:ImageNet 2016中国团队包揽众多冠军 (12)一、计算机视觉的发展现状与应用1.1 从传统图片处理方法跨入人工智能处理时代计算机视觉(Computer Vision)研究如何让计算机可以像人类一样去理解图片、视频等多媒体资源内容。

例如用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等,并进一步处理成更适合人眼观察或进行仪器检测的图像。

近些年在海量的图像数据集、机器学习(深度学习)方法以及性能日益提升的计算机支持下,计算机视觉领域的技术与应用均得到迅速发展,图1:计算机视觉与其他学科的相互关系①、传统的图片处理依据数字图像的基本特性进行处理,例如常见美图软件中的祛斑效果就属于图像处理中的图像增强部分。

伴随着图像处理技术的不断提升,对于图像的简单处理已经不能满足人们的使用需求,模式识别便成为新的发展方向。

②、模式识别方法着眼于图像间的不同,使得计算机可以像人类一样很方便地分辨出两幅图片的差异。

例如指纹识别就是模式识别中的一个经典应用。

可以说模式识别已经踏入了人工智能的领域。

③、人工智能方法利用的是最新的卷积神经网络技术,自动生成足以区分不同图片的强大特征。

迈入人工智能领域,可以说计算机视觉已经可以像人类一样去看,去理解。

尽管神经网络不断刷新着计算机视觉的表现成果,但对于人类来说依然是一个黑匣子,究竟是什么造就了神经网络的强大能力,尚需学术界、工业界进一步的探索与研究。

1.2 海量训练数据集解决计算机视觉瓶颈计算机视觉的传统挑战是图片分类,即让计算机拥有可以识别图像中物体的能力。

对于图片分类问题,计算机就像一个学生,需要人类为它提供图片和图片对应的标签来告诉计算机图片上究竟有什么。

计算机虽然有强大的计算能力,但是却缺乏人类一样的智慧,需要给予大量有标注的图片。

对于已有的数据集,目前传统的算法已经足够优秀。

MNIST手写数字数据集的错误率已经达到0.3%。

计算机视觉的进一步发展需要新的图片数据集,但数据标注需要耗费大量人力物力,一般实验室很难完成如此艰巨的工作。

直到现任斯坦福人工智能实验室和斯坦福视觉实验室主任李飞飞教授(近期公开宣布加入 Google并担任Google Cloud Machine Learning负责人)带领团队,于2007年发起、2009年创建完成的图像识别数据集ImageNet解决了这个问题。

该数据集不仅图片种类达到惊人的1000种,同时每一类都含有超过1000张图片。

新的海量数据集的出现挑战了计算机视觉的传统技术,推动了计算机视觉领域技术的发展,也让卷积神经网络一展所长。

1.3 深度学习方法提升计算机视觉准确度目前计算机视觉领域最为流行也最为有效的技术是卷积神经网络。

它是一种常见的深度学习架构,相比传统神经网络,卷积神经网络体积更小,能力更强。

得益于现在强大的GPU并行运算能力,卷积神经网络已经由最开始的8层的AlexNet,到16层的VGGNet,再到152层ResNet,甚至更高,在ImageNet比赛中所取得的成绩也越来越优秀,自从2012年Hinton团队首次在该赛事中使用深度学习以来,Top5分类错误率已经从26.1%降低到不足3%。

表1:2012年以来ImageNet图像分类大赛冠军成绩1.4 计算机视觉在众多领域得到应用计算机视觉作为人工智能的研究方向之一,主要目的在于使得计算机能识别、分辨甚至理解不同的图像、视频及复杂场景。

在自动驾驶、机器人、AR/VR、金融、安防以及医疗领域均得到应用。

表2:计算机视觉技术在众多领域得到应用二、知名研究机构和创业团队2.1 国外研究机构和学术达人国外计算机视觉相关的研究,除了耳熟能详的Google、微软、Facebook等工业界科技巨头有所涉及之外,一些著名高校也设有专门的实验室,如斯坦福、麻省理工以及伯克利等。

表3:国外著名高校计算机视觉相关实验室2.2 国内知名创业团队依图科技依图科技创立于2012年,从图像识别入手,首先与全国省市级公安系统合作,对车辆品牌、型号等进行精准识别,随后扩展到人像识别,通过静态人像比对技术和动态人像比对技术,协助公安系统进行人员身份核查、追逃、监控、关系挖掘等。

近些年来依图科技的产品已经应用到全国二十多个省市地区的安防、智慧城市和健康医疗等领域,协助政府构建“城市大脑”,也希望将医疗领域的巨大知识鸿沟缩小,改善医患体验。

商汤科技SenseTime商汤科技成立于2014年,致力于引领人工智能核心“深度学习”技术突破,构建人工智能、大数据分析行业解决方案。

聚集了当下华人中深度学习、计算机视觉科学家,以及来自于谷歌、百度、微软、联想等一批产业界的领军人物。

公司在2014年已经在人脸识别和物体识别上分别超过了Facebook和Google,并在同年获得风投千万美元注资。

目前,已经开始对外提供人脸识别技术及集成了人脸识别、危险品识别、行为检测、车辆检测等的安防监控系统。

在业务上,主要深耕金融、移动互联网、安防监控三大行业。

旷视科技旷视科技成立于2011年,公司专注于人脸识别技术和相关产品应用研究,2012年9月推出视觉服务平台Face++0.9版本。

面向开发者提供服务,能提供一整套人脸检测、人脸识别、人脸分析以及人脸3D技术的视觉技术服务,主要通过提供云端API、离线SDK、以及面向用户的自主研发产品形式,将人脸识别技术广泛应用到互联网及移动应用场景中。

Face++与众多互联网公司合作,并通过“脱敏”技术掌握了500万张人脸图片数据库,互联网图片人脸识别LFW准确率达到99.6%,合作伙伴包括阿里、360等一批图片、社交、设备类企业。

云从科技云从科技成立于2015年,专注于计算机视觉与人工智能,核心技术源于四院院士、计算机视觉之父——ThomasS.Huang黄煦涛教授。

核心团队曾于2007年到2011年6次斩获智能识别世界冠军,得到上市公司佳都科技与香港杰翱资本的战略投资。

公司主要技术团队来自中国科学院重庆分院,是中科院研发实力最雄厚的人脸识别团队,并作为中科院战略性先导科技专项的唯一人脸识别团队代表参与了新疆喀什等地安防布控。

格林深瞳格灵深瞳成立于2013年,自主研发的深瞳技术在人和车的检测、跟踪与识别方面居于世界领先水平。

公司借助海量数据,让计算机像人一样看懂这个世界,实时获取自然世界正在发生的一切,打造自然世界的搜索引擎,目前公司产品在金融、零售、公安、司法及智能交通等领域均有应用。

三、两大挑战赛计算机视觉领域比较知名的两大挑战赛分别是ImageNet和MS COCO。

ImageNet数据集主要由斯坦福大学李飞飞教授团队牵头创建,比赛重在评测算法识别图像中显著物体的能力,深度学习算法正是在2012年ImageNet大赛将分类错误率从传统方法26.1%降到16.4%而引起业界的广泛关注。

MS COCO数据集主要由微软赞助,大赛更倾向于评测复杂场景中识别各类物体的能力。

3.1 ImageNetImageNet竞赛(全称ImageNet Large Scale Visual Recognition Challenge,即ILSVRC)一直被誉为国际计算机视觉领域的“奥林匹克”,历次竞赛结果对工业界以及学术届都会产生深远的影响,并且作为风向标指引着未来计算机视觉的发展方向。

ImageNet一直吸引诸多活跃的顶尖研究团队参与其中,不断刷新各比赛项目的记录。

图2:ImageNet竞赛今年ImageNet 2016分为五大部分,包括目标检测、目标定位、视频中目标物体检测、场景分类、场景分割。

与去年相比今年增加了一项场景分割任务。

这五类任务都是计算机视觉领域基础的人工智能任务,有广阔的工业应用前景。

五项任务提供了基础的训练集和测试集,各参赛队伍在训练集上训练,在测试集上完成测试,提交测试结果,然后由组委会统一评估性能并给出排名。

ImageNet 2016 已于 9 月份宣布结果,共计 85 只参赛队伍,344 次提交,同比增长超过一半。

目标检测的 mAP(综合衡量检测召回率+准确率的指标,下同)从去年的 62.07%提升到 66.27%;定位错误从 9.02%降到 7.71%,top5 分类错误率从 3.57%降到 2.99%;视频检测的 mAP 从67.82%提升到 80.83%;场景分类有 28 个队伍,92 次提交, top5 分类错误率从16.87%降低到 9.01%;场景分割有23 个队伍, 80 次提交,最后的平均性能 57.21%。

本次比赛中来自中国学术界和工业界团队包揽了多项冠军。

表4:ImageNet 2016中国团队包揽众多冠军①、目标检测:该项任务在于考核选手所提供的算法模型能够从4万张图像中准确检测到200类物体的具体位置,并且一幅图像往往包含多个不同类别的物体。

ImageNet的物体检测挑战对技术能力要求极高:200类物体在颜色、纹理、形状、长宽比、形变等方面差异巨大;即便属于同一类别,光线、角度、遮挡、部件变形扥因素也使得物体间存在显著的差异。

相关文档
最新文档