2017-智能语音语义发展趋势
语音识别技术的现状和未来发展趋势

语音识别技术的现状和未来发展趋势在这个信息化和智能化的时代,语音识别技术成为了一个备受关注的话题。
无论是个人用户还是企业用户,都希望能够通过语音识别技术快速高效地完成一些操作,提高生产和工作效率。
那么,语音识别技术的现状是怎样的呢?它存在哪些问题?未来发展的趋势又是什么?一、语音识别技术的现状语音识别技术是利用计算机技术对人类语言进行识别和理解的一种技术。
目前,语音识别技术已经得到了广泛应用,例如智能语音助手、语音输入、智能家居、智能客服等等。
在百度、科大讯飞、阿里云、微软、Google等大型科技公司的带动下,语音识别技术和语音交互技术正在不断得到发展和优化。
目前,语音识别技术的准确率已经达到了较高的水平,但仍然存在着一些挑战和困难。
1. 语音识别准确率不够高目前,语音识别准确率已经达到了较高的水平,但仍然存在着一些问题。
例如,语音信噪比较差时,语音识别准确率会大幅降低;语音识别对于方言和口音的识别准确率也比较低。
这对于一些特定的用户群体而言,会造成不便和影响。
2. 语音识别技术的反应速度和稳定性还需提高当前语音识别技术对于简单的指令和问题的识别已经比较可靠,但是语音识别技术的反应速度和稳定性还需要进一步提高。
有时候,语音识别技术会产生延迟等问题,这对于用户而言会造成不便和影响。
3. 语义理解和对话管理还需加强除了基础的语音识别之外,语义理解和对话管理也是语音交互技术中的两个关键环节。
目前,语音识别技术依然存在着一些误识别和困惑的问题,因此对于语义理解和对话管理的需求也越来越大。
二、未来语音识别技术的发展趋势随着人工智能和大数据技术的不断发展,语音识别技术也在不断地得到发展和提升。
从目前的趋势来看,未来语音识别技术的发展趋势主要有以下几个方向。
1. 语音识别技术将更加智能化和精确化随着深度学习技术的不断发展,未来语音识别技术将更加智能化和精确化。
大型科技公司正在不断优化其语音识别算法,这将为用户提供更好的语音交互体验。
人工智能语音识别之前沿技术与发展趋势

人工智能语音识别之前沿技术与发展趋势一、前沿技术人工智能语音识别(Automatic Speech Recognition,ASR)是一门涉及语音识别、音频信号处理、自然语言处理等多学科交叉的科技。
ASR技术从简单的数字识别到语音合成及自然语言交互等领域都发挥着重要作用,在自动化、信息化和智能化领域具有广泛的应用价值。
ASR技术发展经历了漫长的历史,主要经历了以下几个阶段:1.特征提取阶段:早期的语音识别技术主要采用模式匹配来进行语音识别,而最初的模式匹配算法大部分都基于像Mel频率倒谱系数(MFCCs)之类的人工特征,以及动态时间规整(Dynamic Time Warping,DTW)之类的算法。
2.统计模型阶段:随着计算机性能的提高,新的参数建模方法得以应用,如隐马尔可夫模型(Hidden Markov Model,HMM)和贝叶斯网络方法等。
3.深度学习阶段:自20世纪90年代中期以来,深度学习技术发展迅速,为ASR技术带来了一次重大革命。
现今的ASR模型使用卷积神经网络(Convolutional Neural Network,CNN)、循环神经网络(Recurrent Neural Network,RNN)和深度神经网络(Deep Neural Network,DNN)等先进的深度学习架构,提升了语音识别的准确度。
二、发展趋势1.语义理解能力逐渐增强ASR技术的一个关键发展趋势是通过深度学习模型来增强语义理解能力,使得语音识别能够更好地理解自然语言。
语义理解是指将语音转化为意义,而不是简单匹配字词,这对于提高语音识别的准确度和实用性都至关重要。
2.多模态输入分析随着人们生活方式的变化,ASR技术正在逐步向多模态输入分析方向发展。
多模态输入分析指的是从多种语音输入源中获取数据,如语音、图像和视频数据,利用多种特征提取和深度学习模型进行训练,从而提高语音识别的准确度和可靠性。
3.嵌入式应用近年来,物联网技术的迅速发展和终端设备的智能化趋势,催生了嵌入式ASR技术的快速发展。
2017年人工智能行业现状与发展趋势报告

目录CONTENTS1人工智能行业产业链结构2人工智能行业整体市场发展3人工智能行业投资现状4人工智能行业发展前景人工智能行业产业链结构l人工智能产业链结构l人工智能基础技术提供平台l人工智能技术平台l人工智能应用领域PART 01人工智能产业链结构人工智能产业链的主要包含三个核心环节——基础技术、人工智能技术和人工智能应用。
其中,基础技术主要包括数据平台、数据存储以及数据挖掘等,人工智能技术包括语音识别、自然语言处理、图像识别和生物识别等,人用智能应用有工业4.0、无人驾驶汽车、智能家居、智能金融、智慧医疗、智能营销、智能教育以及智能农业等。
基础技术支撑数据平台数据存储数据挖掘计算智能语音识别自然语音处理图像识别生物识别感知智能机器学习预测类API 人工智能平台认知智能工业4.0无人驾驶汽车智能家居智能金融智慧医疗智能营销智能教育智能农业基础技术支撑人工智能技术人工智能应用人工智能产业链结构IaaS代表企业:阿里云、电信天翼云、联通沃云、Ucloud 、青云、万国数据、首都在线等。
基础设施即服务,它是把ICT 基础设施作为一种服务提供的商业模式。
用户通过Internet 可以从服务提供商那里得到完善的计算机基础设施服务。
这些服务包括服务器或虚拟服务器的计算资源、处理能力及基础网络。
PaaS代表企业:科大讯飞、环信、容联、亲加、云知声、思必驰等。
PaaS 的功能主要体现在将现有各种业务能力进行整合,向下根据业务能力需要测算基础服务能力,通过IaaS 提供的API 调用硬件资源,向上提供业务调度中心服务,实时监控平台的各种资源,并将这些资源通过API 开放给SaaS 用户。
SaaS代表企业:百度云、用友云、浪潮、 Ucloud、 Oracle、Infor、Microsoft 等。
SaaS 是一种通过Internet 提供软件的模式,厂商将应用软件统一部署在自己的服务器上,客户可以根据自己实际需求,通过互联网向厂商定购所需的应用软件服务,按定购的服务多少和时间长短向厂商支付费用,并通过互联网获得厂商提供的服务。
中国人工智能语音语义应用行业市场现状及未来发展前景预测分析报告

中国人工智能语音语义应用行业市场现状及未来发展前景预测分析报告博研咨询&市场调研在线网中国人工智能语音语义应用行业市场现状及未来发展前景预测分析报告正文目录第一章、人工智能语音语义应用行业定义 (3)第二章、中国人工智能语音语义应用行业综述 (4)第三章、中国人工智能语音语义应用行业产业链分析 (6)第四章、中国人工智能语音语义应用行业发展现状 (7)第五章、中国人工智能语音语义应用行业重点企业分析 (9)第六章、中国人工智能语音语义应用行业发展趋势分析 (10)第七章、中国人工智能语音语义应用行业发展规划建议 (11)第八章、中国人工智能语音语义应用行业发展前景预测分析 (12)第九章、中国人工智能语音语义应用行业分析结论 (14)第一章、人工智能语音语义应用行业定义人工智能(AI)技术的迅猛发展正在深刻改变着我们的生活和工作方式。
语音语义技术作为AI领域的重要分支之一,近年来取得了显著进展,并广泛应用于多个行业。
本章将详细探讨人工智能语音语义应用行业的定义及其核心特征,并通过具体数据来展示该领域的现状与发展潜力。
一、行业概述人工智能语音语义应用行业主要涉及自然语言处理(NLP)、语音识别(ASR)、语音合成(TTS)等关键技术的研发与商业化应用。
这些技术能够使机器理解和生成人类语言,从而实现更智能的人机交互体验。
该行业涵盖了从基础技术研发到产品开发、服务提供等多个环节,形成了一个完整的产业链条。
二、市场规模与增长趋势2022年全球人工智能语音语义市场规模已达到约450亿美元,预计到2027年这一数字将突破1,200亿美元,复合年增长率高达22%。
这表明随着技术不断成熟及应用场景日益丰富,市场需求呈现出强劲的增长态势。
三、主要应用领域1. 智能家居:2022全球智能音箱出货量超过1.5亿台,同比增长10%,成为推动语音交互技术普及的重要力量。
例如亚马逊Echo系列、谷歌Home等产品深受消费者喜爱。
人工智能中的智能语音助手

人工智能中的智能语音助手智能语音助手作为人工智能技术中的一个重要应用,近年来逐渐成为了人们生活中的必备品。
从最初的普及到家庭生活中的TTSS、到当前火爆的Siri、小度、百度等应用,智能语音助手在方便人们生活的同时也不断地在进化。
本文将探讨智能语音助手在人工智能中的角色、应用和发展趋势。
一、智能语音助手在人工智能中的角色人工智能领域中,智能语音助手的角色十分重要。
这是因为智能语音助手依赖于语音识别、自然语言处理、语音合成等人工智能技术,而这些技术均在人工智能中占据了重要地位。
因此,智能语音助手可以说是人工智能技术的一个典型应用。
此外,智能语音助手还在人工智能技术的研究中起到了重要的作用。
例如,在人工智能的自然语言处理领域,研究人员可以通过对智能语音助手的语音识别、语义理解等方面进行研究,来提高人工智能领域中自然语言处理的技术水平,进而拓展人工智能的应用领域。
二、智能语音助手的应用1.智能家居智能语音助手最早的应用之一是在智能家居中。
智能家居系统通常由多个设备组成,例如智能灯、智能电器、智能门锁等。
通过使用智能语音助手,用户可以通过语音指令对这些设备进行控制。
例如,用户可以通过说“打开客厅的灯”来控制智能灯的开关。
2.智能开车随着智能语音助手的发展,智能驾驶也成为了一个新的应用领域。
在智能驾驶中,智能语音助手可以帮助驾驶员进行导航、音乐播放、电话接听等操作,提升驾驶员的体验和安全性。
如当前车载语音助手中,能够提供高德地图、腾讯地图等多种地图导航功能,搭载在车内,通过语音识别就能够得到对应的导航路线。
3.智能金融智能语音助手在金融领域中的应用也越来越广泛。
例如,用户可以通过智能语音助手查询自己的银行卡余额、还款日期等信息,也可以进行转账、理财等操作。
三、智能语音助手的发展趋势1.从单一应用到多样化应用当前,智能语音助手的应用领域正在逐渐扩展,从简单的家居控制到驾驶、健康、娱乐等各个方面。
未来智能语音助手可以贯穿用户日常生活的方方面面,具有极大的潜力和发展前景。
AI语音翻译技术发展现状与未来趋势分析

AI语音翻译技术发展现状与未来趋势分析导言:随着全球化的不断推进,人们之间的交流变得越来越频繁和紧密。
然而,不同国家和地区的语言差异成为了一道难以逾越的壁垒。
为了解决这一问题,AI语音翻译技术应运而生,并迅速发展起来。
本文将为你分析AI语音翻译技术的现状和未来发展趋势。
一、AI语音翻译技术的现状1.研究成果丰硕近年来,AI语音翻译技术取得了显著的进展。
研究机构和科技公司针对该领域进行了大量的投入,并取得了丰硕的成果。
例如,Google的神经机器翻译系统(GNMT)已经能够实现在多个语言之间进行实时的语音翻译。
2.商业应用扩展AI语音翻译技术不仅在科研领域取得了突破,也在商业领域得到了广泛应用。
许多手机应用程序和智能音箱已经集成了语音翻译功能,用户可以通过语音输入实现语言间的即时翻译。
这样的商业应用为人们的多语言交流提供了便利。
3.准确性逐渐提升AI语音翻译技术的准确性也在逐步提升。
通过深度学习和神经网络技术,语音翻译系统能够学习和理解不同语言之间的语法规则和上下文信息,从而更准确地进行翻译。
然而,对于某些复杂的语义和文化背景,仍然存在翻译不准确的情况。
二、AI语音翻译技术的未来趋势1.实时交互能力的提升随着技术的不断进步,AI语音翻译技术将朝着实时交互的方向发展。
将AI语音翻译技术应用于视频会议、语音助手等场景,能够实现实时的语音翻译,帮助不同语言背景的人们进行流畅的交流。
2.多语种支持的拓展AI语音翻译技术将会拓展支持更多语种的翻译。
除了主流的语言,更多的小语种和地方语言也将得到支持,这将在跨文化交流和旅游等方面起到积极的促进作用。
3.个性化定制的普及未来,AI语音翻译技术也将朝着个性化定制的方向发展。
通过深度学习和用户数据的分析,系统将更加了解每个用户的偏好和特点,提供更符合个体需求的翻译服务,使翻译更加准确和个性化。
4.与其他AI技术的融合AI语音翻译技术还将与其他AI技术如机器学习、计算机视觉等进行深度融合,实现更全面、全感官的翻译服务。
语音识别技术的发展趋势与应用前景

语音识别技术的发展趋势与应用前景随着科技的不断进步和智能化的发展,语音识别技术作为一项重要而炙手可热的技术,正逐渐进入人们的视野。
本文将介绍语音识别技术的发展趋势以及其在各个领域的应用前景。
一、语音识别技术的发展趋势1.1 神经网络技术的崛起随着深度学习技术的发展与应用,神经网络已经成为语音识别中的主流模型。
深度神经网络具有强大的泛化能力和学习能力,能够处理大量的数据和复杂的语音情境,这使得语音识别的准确率得到了极大的提高。
1.2 多模态融合技术的应用随着人机交互的要求越来越高,语音识别技术与其他感知技术的结合成为一种趋势。
例如,将语音识别与图像处理技术相结合,可以实现更精准的场景识别和语义理解,提升语音识别的效果和应用范围。
1.3 端到端的语音识别模型传统的语音识别系统通常由前端特征提取、声学模型和语言模型等多个模块组成,复杂而繁琐。
而端到端的语音识别模型直接将语音信号映射为文本,简化了模型结构,降低了系统延迟,提高了识别效果。
二、语音识别技术的应用前景2.1 智能助手语音识别技术在智能助手领域有着广泛的应用。
诸如苹果的Siri、微软的Cortana、亚马逊的Alexa等智能助手已经成为人们生活中不可或缺的一部分。
通过语音识别技术,智能助手能够以自然语言进行交互,为用户提供各种信息和服务。
2.2 无线耳机与智能音箱语音识别技术的进步也带来了无线耳机与智能音箱领域的革新。
我们可以通过声音指令来控制和操作这些设备,实现音乐播放、设备控制、智能家居管理等功能,为用户带来更加便捷的体验。
2.3 自动驾驶语音识别技术在自动驾驶领域的应用也日益广泛。
通过语音指令,驾驶员可以实现对车辆的操作和控制,避免分散注意力对驾驶安全产生的风险。
同时,语音识别也可以用于车辆内部的语音交互系统,提供更加智能的车内服务。
2.4 医疗领域语音识别技术在医疗领域的应用前景可谓广阔。
通过语音识别技术,医生可以通过语音指令快速记录病人的情况和诊疗方案,提高工作效率。
智能语音助手让你的生活更智能化

智能语音助手让你的生活更智能化随着科技的不断发展,智能语音助手逐渐成为我们日常生活中的重要伙伴。
通过语音控制,智能语音助手能够帮助我们完成各种任务,使生活更加便捷和智能化。
本文将探讨智能语音助手的功能和应用,以及它们在不同领域中的作用。
一、智能语音助手的功能和应用智能语音助手是一种基于人工智能的技术,能够通过语音识别、语义分析和自然语言处理等技术,与用户进行交互,并为用户提供信息和服务。
目前市面上有许多智能语音助手的产品,如苹果的Siri、亚马逊的Alexa、微软的Cortana等,它们在不同的设备上都有广泛的应用。
智能语音助手有多种功能,比如语音搜索、语音控制、提醒和推送、语音翻译等。
通过语音搜索,我们可以直接向语音助手提出问题,它会通过搜索引擎为我们提供答案。
语音控制功能可以帮助我们控制设备,如智能家居中的灯光和空调等。
提醒和推送功能可以根据用户的日程安排和兴趣爱好,为用户提供相关的信息和推荐。
语音翻译功能可以将我们的语音实时翻译成其他语言,方便我们在国际交流中使用。
智能语音助手在日常生活中有广泛的应用。
我们可以将其应用于智能家居中,通过语音控制家电设备,实现智能化的生活。
在驾驶中,我们可以通过语音助手进行导航、播放音乐等操作,提高行车安全性。
在办公场景中,我们可以通过语音助手实现会议记录、事项提醒和日程安排等功能,提高工作效率。
二、智能语音助手在不同领域中的作用1. 教育领域智能语音助手在教育领域有着广阔的应用前景。
它可以帮助学生进行语音搜索,快速获取与学习相关的信息。
同时,通过语音助手与学生进行互动,可以提供个性化的学习方案和反馈,帮助学生更好地掌握知识。
此外,智能语音助手还可以在语言学习中发挥重要作用,通过语音翻译功能,学生可以实时翻译和学习其他语言。
2. 健康医疗领域智能语音助手在健康医疗领域中也具备广泛的应用价值。
它可以帮助医生进行语音记录和查询病历,提高诊疗效率和准确性。
同时,智能语音助手可以提供医疗知识和保健信息,帮助人们更好地管理自己的健康。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
体制之外,以英语流利说为代表的口语评测应用也广受C端用户好评。依靠四年时间积累的 3000万用户数据、500万小时练习录音,流利说于2016年推出可替代口语老师的自适应移动 英语课堂“懂你英语”,加上辅助在线答疑及外教上课,有望领先一步实现自适应口语学习 的商业化落地。 智能语音在教育领域的价值,一方面在于提高教师工作效率,另一方面在于帮助学生提升学 习效果。通过大量语音数据的积累,并和后端大数据分析、机器学习相结合,智能语音有望 在机器辅助学习和自适应学习方面发挥重大作用,为教育行业带来颠覆性变革。
C端应用:变革交互方式,,而需求又十分明确,因此智能语音成了 这一场景下最合适的交互方式。
智能语音在车内的应用主要以车载导航为主,辅以查询和用车。对于业界 热炒的“以语音为入口连接各种服务,从而构建车联网生态”的畅想,目 前看来还距离较远。核心困难在于,整个行业尚未找到车内场景下用户的 刚性、高频需求。或许等到自动驾驶汽车普及之后,人的双手双眼以及大 脑解放出来,才有条件搭建包含各种服务的车内生态。
C端应用:变革交互方式,需求和体验是关键
家居
家居环境的天然特性使得语音成为最合适的交互方式,类似于Echo Alexa这样的平台将吸引越来越多的应用,不断丰富其产品功能,完整智 能家居生态环境。随着用户习惯不断养成,这样的“智能家居控制中心 ”和“流量入口”有望快速普及,成为iPhone级爆款。不过,由于语音 是一种全新的交互方式,除了技术所需的提升,各类应用在开发设计时 还将面临用户体验和价值考量等全新挑战。
由于人工智能技术对数据依赖性极高,因此,这一领域的技术进步和产业 化推进是一种协同关系——通过工程化的方法提升技术效果和体验,从而 促进产业化应用,再根据实际应用中的数据和反馈,反过来推动技术实现 突破。那么,智能语音语义在产业化方面都有哪些应用领域,又存在哪些 问题?
应用篇: C端提升体验 B端提升效率
技术篇: 语音识别和NLP 技术仍不成熟
智能语音语义
智能语音语义包含语音合成、语音识别和自然语言处理(NLP)三项主 要技术。
语音合成技术发展最早,应用已较为普遍,除了合成音仍偏机械之外, 基本不存在太大技术问题; 语音识别在2012年卷积神经网络(CNN)应用之后,准确率大幅提升, 已经在C端、B端得到了广泛应用,但效果和体验还不够理想; NLP技术虽然在搜索引擎中早有应用,但在人机交互领域仍属于浅层处 理。
B端应用:提升效率、解放人力,深耕垂直行业是根本
医疗 医疗领域的应用目前主要是电子病历录入。医生在临床诊断时使用专业麦 克风,可将诊断信息实时转化成文字,录入医院HIS(Hospital Information System)系统,方便后续查询和问答,提高医生工作效率。 由于专业性强、识别难度高,国外语音巨头Nuance最早主要是通过后台 人工转写,而随着语音识别技术有了突破性进展,国内智能语音在国内医 疗领域的应用也开始起步,讯飞和云知声是该领域典型代表。 讯飞正在和安徽省立医院、上交大附属第六医院南院以及北大口腔医院等 合作,让医生使用定制麦克风,通过定向和降噪,先将语音转成文字,再 用NLP技术对文字进行结构化处理(比如分段),医生只需再做简单修改即 可形成电子病历。此外,讯飞还在医疗影像翻译、医疗大数据分析方面展 开布局,欲将AI技术广泛用于智慧医疗领域。
C端应用:变革交互方式,需求和体验是关键
家居
值得一提的是,一些传统家电,如空调、冰箱、洗衣机、抽油烟机等, 也开始配备语音交互功能,事实上并不理性。无论是控制开关、调节设 置,还是对话沟通,从现有技术水平所能解决的需求和效率来看,都价 值有限,或许等到语音交互成本下降,效率提升,才有可能在各种家电 终端上普及。不过更多行业人士倾向于认为,智能家电的语音控制要么 通过一个中枢设备来进行,要么通过房屋前装分体式设计来实现。
B端应用:提升效率、解放人力,深耕垂直行业是根本
医疗 云知声的智能医疗语音录入系统也已经在协和医院、西京医院试点使用。 同时,其医疗语音技术还上线了“平安好医生”20多个科室,让医生通过 语音方式,更便捷地与患者进行线上沟通。 当前,语音在医疗领域的应用还处于语音转文字的初级阶段,在实际使用 中的部分识别错误还需要医生手动修改。不过,以语音为入口所积累的大 量医疗数据会在未来产生巨大价值。此外,随着医疗技术和语音分析技术 的进步,通过声音诊断病情也将成为可能。南加州大学已经开发出一套新 的机器学习工具,可以通过患者的特定语音特征,辅助医生诊断抑郁症等 心理疾病。
目前,机器对句子的理解还只能做到语义角色标注层面,即标出句中的句 子成分和主被动关系等,它属于比较成熟的浅层语义分析技术。未来要让 机器更好地理解人类语言,并实现自然交互,还是需要依赖深度学习技术, 通过大规模的数据训练,让机器不断学习。当然,在实际应用领域中,也 可以通过产品设计来减少较为模糊的问答内容,以提升用户体验。
语义分析仍是浅层处理
NLP技术大致包含三个层面:词法分析、句法分析、语义分析,三者之 间既递进又相互包含。
语义分析仍是浅层处理
词义消歧是NLP技术的最大瓶颈。机器在切词、标注词性、并识别完后, 需要对各个词语进行理解。由于语言中往往一词多义,人在理解时会基于 已有知识储备和上下文环境,但机器很难做到。虽然系统会对句子做句法 分析,可以在一定程度上帮助机器理解词义和语义,但实际情况并不理想。
客服作为劳动密集型行业,对于一些大公司来说,成本依然很高。智能机器人客服的出现可 以在很大程度上解决简单、重复性工作,帮助企业节省人工和坐席成本,提升运营效率。
由于客服问题主要聚焦在特定产品或单一垂直领域,因此需要企业拥有完整的结构化知识库 ,帮助机器人更好地查询和匹配问答内容。目前,按照行业平均水平,机器人客服可以解决 70%左右问题,其余由人工处理。 机器人客服是主要战场。从成立较早的智臻智能(小i机器人)、捷通华声,到后来的图灵机 器人、智齿科技、蓦然认知,以及从云客服转型智能客服的UDesk等,都希望在智能客服市 场分得一杯羹。
智能语音语义 发展趋势
语音识别作为人工智能发展最早、且率先商业化的技术,近几年来 随着深度学习技术的突破,识别准确率大幅提升,带动了一波产业 热潮。继科大讯飞、捷通华声之后,行业内又涌现出思必驰、云知 声、出门问问等后起之秀,在教育、客服、电信等传统行业之外, 开辟出了车载、家居、医疗、智能硬件等语音技术应用新天地。 与此同时,自然语言处理(NLP)作为人机交互技术的重要一环, 也为此提供了助力。Siri的推出打开了语音交互的先河,不的投入。 由于NLP和语义理解技术能够让机器理解人的意图和需求,并把相 应内容反馈给用户,因此在客服行业得到了广泛应用,有效降低了 人力成本,提高了企业运营效率。
对于涉足汽车领域的语音企业来说,当前最重要的是,把导航等刚性需求 的体验做到位,再去考虑如何延伸服务。
C端应用:变革交互方式,需求和体验是关键
家居
在家居场景下,智能语音应用主要围绕智能电视、音箱、家用机器人展 开,解决的需求包括搜片、听歌、提醒、简单交互、应用调取等。
亚马逊Echo面世,带动了语音交互在家居领域应用的热潮。从2014年下 半年至今,Alexa平台应用数从最初20多个增加到7000多个,并在过去 半年内以每月1000个左右的速度增加。据CIRP报告估计,截止2016年 11月,Echo累计销量超过510万台,2016年Q1-Q3共销售约200万台, 较前三季度增长18%。
C端应用:变革交互方式,需求和体验是关键
智能语音为C端提供了一种全新的交互方式,但应用和普及又跟具体场景 和需求挂钩。目前,三大场景中,移动设备中的智能手机,以及车内语 音交互应用最为广泛。家居领域中,虽然各种家电企业也在广泛布局, 但实际使用情况并不理想。 移动设备 智能语音语义在智能手机和可穿戴设备中的应用不尽相同。可穿戴设备 虽然没有屏幕或屏幕较小,更适合语音交互,但大多(比如智能手表) 都是非生活必需品,本身销量就很有限,再加上一些可穿戴设备并没有 太多交互需求,因此实际应用量较少。 智能手机中的各类应用软件大多都配备了语音功能,但相比触摸和文字 交互,使用率也不算高。很多人仍然没有经常使用语音的习惯,或者还 没有使用语音的意识。究其原因,主要由于语音交互在效果和效率上都 不够理想。
由于业务量大、付费能力强,且知识库完整,金融、电信、航空公司等大型客户成了智能客 服的主要应用群体。要更好地满足这些群体的需求,各家公司需要针对不同行业对算法和技 术做相应的改进和优化,在实际应用中,用更大的数据量去提升产品体验和效果。
B端应用:提升效率、解放人力,深耕垂直行业是根本
教育 教育领域,包括中英文口语评测,以及部分教育机器人的交互功能。科大讯飞作为智能语音 和教育市场的龙头企业,通过为一些全国性考试提供技术支持,已经成为中英文口语测评方 面的主要玩家。2016年底,科大讯飞与新东方联合成立东方讯飞,用新东方的数据+讯飞的 技术,推动教育、培训、学习的智能化进程,智能语音测评技术有望在其中发挥重要作用。 在讯飞的广泛布局之下,脱胎于老牌语音公司思必驰,后被网龙(HK 00777)全资收购的 驰声科技,也通过2B2C的模式,在培训、出版、考试服务、教育软硬件等领域持续发力, 欲通过中高考口语考试解决方案、人机英语对话模拟考辅系统打入学校市场。
C端应用:变革交互方式,需求和体验是关键
移动设备
从效果上看,语音在开放场景下识别准确率并不高。对于用户来讲,结 果不可预期,产生错误后纠错成本很高,所以宁愿打字。再者,用户在 手机端对于打字和触摸已经非常习惯,因此缺乏改变习惯的动力。
从效率上看,语音在智能手机和各类软件上的应用主要以输入、搜索和 调取服务为主,输入信息量并不大,而且大多移动应用都是基于触摸和 文字做的交互设计,有文字推荐、按键选择等友好设置,因此原有交互 方式本身已经非常便捷,语音交互效果不好,容易出错,并不能很好地 提升效率。 目前,除了重度文字使用者,比如作家、记者、编辑等,对语音输入和 转化有着刚性需求,其他人使用语音更多还是在无法打字或不方便触摸 时,比如走路、开车等情况下。不过,随着语音识别和交互体验不断提 升,会有越来越多的人在移动端使用语音。