语音识别外文翻译

合集下载

国科发火〔2016〕32号---国家重点支持的高新技术领域

国科发火〔2016〕32号---国家重点支持的高新技术领域

国科发火〔2016〕32号---国家重点支持的高新技术领域附件国家重点支持的高新技术领域一、电子信息二、生物与新医药三、航空航天四、新材料五、高技术服务六、新能源与节能七、资源与环境八、先进制造与自动化一、电子信息(一)软件1. 基础软件服务器/客户端操作系统;通用及专用数据库管理系统;软件生命周期的开发、测试、运行、运维等支撑技术,以及各种接口软件和工具包/组、软件生成、软件封装、软件系统管理、软件定义网络、虚拟化软件、云服务等支撑技术;中间件软件开发技术等。

2. 嵌入式软件嵌入式图形用户界面技术;嵌入式数据库管理技术;嵌入式网络技术;嵌入式软件平台技术;嵌入式软件开发环境构建技术;嵌入式支撑软件生成技术;嵌入式专用资源管理技术;嵌入式系统整体解决方案设计技术;嵌入式设备间互联技术;嵌入式应用软件开发技术等。

3. 计算机辅助设计与辅助工程管理软件用于工程规划、工程管理/产品设计、开发、生产制造等的软件工作平台或软件工具支撑技术;面向行业的产品数据分析和管理软件;基于计算机协同工作的辅助设计软件;快速成型的产品设计和制造软件;专用计算机辅助工程管理/产品开发工具支撑技术;产品全生命周期管理(PLM)系统软件;计算机辅助工程(CAE)相关软件;分布式控制系统(DCS)、数据采集与监视控制系统(SCADA)、执行制造系统(MES)技术等。

4. 中文及多语种处理软件中文、外文及少数民族文字的识别、处理、编码转换与翻译技术;语音识别与合成技术;文字手写/语音应用技术;多语种应用支撑技术;字体设计与生成技术;字库管理技术;支撑古文字、少数民族文字研究的相关技术;支撑书法及绘画研究的相关技术;语言、音乐和电声信号的处理技术;支撑文物器物、文物建筑研究的相关技术;支撑文物基础资源的信息采集、转换、记录、保存的相关技术等。

5. 图形和图像处理软件基于内容的图形图像检索及管理软件;基于海量图像数据的服务软件;多通道用户界面技术;静态图像、动态图像、视频图像及影视画面的处理技术;人机交互技术;裸眼3D内容制作技术;3D图像处理技术;3D模型原创性鉴定技术;遥感图像处理与分析技术;虚拟现实与现实增强技术;复杂公式图表智能识别转换技术;位图矢量化技术和工程文件智能化分层管理技术;实现2D动画和3D动画的自主切换和交互技术等。

dsp外文翻译

dsp外文翻译

外文参考文献翻译英文题目 The Breadth and Depth of DSP 中文题目 DSP的广度和深度学院自动化与电气工程学院专业自动化姓名白学文学号 201108536指导教师王思明2015 年 04月 20日DSP的广度和深度数字信号处理是最强大的技术,将塑造二十一世纪的科学与工程之一。

革命性的变化已经在广泛的领域:通信,医疗成像,雷达和声纳,高保真音乐再现,石油勘探,仅举几例。

上述各领域已建立了深厚的DSP技术,用自己的算法,数学,和专门技术。

这种呼吸和深度的结合,使得它不可能为任何一个人掌握所有已开发的DSP技术。

DSP教育包含两个任务:学习一般适用于作为一个整体领域的概念,并学习您感兴趣的特定领域的专门技术。

本章开始描述DSP已在几个不同领域的戏剧性效果的数字信号处理的世界,我们的旅程。

革命已经开始。

1 DSP的根源独特的数据类型,它使用的信号,数字信号处理是区别于其他计算机科学领域。

在大多数情况下,这些信号源于感觉来自现实世界的数据:地震的震动,视觉图像,声波等DSP是数学,算法,并用来操纵这些信号的技术后,他们已被转换成数字形式。

这包括了各种目标,如:加强视觉图像识别和语音生成,存储和传输的数据压缩,等假设我们重视计算机模拟 - 数字转换器,并用它来获得一个现实世界的数据块。

DSP回答了这个问题:下一步怎么办?DSP的根是在20世纪60年代和70年代数字计算机时首次面世。

电脑是昂贵的,在这个时代,DSP是有限的,只有少数关键应用。

努力开拓,在四个关键领域:雷达和声纳,国家安全风险是石油勘探,可以大量资金;太空探索,其中的数据是不可替代的;和医疗成像,可节省生活。

20世纪80年代和90年代的个人电脑革命,引起新的应用DSP的爆炸。

而不是由军方和政府的需求动机,DSP的突然被带动的商业市场。

任何人士如认为他们可以使资金在迅速扩大的领域突然一个DSP供应商。

DSP的市民等产品达到:移动电话机,光盘播放器,电子语音邮件。

201116910524苗云龙外文资料翻译

201116910524苗云龙外文资料翻译

毕业设计(论文)外文资料翻译题目:语音通信和语音信号处理院系名称:信息学院专业班级:电信1105班学生姓名:苗云龙学号: 201116910524指导教师:乔丽红教师职称:副教授起止日期:地点:附件: 1.外文资料翻译译文;2.外文原文。

附件1:外文资料翻译译文语音通信和语音信号处理序言像语音所携带的信息一样,与一个机器在常规模式下进行交流不仅是一个科技性的挑战,而且还有我们对人们是如何如此不费吹灰之力进行沟通交流能力上的理解力的限制关键点在于去理解语音处理(看作是人们的沟通方式)和语音信号处理(看作是一种机制)之间的不同之处。

当人们听到语音的时候,他们会应用他们积累的语言知识与一种语言的关系来捕获信息。

在这个过程中,注意到用经过很长一段时间学得的知识资源进行有选择的处理那些输入语音信号是非常有趣的,例如良好的声音单员, 声学语音学、韵律、词汇、语法、语义和语用这些知识资源,这种处理过程因人不同而不同,并且,对于任何一个个人去准确有利的表达出他或她在处理输入语音信号这个过程中是用什么原理是非常困难的。

这也就使得通过写一段程序去通过机器来执行提取语音信号重的信息的任务变得比较困难。

应当被注意到的是,对于一种机器来说,在一个抽样序列的模式里,仅仅只有语音信号能够被提取到,而其他的一些包括在输入信号上的知识资源的鉴定以及对他们的调用都是一种科学上的挑战。

这样语音信号的处理过程就是很多非常有趣的挑战之一,以至于引起了报错很多不同科学小组的好奇,包括语言学家,语言学者,心理学或声学专家,电子工程师,计算机科学家,和应用工程师。

SADHANA的编辑文员会已经恰当的把这个主题认同为应当被定位为一个特殊的问题。

他们已经让我采取首创的自发精神来搜集引导科学小组的观点,和这个特殊问题的论文的文章形式。

我也的确非常幸运的已经能够劝说很多已经有很高成就的科学家,说服他们在他们的领域内致力于这个特殊的问题,对这个特殊的额问题多做文章。

人工智能外语实践教学(3篇)

人工智能外语实践教学(3篇)

第1篇摘要:随着人工智能技术的飞速发展,其在教育领域的应用越来越广泛。

外语教学作为我国教育体系的重要组成部分,如何借助人工智能技术提高教学效果,成为当前外语教育改革的重要课题。

本文旨在探讨人工智能外语实践教学的理论基础、实践策略以及面临的挑战,以期为我国外语教学提供有益的参考。

一、引言外语教学在我国教育体系中占据重要地位,随着全球化进程的加快,外语能力成为衡量一个人综合素质的重要指标。

然而,传统的外语教学模式在师资力量、教学资源、教学效果等方面存在诸多不足。

近年来,人工智能技术的兴起为外语教学带来了新的机遇。

本文将从人工智能外语实践教学的理论基础、实践策略以及面临的挑战三个方面进行探讨。

二、人工智能外语实践教学的理论基础1. 认知心理学理论认知心理学理论强调个体在学习过程中的主动性和自主性,主张通过认知加工过程来实现知识的获取和运用。

人工智能外语实践教学正是基于这一理论,通过模拟人类大脑的认知过程,帮助学习者提高外语学习效果。

2. 联通主义理论联通主义理论认为,知识是动态的、网络化的,个体通过与其他个体或知识的互动,不断扩展自己的知识网络。

人工智能外语实践教学通过构建虚拟学习环境,使学习者能够在与人工智能、教师以及同伴的互动中,实现知识的获取和拓展。

3. 人工智能技术人工智能技术包括自然语言处理、机器学习、深度学习等,为外语教学提供了强大的技术支持。

通过人工智能技术,可以实现个性化教学、智能评测、智能翻译等功能,提高外语教学效果。

三、人工智能外语实践教学的策略1. 个性化教学人工智能外语实践教学可以根据学习者的学习进度、兴趣爱好、学习风格等因素,为其提供个性化的学习路径和资源。

例如,利用智能推荐算法,为学习者推荐适合其学习水平的外语学习资料。

2. 智能评测人工智能技术可以实现对外语学习者的听说读写能力进行智能评测。

通过语音识别、语义分析等技术,对学习者的口语、写作能力进行实时评测,并提供针对性的反馈和建议。

基于语音识别和机器翻译的应用场景

基于语音识别和机器翻译的应用场景

基于语音识别和机器翻译的应用场景语音识别和机器翻译技术的应用场景在近年来得到了越来越广泛的发展。

无论是在商业、教育、医疗、安全等领域,这两项技术都得到了广泛的应用。

本文将详细探讨基于语音识别和机器翻译的应用场景。

一、商业领域在商业领域中,语音识别和机器翻译技术的应用可以提高公司的工作效率和客户服务质量。

特别是在国际贸易和旅游业中,机器翻译技术的应用可以帮助企业快速有效地向世界各地的客户传递信息。

此外,语音识别技术在零售领域的应用也越来越受欢迎。

例如,Amazon Echo和Google Home等智能音箱可以通过语音识别技术识别用户的声音指令,帮助用户购买商品、查找信息等。

二、教育领域在教育领域中,语音识别和机器翻译技术的应用可以帮助学生和教师更好地沟通。

例如,在国际教育项目中,机器翻译技术可以降低语言障碍,帮助学生更好地理解教材内容。

此外,智能语音识别教育平台可以通过录音和评分,帮助学生提高口语和听力能力。

三、医疗领域在医疗领域中,语音识别和机器翻译技术的应用可以提高患者服务质量和医生工作效率。

例如,通过语音识别技术,医生可以快速记录患者病历和就诊情况。

同时,机器翻译技术可以降低语言障碍,帮助医生跨越文化和语言障碍,更好地服务患者。

四、安全领域在安全领域中,语音识别和机器翻译技术的应用可以帮助提高安全能力和减少风险。

例如,在移民和海关流程中,机器翻译技术可以帮助海关官员更好地理解旅客提供的信息。

此外,在消防领域,语音识别技术可以识别火警自动报警设备的声音信号,提高消防员的反应速度。

总而言之,语音识别和机器翻译技术的应用越来越广泛,不仅提高了各领域的效率和服务质量,也为我们的生活带来了更多的便利。

计算机科学

计算机科学

计算机科学计算机科学计算机科学,是研究计算机及其周围各种现象和规律的科学,也是研究计算机系统结构、程序系统(即软件)、人工智能以及计算本身的性质和问题的学科。

计算机科学是一门包含各种各样与计算和信息处理相关主题的系统学科,从抽象的算法分析、形式化语法等等,到更具体的主题,如编程语言、程序设计、软件和硬件等。

计算机科学分为理论计算机科学和实验计算机科学两个部分。

后者常称为“计算机科学”而不冠以“实验”二字。

前者有其他名称,如计算理论、计算机理论、计算机科学基础、计算机科学数学基础等。

数学文献中一般指理论计算机科学。

中文名计算机科学简写CS外文名Computer Science 学科门类一级学科1研究领域计算机是一种进行算术和逻辑运算的机器,而且对于由若干台计算机联成的系统而言还有通信问题,并且处理的对象都是信息,因而也可以说,计算机科学是研究信息处理的科学。

计算机科学分为理论计算机科学和实验计算机科学两个部分。

在数学文献中所说的计算机科学,一般是指理论计算机科学。

实验计算机科学还包括有关开辟计算机新的应用领域的研究。

计算机科学的大部分研究是基于“冯·诺依曼计算机”和“图灵机”的,它们是绝大多数实际机器的计算模型。

作为此模型的开山鼻祖,邱奇-图灵论题(Church-Turing Thesis)表明,尽管在计算的时间,空间效率上可能有所差异,现有的各种计算设备在计算的能力上是等同的。

尽管这个理论通常被认为是计算机科学的基础,可是科学家也研究其它种类的机器,如在实际层面上的并行计算机和在理论层面上概率计算机、oracle 计算机和量子计算机。

在这个意义上来讲,计算机只是一种计算的工具:著名的计算机科学家Dijkstra 有一句名言“计算机科学之关注于计算机并不甚于天文学之关注于望远镜。

”。

2 科学领域作为一个学科,计算机科学涵盖了从算法的理论研究和计算的极限,到如何通过硬件和软件实现计算系统。

2022年自然语言处理及计算语言学相关术语中英对译表二

2022年自然语言处理及计算语言学相关术语中英对译表二

自然语言处理及计算语言学相关术语中英对译表二自然语言处理及计算语言学相关术语中英对译表二 delimiter 定界符号 [定界符]denotation 外延denotic logic 符号逻辑dependency 依存关系dependency gram r 依存关系语法dependency relation 依存关系depth-first search 深度优先搜寻derivation 派生derivational bound morpheme 派生性附着语素descriptive gram r 描述型语法 [描写语法]descriptive linguistics 描述语言学 [描写语言学] desiderative 意愿的determiner 限定词deterministic algorithm 决定型算法 [确定性算法] deterministic finite state auto ton 决定型有限状态机deterministic parser 决定型语法剖析器 [确定性句法剖析程序] developmental psychology 开展心理学diachronic linguistics 历时语言学diacritic 附加符号dialectology 方言学dictionary database 辞典数据库 [词点数据库]dictionary entry 辞典条目digital pro ssing 数字处理 [数值处理] diglossia 双言digraph 二合字母diminutive 指小词diphone 双连音directed acyclic graph 有向非循环图disambiguation 消除歧义 [歧义消除] discourse 篇章discourse ysis 篇章分析 [言谈分析] discourse planning 篇章规划discourse representation theory 篇章表征理论 [言谈表示理论] discourse strategy 言谈策略discourse structure 言谈结构discrete 离散的disjunction 选言dissimilation 异化distributed 分布式的distributed cooperative reasoning 分布协调型推理distributed text parsing 分布式文本剖析disyllabic 双音节的ditransitive verb 双宾动词 [双宾语动词;双及物动词]divergen 扩散[分化]d-m (determiner-measure) construction 定量结构d-n (determiner-noun) construction 定名结构document retrieval system 文件检索系统 [文献检索系统] do in dependency 领域依存性 [领域依存关系]double insertion 交互中插double-base 双基downgrading 降级dummy 虚位duration 音长{ 学}/时段{语法学/语意学}dynamic programming 动态规划earley algorithm earley 算法echo 回声句egressive 呼气音ejective 紧喉音electronic dictionary 电子词典elementary string 根本字符串 [根本单词串] ellipsis 省略em algorithm em算法embedding 崁入emic 功能关系的empirici 经验论empty category principle 虚范畴原那么 [空范畴原理] empty word 虚词enclitics 后接成份end user 终端用户 [最终用户]endo ntric 同心的endophora 语境照应entailment 蕴涵entity 实体entropy 熵entry 条目episodic memory 情节性记忆epistemological work 认识论网络ergative verb 作格动词ergativity 作格性esperando 世界语etic 无功能关系etymology 词源学eventevent driven control 驱动型控制example-based chine translation 以例句为本的机器翻译excla tion 感慨exclusive disjunction 排它性逻辑“或”experien r case 经验者格expert system 专家系统extension 外延external argument 域外论元extraposition 移外变形 [外置转换]facility value 易度值feature 特征feature bundle 特征束feature co-ourren restriction 特征同现限制 [特性同现限制] feature instantiation 特征表达feature structure 特征结构 [特性结构]feature unification 特征连并 [特性合一]feedback 回馈felicity condition 妥适条件file structure 档案结构finite auto ton 有限状态机 [有限自动机]finite state 有限状态finite state morphology 有限状态构词法 [有限状态词法] finite-state auto ta 有限状态自动机finite-state language 有限状态语言finite-state chine 有限状态机finite-state transdu r 有限状态置换器flap 闪音flat 降音foreground infor tion 前景讯息 [前景信息]for l language theory 形式语言理论for l linguistics 形式语言学for l se ntics 形式语意学forward inferen 前向推理 [向前推理]forward-backward algorithm 前前后后算法frame 框架frame based knowledge representation 框架型知识表示frame theory 框架理论free morpheme 自由语素fregean principle fregean 原那么fricative 擦音f-structure 功能结构full text searching 全文检索function word 功能词functional gram r 功能语法functional programming 函数型程序设计 [函数型程序设计] functional senten perspective 功能句子观functional structure 功能结构functional unification 功能连并 [功能合一]functor 功能符fundamental frequency 基频garden path senten 花园路径句gb (gover ent and binding) 管辖约束geminate 重叠音gender 性generalized phrase structure gram r 概化词组结构语法 [广义短语结构语法]generative gram r 衍生语法generative linguistics 衍生语言学 [生成语言学]generic 泛指geic epistemology 发生认识论geive rker 属格标记genitive 属格gerund 动名词gover ent and binding theory 管辖约束理论gpsg (generalized phrase structure gram r) 概化词组结构语法[广义短语结构语法]gradability 可分级性gram r checker 文法检查器gram tical affix 语法词缀gram tical category 语法范畴gram tical function 语能gram tical inferen 文法推论gram tical relation 语法关系grapheme 字素haplology 类音删略head 中心语head driven phrase structure 中心语驱动词组结构 [中心词驱动词组结构]head feature convention 中心语特征继承原理 [中心词特性继承原理]head-driven phrase structure gram r 中心语驱动词组结构律heteronym 同形heuristic parsing 经验式句法剖析heuristics 经验知识hidden rkov model 隐式马可夫模型hierarchical structure 阶层结构 [层次结构]holophrase 单词句homograph 同形异义词homonym 同音异义词homophone 同音词homophony 同音异义homorganic 同部位音的horn clause horn 子句hpsg (head-driven phrase structure gram r) 中心语驱动词组结构语法hu n- chine inte 人机界面hypernym 上位词hypertext 超文件 [超文本]hyponym 下位词hypotactic 主从结构的ic (immediate constituent) 直接成份icg (infor tion-based case gram r) 讯息为本的格位语法idiom 成语 [熟语]idiosyncrasy 特异性illocutionary 施为性immediate constituent 直接成份imperative 祈使句implicative predicate 蕴含谓词implicature 含意indexical 标引的indirect object 间接宾语indirect speech act 间接言谈行动 [间接言语行为] indo-european language 印欧语言inductional inferen 归纳推理inferen chine 推理机器infinitive 不定词 [to 不定式]infix 中缀inflection/inflexion 屈折变化inflectional affix 屈折词缀infor tion extraction 信息撷取infor tion pro ssing 信息处理 [信息处理]infor tion retrieval 信息检索infor tion scien 信息科学 [信息科学; 情报科学] infor tion theory 信息论 [信息论]inherent feature 固有特征inherit 继承inheritan 继承inheritan hierarchy 继承阶层 [继承层次]inheritan of attribute 属性继承innateness position 语法天生假说insertion 中插inside-outside algorithm 里里外外算法instantiation 表达instrumental (case) 工具格integrated parser 集成句法剖析程序integrated theory of discourse ysis 篇章分析综合理论 [言谈分析综合理论]in igen intensive production 知识密集型生产intensifier 加强成分intensional logic 内含逻辑intensional se ntics 内涵语意学intensional type 内含类型interjection/excla tion 感慨词inter-level 中间成分interlingua 中介语言interlingual 中介语(的)interlocutor 对话者internalise 内化international phoic association (ipa) 国际学会inter 网际网络interpretive se ntics 诠释性语意学intonation 语调intonation unit (iu) 语调单位ipa (international phoic association) 国际学会ir (infor tion retrieval) 信息检索is-a relation is-a 关系isomorphi 同形现象iu (intonation unit) 语调单位junction 连接keyword in context 上下文中关键词[上下文内关键词] kinesics 体势学knowledge acquisition 知识习得knowledge base 知识库knowledge based chine translation 知识为本之机器翻译knowledge extraction 知识撷取 [知识题取]knowledge representation 知识表示kwic (keyword in context) 关键词前后文 [上下文内关键词] label 卷标labial 唇音labio-dental 唇齿音labio-velar 软颚唇音lad (language acquisition devi ) 语言习得装置lag 发声延迟language acquisition 语言习得language acquisition devi 语言习得装置language engineering 语言工程language generation 语言生成language intuition 语感language model 语言模型language technology 语言科技left-corner parsing 左角落剖析 [左角句法剖析] lem 词元lenis 弱辅音letter-to-phone 字转音lexeme 词汇单位lexical ambiguity 词汇歧义lexical category 词类lexical con ptual structure 词汇概念结构lexical entry 词项lexical entry selection standard 选词标准lexical integrity 词语完整性lexical se ntics 词汇语意学lexical-functional gram r 词汇功能语法lexicography 词典学lexicology 词汇学lexicon 词汇库 [词典;词库]lexis 词汇层lf (logical form) 逻辑形式lfg (lexical-functional gram r) 词汇功能语法liaison 连音linear bounded auto ton 线性有限自主机linear pre den 线性次序lingua franca 共通语linguistic decoding 语言译码linguistic unit 语言单位linked list 串行loan 外来语local 局部的locali 方位主义localizer 方位词locus model 轨迹模型locution 惯用语logic 逻辑logic array work 逻辑数组网络logic programming 逻辑程序设计 [逻辑程序设计] logical form 逻辑形式logical operator 逻辑算子 [逻辑算符]logic-based gram r 逻辑为本语法 [基于逻辑的语法] long term memory 记忆longest tch principle 最长匹配原那么 [最长一致法] lr (left-right) parsing lr 剖析chine dictionary 机器词典chine language 机器语言chine learning 机器学习chine translation 机器翻译chine-readable dictionary (mrd) 机读辞典crolinguistics 宏观语言学rkov chart 马可夫图the tical linguistics 数理语言学ximum entropy 最大熵m-d (modifier-head) construction 偏正结构mean length of utteran (mlu) 语句平均长度measure of infor tion 讯习测度 [信息测度] memory based 根据记忆的mental lexicon 心理词汇库mental model 心理模型mental pro ss 心理过程 [智力过程;智力处理] metalanguage 超语言metaphor 隐喻metaphorical extension 隐喻扩展metarule 律上律 [元规那么]metathesis 易位microlinguistics 微观语言学middle structure 中间式结构mini l pair 最小对mini list program 微言主义mlu (mean length of utteran ) 语句平均长度modal 情态词modal auxiliary 情态助动词modal logic 情态逻辑modifier 修饰语modular logic gram r 模块化逻辑语法modular parsing system 模块化句法剖析系统modularity 模块性(理论)module 模块monophthong 单元音monotonic 单调monotonicity 单调性montague gram r 蒙泰究语法 [蒙塔格语法] mood 语气morpheme 词素morphological affix 构词词缀morphological deposition 语素分解morphological pattern 词型morphological pro ssing 词素处理morphological rule 构词律 [词法规那么] morphological segmentation 语素切分morphology 构词学morphophonemics 词音学 [形态音位学;语素音位学] morphophonological rule 形态音位规那么morphosyntax 词句法motor theory 肌动理论movement 移位mrd ( chine-readable dictionary) 机读辞典模板,内容仅供参考。

外文翻译---产品设计中的人机交互的交互方式

外文翻译---产品设计中的人机交互的交互方式

产品设计中的人机交互的交互方式人机交互过程实际上是一个输入和输出的过程,人通过人机界面向计算机输入指令,计算机经过处理后把输出结果呈现给用户。

人和计算机之间的输入和输出的形式是多种多样的,因此交互的形式也是多样化的。

1.1 数据交互数据交互是人通过输入数据的方式与计算机进行交流的一种方式,它是人机交互的重要内容和形式。

其一般的交互过程是:首先由系统向操作者发出提示,提示用户输入及如何输入;接着用户通过输入设备把数据输入计算机;然后,系统响应用户输入,给出反馈信息,并显示在屏幕上(或者以其他方式显示);同时系统对用户输入进行检查,如有错误就向用户指出,让用户重新输入。

不同的数据输入形式决定了数据交互的不同方式。

注意:这里的数据,可以是各种信息符号,比如数字,符号,色彩,图形等。

数据交互主要有以下交互形式:1).问答式对话数据输入交互特点:简单易用,但单调,输入速度慢。

2).菜单选择数据输入交互如:PDA的操作界面的菜单输入方式,还有各种手机中的图形交互选项。

3).填表数据输入交互特点:输入界面是一个待填充的表格,用户可以按照提示填入合适的数据。

4).直接操纵数据输入交互特点:可通过光标移动进行查找或选择。

输入方便,但常有预设范围的限制。

5).关键词数据输入交互如:在设计软件的应用过程中,熟练的操作用户,经常用快捷键来辅助操作6).条形码数据输入条形码经条形码读入器识别并读入,并八条形码序列翻译成数据序列。

如图书馆书目的编号,超市中商品的品名和价格信息都可使用条形码。

7).光学字符识别(OCR)OCR系统可以让计算机通过模式比较来识别一些具有不同字体和大小的印刷体。

如:办公自动化中的文本输入,邮件自处理,定单数据输入,单证,发票等。

8).声音数据输入交互特点:速度快,不用手和眼。

尤其对那些要求在输入数据的同时要完成手脚并用的工作场合,尤为适用。

9).图像数据输入通过对图像进行特征提取和分析,自动识别限定的标志,字符,编码结构等。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一部分语音识别与理解的研究进展和方向。

为了推进研究,找出有前途、有希望的研究方向,特别是那些在过去没有得到充分的探求或者资助的研究方向是非常重要的。

研究小组写的这篇文章引出了人类语言技术组织(HLT)的一系列经过深思熟虑的研究方向,对今后的研究,可能会成为在自动语音识别(ASR)和理解领域的主要转换范例。

在过去的几十年里,已经对信号处理和人类语言技术(HLT)有很大的兴趣和积极性。

作为第一步,这个组织回顾了此领域主要的发展情况和能引领他们成功的环境,然后专注于他们认为对未来研究特别有用的领域。

这篇文章的第一部分会集中焦点在自动语音识别领域(ASR)历史上有重要意义的发展上,包括几个被不同资金组织资助的主要的成就,并建议在其的中重点研究领域。

第二部分将详细探讨几个保持项目前景以能很大改善ASR的新途径。

这些涉及跨学科的研究和具体办法,以应对三至五年巨大挑战,旨在通过广受关注的现实任务处理以促进先进的研究第二部分语音识别与理解的重大发展自20世纪70年代中期期间见证了ASR的多学科领域继续处于起步阶段,其时代的到来,到实际应用和商业市场的数量迅速增长。

然而,尽管它的许多成就,ASR的仍然是一个远未解决的问题。

在过去,我们希望进一步的研究和发展,将使我们能够建立一个世界性的基础上日益强大的系统。

本节简要回顾了ASR的主要发展重点在五个方面:基础设施,知识表示,模型和算法,搜索,和元数据。

这些领域更广泛和更深入的讨论,可以发现在[12], [16], [19], [23], [24], [27], [32], [33], [41], [42], and [47].读者还可以参考以下网站:t he IEEE History Center’s Automatic Speech Synthesis和Recognition section、the Saras Institute’s History of Speech Language Technology Project在t .基础设施摩尔定律指出计算机发展的长期进展和预测,每12到18个月,计算实现一个给定的成本的费用会翻倍,以及同等萎缩的内存成本。

这些事态发展已使ASR的研究人员在足够短的时间框架运行的日益复杂的算法,使自1975年以来取得伟大进步。

常见的语音语料库语音训练,发展和评价的可用性一直是关键,让创造能力不断增加的复杂系统。

讲话是高度可变的信号,多参数的特点,因此大型语料库在自动化系统的建模不够好以达到熟练的水平。

多年来,这些语料库已被创建及注释,并分发由国家科学和技术研究所的全球组织(NIST),语言数据联盟(LCD),和其他组织。

录制的讲话字符已取得进展,从有限的制约发言材料,以逐步现实自发的讲话。

已经通过由NIST和其他机构制定的严格的评估基准和标准,关键是一直在发展中日益强大和有能力的系统。

许多实验室和研究人员受益于共同的研究工具的可用性,如Carnegie-Mellon University Language Model (CMULM) toolkit ,Hidden Markov Model Toolkit (HTK), Sphinx, and Stanfor Research Institute Language Modeling(SRILM).广泛研究的支持与车间相结合,任务定义,和国防部高级研究计划局(DARPA)和其他组织赞助的评价系统成为对今天的系统发展所必不可少的知识表示在语音信号表示的重大进展,包括感性动机的MEL频率倒谱系数,(MFCC) [10], [29]和感知线性预测(PLP)系数[21]以及通过倒谱归意味着减法(CMS)[16][44]相对光谱(RASTA)过滤[20]和声道长度正常化(VTLN) [13].建筑,最重要的发展一直搜索统一的图形表示,允许多个来源的知识被纳入到一个共同的概率框架。

非成分方法包括多个语音流,多个概率在假设层面相结合的估计,多重识别系统水平和多通道统增加约束(大-RAM与四克,依赖赖关系与跨字在Word,等等)最近,使用多种算法,同时适用于并行顺序,已证明是富有成效的,有基于特征的,如转换异方差的线性判别分析(HLDA) [31],功能空间的最低电话错误(fMPE) [40]和神经基于网络的功能[22]。

模型和算法在20世纪70年代初[38],语音识别进步的最显着的范式转变,已经出台了统计方法,尤其是随机处理隐马尔可夫模型(HMM模型)[3],[25]。

超过30年后,这种方法仍然占主导地位.一些模型和算法已被有效地纳入在此框架内。

期望最大化(EM)算法[11]和向前或向后Baum-Welch算法[4]已经是HMM模型从数据中训练的主要手段。

尽管其简单的N-gram 语言模型已经证明是非常强大和灵活的。

决策树[8]已被广泛应用于套的功能,如从训练数据的发音。

统计差别性的训练技术通常是基于利用最大互信息(MMI)和最小误差模型参数。

确定性方法包括纠正训练和一些神经网络技术[1] [5],[35]。

适应是至关重要的,以容纳多种渠道,环境,扬声器,词汇,主题域等变量条件。

流行的技术,包括最大后验概率(MAP)估计[17],[38],[51],最大似然线性回归(MLLR)[34],本征声音[30]。

培训可以采取少量的新任务或提供额外的培训材料,以及“一次性”学习或“无监督”培训测试时间域数据的基础上进行。

搜索关键解码或搜索策略,原本在非语言应用开发,都集中在堆栈解码(A*搜索)[26]和Viterbi 或N-最好的搜索[50]。

从通信和信息理论推导,堆栈解码随后应用于语音识别系统[25],[37]。

维特比搜索,广泛应用于搜索替代假说,来自动态规划在20世纪50年代[6],随后被用在语音应用程序,从20世纪60年代至80年代及以后,从俄罗斯和日本,美国和欧洲[3] [7],[9],[36] [45],[46],[48] [49]。

元数据句子和扬声器分割以及自动测定标点符号已成为一些处理系统的主要功能。

在20世纪90年代初开始,已启用音频索引和采取高性能主题自动检测和跟踪,以及申请语言和说话人识别[18]。

大挑战:主要的潜在研究计划大的挑战是本小组所谓的雄心勃勃,但实现三至五年的研究计划的举措,将大大推进在国家最先进的语音识别和理解。

大挑战以前由国家和国际倡议发起,一些机构和其他团体在很大程度上为今天的ASR和应用能力的成就负责。

下面描述了六个这样的潜在方案。

每个方案已经确定,可衡量的目标,包括重要的功能复杂,应该大大推进该领域,使其能够满足重大的应用。

这些丰富的任务域,可以使在不同的层次几个有前途的研究领域取得进展。

正如下文所述,这些方案倡议,每年也可以在多学科或跨区域的研究方法中受益,或提供的好处.日常音频这是一种长期的,代表了广泛的语音、扬声器、通道、环境条件下,人们通常会遇到常规的适应语音信号的响应和确认。

目前,当他们最初的开发和培训时遇到从有限的条件下不同的音频信号,ASR系统提供了显着的性能下降。

在许多情况下,这是真正的差异,即使是轻微的。

此重点研究领域将集中在创建和发展系统,这将是变异和变化对声学环境,混响,外部噪声源,沟通渠道(例如,远场麦克风,手机),扬声器的特性(如更健壮,说话风格,外来口音,情绪状态),和语言的特点(例如,正式/非正式的风格,方言,词汇,主题域)。

新技术和新架构建议探索不同环境如会议室演示和非结构化对话的关键问题。

主要的焦点将自动适应不断变化的条件,在多个层面探索的替代品,甚至同步。

我们的目标是在环境和多样化的情况下,提供更多的准确和有用的演讲稿,不同情况比现在是可能的,从而满足更多的应用。

这个具有挑战性的问题,可以高效地用上的专业知识和相关学科的知识,包括自然语言处理,信息检索,认知科学。

快速移植到新兴外语今天的国家的最先进的ASR系统提供最高的性能,通过建立复杂的声学和语言模型使用的特定于域的语音和文本的例子大集合。

对于许多语言,这种语言资源集往往不是现成的。

这项研究计划的目标是创建口语语言的技术,是迅速便携式。

为了准备这样的口语语言系统的快速发展,需要一个新的范例学习,多语言通用的语言,具体的手机的语音和声学单位。

三个具体研究的问题需要解决:1)声学建模为一个新的目标语言的跨语言的语音和声学单位,2)跨语言的单词发音的词汇建模新的语言,和3)跨语言的语言模型。

通过探索这些新兴的语言和充分的语言研究,跨语言的功能,如语言聚类和普遍的声学建模之间的相关性,可以利用声学和语言模型,以便快速适应。

引导技术也从少量标记的话语首先建立初步的系统,使用这些系统的多标签的钥匙话语的例子,在无人监督的方式,纳入新的标签数据,标签集和迭代,以改善系统,直到他们达到的性能水平与今天的高精确度的系统相媲美。

许多研究成果可以扩展到新兴语言的机器翻译,自然语言处理,信息检索系统设计。

预期这种日益增长的需求,一些语言资源和基础设施需要建立能够快速的可移植性设施。

研究还需要研究的名目,需要引导的目的,以创造一个合理的制度监督信息的最低金额。

自适应的语言能力国家的最先进的语音转录,扬声器核查,语言识别系统都是基于统计的标记训练数据模型,如转录讲话,并从人类提供的知识,如发音字典。

这种内置知识往往成为过时的系统后,很快部署在一个真实世界的应用程序,需要重大和经常性的人为干预和再培训,以维持系统的实用形式。

这与人类的讲话设施形成鲜明对比,这是不断更新的一辈子,会经常获得新的词汇和惯用表达式,以及巧妙地处理前所未见的外来口音和一些语言的地方方言。

特别是,人类表现出一个显着的学习一个新的域或应用程序的子语言的倾向,且没有明确的监管。

这项研究计划的目标是创建自适应(或自学)语音识别技术。

需要有在语音和语言处理的各个层次的学习,以应付不断变化的环境,非语音,扬声器,发音,方言,口音,言语,意义,主题,但部署系统的周期变化超过几个来源。

相对于人类,系统会进行自动模式发现,主动学习和适应。

在这方面的研究必须解决学习新模型,将此类模型集成到已经存在的知识源中。

因此,学习的一个重要方面是能够辨别东西已经学到和如何应用这个结果。

学习来自多个并发的方式,例如,新的文本和视频也可能是必要的。

例如,ASR系统可能会遇到在其语音输入新的专有名词,可能需要检查匹配的上下文来确定名称的拼写。

无标签或标记的部分数据的开发利用将对这种学习有其必要性。

投资于这类研究的一个动机是模仿机器学习领域有不断增长的积极性。

在这一努力下,成功延长已部署系统的寿命,并直接推动我们无标记讲话的繁重的要求,在新的语言和域的语音系统的开发能力中,基本上是通过创建系统,随着时间的推移自动学习和改善。

相关文档
最新文档