人工智能与机器翻译复习总结

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一.名词解释(3X5)

1.机器翻译:机器翻译是人工智能研究的一个分支, 是用电脑代替人做翻译

工作。

2.组合型歧义:一个句子中,一个字既可以与前面的字构成一个词,也可

以与后面的字构成一个词,也可以合起来组成一个词。(词与词之间的串联产

生的)

3.交集型歧义:一个句子中,一个字既可以与前面的字构成一个词,也可

以与后面的字构成一个词。(词与词之间的交叉组合产生的)

4.语料库:由单词、短语、句子组成的电子库。

5.人工智能:人工智能是计算机科学的一个分支,任务旨在

模拟人类行为和认知过程。

6.人工智能软件技术:知识表示、知识推理、知识获取。

7.语法分析:分析一个句子有无语法错误。例如“兔子吃草”

是正确的,但“草吃兔子”是错误的。

8.兼类:兼类指同一个词具有不同的词类语法功能, 即这个词兼属不同的词

类。

二.基本概念(3x4)

1.人工智能应用领域:P11

(1)问题求解

(2)逻辑推理与定理证明

(3)自然语言理解

(4)自动程序设计

(5)专家系统

(6)机器学习

(7)人工神经网络

(8)机器人学

(9)模式识别

(10)机器视觉

(11)智能控制

(12)智能检索

(13)智能调度与指挥

(14)系统与语言工具

2.分析智能软件与通常软件的区别:P8

通用软件:采用两级层次加以组织:数据级、控制级

智能软件:采用三级层次加以组织:数据级、知识库、控制级

3.比较智能软件与通常软件的性质:P8

通用软件:(1)通用性。算法应能求解问题范围内的全部问题,而不是只能解决其中的某些特殊问题。

(2)确定性。算法中的问题求解状态、求解步骤应该是精确的、唯一的,并可以机械的执行。

(3)有效性。问题范围内的任何具体问题带入算法后,都可以经过有限步骤达到所期望的结果。

智能软件:(1)局部性。仅适用与求解一类问题中那些被认为合理或者常见的问题。

(2)试探性。常采用一般情况下能保证正常工作的方法进行问题求解,当这个方法失败时,允许采用其他方法。

(3)针对性。智能软件常利用求解问题的一些特殊规律,但这些规

律是针对性的,甚至是不精确的,它经不起或者未经过严谨的理论证明,不能保证对每个具体问题有精确解或最优解。

4.阐述机器学习/知识获取的两种方式:

狭义知识获取(人工向计算机输入程序(知识))

广义知识获取(由计算机自动或半自动获取知识)

5.阐述深度、广度、代价优先搜索方法:

广度:对全部节点沿广度进行横向扫描, 按各节点生成的先后次序,先生成、先检查、先扩

展, 沿广度遍历所有节点。

深度:这种方法每一次扩展最晚生成的子节点,沿着最晚生成的子节点分支,逐级纵向深入发展。

代价:依据初始节点到它们各自所付出的代价大小进行排序, 代价小的节点放在前面扩展, 周而复始重复上述操作,直至找到目标节点为止

6.智能技术实施的三个步骤:知识表示、知识推理、知识获取三.技术阐述

1.回溯在什么情况下进行:

(1)新生成的状态在通向初始状态的路径上已出现过;

(2)从初始状态开始, 应用的规则数目达到所规定的数目之后还未找到目标状态(这一组规则的数目实际上就是搜索深度范围所规定的);

(3) 对当前状态, 再没有可应用的规则。

2.阐述引起歧义的主要点:

(1)词组的多义产生的歧义。例如单词bank

(2)计算机程序在自动分词阶段产生的歧义:组合型歧义,对于字串

AB,可以分成AB,也可以分成A / B;交集型歧义。即,对于字串ABC,可以分成AB / C,也可以分成A / BC。

(3)由词典大小引起的歧义:自然语言的词组无穷,新的词组还在不断创造,

机器词典不可能收集全部的词组,如果要翻译的语句中出现了没有收

集的词,歧义就可能出现。

(4)由自然语言的二义性产生的歧义:例如:“在日本保留和尚使用的古典乐器很多”。这句若没有上下文辅助,连人也难理解其真实含义,机器翻译时计算机程序肯定在自动分词时就会出现两种情况。

3.叙述规则不一致的种类和原因:p77

产生式规则不一致的原因

系统建立初期,由于规则集较小, 内容也比较简单,设计人员能对每一条规则的条件和结论部分反复推敲和精心构造, 这类问题容易防止。但随着时间的推移, 新的规则不断加入, 规则集合越来越大, 内容也越来越丰富, 这时规则间的相互影响和相互联系就随之变得复杂。在此情况下,规则的不一致就将自然产生。

主要的不一致规则种类

(1) 循环规则: 由数个规则的前提和结论形成一个循环链,最终由末尾规则的结果子句推

出起始规则的前提部分;

(2) 冲突规则: 两个规则的前提条件等价,但一个或多个结果子句有矛盾或者前提子句有

矛盾而结论部分完全等价; 也有可能由多条规则链形成冲突规则集;

(3) 冗余规则: 两个规则的前提条件等价, 一个或多个子结果子句也等价;

(4) 从属规则: 两个规则有相同的结果, 但其中一个包含有多余的约束条件。

4.阐述非精确推理的原理:P82

非精确推理中的原理为下述结构:

IF E THEN H(X)其中:E是证据,H是假设,X是规则的不确定因子,或称为规则强度。

四.机器翻译及其它

1.类比搜索方法及思想:利用类比获得与新问题相似的过去问题的求解过程,作为启发信息来指导新问题的求解,这样可以缩小搜索范围,降低问题的复杂性。

2.机器翻译的四种方法:

1基于分析和转换的机器翻译方法

2基于中间语言的翻译方法

3基于统计的机器翻译方法

4基于实例的机器翻译方法

3.词法分析的重点:可将变化了的形态还原成基本形,再去查词。

相关文档
最新文档