人工智能与机器翻译期末复习题

一、名词解释（5X3‘）15’

1.兼类（P121）：一个单词既可以作名词动词又可以作其他词类

2.机器翻译：用计算机软件代替人做的书面翻译

3.组合型歧义：一个字与前面的字成词,与后面的字成词,合起来也成词。

4.交集型歧义（P117）：一个字与前面的字成词,与后面的字也成词。

5.人工智能：用计算机硬件、软件模拟人的行为，解决人类目前尚未认识清楚的问题。

6.人工智能软件的三大技术：知识表示、知识推理、知识获取。

7.语料库：单词、短语和句子组成的数据库。

8.知识工程：包括人工智能软件技术的工程。（知识工程是以知识为基础的系统，就

是通过智能软件而建立的专家系统）

9.深度学习：一步一步在丰富起来的特征规律引导下，由浅入深完成推理的方法。

10.语用分析：分析成语和习惯用语的方法。

二、题解 P36 例2.1 、2.2

例2.1 设有下列语句：

（1）高山比他父亲出名。

（2）刘水是计算机系的一名学生，但他不喜欢编程序。

（3）人人爱劳动。

为了用谓词公式表示这些语句，应先定义谓词：

BIGGER(x,y):x比y出名

COMPUTER(x):x是计算机系的学生

LIKE(x,y):x喜欢y

LOVE(x,y):x爱y

M(x):x是人

定义函数father(x)表示从x到其父亲的映射此时可用谓词公式把上述三个语句表示为：（1）BIGGER(高山，father(x))

（2）COMPUTER(刘水)∧∽LIKE（刘水，程序）

（3）（?x）（M(x) →LOVE(x,劳动)）

例2.2 设有下列语句：

（1）自然数都是大于零的整数。

（2）所有整数不是偶数就是奇数。

（3）偶数除以2是整数。

定义谓词如下：

N(x):x是自然数

I(x):x是整数

E(x):x是偶数

O(x):x是奇数

GZ(x):x大于零

另外，用函数S（x）表示x除以2。此时，上述三个句子可用谓词公式表示为：

（?x）(N(x) →GZ(x)∧I(x))

(?x)（I(x) →E(x)∨O(x））

（?x）(E(x) →I(S(x)))

三、论述（4X5‘）20’

1.阐述深度、广度、代价驱动搜索方法。（P68）

答：广度优先搜索法：对全部节点沿广度进行横向扫描，按各节点生成的先后次序，

先生成、先检查、先扩展，沿广度遍历所有节点。

深度优先搜索法：每一次扩展最晚生成的子节点，沿着最晚生成的子节点分支，逐级纵向深入发展。

代价驱动搜索法：依据初始节点到它们各自所付出的代价大小进行排序，代价小的节点放在前面扩展，周而复始重复上述操作，直到找到目标节点为止。

2.智能软件的核心组成部分。

答：数据库、控制程序、知识库或规则集。

3.举例说明专业人工智能和广义人工智能的区别。

广义:能够代替人类做任何事情功能的即可

专业:用计算机软件模拟人的行为以解决人类目前尚未认识清楚的问题

4.阐述人工智能软件和常规软件的区别。

答：普通软件只有控制集与数据库集；

智能软件具有控制集与数据库集，还有知识库或者规则集。

5.试述规则不一致的规则与原因（P77）

答：（1）循环规则：由数个规则的前提和结论形成一个循环链，最终由末尾规则的

结果子句推出起始规则的前提部分；

（2）冲突规则：两个规则的前提条件等价，但一个或多个结果子句有矛盾或者前

提子句有矛盾而结论部分完全等价；也有可能由多条规则链形成冲突规则集；

（3）冗余规则：两个规则的前提条件等价，一个或多个子结果子句也等价；

（4）从属规则：两个规则有相同的结果，但其中一个包含有多余的约束条件。

6.简述三次人工智能的高潮及原因

答：1956年，人工智能诞生；

1981年，日本研制智能机，各个国家不甘落后；

2017年，计算机软件战胜围棋冠军，人工智能备受瞩目。

7.阐述类比搜索方法的基本思想。（P75）

答：利用类比获得与新问题相似的过去问题的求解过程，作为启发信息来指导新问

题的求解，这样可以缩小搜索范围，降低问题求解的复杂性。

8.阐述机器学习的两种方式

答：狭义：指人们通过系统设计,程序编制和人机交互,使机器获取知识。

广义：指机器自动或半自动地获取知识。

四、自然语言处理的概念

1. 试述歧义问题的种类。（P129）

答：①词组的多义产生的歧义；

②由计算机程序在自动分词阶段产生的歧义；

③由词典大小产生的歧义；

④由自然语言的二义性产生的歧义。

2. 人工智能、知识工程、专家系统的区别。

答：专家系统：是人工智能特定领域技术；

知识工程：就是人工智能的软件技术；

人工智能：不仅是软件技术还有硬件技术。

3. 试述机器翻译的四种方法。（P88的四个小标题）

答：①基于分析和转换的机器翻译方法。

②基于中间语言的机器翻译方法。

③基于统计的机器翻译方法。

④基于实例的机器翻译方法。

1.转换式的方法特征：利用了语法语义关系

2.中间语言的方法特征：假想每种语言都能转换到中间语言

3.统计的方法特征：利用了数学统计原理

4.实例的方法特征：利用了类比相似语句

4. 机器字典的用途。（P114）

1>机器词典的好坏是更好的实现实用化机器翻译系统软件的障碍之一

2>机器词典是机器翻译的质量的关键, 要达到机器翻译的全自动, 高质量, 就必须有一部信息丰富, 易于使用的机器词典

3>电子词典(机器词典)不仅可以用于机器翻译, 而且也可以用在自然语言理解, 自然语言处理等诸多方面

机器翻译系统的词典又可以分为通用词典和专业词典两部分, 这种划分便于维护和扩充.也可以把机器词典分的更细一点, 如组俺们的缩略语词典, 特殊字词典等,还可以把通用词典再细分为名词词典, 动词词典, 成语词典等

5. 举例说明语义分析的用途

例: 乒乓球拍买完了

6. 上下无关文法的定义

答：一个句子意义本身每一个单词意义全部明确。（比如王明是好学生，意义明确，而他是好学生，他与上下文相关，意义就不明确。）

五、算法描述

1．产生式系统的基本算法（P59）

答： E1：初始化综合数据库（DATA←初始事实库）

E2：until DATA满足结束条件以前，do

E3：begin

E4：在规则集中，按冲突解决方法选出某一条可用于综合数据库的规则

E5：执行当前选中的规则，把该规则执行后得到的结论送入综合数据库中（DATA←规则应用到DATA得到的结果）

E6：end

2．回溯方法（P67）

YX0:选择一条新路径搜索

YX1:搜索若超出规定指标 (无新路径, 超时, 超深度等) 失败退出; 否则搜索继续

YX2:搜索真的状态找不到可用规则, 回溯到YX0

YX3:搜索的状态依某种原则 (任意排列或按启发式准则) 取有用规则

YX4:若规则用完未找到目标回溯YX0

YX5:取头条可用规则Ri

YX6:删去头条规则减少搜索中规则集长度 (注意这里不懂原则规则集)

YX7:规则Ri作用于当前状态生成新状态

YX8:若找到目标成功退出; 若生成的"新状态" 已出现过回溯到YX0

YX9:记录新状态对新状态递归调用YX1 ~ YX7

六、分析题

P117-P119（18题选8）

1、交集型歧义切分字段是由词与词之间的交叉组合产生的。

(1) 名词+名词：例如, 在句子“用树形图形式加以描述”中, 歧义字段“图形式”是由名词“图”与名词“形式”之间的交叉组合产生的----“图形”十“形式”。事实上，“图形”是歧义词，它是歧义字段“图形式”在给定句子中错误地切分出来的片段，“形式”是非歧义词，它是歧义字段“图形式”在给定句子中，按正确的切分方式切分出来的片段。

(2) 动词十名词：例如，在句子“研究生命的本质”中，歧义字段“研究生命”是由动词“研究”与名词“生命”之间的交叉组合产生的----“研究生”(歧义词)十“生命”(非歧义词)。

(3) 形容词十名词：例如，在句子“白天鹅游过来了”中，歧义字段“白天鹅”是由形容词“白”与名词“天鹅”之间的交叉组合产生的——“白天”（歧义词）十“天鹅”（非歧义词）。

(4) 介词十名词：例如，在句子“让位移等于50厘米”中，歧义字段“让位移”是由介词“让”与名词“位移”之间的交叉组合产生的——“让位”（歧义词）十“位移”（非歧义词）。

(5) 连词十名词：例如，在短语“独立自主和平等互利的原则”中，歧义字段“和平等”是由连词“和”与名词“平等”的交叉组合产生的——“和平”（歧义词）十“平等”（非歧义词）。

(6) 副词十形容词：例如，在句子“这本小说的情节太平淡了”中，歧义字段“太平淡”是由副词“太”与形容词“平淡”的交叉组合产生的----“太平”（歧义词）十“平谈”（非歧义词）。

(7) 助词十形容词：例如，在短语“对这种现象的确切描述”中，歧义字段，“的确切”是由助词“的”与形容词“确切”的交叉组合产生的----“的确”（歧义词）+“确切”（非歧义同）。

(8)名词十连词：例如，在句子“社会需求和生产水平有矛盾”中，歧义字段“需求和”是由名词“需求”与连词“和”的交叉组合产生的----“需求”（非歧义词）十“求和”（歧义词）。

(9)动词十介词：例如，在句子“他们看中和日本人做生意的机会”中，歧义字段“看中和”是由动词“看中”与介词“和”的交叉组合产生的----“看中”（非歧义词）十“中和”（歧义词）。

2、多义组合型歧义切分字段比较复杂，这种歧义切分字段是由词与词之间的串联组合产生的。

(1)量词十名词：例如，在句子“一阵风吹过来了”中，歧义切分字段“阵风”是由量词“阵”和名词“风”的串联组合产生的。

(2)介词十名词：例如，在句子“请把手抬高一点儿”中，歧义切分字段“把手”是由介词“把”和名词“手”的串联组合产生的。

(3)动词十名词：例如，在句子“他喜欢吃烤白薯，中，歧义切分字段“烤白薯，是由动词“烤”和名词“白薯”的串联组合产生的。

(4)名词十方位词：例如，在句子“他骑在马上”中，歧义切分字段“马上”是由名词“马”和方位词“上”的串联组合产生的。

(5)名词十动词：例1，在句子“语言学起来并不十分容易”中，歧义切分字段“语言学”是由名词“语言”和动词“学”的串联组合产生的。

例如，在句子“学生会兴奋得手舞足蹈”中，歧义切分字段“学生会”是由名词“学生”

和动词“会”的串联组合产生的。

例如, 在句子“乒乓球拍卖完了”中，歧义切分字段“乒乓球拍”是由名词“乒乓球”和动词“拍”的串联组合产生的。

例如，在句子“美国会采取措施提高工业竞争力”中，歧义切分字段“美国会”是由名词“美国”和动词“会”的串联组合产生的。

(6) 方位词十动词：例如，在句子“他在庄稼地里间麦苗”中，歧义切分字段“里间”是由方位词“里”和动词“间”的串联组合产生的。

(7) 副词十动词：例如，在句子“他将来北京探亲”中，歧义切分字段“将来”是由副词“将”和动词“来”的串联组合产生的。

(8) 助词十动词：例1，在句子“他学会了解数学难题”中，歧义切分字段“了解”是由助词“了”和动词“解”的串联组合产生的。

例如，在句子“只要努力地学就可以学会”中，歧义切分字段“地学”是由助词“地”和动词“学”的串联组合产生的。

(9) 连词十副词：例如，在句子“日本保留和尚使用的古代庙宇已经不多了”中，歧义切分字段“和尚”是由连词“和”与副词“尚”的串联组合产生的。

七、证明题

P64-P65 例3-2

用于句法分析的产生式模块经过改进,但仍包含三个基本组成部分:

(1) 事实库:改进后的词语库,它进行了词类标注等.如,的/P;涌现/V;价值/A; 技术/N; 产品/N;科技园/N;高新/DET…

(2) 规则集:存储有关语法的状态转移、性质变化等规则的过程性知识。

(3) 控制器:将规则与事实进行匹配,控制句法分析过程。

例: 定义分析有限个汉语句子的产生式规则(限于篇幅,仅选有关一小部分), 终结目标S。(1) N→NP

(2) A NP→NP

(3) DET NP→DNP

(4) P DNP→PP

(5) DNP PP→DNP

(6) V DNP→VP

(7) DNP VP→S

下面用计算机程序(产生式模块)来分析一个汉语句子是否合法: "高新技术的高新价值产品涌现高新科技园". 算法执行过程:

经自动分词和算法E1,已得到: DET N P DET A N V DET N

继续执行算法E2～E6,

将N→NP(1):DET NP P DET A NP V DET NP

将 A NP→NP(2):DET NP P DET NP V DET NP

将DET NP→DNP(3):DNP P DNP V DNP

将P DNP→PP(4):DNP PP V DNP

将DNP PP→DNP(5):DNP V DNP

将V DNP→VP(6):DNP VP

将DNP VP→S(7):S (合法而结束)