人工智能与机器翻译期末复习题

人工智能与机器翻译期末复习题
人工智能与机器翻译期末复习题

一、名词解释(5X3‘)15’

1.兼类(P121):一个单词既可以作名词动词又可以作其他词类

2.机器翻译:用计算机软件代替人做的书面翻译

3.组合型歧义:一个字与前面的字成词,与后面的字成词,合起来也成词。

4.交集型歧义(P117):一个字与前面的字成词,与后面的字也成词。

5.人工智能:用计算机硬件、软件模拟人的行为,解决人类目前尚未认识清楚的问题。

6.人工智能软件的三大技术:知识表示、知识推理、知识获取。

7.语料库:单词、短语和句子组成的数据库。

8.知识工程:包括人工智能软件技术的工程。(知识工程是以知识为基础的系统,就

是通过智能软件而建立的专家系统)

9.深度学习:一步一步在丰富起来的特征规律引导下,由浅入深完成推理的方法。

10.语用分析:分析成语和习惯用语的方法。

二、题解 P36 例2.1 、2.2

例2.1 设有下列语句:

(1)高山比他父亲出名。

(2)刘水是计算机系的一名学生,但他不喜欢编程序。

(3)人人爱劳动。

为了用谓词公式表示这些语句,应先定义谓词:

BIGGER(x,y):x比y出名

COMPUTER(x):x是计算机系的学生

LIKE(x,y):x喜欢y

LOVE(x,y):x爱y

M(x):x是人

定义函数father(x)表示从x到其父亲的映射此时可用谓词公式把上述三个语句表示为:(1)BIGGER(高山,father(x))

(2)COMPUTER(刘水)∧∽LIKE(刘水,程序)

(3)(?x)(M(x) →LOVE(x,劳动))

例2.2 设有下列语句:

(1)自然数都是大于零的整数。

(2)所有整数不是偶数就是奇数。

(3)偶数除以2是整数。

定义谓词如下:

N(x):x是自然数

I(x):x是整数

E(x):x是偶数

O(x):x是奇数

GZ(x):x大于零

另外,用函数S(x)表示x除以2。此时,上述三个句子可用谓词公式表示为:

(?x)(N(x) →GZ(x)∧I(x))

(?x)(I(x) →E(x)∨O(x))

(?x)(E(x) →I(S(x)))

三、论述(4X5‘)20’

1.阐述深度、广度、代价驱动搜索方法。(P68)

答:广度优先搜索法:对全部节点沿广度进行横向扫描,按各节点生成的先后次序,

先生成、先检查、先扩展,沿广度遍历所有节点。

深度优先搜索法:每一次扩展最晚生成的子节点,沿着最晚生成的子节点分支,逐级纵向深入发展。

代价驱动搜索法:依据初始节点到它们各自所付出的代价大小进行排序,代价小的节点放在前面扩展,周而复始重复上述操作,直到找到目标节点为止。

2.智能软件的核心组成部分。

答:数据库、控制程序、知识库或规则集。

3.举例说明专业人工智能和广义人工智能的区别。

广义:能够代替人类做任何事情功能的即可

专业:用计算机软件模拟人的行为以解决人类目前尚未认识清楚的问题

4.阐述人工智能软件和常规软件的区别。

答:普通软件只有控制集与数据库集;

智能软件具有控制集与数据库集,还有知识库或者规则集。

5.试述规则不一致的规则与原因(P77)

答:(1)循环规则:由数个规则的前提和结论形成一个循环链,最终由末尾规则的

结果子句推出起始规则的前提部分;

(2)冲突规则:两个规则的前提条件等价,但一个或多个结果子句有矛盾或者前

提子句有矛盾而结论部分完全等价;也有可能由多条规则链形成冲突规则集;

(3)冗余规则:两个规则的前提条件等价,一个或多个子结果子句也等价;

(4)从属规则:两个规则有相同的结果,但其中一个包含有多余的约束条件。

6.简述三次人工智能的高潮及原因

答:1956年,人工智能诞生;

1981年,日本研制智能机,各个国家不甘落后;

2017年,计算机软件战胜围棋冠军,人工智能备受瞩目。

7.阐述类比搜索方法的基本思想。(P75)

答:利用类比获得与新问题相似的过去问题的求解过程,作为启发信息来指导新问

题的求解,这样可以缩小搜索范围,降低问题求解的复杂性。

8.阐述机器学习的两种方式

答:狭义:指人们通过系统设计,程序编制和人机交互,使机器获取知识。

广义:指机器自动或半自动地获取知识。

四、自然语言处理的概念

1. 试述歧义问题的种类。(P129)

答:①词组的多义产生的歧义;

②由计算机程序在自动分词阶段产生的歧义;

③由词典大小产生的歧义;

④由自然语言的二义性产生的歧义。

2. 人工智能、知识工程、专家系统的区别。

答:专家系统:是人工智能特定领域技术;

知识工程:就是人工智能的软件技术;

人工智能:不仅是软件技术还有硬件技术。

3. 试述机器翻译的四种方法。(P88的四个小标题)

答:①基于分析和转换的机器翻译方法。

②基于中间语言的机器翻译方法。

③基于统计的机器翻译方法。

④基于实例的机器翻译方法。

1.转换式的方法特征:利用了语法语义关系

2.中间语言的方法特征:假想每种语言都能转换到中间语言

3.统计的方法特征:利用了数学统计原理

4.实例的方法特征:利用了类比相似语句

4. 机器字典的用途。(P114)

1>机器词典的好坏是更好的实现实用化机器翻译系统软件的障碍之一

2>机器词典是机器翻译的质量的关键, 要达到机器翻译的全自动, 高质量, 就必须有一部信息丰富, 易于使用的机器词典

3>电子词典(机器词典)不仅可以用于机器翻译, 而且也可以用在自然语言理解, 自然语言处理等诸多方面

机器翻译系统的词典又可以分为通用词典和专业词典两部分, 这种划分便于维护和扩充.也可以把机器词典分的更细一点, 如组俺们的缩略语词典, 特殊字词典等,还可以把通用词典再细分为名词词典, 动词词典, 成语词典等

5. 举例说明语义分析的用途

例: 乒乓球拍买完了

6. 上下无关文法的定义

答:一个句子意义本身每一个单词意义全部明确。(比如王明是好学生,意义明确,而他是好学生,他与上下文相关,意义就不明确。)

五、算法描述

1.产生式系统的基本算法(P59)

答: E1:初始化综合数据库(DATA←初始事实库)

E2:until DATA满足结束条件以前,do

E3:begin

E4:在规则集中,按冲突解决方法选出某一条可用于综合数据库的规则

E5:执行当前选中的规则,把该规则执行后得到的结论送入综合数据库中(DATA←规则应用到DATA得到的结果)

E6:end

2.回溯方法(P67)

YX0:选择一条新路径搜索

YX1:搜索若超出规定指标 (无新路径, 超时, 超深度等) 失败退出; 否则搜索继续

YX2:搜索真的状态找不到可用规则, 回溯到YX0

YX3:搜索的状态依某种原则 (任意排列或按启发式准则) 取有用规则

YX4:若规则用完未找到目标回溯YX0

YX5:取头条可用规则Ri

YX6:删去头条规则减少搜索中规则集长度 (注意这里不懂原则规则集)

YX7:规则Ri作用于当前状态生成新状态

YX8:若找到目标成功退出; 若生成的"新状态" 已出现过回溯到YX0

YX9:记录新状态对新状态递归调用YX1 ~ YX7

六、分析题

P117-P119(18题选8)

1、交集型歧义切分字段是由词与词之间的交叉组合产生的。

(1) 名词+名词:例如, 在句子“用树形图形式加以描述”中, 歧义字段“图形式”是由名词“图”与名词“形式”之间的交叉组合产生的----“图形”十“形式”。事实上,“图形”是歧义词,它是歧义字段“图形式”在给定句子中错误地切分出来的片段,“形式”是非歧义词,它是歧义字段“图形式”在给定句子中,按正确的切分方式切分出来的片段。

(2) 动词十名词:例如,在句子“研究生命的本质”中,歧义字段“研究生命”是由动词“研究”与名词“生命”之间的交叉组合产生的----“研究生”(歧义词)十“生命”(非歧义词)。

(3) 形容词十名词:例如,在句子“白天鹅游过来了”中,歧义字段“白天鹅”是由形容词“白”与名词“天鹅”之间的交叉组合产生的——“白天”(歧义词)十“天鹅”(非歧义词)。

(4) 介词十名词:例如,在句子“让位移等于50厘米”中,歧义字段“让位移”是由介词“让”与名词“位移”之间的交叉组合产生的——“让位”(歧义词)十“位移”(非歧义词)。

(5) 连词十名词:例如,在短语“独立自主和平等互利的原则”中,歧义字段“和平等”是由连词“和”与名词“平等”的交叉组合产生的——“和平”(歧义词)十“平等”(非歧义词)。

(6) 副词十形容词:例如,在句子“这本小说的情节太平淡了”中,歧义字段“太平淡”是由副词“太”与形容词“平淡”的交叉组合产生的----“太平”(歧义词)十“平谈”(非歧义词)。

(7) 助词十形容词:例如,在短语“对这种现象的确切描述”中,歧义字段,“的确切”是由助词“的”与形容词“确切”的交叉组合产生的----“的确”(歧义词)+“确切”(非歧义同)。

(8)名词十连词:例如,在句子“社会需求和生产水平有矛盾”中,歧义字段“需求和”是由名词“需求”与连词“和”的交叉组合产生的----“需求”(非歧义词)十“求和”(歧义词)。

(9)动词十介词:例如,在句子“他们看中和日本人做生意的机会”中,歧义字段“看中和”是由动词“看中”与介词“和”的交叉组合产生的----“看中”(非歧义词)十“中和”(歧义词)。

2、多义组合型歧义切分字段比较复杂,这种歧义切分字段是由词与词之间的串联组合产生的。

(1)量词十名词:例如,在句子“一阵风吹过来了”中,歧义切分字段“阵风”是由量词“阵”和名词“风”的串联组合产生的。

(2)介词十名词:例如,在句子“请把手抬高一点儿”中,歧义切分字段“把手”是由介词“把”和名词“手”的串联组合产生的。

(3)动词十名词:例如,在句子“他喜欢吃烤白薯,中,歧义切分字段“烤白薯,是由动词“烤”和名词“白薯”的串联组合产生的。

(4)名词十方位词:例如,在句子“他骑在马上”中,歧义切分字段“马上”是由名词“马”和方位词“上”的串联组合产生的。

(5)名词十动词:例1,在句子“语言学起来并不十分容易”中,歧义切分字段“语言学”是由名词“语言”和动词“学”的串联组合产生的。

例如,在句子“学生会兴奋得手舞足蹈”中,歧义切分字段“学生会”是由名词“学生”

和动词“会”的串联组合产生的。

例如, 在句子“乒乓球拍卖完了”中,歧义切分字段“乒乓球拍”是由名词“乒乓球”和动词“拍”的串联组合产生的。

例如,在句子“美国会采取措施提高工业竞争力”中,歧义切分字段“美国会”是由名词“美国”和动词“会”的串联组合产生的。

(6) 方位词十动词:例如,在句子“他在庄稼地里间麦苗”中,歧义切分字段“里间”是由方位词“里”和动词“间”的串联组合产生的。

(7) 副词十动词:例如,在句子“他将来北京探亲”中,歧义切分字段“将来”是由副词“将”和动词“来”的串联组合产生的。

(8) 助词十动词:例1,在句子“他学会了解数学难题”中,歧义切分字段“了解”是由助词“了”和动词“解”的串联组合产生的。

例如,在句子“只要努力地学就可以学会”中,歧义切分字段“地学”是由助词“地”和动词“学”的串联组合产生的。

(9) 连词十副词:例如,在句子“日本保留和尚使用的古代庙宇已经不多了”中,歧义切分字段“和尚”是由连词“和”与副词“尚”的串联组合产生的。

七、证明题

P64-P65 例3-2

用于句法分析的产生式模块经过改进,但仍包含三个基本组成部分:

(1) 事实库:改进后的词语库,它进行了词类标注等.如,的/P;涌现/V;价值/A; 技术/N; 产品/N;科技园/N;高新/DET…

(2) 规则集:存储有关语法的状态转移、性质变化等规则的过程性知识。

(3) 控制器:将规则与事实进行匹配,控制句法分析过程。

例: 定义分析有限个汉语句子的产生式规则(限于篇幅,仅选有关一小部分), 终结目标S。(1) N→NP

(2) A NP→NP

(3) DET NP→DNP

(4) P DNP→PP

(5) DNP PP→DNP

(6) V DNP→VP

(7) DNP VP→S

下面用计算机程序(产生式模块)来分析一个汉语句子是否合法: "高新技术的高新价值产品涌现高新科技园". 算法执行过程:

经自动分词和算法E1,已得到: DET N P DET A N V DET N

继续执行算法E2~E6,

将N→NP(1):DET NP P DET A NP V DET NP

将 A NP→NP(2):DET NP P DET NP V DET NP

将DET NP→DNP(3):DNP P DNP V DNP

将P DNP→PP(4):DNP PP V DNP

将DNP PP→DNP(5):DNP V DNP

将V DNP→VP(6):DNP VP

将DNP VP→S(7):S (合法而结束)

相关主题
相关文档
最新文档