中文信息处理与挖掘智慧树知到答案章节测试2023年山东交通学院

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章测试

1.本课程将详细介绍的自然语言处理应用有哪些()。

A:自动问答

B:情感分析

C:机器翻译

D:自动摘要

答案:ABCD

2.下列那个概念与自然语言处理无关。()

A:Computer Vision

B:Computational Linguistics

C:Natural Language Processing

D:Natural Language Understanding

答案:A

3.黏着型语言比较有代表性的语言是日语。()

A:对

B:错

答案:A

4.自然语言中最小的有意义的构成单位是()。

A:词

B:篇章

C:句子

D:字

答案:A

5.中文信息处理的第一步是()。

A:词性标注

B:构建句法树

C:分词

D:确定上下文关系

答案:C

6.如果打开校正功能,对于一些典型的语法错误、拼写错误以及用词错误就可

以自动检测出来。( )

A:对

B:错

答案:A

7.就分词来讲,主要有三类分词方法()。

A:基于规则的分词方法

B:基于语法的分词方法

C:基于词典的分词方法

D:基于统计的分词方法

答案:ACD

8.基于词典的分词方法从匹配的方法来讲,一般使用最大匹配法,而最匹配法

又包括()。

A:逆向最大匹配算法

B:双向最大匹配算法

C:正向最大匹配算法

D:三向最大匹配算法

答案:ABC

9.词性标注的主要方法主要有()。

A:统计与规则相结合的词性标注方法

B:基于规则的词性标注方法

C:基于字典的词性标注方法

D:基于统计的词性标注方法

答案:ABD

10.命名实体识别事实上就是识别出以下三类命名实体。()

A:人名

B:别名

C:组织机构名

D:地名

答案:ACD

第二章测试

1.概率论作为统计语言模型的数学基础,应用到自然语言处理领域,是由于:

统计语言处理技术已经成为自然语言处理的主流,而在统计语言处理的步骤中,收集自然语言词汇(或者其他语言单位)的分布情况、根据这些分布情况进行统计推导都需要用到概率论。()

A:错

B:对

答案:B

2.设E为随机试验,Ω是它的样本空间,对于E的每一个事件A赋予一个实

数,记为P ( A ),如果集合函数P ( ⋅ )满足下列哪些条件,则实数P ( A )为

事件A的概率。()

A:唯一性

B:规范性

C:非负性

D:可列可加性

答案:BCD

3.设A、B是两个事件,且P(B)>0,则称P(A|B)为在已知事件B发生的条件

下,事件A发生的()。

A:似然估计

B:条件频率

C:条件概率

D:概率

答案:C

4.某一事件B的发生有各种可能的原因n个,B发生的概率是各原因引起B

发生概率的总和,也就是()。

A:条件概率

B:后验概率

C:先验概率

D:全概率公式

答案:D

5.贝叶斯公式于1763年由贝叶斯(Bayes)给出,它是在观察到事件B已发生

的条件下,寻找导致B发生的每个原因的概率。()

A:错

B:对

答案:B

6.在自然语言处理中,以句子为处理单位时一般假设句子独立于它前面的其它

语句,句子的概率分布近似地符合以下哪项()。

A:期望

B:贝叶斯法则

C:二项式分布

D:最大似然估计

答案:C

7.在概率论和统计学中,一个离散性随机变量的期望值,是试验中每次可能结

果的概率乘以其结果的总和,也被称为()。

A:期望

B:均值

C:数学期望

D:方差

答案:ABC

8.在概率论和统计学中,一个随机变量的方差,描述的是它的离散程度,也就

是该变量离其期望值的距离.()

A:对

B:错

答案:A

9.以下哪项表示信源X 每发一个符号且不论发什么符号所提供的平均信息量。

()

A:联合熵

B:熵

C:信息

D:条件熵

答案:B

10.哪一项常被用以衡量两个随机分布的差距。()

A:联合熵

B:条件熵

C:熵率

D:相对熵

答案:D

第三章测试

1.以下哪一个属于序列标注问题()。

A:命名实体识别

B:指代消解

C:英文词的形态还原

D:词频统计

答案:A

2.在词法分析里,需要处理的最小单位是()。

A:句子

B:短语

C:字

D:词

答案:D

3.下列()形式是最主要的信息载体()。

A:音频

B:视频

C:图像

D:文字

答案:D

4.词性标注的主要方法包括()。

A:基于统计的和基于规则的相结合的方法

B:基于统计的方法

C:基于语义的标注方法

D:基于规则的方法

答案:ABD

5.设输入句子“我爱人工智能”,经过词性标注等得到“我/PN爱/VV人工智能

/NR”,其中,PN、VV和NR的含义分别是代词、动词、专有名词;()是命名实体。

A:“爱”

B:“我”

C:“我”、“人工智能”

D:“人工智能”

答案:D

相关文档
最新文档