2019年公需培训信息检索答案
《信息检索》试题与答案

《信息检索》试题与答案一、选择题1. 以下哪个不是信息检索的基本过程?A. 需求分析B. 检索策略制定C. 检索结果评价D. 信息编码答案:D2. 信息检索的核心技术是?A. 检索算法B. 检索系统C. 信息组织D. 用户界面答案:A3. 以下哪个不是信息检索的评价指标?A. 检索速度B. 检索结果的相关性C. 检索系统的稳定性D. 检索结果的数量答案:D4. 以下哪个不是信息检索的分类?A. 文本检索B. 图像检索C. 音频检索D. 数据库检索答案:D二、填空题5. 信息检索的目的是为了满足用户对信息的______。
答案:需求6. 信息检索的三个基本过程是______、______和______。
答案:需求分析、检索策略制定、检索结果评价7. 信息检索的评价指标包括______、______和______等。
答案:检索速度、检索结果的相关性、检索系统的稳定性8. 信息检索可以分为______检索、______检索、______检索等。
答案:文本检索、图像检索、音频检索三、判断题9. 信息检索的目的是为了获取用户感兴趣的信息。
()答案:正确10. 信息检索的评价指标只包括检索结果的相关性。
()答案:错误11. 信息检索的过程中,需求分析是非常重要的环节。
()答案:正确12. 信息检索的分类只包括文本检索和图像检索。
()答案:错误四、简答题13. 简述信息检索的基本过程。
答案:信息检索的基本过程包括以下三个环节:(1)需求分析:分析用户的信息需求,明确检索目标。
(2)检索策略制定:根据需求分析的结果,制定相应的检索策略,包括检索词、检索范围、检索方式等。
(3)检索结果评价:对检索结果进行评价,判断是否满足用户需求,并对检索策略进行优化。
14. 简述信息检索的评价指标。
答案:信息检索的评价指标包括以下三个方面:(1)检索速度:指检索系统在给定的时间内返回检索结果的能力。
(2)检索结果的相关性:指检索结果与用户需求的相关程度。
2019年公需科目答案

2019年公需科目答案1.在2016年,ImageNet测试的识别错误率为(B)。
2.中国人工智能产业初步呈现集聚态势,人工智能市及沿海地区,排名第一的城市是(B)。
3.《“健康中国2030”规划纲要》中提到,健康是经济社会发展的(B)。
4.人工智能是(D)的一个分支,它试图揭示人类智能的实质和真相,并以模拟人类智能的5.(C)是自然语言处理的重要应用,也可以说是最基础的应用。
6.下列对人工智能芯片的表述,不正确的是(C)。
7.关于专用人工智能与通用人工智能,下列表述不当的是(D)。
8.对于神经退行性疾病,(C)将成为主要的检测手段。
9.现在医学上使用的水银柱血压计是在(B)开始应用于临床的。
10.我国骨质疏松的诊断标准是T值小于等于(D)。
11.在2016年,我国人工智能企业超过了(D)家。
12.根据国际评判健康的标准,我国成年人心血管呈理想状态的比率为(B)。
13.“计算机器能够思维”的观点是由(B)提出来的。
14.(C)宣布启动了“先进制造伙伴计划”“人类连接组计划”“创新神经技术脑研究计15.(C)是用电脑对文本集按照一定的标准进行自动分类标记。
16.MIT教授Tomaso Poggio明确指出,过去15年人工智能取得的成功,主要是因为(D)。
17.在高血压诊断标准的变迁史上,(D)将高血压的诊断标准定为120/80mmHg以下更18.在国际评判健康的标准中,血压值低于(B)才是健康的。
19.据2005年美国一份癌症统计报告表明,在男性的所有死亡原因中,排在第二位的是(C)。
20.(C)是指能够按照人的要求,在某一个领域完成一项工作或者一类工作的人工智能。
21.我们应该正确认识统计学中概率与个体之间的关系,概率是(A)比较,从小到老的数22.古代把计量叫“度量衡”,其中,“度”是测量(A)的过程。
23.古代把计量叫“度量衡”,其中,“量”是测量(B)的过程。
24.到(B)年,几乎所有的算法都使用了深度学习的方法。
2019年人工智能公需科考试判断题答案

2019年人工智能公需科考试判断题答案1.高血压、骨质疏松等疾病的诊断标准多源于概率判断。
(1.0分)2.问答系统(Question Answering System, QA)是信息检索系统的一种高级形式,它能用准确、简洁的自然语言回答用户用自然语言提出的问题。
其研究兴起的主要原因是人们对快速、准确地获取信息的需求。
(1.0分)3.在健康标准的制定过程中,数据库的数据数量和质量决定了健康与机能状态评估系统是否科学准确。
(1.0分)4.肺癌治疗中有一项困难就是呼吸会引起肿瘤运动,目前医学中对此没有任何解决办法。
(1.0分)5.根据国际机器人联合会的统计,近年来中国在家庭清洁机器人、养老陪护机器人、教育娱乐机器人等领域已经形成了系列产品。
(1.0分)6.日本对人工智能非常重视,启动了“人类脑计划”,希望通过计算机技术模拟大脑,建立一套全新的、革命性的生成、分析、整合、模拟数据的信息通信技术平台,来促进相应研究成果的应用和转化。
(1.0分)7.据《中国心血管病报告2017》(概要)显示,中国心血管病死亡占居民疾病死亡构成的40%以上,居首位,高于肿瘤及其他疾病。
(1.0分)8.从2017年年终数据来看,我国人工智能在企业数量、投资机构、投资金额、人才队伍方面已经与美国持平。
(1.0分)9.2017年10月,阿里巴巴官方宣布其建成全球首个全流程的无人仓。
(1.0分)10.据清华原副校长施一公教授研究,每年中国人死亡原因统计结果显示,神经退行性疾病导致死亡的比率并不高,但其影响很大。
(1.0分)11.如果一个人激烈运动过后测血压,测量出的血压值偏高,并不代表他是真的血压高。
(1.0分)12.在对医学数据的解读上,统计学意义就等同于临床意义。
(1.0分)13.现在的AI技术在肺结节良恶性判别上已经达到了很高的水平。
(1.0分)14.K近邻算法的目标是从大量的数据中通过算法搜索隐藏于其中的知识。
(1.0分)16.《SPRINT研究》纳入的人群是明确限制条件的,以该小部分人群为基础得到的研究结论具有限制性,不能无限推广至其他人群甚至所有人群。
2019年公需科目考试参考答案

1.(),中共中央政治局就人工智能发展现状和趋势举行第九次集体学习。
(2.0分)A.2018年3月15日B.2018年10月31日C.2018年12月31日D.2019年1月31日我的答案:B√答对2.下列对我国人工智能基础理论的表述,不当的是()。
(2.0分)A.大数据智能B.人机混合智能C.独媒体感知计算D.自主协同与决策我的答案:C√答对3.2012年,Hinton教授小组在ImageNet竞赛中夺冠,降低了几乎()的错误率。
(2.0分)A.25%B.50%C.75%D.100%我的答案:B√答对4.()是一种处理时序数据的神经网络,常用于语音识别、机器翻译等领域。
(2.0分)A.前馈神经网络B.卷积神经网络C.循环神经网络D.对抗神经网络我的答案:C√答对5.现在医学上使用的水银柱血压计是在()开始应用于临床的。
(2.0分)A.1872年B.1896年C.1970年D.2005年我的答案:B√答对6.在2016年,我国人工智能企业超过了()家。
(2.0分)A.1000B.1200C.1400D.1500我的答案:D√答对7.()是指能够自己找出问题、思考问题、解决问题的人工智能。
(2.0分)A.超人工智能B.强人工智能C.弱人工智能D.人工智能我的答案:A×答错8.古代把计量叫“度量衡”,其中,“度”是测量()的过程。
(2.0分)A.长度B.容积C.温度D.轻重我的答案:A√答对9.据《中国心血管病报告2017》(概要)显示,中国现有心血管病患()。
(2.0分)A.1300万人B.1100万人C.450万人D.2.9亿人我的答案:D√答对10.如果一个人体检时发现乳腺癌1号基因发生突变,可以推断出()。
(2.0分)A.这个人患乳腺癌的概率增加了B.这个人已经患了乳腺癌C.这个人一定会患乳腺癌D.这个人很快会被检查出乳腺癌我的答案:A√答对11.()是指直接通过肢体动作与周边数字设备和环境进行交互。
2019年专业技术人员公需科目继续教育答案

2019 年专业技术人员公需科目继续教育单选题:1.(引导性病毒 )又称操作系统病毒,主要寄生在硬盘的主引导程序中,当系统启动时,进入内存,肆意传染和破坏,典型代表有大麻病毒和小球病毒。
2.本课程提到,朱熹曾经说过:“治骨角者,既切之而复磋之;治玉石者,既琢之而复磨之,皆言其治之有绪,而益致其精也。
”该话语出自(大学章句)。
3.B2C 是指(企业对消费者的网络交易)。
4.1991 年,(万维网)的诞生,互联网开始走向标准化、商业化和国际化。
5.“建设中国生态康养旅游名市,也是应对挑战的重要路径。
”广元最大的优势是(绿色生态)。
6.根据本讲,涉密信息系统的界定是指系统内存储、处理和传输信息涉及(国家秘密)的。
7.良好的手机安全防护习惯对保障个人信息安全至关重要,下列各项中,不属于良好的手机安全防护习惯的是(在公共 WiFi 场所使用银行账号等支付服务)8.根据本讲,下列有关“组织部门信息系统安全”的说法中,不正确的是(由于党委组织部并非党委第一部,因此安全要求不高)。
9.《网上仲裁规则》对于争议金额在10万以下,其收费标准是争议金额的( 5%)。
10.根据信息系统在国家安全、经济建设、社会生活中的重要程度,遭到破坏后对国家安全、社会秩序、公共利益以及公民、法人和其他组织的合法权益的危害程度等,可以把信息系统的安全等级由低到高分为(五级)进行安全保护。
判断题:1.电子文档安全管理是管理电子文档的产生、制作、传输、使用中的安全,不包括销毁阶段。
(错)2.计算机安全终端防护要综合查杀,综合防治,不存在一个反病毒的软硬件能防止未来所有的病毒。
(对)3.在线解决机制通过计算机屏幕进行电子化信息的交换,可以非常容易的隐瞒性别、年龄、肤色等特征,有效地防止来自这些外观特征上的歧视。
(对)4.孟子曰,“学问之道无他,求其放心而已矣。
”学问之道,从根本上讲就是被自己迷失方向的心给找回来。
(对)5.计算机专业技术人员可以随意卸载涉密信息系统的安全技术程序、管理应用程序。
四川省2019年4月02139 计算机信息检索 试题及答案

四川省 2019 年 4 月高等教育自学考试计算机信息检索(课程代码 02139)注意事项:1.本试卷分为两部分,第-部分为选择题,第二部分为非选择题。
2.应考者必须按试题顺序在答题卡指定位置上作答,答在试卷上无效。
3.涂写部分、画图部分必须使用 2B 铅笔,书写部分必须使用黑色字迹签字笔。
第一部分选择题一、单项选择题:本大题共 15 小题,每小题 1 分,共 15 分。
在每小题列出的备选项中只有一项是最符合题自要求的,请将其选出。
1.出自官方并具有权威性、可靠性特点的互联网信息是A.科研信息B.媒体信息C.教育信息D.政府信息2.万维网的英文缩写是A.wwwB.HTTPC.URLD.HTML3.以下查询算法模型中最简单的是A.扩展布尔模型B.布尔检索模型C.向量空间模型D.概率检索模型4.针对某一特定领域的搜索引擎是A.通用搜索引擎B.元搜索引擎C.垂直搜索引擎. D.目录搜索引擎5.在国内推出第一个全旅游搜索引擎的是A.智联B.酷讯C.搜房D.优酷6.以事物分类,并有利于对交叉学科进行主题揭示的分类方式是A.分面组配法B.图书分类法C.主题分类法D.学科分类法7.以下学科信息门户中,收录范围覆盖所有学术领域的是A.BUBL LINKB.SOSIGC.SciCentralmine8.用户提供一个查询图片,搜索引擎在数据库中搜索相似图片的查询模式是A.按绘查询B.按描述查询C.按例查询D.按需求查询9.以下音频检索工具中,专门用来查找歌剧信息的是A.音乐极限B.九天音乐C.八宝音乐盒D.OPERABASE10.由北京大学方正公司开发的数字图书系统是A.读秀知识库B.Apabi 数字资源平台C.书生之家D.书同文古籍书库11.当今世界信息量最大的电子、工程类信息资源是A.IELB.ECO .C.ProQuestD.ACM12.被称为“工具书之王”的是A.辞典B. 传记C.白页信息D.百科全书13.目前世界上最好的黄白页信息查询工具是A.Who whereB.InteliusC.IAFD.AnyWho14.以下网站中能够提供各种有关旅行的拍卖信息的是A.Lonely PlanetB.Virtual TouristC.Expedia .comD.Sky Auction15.以下网站中集百科全书、字典、地图集和年鉴于一体的是pleaseB.Europa WorldC.中国年鉴网D. Almanac第二部分非选择题二、名词解释题:本大题共 5 小题,每小题 2 分,共 10 分。
信息检索考试题及答案

信息检索考试题及答案第一篇:信息检索考试题及答案一、名词解释0、文献及其要素“文献”是泛指“有历史价值或参考价值的图书资料。
”要素:1、构成文献内核的信息、知识、数据、事实2、载体信息、知识、数据、事实的物质载体。
3、记录信息、知识、数据、事实的符号系统。
1、专利文献专利文献是实行专利的国家、地区及国际专利组织在批审专利过程中产生的官方文件及出版物,包括专利说明书、专利权利要求书、专利公报、专利分类表、专利检索工具等。
2、三大检索系统三大检索系统是:SCI(《科学引文索引》,英文全称为Science Citation Index)是美国科学情报研究所(Institute for Scientific Information,简称ISI)出版的一部世界著名的期刊文献检索工具,其出版形式包括印刷版期刊和光盘版及联机数据库,现在还发行了互联网上Web版数据库。
EI是美国《工程索引》(TheEngineeringIndex)的简称。
EI创刊于1884年,由美国工程情报公司(EngineeringInformationCo.)出版发行。
EI是工程技术领域内的一部综合性检索工具,报道内容包括:电类、自动控制类、动力、机械、仪表、材料科学、农业、生物工程、数理、医学、化工、食品、计算机、能源、地质、环境等学科。
ISTP是IndextoScientific&TechnicalProceedings的缩写,是美国科学情报研究所的网络数据库WebofScienceProceedings中两个数据库(ISTP和ISSHP)之一。
专门收录世界各种重要的自然科学及技术方面的会议,包括一般性会议、座谈会、研究会、讨论会、发表会等的会议文献,涉及学科基本与SCI相同。
3、二次文献二次文献又称二级次文献,它是文献检索工具,能比较全面、系统地反映某个学科、专业或专题在一定时空范围内的文献线索,是积累、报道和检索文献资料的有效手段.4、受控语言受控语言是一种规范化的人工语言,包括具有较强族性检索功能的分类语言和具有较强特性检索功能的主题语言。
2019年专技人员公需科目培训班考试答案.复制问题直接查询

2020年
2025年
2030年
•29、有了(b)心,也就有了良心。在工作当中就能够兢兢业业,能够珍惜自己的事业
理解
感恩
事业
同情
•30、哪个国家的石墨烯专利技术在数量、质量上均有好的表现,综合排名全球第一。(A)石墨烯专利排行:中国、美国、韩国、日本
中国
韩国
美国
日本
•31、为了进一步坚定理想信念,必须(C)。
90
80
70
100
•35、我国新时代的特征是(B)。
步入小康社会
社会主要矛盾发生转变
全体人民共同富裕
成为世界第二大经济体
•36、1+3(A)
4
5
6
7
•37、中国共产党区别于其他政党的显著标志是(A)。
奉献精神
奋斗精神
首创精神
忠诚精神
•38、党是从十六大开始提出“(b)城市和小城镇协调发展”的方针。
大中
体制机制创新
发展特色农业
编制小镇规划
与重点项目结合
•23、关于人的评价方式,未提及(B)
结果性评价
心理性评价
行为性评价
过程性评价
•24、技术进步和产业升级带来了产业结构的高级化,即(A)
系统化
统一化
一体化
多元化
•25、反贫困的终极目标是(d)。
物质极大丰富
经济自由和精神解放
精神极大满足
共同富裕
•26、习近平总书记提出脱贫要下一番“绣花”功夫的重要思想是在(c)。
正确
错误
?•16、新时代要有新目标,新目标既要与纵向的历史比较,还要与横向的世界舞台空间上的其他国家比较。v
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息检索
1、(单选,4分)
所有检索策略都包含三个要素,以下选项中不属于三要素的一项是()
A、匹配函数
B、排序函数
C、文档表示
D、查询表示
答案:B
2、(单选,4分)
在向量模型中,不可以通过()来衡量文档和查询之间的相似度。
A、向量间距离
B、向量内积
C、向量间夹角大小
D、向量间正切值
答案:D
3、(单选,4分)
T1、T2、T3表示特征项,D1、D2、D3、D4为文档向量,Q为查询向量,其中,D1=4T1+2T2+3T3,D2=T1+4T2+2T3,D3=5T1+2T3,D4= T2+3T3,Q=T1+0T2+2T3 。
以上文档中和Q最大可能相关的是()
A、D1
B、D2
C、D3
D、D4
答案:A
4、(单选,4分)
以下选项中属于概率模型的优点的是()
A、模型具有内在的相关反馈机制,将文档根据相关概率按递减顺序排列
B、模型最初将文档分成相关的集合和不相关的集合
C、模型中所有的权值都是二值的
D、模型假设标引词相互独立
答案:A
5、(单选,4分)
信息检索模型中,神经网络模型属于()
A、布尔模型
B、向量模型
C、概率模型
D、结构化模型
答案:B
6、(单选,4分)
以下关于网络爬虫的描述中,错误的一项是()
A、在爬虫开始的时候,需要给爬虫输送一个URL列表,作为爬虫的起始位置
B、根据某种抓取策略爬行新发现的URL,如此重复下去
C、爬虫程序会抓取所有网页,以保证搜索正确性
D、对于商业搜索引擎来说,分布式爬虫是必须采用的技术
答案:C
7、(单选,4分)
在实际的搜索引擎系统中,通过存储()来存储文档信息
A、文档地址
B、文档简化序号
C、文档编号
D、文档编号差值
答案:D
8、(单选,4分)
下面方法中,不是建立索引的方法的是()
A、两边文档遍历法
B、排序法
C、归并法
D、HITS
答案:D
9、(单选,4分)
关于PageRank标准算法与简化算法正确的是()
A、PageRank简化算法对G中的每一个节点n,设定其初始值均为1/n
B、PageRank简化算法可以保证迭代过程中的PageRank值之和为1
C、PageRank标准算法不考虑没有超链接网页的情况
D、在实际运算过程中,由于节点数n的值巨大,因此通常采用适用于稀疏
矩阵运算的PageRank标准算法来对运算过程进行改善
答案:A
10、(单选,4分)
关于HITS算法描述正确的是(C)
A、算法最后输出的是按照内容权威度排序的结果列表
B、如果在原有的扩展网页集合内添加删除个别网页或者改变少数链接关系,HITS算法的排名结果不会有非常大的改变
C、HITS算法核心思想是对网页两个方面的权威程度进行评价,一个是内容权威度,另一个是链接权威度,两者具有相互增强的关系
D、HITS是与查询相关的算法,计算效率较高
答案:C
11、(单选,4分)
网页重定向属于下列哪种作弊方式(C)
A、内容作弊
B、链接作弊
C、隐藏作弊
D、Web2.0作弊
答案:C
12、(单选,4分)
对网页进行两次抓取,第一次是正常的搜索引擎爬虫抓取,第二次以模拟人工访问页面的方式抓取,如果两次抓取到的内容差异较大,则认为是作弊页面,这属于()
A、识别网页重定向
B、识别页面隐藏
C、反内容作弊
D、链接反作弊
答案:B
13、(单选,4分)
以下不是搜索引擎的主要功能模块的一项是()
A、网络爬虫
B、搜索引擎索引
C、PageRank
D、搜索排序
答案:C
以下选项中描述不正确的是()
A、爬虫的作用是为搜索引擎抓取大量的数据,抓取的对象是整个互联网上
的网页
B、根据具体应用的不同,可以将爬虫分为两种类型,即增量型爬虫和垂直型爬虫
C、暗网是一些垂直领域网站,它们通常是网站提供组合查询界面,用户按照需求输入查询之后,才能获取相关数据
D、倒排列表是指记载出现过某个单词的所有文档的文档列表、以及单词在
该文档中出现的位置信息
答案:B
15、(单选,4分)
以下选项中描述正确的是()
A、动态索引包含2个关键的索引结构:倒排索引、临时索引
B、查准率是衡量系统在实施某一作业时检出相关文献能力的一种测度指标,是对检索遗漏程度的度量。
C、中文分词技术采用了基于符号的方法来识别
D、机器学习的四个步骤中,文档特征抽取是指利用抽取算法抽取查询词
TF/IDF信息、文档长度、网页PageRank值、网页入链/出链数量等
答案:D
16、(单选,4分)
以下关于推荐系统和搜索引擎的说法中,错误的是()
A、推荐系统和搜索引擎都是为了解决信息过载的问题
B、搜索引擎需要用户提供明确的需求
C、推荐系统是由用户主导的
D、搜索引擎注重结果之间的排序
答案:C
下列关于推荐系统评测中在线实验的说法,错误的是()
A、可以公平获得不同算法实际在线时的性能指标
B、成本较低,容易部署
C、可以获得商业上关注的指标,如转化率、点击率等
D、周期较长,需要进行长期的实验才能得到可靠的结果答案:B
18、(单选,4分)
为了覆盖用户的不同兴趣领域,我们需要提高推荐结果的()
A、惊喜度
B、满意度
C、多样性
D、准确率
答案:C
19、(单选,4分)
下列各项中为工业界更关注的评测指标的是()
A、点击率
B、惊喜度
C、新颖性
D、准确率
答案:A
20、(单选,4分)
从商家角度看,推荐系统受欢迎的原因有()
A、拓宽了用户获取知识的方式
B、可以增加用户信任度和粘性,增加营收
C、可以帮助用户发现喜欢的新事物
D、可以增强用户体验
答案:B
21、(单选,4分)
下列选项中是显性反馈数据的是()
A、用户观看了某个视频
B、用户对某个视频的评分
C、用户观看视频的日志
D、用户在某个视频的停留时长
答案:B
22、(单选,4分)
下列关于基于用户的协同过滤算法的说法中,错误的是()
A、随着网站的用户数目越来越大,计算用户兴趣相似度矩阵将越来越困难
B、基于用户的协同过滤算法相对于基于物品的协同过滤算法来说更个性化,反映了用户自己的兴趣传承
C、基于用户的协同过滤算法可以使用余弦相似度来评测两个用户之间的联系
D、新用户刚加入系统时,基于用户的协同过滤算法没有办法马上对该用户
进行个性化推荐
答案:B
23、(单选,4分)
下列关于推荐算法的说法中,错误的是()
A、隐语义模型很难实现实时推荐
B、基于物品的协同过滤算法着重于维护用户的历史兴趣
C、使用基于内容的推荐算法进行个性化推荐时,由于非结构化特征难以利
用,我们通常直接将其舍弃
D、基于用户的协同过滤算法更社会化,着重于反映和用户兴趣相似的小群
体的热点
答案:C
24、(单选,4分)
针对用户冷启动问题,下列选项中做法错误的是()
A、利用用户的人口统计学信息
B、推荐热门商品
C、引导用户勾选感兴趣的标签
D、利用用户手机中其它应用的日志文件分析用户的兴趣点
答案:D
25、(单选,4分)
下列选项中不是冷启动问题解决方案的是()
A、推荐热门商品给新用户
B、请专家对商品进行标注
C、推荐冷门物品给用户
D、雇佣少量用户试用新商品并给出评分
答案:C。