第6章信息检索与服务

合集下载

第6章人工智能及其应用(考点梳理)

第6章人工智能及其应用1、人工智能是研究计算机模拟人的某些感知能力、思维过程和智能行为（如学习、推理、思考、规划等）的学科。

2、智能问答系统主要包括常见问题解答（FAQ）、问题理解、信息检索、文档库、答案抽取五大模块。

3、问题理解模块该模块主要实现计算机理解用户的问题，确定问题的关键词和问题的类型，为后面的信息检索和答案提供服务。

问题理解模块的实现过程一般包括问题预处理、问题分类、关键词提取和关键词扩展等。

其中，问题分类主要确定问题的类别，以方便信息检索和答案抽取。

问题理解模块主要运用的技术有分词、同义词词典、分类方法等。

4、信息检索模块该模块主要从互联网或者知识库中找到与问题相关的文档作为答案提取的原材料。

信息检索的方法一般有两种，一种是直接利用搜索引擎检索信息;另一种是建立特定的知识库，然后根据知识库建立索引模块，从而可以方便、快速地找到相关文档，并根据特点的排序算法对文档进行排序。

信息检索模块运用的技术主要包括查询扩展、语料库的构建技术、词汇索引、文档排序等。

5、文档库模块文档库用于存放专家提供的知识，其内部含有大量某个领域的常识性知识和专家水平的知识与经验总结，且能够利用专家的知识和解决问题的方法来处理该领域问题。

6、答案抽取模块该模块主要利用问题的类型构建相应的答案抽取策略，从信息检索后的文档中对排序靠前的文档进行答案的定位和输出，所用技术主要有答案抽取模板的制定、模式匹配、聚类等。

7、图灵测试是指测试者在与被测试者（一个人和一台机器）隔开的情况下，通过一些装置（如键盘）向被测试者随意提问。

问过一些问题后，如果被测试者有超过70%的答复不能使测试者确认出哪个是人、哪个是机器，那么这台机器就通过了测试，并被认为具有人类智能。

8、人工智能发展大致分为三个阶段。

第一阶段（20世纪50-80年代）刚刚诞生，符号主义快速发展。

第二阶段（20世纪80年代-90年代末）专家系统快速发展，数学模型有重大突破。

第六章__事实数据信息检索.

第二节印刷型参考工具书简介
• 一、类型和作用
• （一）词、字典 • 词、字典是字、词或词语的某些成分、根据一定编纂目的加以处理和编排，供人们查考的工具书。就广义而言，词典分为语文词典和知识词典（学科词典）两大类，前者词语的语言方面的知识或本身的意义，后者提供词语的学科方面的知识、即解释在专科领域内词语所代表的事物和概念，作一定广度和深度的叙述。
• (四）手册
• 手册(Handbook, Manual)是一种便捷式参考书 (Ready Reference Book), 它的信息、知识密集，是些经常要查阅、参考的资料和数据。手册内容及时修订，编排合理，使用方便。科技手册是参考工具书中的一大门类，其内容广泛、种类各异，。它有综合性手册和专业性手册之分，以专业性为主。专业性手册包括：数据型手册、知识型手册、设计手册以及产品手册等。数据型手册提供各种常数、参数、计算公式、曲线、图表、图示、线路图等，是一种简明、实用的检索工具。知识型手册以文字叙述为主, 阐述科学原理、专业技术、物化性能等学科知识，也配有适当公式和图表，它们既可检索，也可阅读。设计手册为科技人员、专业设计人员提供所需知识和数据，是他们在工作中经常使用的工具。产品手册具有产品说明书作用，介绍产品名称、技术指标、标准、生产厂商等。
• 类书与百科全书的区别
• 将类书视为古代百科全书未尝不可，但不能与现代百科全书相提并论，正如西方现代百科全书与古代百科全书也远不是一回事了。类书与百科全书相比，不同之处具体表现在下列方面：一是编纂方式不同。类书是辑录原始资料，重在资料性，是原始资料的汇集。百科全书是根据已有的资料进行加工整理，是对已有知识的加工、整理和浓缩，反映了编纂者本人的知识水平。二是编排方式不同。类书是根据原始资料分类进行编排，通过分类编排反映原始资料之间的内部联系。百科全书则是以条目的字顺进行编排，条目之间通过索引反映内部之间的联系。三是内容有别。类书一般侧重于文史资料，而百科全书以反映人类全部知识为己任，对自然科学方面的知识更为重视。四是后期工作不同。类书编纂完成以后，一般很少进行补充或修订。而百科全书有连续修订制度，一般每隔5到10年要进行一次全面修订，保证知识的准确性。此外，百科全书有完备的索引体系、部分条目有参考书目指引读者进一步阅读等，也是类书不具备的。因此从根本上讲，类书与百科全书不是同一种工具书。

信息检索概论思考题答案

第一章信息检索概论思考题：1.什么是信息?简述信息的特点和分类？我们认为，信息是事物或事物之间不确定性的量度，即负熵。

掌握的信息越多，所需认识的事情的确定性就会越少。

信息由信源，信宿和信道（载体）构成。

信息的特点：（1）客观真实性：客观、真实是信息的最重要的本质特性（2）普遍性：信息是物质的普遍属性，物质是具有普遍性，所以信息也拥有该特性（3）针对性：信息的作用和价值可以随着接受者的不同而不同（4）传递性：过程：信息源（信息的发出者）——>编码—>信道（载体）—>译码—>信宿（信息的接收者）信息源:是信息的发出者信宿:是信息的接收者信息的传播是双向的，多维的。

信息源和信宿是相对的，也是可以相互转换的。

信道：就是在传播过程中，编码经过的物理通道（5）时效性：指信息发出、接收到利用的时间间隔及效率，也包括信息的本身更新速度。

客观物质不断的变化，反映事务的运动状态和运动方式的信息也会发展变化一般而言，随着时间的推移，信息的价值会逐渐减少也有反例：如考古信息（恐龙、古钱币），年代越久，使用价值越大衡量信息的时效性参数不只是时间参数，还有地理环境（6）可转换性：信息可以从一种形态转换成另一种形态（7）可处理性（可识别性）：可以通过人们的感觉器官所感知，也可以通过仪表、器械来检测进而予以识别。

（8）可共享性：指同一内容的信息可以在同一时间里被若干个用户使用，此时信息载体本身的信息量不会被磨损、消失信息的类型：(1)按信息表现形式划分，可分为文字信息，图象信息，数值数据信息，语音信息。

▪文字信息：文字是人们为了实现信息交流、通信联系所创造的一种约定的形象符号。

▪图象信息：图象（形）是一种视角信息，它比文本信息直接，易于理解。

如，一幅画、一部电影。

▪数值数据信息：数值数据是“信息的数字形式”或“数字化的信息形式”。

▪语音信息：人讲话实际是大脑的某种编码形式的信息转换成的语言信息的输出，是一种最普遍的信息表现形式。

(网络信息检索)第6章信息检索性能评价

Elasticsearch
一个基于Lucene的开源搜索和分析引擎，提供了高性能、实时的全文搜索功能，广泛应用于日志分析、网站搜索等领域。
检索效率提高的实践案例
05
信息检索性能评价的挑战与未来发展
信息过载问题
01
信息过载是指用户在信息检索过程中面临的信息量过大、难以有效筛选的问题。
02
随着互联网信息量的爆炸式增长，信息过载问题愈发严重，给用户带来困扰。
查全率计算公式
查全率 = (检索到的相关文档数 / 全部相关文档总数) * 100%。
查全率评价
总结词
查准率是衡量信息检索系统准确性的一个重要指标。
查准率计算公式
查准率 = (检索到的相关文档数 / 所有检索出来的文档总数) * 100%。
详细描述
查准率是指检索系统返回的相关文档数与所有检索出来的文档总数的比值，它反映了检索系统筛选出相关文档的能力。
查询优化
利用多核处理器和分布式系统，提高信息检索的响应速度。
并行计算和分布式处理
检索效率优化方法
Solr
基于Lucene构建的开源搜索平台，提供了丰富的功能和可扩展性，适用于大型企业和互联网应用的信息检索需求。
Google Search
作为全球最大的搜索引擎，Google通过先进的算法和大规模分布式处理技术，实现了快速、准确的信息检索服务。
总结词
检索覆盖率是指信息检索系统能够检索到的与用户查询相关的文档数量。高检索覆盖率意味着系统能够从大量文档中筛选出更多与用户需求源、使用更全面的关键词、优化索引结构等。
总结词
为了提高检索覆盖率，信息检索系统需要不断扩大信息源，尽可能涵盖更多的文档和资源。同时，使用更全面的关键词和优化索引结构可以提高系统的查全率和查准率，从而提升检索覆盖率。

第六章计算机信息检索基础知识

25
�
2
二,计算机信息检索的基本概念
利用计算机,根据用户的提问, 利用计算机,根据用户的提问,在一定时间内, 定时间内,从经过加工处理并已存储在计算机存储介质内的信息集合中查出所需信息的一种方式. 息的一种方式.
3
三,计算机信息检索系统构成
1,硬件 , 2,软件 , 系统软件和应用软件. 系统软件和应用软件. 3,数据库 , 数据库是至少由一种文档组成, 数据库是至少由一种文档组成, 能满足特定目的或特定数据处理系统需要的数据集合. 需要的数据集合.
19
第二节 DIALOG联机检索命令联机检索命令
一,BEGIN(或B)选库命令 ( )
?BEGIN 文挡名 ?B 文挡名 ?BEGIN 文挡号 ?B 文挡号
20
二,sf调文档命令 sf调文档命令
只在打开411 库时有效只在打开 ? 8,12,63,72…… , , ,
21
三,SELECT(或S)选词命令 ( )
23
六,DISPLAY SETS (或DS)联或联机显示命令
用于显示相应的检索结果, 用于显示相应的检索结果,具体指令格式与TYPE相同式与相同
七,LOGOFF结束检索过程命令结束检索过程命令
24
第三节联机检索的一般步骤
1,分析信息需求; 2,选择系统及数据库; 3,确定检索途径; 4,选择检索项; 5,编制检索式; 6,上机检索; 7,输出检索结果; 8,退出联机检索系统
22
STEPS( SS) 四, SELECT STEPS(或SS)命令
SS computer? and image? S1 597 computer? S2 176 image? S3 105 computer? and image?

2019信息检索课件第6章

? </~scholzcr/eval.html>
? University of California, Los Angeles, College Library, Thinking Critically about World Wide Web Resources
? </libraries/college/instruct/web/critical.htm>
? 信息数量庞杂而无序
导致网络信息分布范围广、网络信息的类型多样、信息污染严重
? 信息的不稳定性强
网络的动态性、内容可靠性降低
? 网络安全存在隐患
计算机病毒的破坏
2020/3/26
4
据第25次中国互联网络发展状况统计报告（2019.1 ）显示，绝大多数网络信息来自商业网站，来自教育、科研、政府机构的网络信息仅占总量的1.9%
2020/3/26
5
网络炒作增加网络信息的不真实性
2020/3/26
6
6.2 网络信息选择与评价的客体
? 对网站的选择与评价（IT）
? Website
? 定量为主
? 存在作弊行为
? 对网络信息内容的评价 (LIS)
? Information on the web ? 定性为主，辅之以定量 ? 不易操作
2020/3/26
LOGO
图书馆参考咨询部 2019.7
第六章网络信息的选择与评价
2020/3/26
22
目录
6.1网络信息选择与评价的必要性 6.2网络信息选择与评价的客体 6.3网络信息选择与评价的主体 6.4网络信息选择与评价的标准 6.5各类型网络信息的评价
2020/3/26
3

信息检索与分析利用第6章

信息检索与分析利用
6.1.2 中外文期刊检索工具的特点
1.中文期刊库一般只收录国内的期刊信息；外文检索工具收录世界各国有影响的文献，也包含部分有学术价值的中文文献。 2.中文期刊库收录信息类型单一，如维普《中文科技期刊库》就只收录期刊信息；外文检索工具信息类型收录广泛，有的还收录大量专利、科技报告、专著等。 3.服务方式多样化
先输入名的全称或缩写，然后输入姓 r smith ； jianhua zhang
检索技巧
• 选择与检索主题密切相关的检索词； • 包含jargon和buzzwords；如：kidney disease OR renal failure;
• 包括同义词和缩写形式；如：mri OR magnetic resonance imaging;
Email/输出引文
检索结果显示（续）
在编文章
在编文章
检索结果显示: 文摘 + 引文
二次检索框
文章显示: 综合信息(Summary Plus)
链接到内容链接到功能
HTML格式全文中的链接
图形、表格、文本和多媒体格式文件的链接
Cite By
被引用文章
引用文章
浏览界面
学科分类
农业及生物科学
信息检索与分析利用
6.2.1 综合性检索工具简介
1．中文综合检索工具 1）维普《中文科技期刊全文数据库》 2）清华同方（CNKI）的《中国期刊网全文数据库》 3）万方《中国数字化期刊群》 4）中国国家科技图书文献中心（NSTL）期刊数据库
信息检索与分析利用
2．外文综合检索工具 1）联机检索系统 2）网络在线检索系统 (1) Elsevier (2) EBSCO (3) Springerlink

信息检索笔记

第一章信息资源的概述一．传统信息资源的概述1.概念与特征2.类型：（1）一类文献：原始文献（2）二类文献：对一类文献的加工整理，报道揭示一类文献，提供的是一类文献的线索和地址（书目，索引，文献）（3）三类文献：来源于一类文献，有丰富的权威的资料，可以解决各种问题。

如：百科全书，字典，词典，手册，年鉴，名录二．数字信息资源1.与传统信息资源相比具有的特征：（1）以多媒体为内容特征（2）内容复杂多样（3）更新速度快，时效性强（4）利用不受时空限制（5）具备检索系统（6）具备全方位的动态的信息服务功能2.数字信息资源的类型：（1）按性质和功能划分：a)一次文献：原始文献b)二次文献：参考数据库，搜素引擎，网资，导航等。

c)三次文献：元搜素引擎（关于搜素引擎的搜素引擎）（2）按载体划分：光盘，网络数据库，联机检索系统（三）主要数字信息资源1.参考型数据库：包含各种数据信息的来源和属性的数据库。

包括：书目数据库，索引数据库，文献数据库2.全文数据库：收录有原始文献全文的数据库3.事实数据库；直接提供原始文献的数据库，分为数值数据库，指南数据库，术语数据库4.电子图书5电子报纸6.搜索引擎/分类指南7.网络学术资源学科导航：对各类信息资源进行筛选整理之后，按学科属性对其进行分类、组织。

第二章信息检索概述一．信息检索：信息检索就是利用一定的检索工具，运用一定的检索技术和方法查找信息的过程。

二．信息检索的原理1.利用计算机进行信息检索的前提和基础是信息的组织和贮存。

没有贮存就没有检索对象。

2.信息的组织与贮存就是数据库的建立过程。

在这一过程中，系统对收集到的信息进行概念分析（即找出能够表达主题的关键词），然后赋予其特征标识（这一过程也叫对信息内容进行标引），并按特定的编排方法将其组织起来，形成有序的具有可检性特征的数据库。

3.计算机进行信息检索的原理就是指用户和检索人员将能够表达其信息需求的检索式提交给检索系统，检索系统即自动将检索式与系统中的信息进行匹配，凡是信息特征标识和逻辑组配关系与用户检索式一致的，既未命中内容。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

n 基于相关反馈的原理，需要进行一个逐步求精的过程
第6章信息检索与服务
6.1.4 概率模型
检索问题转化为求条件概率问题
If Prob(R|di, q) > Prob(NR|di, q) then di是检索
结果，否则不是检索结果
第6章信息检索与服务
6.1.5 全文检索
n 直接在全文中进行匹配检索 n 获得的也是全文信息而非文献线索 n 全文检索技术以其较高的查准率和查全
n （2）文献频率
n 假设存在一个文献集合，其中大部分的文献都包含了某一项，则说明该项对某一主题的专指度较差，可能就不太重要
n 在设计项权重时，要考虑逆文献频率（用idf表示）
第6章信息检索与服务
向量空间模型介绍
n 2. 项权重
n （3）权重的规范化处理
n 为了抵消由篇幅带来的不同影响，经常要对项权重进行规范化处理
n 查询表示
n 在布尔检索系统中，根据用户提出的检索需求，选取适当的检索标识，与布尔运算符“与”、“或”、 “非”共同构成与查询相符的检索提问式，也即相应的布尔表达式
n 例如 :
n 1) “飞碟” n 2) “飞碟”AND “美国” n 3) “飞碟”AND (“中国” OR (NOT “科幻小
第6章信息检索与服务
信息检索过程
n 信息检索过程实际上涉及到三个重要的处理：
n 文档集的逻辑表示 n 查询的表示 n 相似匹配及其排序
n 对上述因素和检索过程建模（抽象描述），产生各种不同的信息检索模型
第6章信息检索与服务
图6-1 信息检索系统的一般模型
•信息资源
•标引
•信息资源替代物
•相关性判断
n 超文本技术的优点
n 1）非线性的组织结构 n 2）以信息单元为检索对象 n 3）体现了信息层次关系 n 4）交互更加友好 n 5）信息内容丰富多样 n 6）避免了检索语言的复杂性
第6章信息检索与服务
6.1.7 超文本模型
n 超文本技术的缺陷
n 1）偶然发现 n 2）失控 n 3）迷航
第6章信息检索与服务
n 在各种规范化方法中，余弦规范是一种常用、有效的方法：tf×idf权重/文献向量的欧氏长度
第6章信息检索与服务
向量空间模型介绍
n 3.文献向量与查询向量的匹配
n 匹配函数
n 利用向量的内积运算，得到文献向量Di与查询向量q之间的相似度
n Sim(Di,q)=Di•q n 简单 n 存在的一个主要的不足是它忽略了项之间存在一
6.1.6 语义检索
n 基于关键词匹配的传统文本信息检索技术对语义匹配的支持能力较差，其性能取决于用户对方法的理解，具有很大的局限性
n 尽管基于关键词匹配的检索技术已经经过多次改进，但是由于没有添加语义处理方面的功能，检索性能没有得到本质的改善，那些没有被文字直接表述出来但隐含在文本内容中的一些重要的信息无法被检索
6.1.4 概率模型
n 概率论模型主要基于概率论原理来理解和解决信息检索问题
n 主要有早期的经典概率模型（又称为二值独立检索模型，英文简称BIR）
n 基于贝叶斯网络的推理网络模型和信念网络模型等
n INQUERY检索系统是基于概率模型的代表
第6章信息检索与服务
6.1.4 概率模型
n 基本思路:
n Lucene
第6章信息检索与服务
6.1.5 全文检索
n 全文检索技术指标
n 基本指标有：查全率、查准率、检索速度、索引膨胀率等
n 索引的膨胀系数是指针对全文所建的索引文件大小与全文文件大小之比，其中索引文件的大小取决于索引的结构
n 没有为全文创建索引的全文检索系统，其膨胀系数为0
第6章信息检索与服务
6.1.5 全文检索
n 基于单汉字的全文索引 n 索引倒排结构
第6章信息检索与服务
6.1.5 全文检索
n 以倒排表模型为基础的全文检索有检索速度快，与原文无关的特点
n 其缺点主要包括两个方面：
n 首先，空间和时间效率低； n 其次，当文本集合不断变化时，需要不断重
建全文索引
n 第一个问题通常采用压缩技术和更加高效的编码策略加以解决
n 给定一个文献集合D，包含m篇文献，分别用 d1,d2,d3……dm表示。再给出一个标引词集合T，包含n个标引词t1,t2,……,tn。假定对文献集D的描述完全是基于该标引词集合的,则文献集D中任意一篇文献di就可以表示为（di1,di2,……,din）
第6章信息检索与服务
传统布尔检索模型
n （2）布尔逻辑表达用户需求的能力问题。把用户的一个信息需求转换成一个恰当的布尔表达式，在很多情况下并不容易实现。
第6章信息检索与服务
传统布尔查询的评价
n 为了弥补这些缺陷，发展了一些别的检索模型，如向量空间、扩展布尔、概率检索和聚类模型。
第6章信息检索与服务
6.1.3 向量空间模型
n 向量空间模型(Vector space model)介绍 n 向量空间模型(VSM)的评价
些相互联系的事实。通常，需要引入一些特别的方法来改进这个相似度计算公式，使得其能够考虑到项的相互联系这一重要因素
第6章信息检索与服务
相似度的计算
n 内积相似度运算 n 余弦相似度 n “距离”相似度运算 n 等等
第6章信息检索与服务
向量空间模型的评价
优点
简单，功能却非常强大
能将非结构ห้องสมุดไป่ตู้的文献表示成向量的形式，使得各种数学处理成为可能
率被广泛应用于网络信息的检索中 n 全文检索还提供位置检索功能
第6章信息检索与服务
6.1.5 全文检索
n 全文检索模型中信息资源的逻辑表示
n 全文索引
n 目前常见的全文检索模型主要有
n 倒排表、署名文件、位图、Pat树和Pat数组等模型
n 从中文语言特点出发提出的互关联后继树模型等
第6章信息检索与服务
第6章信息检索与服务
布尔检索示例
第6章信息检索与服务
传统布尔查询的评价
n 该模型结构简单、容易实现和快速检索。
第6章信息检索与服务
传统布尔查询的评价
n 布尔模型在检索系统的开发与应用中表现出的主要问题有：
n （1）准确匹配（exact matching）策略问题。布尔模型采用准确匹配策略，对检索过程中客观存在的一些不确定性情形绝对排斥，认为一篇文献对于某一提问要么是“相关的”，要么是“不相关的”。这种“非此即彼”的二值判断标准严重影响到检索系统的性能改善，并带来其他一些相关问题。
第6章信息检索与服务
向量空间模型介绍
n 1. 文献空间
n （1）文献空间的概念
n 文献集合中的任一文献都可以表示为这个多维空间中的一个向量,这个空间就称为“文献空间”
n 在一个文献空间内，用向量D1来代表某一文献，则该向量在这个文献空间各个轴上的分量就是相应的表述该文献的各个项的权重
n 文献与空间点
n 语义检索是对检索条件、信息组织以及检索结果显式赋予了一定语义成分的一种新的检索方式
n 与传统关键词检索相比，它更加强调语义，其性能明显改善
第6章信息检索与服务
图6-3 基于本体的文本信息检索系统的一般模型
•领域概念关系本体集
•指导主题标引
•指导查询表达式的构造本体
•文档
•主题标引 •带所属领域标识的标引词序列
•表达式构造
•需求替代物
•用户需求
•检索结果
第6章信息检索与服务
6.1.2 布尔模型
n 布尔检索模型的理论基础是布尔逻辑和集合理论
第6章信息检索与服务
6.1.2 布尔模型
n 布尔逻辑主要内容:命题逻辑与谓词逻辑
n 布尔逻辑是数理逻辑的基础部分
n 利用符号来表示逻辑中的各种概念 n 建立了一系列的运算法则，利用代数
的方法研究逻辑问题
第6章信息检索与服务
布尔运算
n 布尔逻辑运算符:
n “与（AND）”、“或(OR)”、“非(NOT)” 运算的定义
第6章信息检索与服务
传统布尔检索模型
n 文献表示
n 将文档表示成一个集合，集合中的每个元素都为一个二元变量，取值非“0”即“1”，表示该元素所代表的主题词是否包含在该篇文档之内。若包括在文档中，则元素取值为1，反之则取0。
模型的检索效果和布尔检索模型比起来，要好得多
不足
忽略项之间存在的相互联系，必然使得检索效果产生极大的偏差
传统向量处理模型不能处理布尔表达等结构化查询
改进
广义向量空间模型（GVSM）、潜在语义标引（LSI）、概率向量处理模型以及基于语义分析的向量空间模型（SVSM）
第6章信息检索与服务
n 超文本不是单纯以线性方式存储文本，而是附加了一种非线性结构来组织信息，即在文本中设置若干超级链接（简称超链）指向相关位置，以确保在顺序阅读文献的同时，还可以顺着超级链接的指引“跳跃”阅读信息
n 超文本组织强调了信息与对象之间的联系关系，符合人们联想式阅读和思维习惯
第6章信息检索与服务
6.1.7 超文本模型
n 基于内容的多媒体信息检索方法是一种新型的检索技术，它融合了图像理解、模式识别、计算机视觉等技术，直接根据描述媒体对象内容的各种特征进行检索，从数据库中查找到具有指定特征或含有特定内容的声音、图像、视频等对象
or （1，0，0）,其中，（1，1，1）、（1，1，0）
和符（号1q，cc表0，示0））是qdnf的3个合取子项（合取子项可用
第6章信息检索与服务
传统布尔检索模型
n 匹配函数
n 菊池敏典算法
第6章信息检索与服务