计算机检索基本方法

合集下载

计算机文献检索方法与步骤

计算机文献检索方法与步骤

计算机文献检索方法与步骤以下是关于计算机文献检索方法与步骤:一、基本动作要领首先呢,你得确定要使用的检索工具。

就像你要找东西,得先知道去哪儿找一样。

常见的有学校或单位图书馆买的数据库,像知网、万方这些,还有谷歌学术(不过国内可能用不了全部功能)。

1. 打开数据库首页之后,最重要的就是输入关键词。

比如说你想找关于人工智能在医疗领域的应用方面的文献,那就把“人工智能医疗应用”这种相关的词输进去这一步可别小瞧了,我之前就老输错关键词,结果找出来的文献都不对路。

2. 限定范围呢,也很关键。

就像你在大市场里找东西,得先确定个小区域。

大多数数据库都有时间范围、文献类型(是期刊论文、学位论文还是会议论文等)这样的选项。

如果你只想要近三年的期刊论文,就把时间限定在最近三年,文章类型只选期刊论文,这样能精确不少哦。

二、我的小技巧对了这里可以多试试不同的关键词组合。

有时候直接搜大概念找不到好东西,那就把大概念拆成小部分。

就像刚刚说的人工智能在医疗的应用,我可能会再试试“机器学习医疗影像识别”这种细分一点的词,这样出来的结果可能更精准。

而且啊,如果一个关键词找不到合适的文献,试着换个同义词。

比如说“电脑”和“计算机”,这俩词有时候能让你找到不同的文献资源。

三、容易忽视的细节嗯,在搜索的时候一定要注意拼写。

好多数据库可是严格按你输入的拼写来找文献的,我就有一次把“algorithm(算法)”拼成“algorhythm”,结果啥都找不出来。

还有,有些数据库是区分大小写的,这个也要小心咯。

另外,有些数据库你登录的时候可能需要校园网或者单位内部网才能用全部功能,如果在外面登录遇到问题,要先检查网络环境。

四、常见问题及解决办法常见的问题就是搜索出太多结果了。

这时候咋办呢?一方面可以继续加关键词来缩小范围;另一方面可以利用数据库的排序功能。

有的数据库能按照相关性、引用频率等来排序。

像引用频率高的文献往往质量可能更好些。

如果搜索结果太少,那就减少关键词,或者扩大时间范围、文献类型范围等。

计算机信息检索基本步骤

计算机信息检索基本步骤

计算机信息检索基本步骤
计算机信息检索是指通过计算机技术来获取所需信息的过程。

下面是计算机信息检索的基本步骤:
1. 确定信息需求:信息检索的第一步是明确需要获取的信息。

这包括确定需要什么类型的信息、需要什么样的数据和文献。

2. 制定检索策略:针对信息需求制定检索策略。

这包括选择合适的检索工具、构造检索式,如关键词、主题词、文本、语义等。

3. 选择检索工具:根据检索策略选择合适的检索工具。

常见的检索工具包括搜索引擎、数据库、图书馆目录等。

4. 构造检索式:根据信息需求和检索工具的特点,构造出正确的检索式。

检索式可以使用布尔运算符(AND、OR、NOT)等。

5. 执行检索:使用检索式在检索工具中进行检索。

不同的检索工具可能会有不同的检索方法,如输入检索式、选择检索词汇、选择检索方式等。

6. 过滤检索结果:根据信息需求和检索结果的相关性,去除不相关的信息,保留符合需求的信息。

过滤方法包括阅读摘要、筛选关键词、修改检索式等。

7. 评价和利用检索结果:根据需求的满足程度,评价和利用检索结果。

评价方法包括精度、召回率、F值等,利用方法包括提取摘要、下载全文、保存书签等。

以上是计算机信息检索的基本步骤。

在实际操作中,还需要注意检索策略和检索式的精细设计,以及对不同检索工具的熟练应用。

简述计算机信息检索基本步骤

简述计算机信息检索基本步骤

简述计算机信息检索基本步骤计算机信息检索就像是一场奇妙的寻宝之旅,下面我就给大家唠唠这有趣的基本步骤。

咱开始的时候,就像是一个准备闯荡江湖的小侠客,要先明确自己的目标。

这目标得清晰得像刚擦过的玻璃一样,不能模模糊糊的。

比如说你想找关于“猫咪为什么总是追着自己尾巴跑”的信息,你可不能就大概想个“小动物的奇怪行为”,那范围可就大得像宇宙一样,你可能就迷失在信息的黑洞里啦。

有了目标之后呢,就像是知道了宝藏大致的方位。

接下来就要选对工具,这就好比你要去打仗,得选一把称手的兵器。

是用搜索引擎这个大宝剑呢,还是用专业数据库这个神秘的魔法棒?不同的问题得选不同的工具,要是拿个小勺子去挖宝藏,那可挖到猴年马月去喽。

选好工具之后,那就是要输入关键词啦。

这关键词可得讲究,就像是给宝藏守门的小精灵的咒语一样。

你要是乱念一气,小精灵可不会给你开门。

比如说“猫咪追尾巴原因”,这样精准的关键词就像三把正确的钥匙,能让你顺利地开启信息的大门。

然后就是等着计算机这个超级大脑开始工作啦。

它就像一个超级勤奋的小书童,在那巨大的知识仓库里疯狂翻找。

你就坐在那儿,感觉像是在等一个神秘的礼物被送过来。

当结果出来的时候,那场面就像是打开了一个装满惊喜的宝箱。

不过可别高兴得太早,这里面可能也夹杂着一些看起来像宝石其实是玻璃的假信息。

这时候你就得像一个精明的商人,仔细甄别,把那些不靠谱的信息像挑烂苹果一样扔掉。

有时候呢,你第一次搜索可能没找到特别满意的答案,这就像你在迷宫里转错了弯。

别怕,咱调整一下关键词,就像重新规划迷宫的路线一样,再试一次。

要是你发现有些信息特别有用,就像发现了超级稀有的宝藏,那你可以把它们标记或者保存下来。

这就好比把宝藏放进自己的小金库,以后可以随时拿出来欣赏或者继续研究。

在整个检索的过程中,也要小心那些看起来很诱人但是其实很危险的陷阱。

比如说一些来源不明的信息,就像外表漂亮但是有毒的蘑菇,可不能轻易相信。

计算机信息检索就是这样一个充满乐趣又有点小挑战的过程,只要掌握了这些步骤,就像拥有了一张通往知识宝库的通行证,能让你在信息的海洋里畅游无阻,找到那些真正对你有用的宝藏。

基本检索方法

基本检索方法

基本检索方法一、布尔检索利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种方法。

常用的布尔逻辑算符有三种,分别是逻辑或“OR”、逻辑与“AND”、逻辑非“NOT”。

用这些逻辑算符将检索词组配构成检索提问式,计算机将根据提问式与系统中的记录进行匹配,当两者相符时则命中,并自动输出该文献记录。

下面以“计算机”和“文献检索” 两个词来解释三种逻辑算符的含义。

(1)“计算机”AND“文献检索”,表示查找文献内容中既含有“计算机”又含有“文献检索”词的文献。

(2)“计算机”OR“文献检索”,表示查找文献内容中含有“计算机”或含有“文献检索”以及两词都包含的文献。

(3)“计算机”NOT“文献检索”,表示查找文献内容中含有“计算机”而不含有“文献检索”的那部分文献。

检索中逻辑算符使用是最频繁的,对逻辑算符使用的技巧决定检索结果的满意程度。

用布尔逻辑表达检索要求,除要掌握检索课题的相关因素外,还应在布尔算符对检索结果的影响方面引起注意。

另外,对同一个布尔逻辑提问式来说,不同的运算次序会有不同的检索结果。

布尔算符使用正确但不能达到应有检索效果的事情是很多的。

二、截词检索截词检索就是用截断的词的一个局部进行的检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中的文献。

按截断的位置来分,截词可有后截断、前截断、中截断三种类型。

不同的系统所用的截词符也不同,常用的有?、$、*等。

分为有限截词(即一个截词符只代表一个字符)和无限截词(一个截词符可代表多个字符)。

下面以无限截词举例说明:(1)后截断,前方一致。

如:comput?表示computer,computers,computing等。

(2)前截断,后方一致。

如:?computer表示minicomputer,microcomputers等。

(3)中截断,中间一致。

如?comput?表示minicomputer,microcomputers等。

简述计算机信息检索的主要途径

简述计算机信息检索的主要途径

简述计算机信息检索的主要途径计算机信息检索是指通过计算机技术,对大量的信息进行存储、组织、检索和提取,以满足用户对信息的需求。

在信息爆炸的时代,计算机信息检索成为人们获取信息的主要途径之一。

本文将从不同的角度介绍计算机信息检索的主要途径。

一、网络搜索引擎网络搜索引擎是计算机信息检索的主要途径之一。

通过搜索引擎,用户可以在互联网上检索到各种形式的信息,如网页、新闻、图片、视频等。

目前,谷歌、百度、必应等搜索引擎已经成为人们日常生活中必不可少的工具之一。

用户可以通过输入关键词,搜索引擎会根据算法对互联网上的信息进行索引和排序,展示给用户最相关的结果。

二、数据库检索数据库是存储和管理大量结构化数据的系统,也是计算机信息检索的重要途径之一。

通过数据库管理系统,用户可以对数据库中的信息进行检索。

数据库检索可以是基于关键词的,也可以是基于结构化查询语言(SQL)的。

用户可以通过输入条件或者SQL语句,从数据库中提取所需的信息。

数据库检索通常用于企业、政府等组织的数据管理和决策支持系统中。

三、文献检索文献检索是学术界和科研人员进行科学研究的重要途径之一。

通过文献检索工具,如Google Scholar、万方数据库等,用户可以检索到全球范围内的学术论文、会议论文、专利等文献信息。

文献检索可以根据关键词、作者、期刊等多种检索方式进行。

文献检索工具提供了方便的界面和高效的搜索算法,帮助用户快速找到所需的文献信息。

四、专业知识库专业知识库是某一领域专家或组织对特定领域知识进行整理和归纳形成的数据库。

专业知识库通常包含了该领域的基本概念、原理、方法等内容,并提供了详细的参考资料和相关文献。

用户可以通过专业知识库快速获取到某一领域的专业知识和最新进展,以支持自己的工作和学习。

五、社交媒体搜索随着社交媒体的普及,社交媒体搜索成为了人们获取信息的重要途径之一。

通过社交媒体搜索引擎,如微博、微信等,用户可以检索到社交媒体平台上的各种信息,如动态、评论、话题等。

计算机检索技术

计算机检索技术

⑵ 逻辑“或”:
用“OR” 、“+”或逗号表示,“A OR B”表示只要 有两者中的一个就能满足检索要求,也可能包含两者。 通常用于连接同义词、近义词、别名、简称、或缩写, 以及外文单词的不同拼写形式。这种组配可以扩大检 索范围,比“A and B”查的更多,防止漏检,提高查 全率。
A B
7
逻辑“或”检索实例
⑶ 逻辑“非”:用NOT或“-”表示,是用于从 某一检索范围中排除不需要的概念。A NOT B 表示包含A且不包含B。这种组配可以缩小检索 范围,使检索结果更准确。
A
B
9
逻辑“非”检索实例
检索猫但是不包含熊猫的信息 猫 NOT 熊猫 检索病毒但是不包含电脑病毒的信息 病毒 NOT 电脑病毒 检索杜鹃(花)的信息,但是不包含杜鹃鸟 杜鹃 NOT 杜鹃鸟
⑸ (S)—Sub field:表示其两侧的检索词必须是在 文献记录的同一子字段中,而不限定它们在该子字段 中的相对次序和相对位置的距离。
• 如:silicon(S)sensor 命中记录出现的匹配情况如: A vacuum magnetic sensor(VMS) using a silicon field emitter tip was fabricated and demonstrated.
(1)逻辑“与”:
用AND 、“*”或者空格表示,“A and B”表示 同时含有“A”与“B”这两个词或符号,但是不 限定距离和次序,中间可以间隔若干个词或符号。 它连接的两个检索词必须同时出现在结果中才能 满足检索条件。这种组配可以缩小检索范围,有 利于提高查准率。
A
B
逻辑“与”检索实例:
检索课题“中国外汇储备规模的研究” 检索式: 中国 and 外汇 and 储备 and 规模 中国 外汇 储备 规模 中国*外汇*储备*规模 在数据库中检索关于急性胰腺炎的文献 检索式: 急性 and 胰腺炎 急性*胰腺炎 急性 胰腺炎 可检出:急性胰腺炎,急性重症胰腺炎,急性胆源性胰 腺炎,急性出血性胰腺炎等等结果

计算机检索的步骤和方法

计算机检索的步骤和方法

计算机检索得步骤与方法1、明确检索要求与检索目标计算机检索得第一步准备工作就是明确检索要求与检索目标。

明确检索要求就就是要搞清楚本课题属于什么学科,所需文献得类型及语种,查找文献得年代,所需文献得最佳篇数,允许支配得检索费用。

这些要求对选择数据库、构造检索策略都就是十分重要得.确定检索目标也就是进行计算机信息检索前应搞清楚得准备工作。

例如:如果属于开题调研,则应尽可能地检索出与之相关得全部文献,即要求较高得查全率;以便充分地做好开题得准备工作;如果属于探索性、开创性得课题,则只需要查出一些启发性得文献,对查准率与查全率要求都不一定有很高得要求。

2、课题分析2、1课题概念得分析方法分析课题就就是分析出课题所涉及得主要概念,并找出能代表这些概念得若干个词或词组,进而分析概念之间得上、下、左、右关系。

对于新学科、交叉学科与边缘学科得课题,则要搞清楚这些概念之间得关系.概念分析得结果应以概念组为单元得词或词组得形式列出,以便下一步制订检索策略时使用。

2、2隐含概念得分析方法有些课题得实质性内容往往很难从课题得名称上反映出来,课题所隐含得概念与相关得内容需要从课题所属得专业角度作深入分析,才能提炼出能够确切反映课题内容得检索概念.例如:”社会保障"包含”养老保险"、”失业保险"、”医疗保险”与"社会救济”等概念,如果要检索社会保障方面得文献,应该析出上述概念,才能保证文献得查全率。

2、3核心概念得选取有些检索词中已经含有得某些概念,在概念分析中应予以排除。

例如:课题”公司劳动奖励、职工培训与养老保险制度管理得理论与实践",如果把”劳动奖励","职工培训”,"养老保险”,"公司",”制度","管理”六个概念全部组配起来,则会造成大量文献漏检.实际上,劳动力资源管理已经包含了劳动奖励、职工培训与养老保险三个方面,而且,劳动力管理必然就是针对该三个方面而言得。

简述计算机检索的基本步骤

简述计算机检索的基本步骤

简述计算机检索的基本步骤计算机检索是把人与计算机连接在一起,使用检索技术在大量信息中查找信息的技术。

它是一种把现实复杂的、无序的信息快速地检索整理出有价值的、有效的信息,为用户提供实时有价值的信息服务的方法。

计算机检索的基本步骤主要包括以下几个部分:第一步:分析检索请求。

检索请求的精确性可以影响检索的准确度。

因此,收集请求要求的信息,分析检索请求是检索的第一步。

第二步:构建检索索引。

索引是计算机检索信息的基础,可以提高信息检索的效率,是计算机检索的重要步骤。

构建检索索引的方法有很多,最常用的是关键字检索,关键词检索可以搜索出符合要求的信息。

第三步:检索信息。

这一步是对索引进行检索的过程,采用的方法有模糊检索和精确检索。

具体的操作方式有使用Boolean组合法,语义检索,知识检索等。

第四步:处理检索结果。

检索完成后,要对检索结果进行处理,提取符合要求的内容,也可以将检索后的内容根据需要进行排序,以获取更有价值的信息。

第五步:显示检索结果。

将检索处理后的信息以合适的方式,以及容易理解的形式显示出来,以满足用户的检索需求。

总结起来,计算机检索的基本步骤主要包括:分析检索请求、构建检索索引、检索信息、处理检索结果以及显示检索结果。

这些步骤构成了计算机检索的基本流程,要想获得准确、完整的信息,必须按照这个基本流程进行操作。

计算机检索技术在现实生活中起到了重要的作用。

它不仅可以把浩瀚的信息数据转换成有价值的信息,而且可以帮助用户快速、便捷的检索到需要的信息。

对于简单的检索,可以采用关键字检索,而对于复杂的检索通常需要运用各种检索技术,比如Boolean组合法,语义检索,知识检索等。

计算机检索技术的发展也促进了计算机科学、信息科学和生物信息学等领域的发展,它既提高了信息管理、检索及研究的效率,又为科学研究提供了便利。

正是借助于计算机检索技术,人类才能在无序的信息中快速检索出宝贵的资源,实现信息传播、调研分析和技术进步等关键性的任务。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

例2:《我区中小企业发展的资金支持问题》
(某学生毕业论文选题)
跨库初级检索使用: 我区中小企业发展的资金支持问题 使用关键词或题名检索记录均为O,说明检索策 略不正确,从而导致检索失败。再将检索词改为: 新疆中小企业发展的资金问题 使用关键词或题名检索记录仍为O,此时应调整 检索策略,改用跨库高级检索,以便将检索词进行 组配。
图书馆用户培训
➢计算机检索所使用的方法
➢计算检索策略的制定、评价和调整
计算机检索策略的构成方法
计算机检索策略:又称提问逻辑,就是 对多个检索词之间的相互关系和检索顺序作 出某种安排。构成检索策略就是运用计算机信 息检索系统可以接受的方法,表达课题检索要 求的过程。
1、布尔逻辑检索法 2、截词检索法 3、字段检索法 4、词位置检索法
就是采用布尔代数中的逻辑算符,将信息提问转换成逻辑表达式。 通常应用于计算机检索的布尔逻辑算符有三种: 1、逻辑与 运算符号为 AND 或 *,表示两个检索项之间是相交的关 系,即一篇文献既含有检索项A,也含有检索项B才算命中,缩小 了检索范围。则检索提问式可写:A AND B 或 A*B、A并且B 2、逻辑或 运算符号OR 或 +,表示两个检索项之间是合并的关系, 即一篇文献只要含有A或B就算命中,相当于增加主题词的同义词, 扩大了检索范围。检索提问式:A OR B或 A+B、A或者B 3、逻辑非 运算符号NOT 或- ,表示两个检索项之间为“非”的关 系,即一篇文献中含有A但不含有B才算命中,缩小检索范围。使 用时要特别小心,否则会把对口文献漏掉。检索提问式为:A NOT B 或A – B、A不包含B
➢ 跨库高级检索使用:
例2:《我区中小企业发展的资金支持问题》
(某学生毕业论文选题)
➢ 跨库高级检索(1、2、5、8库)使用几种不 同的检索策略:
A.企业发展 并且 资金支持并且 新疆 无论用题名还是关键词 ---检索记录为0 B.企业发展 并且 资金 并且 新疆
➢(三)字段检索法
字段是数据库中记录的下级单位,一个字段即是一 个著录项目。字段检索是一种限定检索词在数据库记 录中出现的字段范围的一种检索方法。
分为两种 :
主题字段(题名、主题词、文摘等 )
非主题字段(作者、文献类型、语种、出版年份等)。
非主题字段 主题字段
注:可以看成是具有特殊功能的and运算符
案例
检索策略的编制及优化
检索策略是指为实现检索目标而制定的检 索计划和方案。检索式是检索策略的具体 体现,是指计算机检索中用来表达用户检 索提问的逻辑表达式,通常由检索词和各 种逻辑算符、截词符、位置算符以及系统 规定的其他连接符号等构成。
检索策略的编制和优化
➢ 确定项目的主题内容 ➢ 确定检索概念 ➢ 选择表达概念的检索词
用主题查找“英语”方面的资料,但不包括美国英语
命中记录
逻辑组配
命中记录
检索词
(二)截词检索法
所谓截词是指在检索词的某个局部截断,利用某些 检索词的词干或不完整词形加上截词符进行检索, 其目的是查找某一词干的不同变化形式,防止漏检, 提高检全率。截词方式有后截词、前截词和中间截 词3种。也可分别称作:前方一致、后方一致、中间 一致。截词符号一般用“ ?”表示,也有用“ # ” 或 “ $ ” 等表示。
检出的相关文献数
查全率= ——文—献—库—内—相—关—文—献—总—数— ×100%

R= ———————— ×100

a+c
查准率:指检出的相关文献数与检出的文献 总数之比,又称“检准率”
检出的相关文献数 查准率= ——————————
×100% 检出的文献总数

R= ———————— ×100%
a+b
R 90

全 70

60
查全率(R)和查准率(P)关系曲线图
A C
a=有关文献
b= 无关文献 C=未查出的有关文献 D=未查出的无关文献
D
4
B
0
20 4 5
90
0查准率 0
计算机检索策略的构成 --- 调整检索策略的方法
检索策略输入检索系统后,系统响应的检 索结果有时不一定能满足课题的要求,例如: A. 检出的篇数过多,而且不相关文献所占比 例很大;
➢ 选择所有不同的能够表达检索概念的词 ➢ 使用截词检索各种词尾变化的词 ➢ 使用位置算符指定词组或词间的相对位置关系
数据库的选择
➢ 使用数据库目录选择数据库 ➢ 使用数据库说明书选择数据库 ➢ 使用数据库总索引文档选择恰当的数据库
检索效果评价
查全率: 指检出的相关文献数与库内文献总数之 比,又称“检全率、命中率”
所以可采用前方一致的方式标引检索提问: Data ? :标题=英语
2、后方一致(前截断或称左截断):
当提问词的后半部完全相同时可使用。比较时机器 从文献标引词的后面往前比较,主题词后部与提 问词相同,该主题的文献即命中。
标题=英语
3、中间一致
当提问词的中间部分完全相同时,可使用“ 中间一致”比较节省时间。检索时文献标引 词的中间部分与提问词相同,该文献即命中 标题=律师资格考试
*所有例句使用CNKI数据库
案例1 :逻辑与(A*B)CNKI数据库 查找题名
文献时间跨度 学科导航区
检索结果
命中记录
检索词
案例2 : 逻辑或 ( A + B) 查找题名“高校图书馆或图书馆”的 有关资料
命中记录
逻辑组配
命中记录
检索词
案例3 :逻辑非 (A-B)
具体采用什么形式各系统都有明确的规定。
、前方一致(后截断或右截断):
文献标引词只要前面部分相同即命中。
:data structures, data privacy, data communication Systems, data handling 方面的资料, 因这几个主题词都有词头data,
B. 检出的文献数量太少,有时甚至为零这两 种情况均需要调整检索策略。
中 国 学 术 期 刊 数 据 库 结 构 图
例1:《我国商业银行资产结构》
(某学生毕业论文选题)
不同的检索策略会有不同的检索结果。
跨库初级检索使用:我国商业银行资产结构 --用关键词检索共有记录223条 --用题名检索共有记录6条 跨库高级检索使用:商业银行并且资产结构并且中国 --用题名检索共有记录1条
相关文档
最新文档