信息检索与信息存储

合集下载

信息检索名词解释

信息检索名词解释

1)信息检索(information retrieval) 是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。

所以,它的全称又叫信息存储与检索(information storage and retrieval), 这是广义的信息检索。

狭义的信息检索则仅指该过程的后一步,即从信息集合中找出所需要信息的过程。

相当于我们所说的信息查询(information search)。

2)零次文献:也叫灰色文献,未经公开发表或未交流于社会的文献。

如私人笔记,设计草图、实验记录、文章草稿、会议记录、书信文书、以及档案等。

其主要特点是内容新颖,但不成熟,不公开交流,难以获得。

3)一次文献(Primary Document): 以著者本人的研究或研制成果为依据而创作或撰写的文献,习惯上称做原始文献。

如期刊论文、科技报告、专利说明书、会议论文、学位论文等。

体现创作性。

其主要特点是内容新颖丰富,叙述具体详尽,参考价值大,但数量庞大、分散。

4)二次文献(Secondary Document):就是检索工具。

是将大量分散的无组织的一次文献经浓缩,整序的加工整理,编辑成目录、题录、文摘、索引等检索工具或数据库。

如文摘,目录、索引等。

它有存贮、检索、报道的功能。

体现高度的浓缩性。

其主要功能是检索、通报、控制一次文献,帮助人们在较少时间内获得较多的文献信息。

二次文献具有汇集性、工具性、综合性、交流性等特点。

5)三次文献(Tertiary Document):在一、二次文献的基础上,经过综合分析而编写出来的文献,如专题述评、动态综述、学科年度总结,进展报告以及数据手册、百科全书等参考工具书。

三次文献是情报研究的产物和成果。

具有很强的的综合性。

总之,一次文献(创造性),二次文献(有序化),三次文献(高度浓缩,提炼,再创造)。

6)以上四个级别的文献中,零次文献由于没有进入出版、发行和流通这些渠道,收集利用十分困难,一般不作为我们利用的文献类型。

信息检索---名词解释

信息检索---名词解释

一、名词解释信息检索:信息检索最普通的理解就是信息查找。

它是将信息按一定的方式组织起来,并根据信息用户的需求查找出有关的信息的过程和技术。

信息检索又叫做信息存储与检索(information storage and retri)。

信息检索可以分为事实检索、数据检索、文献检索。

特性检索:也称强相关性检索,强调向用户提供高度对口的信息。

强调检索的准确性,对检索结果的数量不作要求。

族性检索:也成弱相关性检索,强调向用户提供系统、完整的信息。

注重检索的全面性,要求检索出一段时间期限内有关特定主题的所有信息,对准确性要求较低。

特种文献:特种文献是一种不以书刊形式出版的文献,一般不公开发行,它包括专利文献、会议资料、科技报告、技术标淮、学位论文、政府出版物、产品样本及其说明书等。

其特点是内容涉及面广、种类多、数量大、报道快、参考价值高。

OPAC:联机图书馆公共检索目录,有开放的公共查询目录演化而来,是20世纪70年代末美国一些大学图书馆和公共图书馆共同开发的供读者查询馆藏数据的联机书目检索系统。

参考工具书:是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。

年鉴:是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。

手册:是汇集某一方面常需要查考的基本知识和数据资料,以供读者手头随时翻检的一种工具书。

名录:是汇集机构名、人名、地名等专名基本情况和资料的一种工具书。

搜索引擎:就是通过运行一个不断在网络上通过域名扫描和各种链接的软件,自动获得大量站点页面的信息,并按照一定规则归类整理,从而形成数据库,用以提供查询的站点。

图书:论述或介绍某一领域知识的出版物。

期刊:期刊一般是指名称固定、开本一致的定期或不定期连续出版物。

信息检索概念及分类

信息检索概念及分类

信息检索概念及分类
一、概念
信息检索(Information Retrieval)是用户进行信息查询和获取的主要方式,是查找信息的方法和手段。

狭义的信息检索仅指信息查询(Information Search)。

即用户根据需要,采用一定的方法,借助检索工具,从信息集合中找出所需要信息的查找过程。

广义的信息检索是信息按一定的方式进行加工、整理、组织并存储起来,再根据信息用户特定的需要将相关信息准确的查找出来的过程。

又称信息的存储与检索。

一般情况下,信息检索指的就是广义的信息检索。

二、分类
(一)按存储与检索对象划分,信息检索可以分为:
文献检索
数据检索
事实检索
以上三种信息检索类型的主要区别在于:数据检索和事实检索是要检索出包含在文献中的信息本身,而文献检索则检索出包含所需要信息的文献即可。

(二)按存储的载体和实现查找的技术手段为标准划分:
手工检索
机械检索
计算机检索
其中发展比较迅速的计算机检索是“网络信息检索”,
也即网络信息搜索,是指互联网用户在网络终端,通过特定的网络搜索工具或是通过浏览的方式,查找并获取信息的行为。

(三)按检索途径划分:
直接检索
间接检索。

信息检索

信息检索

专业科训信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。

狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻(Information Search 或Information Seek)。

信息检索有广义和狭义的之分。

广义的信息检索全称为“信息存储与检索”,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。

狭义的信息检索为“信息存储与检索”的后半部分,通常称为“信息查找”或“信息搜索”,是指从信息集合中找出用户所需要的有关信息的过程。

狭义的信息检索包括3个方面的含义:了解用户的信息需求、信息检索的技术或方法、满足信息用户的需求。

一·按存储与检索对象划分,信息检索可以分为:1·文献检索·2数据检索 3·事实检索以上三种信息检索类型的主要区别在于:数据检索和事实检索是要检索出包含在文献中的信息本身,而文献检索则检索出包含所需要信息的文献即可。

二·按存储的载体和实现查找的技术手段为标准划分:1·手工检索 2·机械检索 3·计算机检索其中现在发展比较迅速的计算机检索是“网络信息检索”,也即网络信息搜索,是指互联网用户在网络终端,通过特定的网络搜索工具或是通过浏览的方式,查找并获取信息的行为。

按检索途径划分:(1)直接检索,(2)间接检索三·检索方法信息检索方法包括:普通法、追溯法和分段法。

1.普通法是利用书目、文摘、索引等检索工具进行文献资料查找的方法。

运用这种方法的关键在于熟悉各种检索工具的性质、特点和查找过程,从不同角度查找。

普通法又可分为顺检法和倒检法。

顺检法是从过去到现在按时间顺序检索,费用多、效率低;倒检法是逆时间顺序从近期向远期检索,它强调近期资料,重视当前的信息,主动性效果较好。

信息检索-简答题(整理)较全版本

信息检索-简答题(整理)较全版本

四、简答1. 简述信息组织、存储与检索的关系。

答:信息组织、存储与检索三者是不可分割的。

信息检索是通过信息存取系统(即检索工具)来实现的,任何一种信息存取系统都包括信息存储子系统和信息检索子系统,它们是同一事物中既相互对立又相互联系、互为依存的两个方面,而信息存取系统的建设,需要信息组织。

信息组织在信息资源开发中具有重要的地位,在信息管理中具有承上启下的作用,它是建立信息系统的重要条件,是信息存储与检索的基础。

所以,三者是不可分割的。

2. 简述信息存储的含义及作用。

答:信息存储是指通过多种形式记录和排序信息的过程。

它包含三层含义:一是将所采集的信息按照一定规则记录在相应的信息载体上;二是将这些载体按照一定的特征和内容性质组织成系统有序的、可供自己或者他人检索的集合体;三是应用计算机等先进的技术和手段,提高信息存储的效率和信息利用水平。

存储子系统的建设,要求根据一定的原则记录和描述信息或知识载体的内容与形式特征,然后按特征序化成各类信息集合并组织成系统。

信息存储部分是揭示信息特征、整序信息、建设系统的过程。

只有经过记录、描述与组织序化的知识集合,才能提供有效的信息检索。

因此,信息存储是基础,信息检索是目的。

3.文献的概念及分类4.什么是文献类型标识符,在什么情况下使用如何使用答:文献类型标识符:标识各种文献类型的符号。

使用范围:仅在含有各种文献类型的目录及其他检索工具中使用。

使用方法:著录在正题名后面,并用中括号“[ ]”括起来。

5.目录:是图书、期刊或其他单位出版物外表特征的揭示与报道。

它是以一本书、一种刊物为著录的基本单位,记录图书、期刊、资料等的名称、著者、出版项与馆藏项等内容,并按照一定的编排体例进行编制,但不涉及书中的章节或期刊中具体的文章。

6.信息检索语言7.追溯法:8.文献信息资源9.信息的概念是什么信息有哪些特征10.影响查全率和查准率的因素有哪些11试比较分类语言与主题词语言分类语言是运用概念划分的原理,以分类号为标识,将各种概念按学科性质加以划分和排列,用以分门别类地、系统地组织信息的一种检索语言,它又可以分为体系分类语言和组配分类语言以及混合分类语言。

信息存储与检索复习资料答案

信息存储与检索复习资料答案

一、单项选择题1. 以下哪个数据库提供同名作者检索功能:〔D〕A.万方数据库B.中国期刊全文数据库C.复印报刊资料全文数据库D.中文科技期刊全文数据库2. _______提供一次文献的线索.〔B〕A.文摘、索引等B.图书C.百科全书D.手册3. 以下属于特种文献的是〔 B〕. A.图书 B.科技报告 C.报纸D.期刊4. 用主题词检索只可以检索出对应的〔〕5. 我国制定专利法的主要目的就是为了保护发明创造的〔D〕A.著作权 B.发明权 C.发现权 D.专利权6. 利用分类途径进行检索,其检索标识为〔C〕A.主题词B.关键词C.分类号D.分子式7. 在一般的著录格式中可以通过_______来判断该文献为会议文献〔C〕A.Journal B.Report C.Conference D.Patent8. 下列选项中,不属于信息能力的有〔 B〕A.鉴别 B.传递 C.评价 D.有效利用9. 从狭义上说专利文献就是指〔专利注明书〕10. Google搜索引擎的首页面上有一个"手气不错"的按钮,这个按钮的作用是什么?〔D〕A.测试你当天的手气B.提供最相关的一组检索结果列表C.提供最相关的一个检索结果的 D.直接跳转到系统认为是最相关的页面11. 利用___索引,我们可以检索任一知名专家的文献被引用的情况〔D〕A、Citation Index;B、Corporate Index;C、Permuterm Subject Index;D、Source Index;12. 文献信息检索的全过程包括文献信息的______两个过程〔C〕A.存贮和检索B.存贮和编排C.标引和编排D.存贮和标引13. 利用分类途径进行检索,其检索标识为〔C〕.A.主题词 B.关键词 C.分类号D.分子式14. 已知名叫孙钱章的作者99年出版了一本书,若想找到书名与其他信息,应在下列哪个数据库中查找?〔C.〕A.中文科技期刊全文数据库B.复印报刊资料全文数据库C. 超星数字图书馆D.万方数据资源系统15. 利用搜索引擎检索有关知识管理方面的学术论文,其检索式采用哪种比较好?〔C〕A.关键词摘要intitle:知识管理B.论文知识管理PDFC.学术论文知识管理D.学术论文intitle:知识管理16.在中国知网提供的检索服务中,〔检索词扩展〕起到扩展检索的作用.17. 下列哪种语言不属于规范化语言______〔B〕A.分类语言B.叙词语言C.关键词语言D.标题词语言18. 数据库检索中,布尔逻辑检索的逻辑关系中A OR B 又可以表示成〔A〕A.A+B B.A-B C.A*B D.B OR A19. 下列哪些不属于主题途径?〔D〕A.标题B.关键词C.摘要D.ISBN20. 《中华人民共和国专利法》开始实施的时间是〔B〕A.1984年4月l日B.1985年4月1日C.1990年9月7日D.1987年1月1日21. 赵一.科技成果向现实生产力转化.科学学研究,1996,14〔2〕:33-38是< A >A.期刊论文B.专著C.书目D.论文集22. 在检索式中,下列哪一个不能为提高检索的查全率而起到扩展检索范围的作用.〔D〕A.逻辑或B.截词检索C.位置运算符W D.逻辑与23. 在中文网络数据库中,能查到企业名录的是哪一个?〔C〕A.中国知网B.维普中文科技期刊数据库C.万方数据库D.超星数字图书馆24.读者阅读万方资源数据库的全文,需要安装的阅读器是〔PDF〕25. 检索最新的学术动态方面的信息,最好用哪种检索工具书?〔A〕A.手册 B.年鉴 C.期刊 D.书目26. 根据"Anon D..Biomedical applications of nanoscale devices[J].Materials Technology, 2004, 19<2>: 118-119."的著录特点,可以判断,该文献属于〔A〕.A.期刊论文B.图书C.科技报告D.会议论文27. 哪种不属于常规检索方法〔D〕A.直接检索法B.顺查法C.抽查法D.引文法28.根据"林福宗.多媒体技术基础[M].:清华大学,2006."的著录特点,可以判断,该文献属于〔B〕.A.期刊论文B.图书C.科技报告D.会议论文29. 世界三大检索刊物是指SCI<科学引文索引>、EI<工程索引>、ISTP<科技会议录索引>30. 检索2009年中国房地产方面的统计信息,最好用哪种检索工具书?〔A〕 A.年鉴B.手册C.书目D.百科全书31. 课题"查找王安石的相关资料"应用____〔B〕A.分类途径B.主题途径C.作者途径D.高级途径32.在《科学引文索引》中,下列哪个索引能提供从著者单位名称检索文献〔〕33. 查找中文科技期刊全文文献的数据库有〔维普〕二、名词解释1. 主题标引:是依据一定的主题词表或主题标引规则,赋予信息资源语词标识的过程.具体而言,主题标引是在主题分析的基础上,以一定的词表或标引规则作为依据,将信息资源中具有检索意义的特征转换成相应的主题词,并将其组织成表达信息资源内容特征的标识的过程.2. INTERNET〔因特网〕:泛指由多个计算机网络相互连接而成的一个网络,它是在功能和逻辑上组成的一个大型网络.3. 顺查法:就是以课题研究的起始年限为出发点,利用选定的检索工具如书目、索引、文摘又远与近的逐年查找.4. 三次文献:是在一、二次文献的基础上,经过综合分析而编写出来的文献,人们常把这类文献称为"情报研究"的成果5. 文献信息资源:文献是记录有知识的一切载体,文献信息资源是以文字、图形、符号、声频、视频等方式记录在各种载体上的知识和信息资源.6. 倒查法:一种逆时间顺序由近而远地查找信息的方法.7. 一次文献:即原始文献.它是作者以生产或科研为依据而创作的原始文献.如专著、期刊论文、学位论文等.8. 检索语言:又称为情报语言、情报存储和检索语言、信息组织语言等.它是根据检索的需要而创作的人工语言,把信息的存储和检索联系起来,把标引人员与检索人员联系起来,以便取得共同理解、实现交流的语言.9. 手工检索:是由检索者通过卡片式或书本式的目录、题录、文摘、索引等检索工具查找文献线索的过程.10. 信息检索语言:信息检索语言是用来描述信息的内容特征、外部特征和表达信息检索提问的一种专门语言.11. 特种文献:特种文献是指和获取途径都比较特殊的科技文献.特种文献一般包括会议文献、科技报告、专利文献、学位论文、标准文献等.12. 间接检索法:利用一定检索工具进行文献检索13. 专利:有三层含义:一指受专利法保护的发明,二是指专利权,三指专利说明书等专利文献.这三层含义的核心是受专利法保护的发明,而专利权和专利文献是专利的具体体现.14. 搜索引擎:是一种 Web 上应用的软件系统,它以一定的策略在 Web 上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务.用户可以通过主题浏览和关键词检索的方式搜索所需信息.15. 技术档案:指生产、设计、建设、科研等专业部门,在科技活动中形成的文件、图书、照片、数据等原始记录文献,包括项目规划、设计、实施方案、任务说明书、协议书、技术指标、实验计划等,具有##性和内部使用的特点.16. 索引:根据标题法的原理,将类目与其注释改成标题形式,按字顺排列,并注明相应的分类号.这样不仅可方便查表,而且还可将分类表中因为按学科分类而被分散的同一事物不同方面的类目集中,使分类法在某种程度上兼有主题法的性能.17. 抽查法:针对研究课题发展的特点,选择有关的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法.18. 回溯检索:又叫追溯法,是以某一篇文献末尾所附的参考文献为依据,由近与远进行逐一追踪的查找方法.19. 循环检索:先利用检索工具查出一批有用文献,然后再利用这些文献末尾所附参考文献的线索进行追溯查找.20. 追溯法:以已获文献后面所附参考文献为线索进行追溯查找,又称为参考文献法.21. 分类标引:对档案给予分类号标识的过程.22. 目录:是图书、期刊或其他单位出版物外表特征的揭示与报道.它是以一本书、一种刊物为著录的基本单位,记录图书、期刊、资料等的名称、著者、出版项与馆藏项等内容,并按照一定的编排体例进行编制,但不涉与书中的章节或期刊中具体的文章.23. 竞争情报:竞争情报是20世纪80年代在国际上迅速发展起来的一种信息业务,是关于竞争环境、竞争对手和竞争策略的情报研究.三、简答题1. 光盘检索与手工检索相比有哪些优势?使用光盘检索系统,可免除联机检索系统所必须使用的电讯设备,节省了电讯费和联机系统使用费,还可免除由通信线路传输过程中所造成的失误光盘系统向用户随盘提供相当于联机信息检索系统功能的软件,并提供菜单驱动与命令驱动两种方式光盘存贮容量大,耐用,复制费用低可以把文本,图形,图像,声音与动态形象结合在一起如果光盘数据库量不够多,则信息资源就显得有限,购买大量光盘数据库,又要受到经费限制在信息需求的适时性上,光盘检索不如联机检索系统,因为光盘只能定期提供数据库费用大手工检索的优势〔1〕手工检索能了解标引规则,按规则进行各项的著录,便于检索者根据文献标引规则查阅相关文献.〔2〕手工检索能了解各类检索刊的收录范围、专业覆盖面、特点和编制要点,检索回溯期长,可以提高查全率和查准率.〔3〕手工检索灵活性高、费用低.〔4〕手工检索也便于检索策略的制定和修改,所得到的文献信息一般能符合检索者的信息要求,并且手工检索过程中发现问题,可以与时地修改和提出.手工检索过程中,直接查找任务的是人,在查找过程中,人的思维一直起着主导作用.检索者可以在检索过程中,结合检索的结果不断明确自己的信息需求和不断地修改自己的检索提问.检索提问标识与检索系统中文献特征标识的组配完全可以做到内容、概念和形式上的一致,而无须严格的字面的组配.因此,检索到的文献信息一般能符合检索者的信息要求.〔5〕在载体内容的直观性方面,手工检索也优越于计算机检索.利用手工检索工具,人们无须借助任何转换设备便可一目了然地判读具体文献的描述内容,也能够比较准确地了解其全部.而计算机检索则不然,必须借助于相应的读取工具,如计算机、光盘阅读器等,才能得以判读.手工检索的缺憾:<1> 检索速度慢 <2 >检索受时空的限制 <3> 检索受馆藏资源的限制 <4> 更新周期长 <5> 检索途径少2. 信息的特征有哪些?答:普遍性、无限性、传递性、可知性与可贮性、动态性、共享性3. 简述联机检索的基本原理.信息用户利用终端设备,通过通讯网络与世界各地的信息检索系统联机,进行人机对话,从检索系统的数据库中查找出用户所需信息的全过程.一个典型的计算机信息系统,能完成数据收集,分析,加工处理,存储,传递通信和检索信息的全过程.4. 信息的概念是什么?信息有哪些特征?广义的信息概念:即信息是事物运动的状态和方式,也叫本体论信息狭义的信息概念:即信息是认识主体对事物运动状态和方式的反映,也叫认识论信息信息具有如下几个特征:普遍性、无限性、传递性、可知性与可贮性、动态性、共享性5. 检索系统必备四大要素是什么?答:检索文档〔数据库〕、检索设备〔检索硬件与通讯设施〕、系统规则、相关人员、.6. 简述信息检索语言的功能.信息检索语言是沟通信息存储和信息检索的桥梁;对信息组织人员来说,它是表达信息主题内容,形成标识并赖以组织信息的依据;对信息检索人员来说,它是表达检索需求的依据.7. 简述信息检索的作用.答:全面掌握必要信息;提高信息利用效率;提高信息素质;具有一定经济性.8. 简述信息检索原理〔可以用图描述〕.9. 简述网络信息资源的特点.<1>信息量大,有污染.在Internet上的信息资源数量究竟有多少,谁也说不清楚,因为它是世界上联系在网络上的所有主机里存储的信息总和.有人估计,在Internet上每天发布的新信息约有14万件,它的信息量是过去任何一种存储信息方法所无法比拟的.但同时也产生了信息的污染,任何人只要同网络相联系,就既是网上的信息使用者,也是信息生产者.这就使网上存在有大量信息的同时也产生了一定的垃圾,出现了信息污染.当我们在检索时,往往会出现许多无关的信息,而信息的真伪是需要鉴别的.<2>信息共享性好,更新快.Internet上的信息共享性最好,只要在网上的任何一个主机上发表信息,在全世界范围内都能看到.许多聪明的商家充分利用这一特点在网上大做广告,树立企业形象,推销产品.Internet网络信息的另一特点是新陈代谢快,可以说Internet网络信息资源要比其他信息资源更新得快.<3>信息源分散无序.Internet上的信息源是在每个独立的计算机服务器上,使网上的信息源呈现出分散、无政府状态.用户无法判断网上有多少同自己需求有关的信息,给用户的信息检索带来一定的困难.<4>信息商品化.刚刚利用Internet查询信息时,你可能会感到网上的大量信息在利用时都不需要付费,只要付少量的通讯费就可以了.但只要细心观察就会发现,免费信息多数都是具有一定宣传作用的,真正有用的信息多数是要付费的,可以说Internet上的网络信息具有一定的商品化.10. 什么是检索策略?以Google搜索引擎为例,论述检索策略的优化方法.检索策略,就是在分析课题内容具有哪些概念单元的基础上,确定检索系统、检索文档、检索途径和检索词,并科学安排各检索词之间的位置关系和逻辑关系以与查找步骤等.检索策略考虑得是否周全,直接影响文献的查全率和查准率.优化方法略11. 简述信息检索的本质.答:本质就是提问标识语文献标识的对比和匹配.12. 举例说明什么是一次文献、二次文献、三次文献.一次文献指以作者本人的研究成果为依据而创作的原始文献,如期刊论文、研究报告、专利说明书、会议论文等.二次文献是对一次文献进行加工整理后产生的一类方面,如书目、题录、简介、文摘等检索工具.三次文献是在一、二次文献的基础上,经过综合分析而编写出来的文献,人们常把这类文献称为"情报研究"的成果,如综述、专题述评、学科年度总结、进展报告、数据手册等.13. 如果要查找有关"转基因生物和细胞与其制备方法"方面的中外文文献,如何查找?请写出具体的检索步骤.1、分析课题,明确检索要求;2、选择检索系统:要考虑文献类型3、选择检索途径4、选择检索方法5、查找文献线索6、获取原始文献14. 简述文献检索步骤答:明确信息检索需求、选择检索系统、确定检索词、构造检索表达式、实施检索策略并分析结果、检索策略的修改与完善15. 影响查全率和查准率的因素有哪些?查全率:R=检出的相关信息量/检索系统中相关信息总量使用泛指性较强的检索语言<如上位类、上位主题词>能提高查全率,但查准率下降.使用专指性较强的检索语言<如下位类、下位主题词>能提高查准率,但查全率下降主要从以下几个方面考虑:选词、选择数据库是否全面;时间,文献类型16. 信息检索系统都包含哪些子系统?答:文献信息选择子系统;检索语言和名称规范子系统;标引著录子系统;查询子系统;交互子系统;匹配子系统.17. 简述信息检索的特征.答:相关性;不确定性;逻辑性.18. 信息检索智能化主要体现在哪些方面?答:检索技术智能化;检索结果处理智能化;检索服务智能化.19. 某同学在检索一个课题时,第一次检索的结果有200条文献,你建议一下她采用何种方式来缩小检索范围?增加文献的检准率,减少文献的检全率第一,变逻辑或为逻辑非,增加"and"的检索词第二,限定文献的类别,〔如该文献是医学方面的,就将其限定在医学这个大类下〕第三,或变模糊检索为精确检索第四,增加其他的限度,这就要看你自己的,如有没有年限现在啊,作者之类20. 什么是检索策略?计算机检索策略的制定一般经过哪几个步骤?检索策略,就是在分析课题内容具有哪些概念单元的基础上,确定检索系统、检索文档、检索途径和检索词,并科学安排各检索词之间的位置关系和逻辑关系以与查找步骤等.检索策略考虑得是否周全,直接影响文献的查全率和查准率.检索步骤〔1〕弄清信息需求,明确检索目的〔2〕选择数据库,确定检索途径〔3〕确定课题的概念组面和检索标识21. 简述专利的新颖性、创造性与实用性的含义,并说明中国保护的专利有哪几种类型?专利的新颖性,是指申请日前没有同样的发明或者实用新型在国内外出版物上公开发表过、在国内公开使用过或者以其他方式为公众所知,也没有同样的发明或者实用新型由他人向国务院专利行政部门提出过申请并且记载在申请日以后公布的专利申请文件中. 专利的创造性:是指在有新颖性的情况下,不同的技术之间实际上是没有产生意想不到的技术效果,简单说,就是两者之间的差异不明显,而且效果无进步. 专利的实用性:指该理论或者观点的提出对实践的知道程度. 中国保护的专利类型有3种类型,分别是:发明专利、实用新型专利和外观设计专利.22. 什么是信息检索查全率和查准率?两者之间的关系如何?查全率<Recall Ratio> 当用户要全面检索某一信息库时,检出的成功度可用检出的所有相关信息在信息库所有相关信息中所占的比例来表示.这种对信息库检索全面性的测量指标即为查全率.查全率与系统能够检索出的相关文献能力有关.可定义为:查全率 =<检出的相关信息数/信息库中相关信息总数>×100%查准率<Precision Ratio> 当用户要对检索到的结果进行分析时,检出的相关信息数在所有检出信息中所占的比例往往成了较重要的评判指标.这种对检索结果中的相关信息的测量指标即为查准率.也有称为信号噪声比<signal-to-noise ratio>.查准率与检索出的相关信息数有关.可定义为:查准率 =<检出的相关信息数 /检出的信息总数>×100%查全率和查准率必须结合使用,单独使用两者中的任何一个都不能全面说明检索效果的好坏.若检出 1 篇相关信息,必能达到100% 的查准率,但查全率却会非常低;同样,若检出的信息数等于库##息的总量 a + b + c + d ,则必能获得 100% 的查全率,但很显然查准率必定也低得可怜.查全率和查准率是评价检索效果好坏的指标,而漏检率和误检率则是测量检索误差的指标.23. 影响信息检索效果的因素有哪些?<1> 影响查全率的因素从文献存储来看,主要有:文献库收录文献不全;索引词汇缺乏控制和专指性;词表结构不完整;词间关系模糊或不正确;标引不详;标引前后不一致;标引人员遗漏了原文的重要概念或用词不当等.此外,从情报检索来看,主要有:检索策略过于简单;选词和进行逻辑组配不当;检索途径和方法太少;检索人员业务不熟练和缺乏耐心;检索系统不具备截词功能和反馈功能,检索时不能全面地描述检索要求等.<2> 影响查准率的因素主要有:索引词不能准确描述文献主题和检索要求;组配规则不严密;选词与词间关系不正确;标引过于详尽;组配错误;检索时所用检索词〔或检索式〕专指度不够,检索面宽于检索要求;检索系统不具备逻辑"非"功能和反馈功能;检索式中允许容纳的词数量有限;截词部位不当,检索式中使用逻辑"或"不当等等.实际上,影响检索效果的因素是非常复杂的.根据国外有关专家所做的实验表明,查全率与查准率是呈互逆关系的.要想做到查全,势必会要对检索范围和限制逐步放宽,则结果是会把很多不相关的文献也带进来,影响了查准率.企图使查全率和查准率都同时提高,不是很容易的.强调一方面,忽视另一方面,也是不妥当的zx.应当根据具体课题的要求,合理调节查全率和查准率,保证检索效果.24. 信息检索的方法有哪几种?从检索手段看,信息检索分为: 手工信息检索机械信息检索计算机信息检索25. 什么是信息检索漏检率和误检率,二者之间的关系如何?误检率为检出的结果中,不相关信息占检出信息的比例.这种对检索结果中不相关信息数的测定即为误检率.可定义为:误检率 =<检出的非相关信息数/检出的信息总数>× 100%漏检率为系统未检索出的相关信息占库中相关信息总数的比例.这种对检索结果中不包含系统中存在的相关信息数的测定即为漏检率.可定义为:漏检率 =<未检出的相关信息数/信息库中相关信息总数>× 100%其实,查全率和漏检率是互补的;而查准率和误检率也是互补关系.即:查全率 + 漏检率 = 1 ;查准率 + 误检率 = 1 .漏检率和误检率则是测量检索误差的指标.26. 试比较分类语言与主题词语言分类语言是运用概念划分的原理,以分类号为标识,将各种概念按学科性质加以划分和排列,用以分门别类地、系统地组织信息的一种检索语言,它又可以分为体系分类语言和组配分类语言以与混合分类语言.主题语言是直接以表达主题内容的语词作为检索标识,以字顺为主要检索途径的标引和检索信息的语言.主题语言是一种描述性语言,它使用自然语言中的词语或规范化的词语来描述文献所论述或研究的事物概念,具有较强的直观性、专指性和灵活性.。

信息存储与检索

课件第一章1 纸质文献资源的存储与组织的4个基本要素:信息内容、载体材料、记录符号和记录方式2 零次文献、一次文献、二次文献、三次文献的区分(课本P23)零次文献:尚未经过系统整理形成正式文献的零散资料,包括草稿、记录和谈话等。

它与一次文献的重大区别在于前者没有形成正式文献,没有正式发表。

一次文献:作者最初发表的原始文献。

主要类型有期刊论文、专利文献、科技报告、会议录、学位论文等等,这些文献具有创新性、实用性和学术性等明显特征,是科技查新工作中进行文献对比分析的主要依据。

二次文献:对一次文献进行加工整理后的产物,用做文献检索工具。

它是将大量分散、零乱、无序的一次文献进行整理、浓缩、提炼,并按照一定的逻辑顺序和科学体系加以编排存储文学类型,如书目、索引、文摘等都是二次文献。

三次文献:在运用一次文献成果并借助二次文献检索的基础上,用科学的研究方法,对一次文献进行综合分析、比较研究,从而揭示某种规律性认识的文献类型。

如综述、述评、百科全书等。

从零次文献、一次文献、二次文献到三次文献,是一个由分散到集中,由无序到有序,由博而精的对知识信息进行不同层次的加工过程。

它们所含信息的质和量是不同的,对于改善人们的知识结构所起到的作用也不同。

零次和一次文献是最基本的信息源,是文献信息检索和利用的主要对象;二次文献是一次文献的集中提炼和有序化,它是文献信息检索的工具;三次文献是把分散的零次文献、一次文献、二次文献,按照专题或知识的门类进行综合分析加工而成的成果,是高度浓缩的文献信息,它既是文献信息检索和利用的对象,又可作为检索文献信息的工具。

3 (课件第二章)信息存储与检索定义信息存储与检索是信息检索的全称形式或广义的信息检索,又称为信息存取,它既包括采用多种形式记录信息、排序信息的信息存储过程,也包括通过一定的设备、采用一定的手段与技巧从信息系统中快速、准确地搜寻所需信息的方法与活动。

广义的信息检索包括信息的存储和检索两个过程。

信息检索

1.什么是信息检索?从广义的角度讲,信息检索包含信息存储和信息获取两个过程。

信息存储指通过对大量无序信息的选择和收集、著录和标引等方法,建成各种各样的信息检索工具或信息检索系统,使之成为有序化信息集合的过程。

获取是存储的逆过程,其实质是根据特定的需求,运用以组织好的检索系统,将特定的信息查找出来。

存储是获取的前提和基础,没有存储就没有获取,而获取是存储的目的,二者密切联系,互相依存,缺一不可。

狭义的信息检索是指广义的信息检索的后一个过程,即信息获取的过程,相当于人们所说的信息查检等。

具体来说,狭义的信息检索指通过一定的方法,从已存储的信息中检索出与用户提问相关的文献、数据和事实的过程,即根据用户的特定要求查找所需信息的过程。

2.信息检索效果的评价指标有哪些?(1)检索效果有效性评价,即检索技术效果的评价,是对检索系统满足检索要求的有效程度的评价,主要以查全率和查准率为评价标准。

(2)检索系统使用的评价,包括系统对用户是否需要,是否实用有多大的实用效果,即检索的社会效果的评价,需要应用社会学方法。

(3)检索费用——效率评价,即检索的经济效果的评价,包括检索系统完成检索服务的成本及时间消耗,需要应用经济学方法。

评价信息检索效果的指标主要有6个:收录范围、查全率、查准率、响应时间、用户负担和输出形式。

附:查全率=【检出相关文献信息量/检索系统中相关文献信息总量】*100%=(a/a+c)*100%查准率=【检出相关文献信息量/检出文献信息总量】*100%=(a/a+b)*100%漏检率=【漏检相关文献信息量/检索系统中相关文献信息总量】*100%=(c/a+c)*100%误检率=【误检文献信息量/检出文献信息总量】*100%=(b/a+b)*100% 3.什么是检索语言?检索语言的实质是用于表达一系列概括文献信息内容的概念及其相互关系的概念标识系统。

它可以是从自然语言中精选出来并加以规范化的一套词汇,可以是代表某种分类体系的一套分类号码,也可以是代表某一类事物的某一方面特征的一套代码(如化合物的各种代码),用于对文献内容进行主题标引、特征描述或逻辑分类。

中职《信息技术》项目五 信息检索


3 知识百科检索https://)、搜狗百科(https://)、 维基百科(h索——使用搜狗搜索检索全国计算机等级考试信息
全 国 计 算 机 等 级 考 试 ( national computer rank examination,NCRE)是我国教育部于1994年推出的全国性计算 机能力考试,共分四级,主要考察应试人员(多为非计算机专业学 生及从业人员)的计算机应用知识与技能。对于在校学生而言,参 加全国计算机等级考试不仅能检验自身的计算机技术水平,还能在 日后的求职简历中增添更多亮点。
2搜 索 ( https:// ) 、 搜 狗 搜 索 ( https:// ) 、 Google (https://)、Microsoft Bing (https://)等,如图所示。
二、信息检索的基本流程
图5-5 信息检索的基本流程
1 分析检索内容,明确信息需求基本操作
该步骤的主要工作是通过分析检索内容的主题、类型、用途、时间范围和自身对检索的 评价要求等,明确自身对信息的要求。
2 选择检索工具,了解检索系统
(1)检索工具
检索工具是帮助用户快速、准确地检索所需信息的工具和设备的总称。 根据检索范围的不同,检索工具可大致分为综合性检索工具和专业性检索工具两类。其中, 综合性检索工具包括搜索引擎、门户网站、图书馆、百科全书等,而专业性检索工具则包括各类 垂直网站、专业数据库、专题工具书等。
4 文件资料检索
当前国ttps://)、爱问共享资料 (https://)、360doc个 人图书馆()、站作为补充。
能力目标
掌握布尔逻辑检索、截词检索、位置检索、 限制检索等常用的信息检索方法,能够根据特定 的信息需求选择合适的信息检索工具和方式,并 能以有效的方法和手段判断信息的可靠性、真实 性、准确性和目的性。

广义的信息检索包括信息的存储和检索两个过程.

广义的信息检索包括信息的存储和检索两个过程.
广义的信息检索包含储存与检索两个过程。

信息的存储实现信息检索的基础。

这里要存储的信息不仅包括原始文档数据,还包括图片、视频和音频等,首先要将这些原始信息进行计算机语言的转换,并将其存储在数据库中,否则无法进行机器识别。

待用户根据意图输入查询请求后,检索系统根据用户的查询请求在数据库中搜索与查询相关的信息,通过一定的匹配机制计算出信息的相似度大小,并按从大到小的顺序将信息转换输出。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

信息检索与分析利用
商标信息检索
商标的基本知识
1.商标信息检索 2.商标信息检索方法 目前,商标信息检索主要有两种方法; 目前,商标信息检索主要有两种方法; 1)商标的文字检索和分类检索 2)图形商标的图形检索
信息检索与分析利用
商标检索工具
1.中国商标信息检索工具 1)中国知识产权网(/xwxx/) 中国知识产权网(/xwxx/) 该网的中国商标部分检索字段包括: 商标公告号、 该网的中国商标部分检索字段包括 : 商标公告号 、 商标名 使用商品类、联系人、商标注册人、所属地区。 称、使用商品类、联系人、商标注册人、所属地区。 . 2 ) 中 国 商 标 网 ” ( 或 ) ) 是国家工商行政管理总局商标局主办的在线查询商标注册 信息的网站,免费向公众开通商标网上查询。 信息的网站,免费向公众开通商标网上查询。 提供: 商标近似查询、商标综合查询、 提供: 商标近似查询、商标综合查询、商标状态查询
2.外观设计必须是对产品的外表所作的设计 2.外观设计必须是对产品的外表所作的设计 外观设计顾名思义, 外观设计顾名思义,是指用在产品上的一种 外部设计。所谓产品是指具有独立用途的、 外部设计。所谓产品是指具有独立用途的、 可以成为交易对象的物品, 可以成为交易对象的物品,而且这种物品 具有一定的形状,能够自由移动。如脸盆、 具有一定的形状,能够自由移动。如脸盆、 床单、壁纸等都有自己的独立用途, 床单、壁纸等都有自己的独立用途,都可 以称之为产品。 以称之为产品。
信息检索与分析利用
2.国外商标信息检索工具 1 ) 美 国 专 利 商 标 局 ( http : //www. uspto. gov/ //www . uspto . gov / ) 提供商标电子查询 系统。 系统。 国际商标协会(INTA, 2)国际商标协会(INTA, /) /)
在实用新型专利中,所谓产品的形状, 在实用新型专利中,所谓产品的形状, 是指产品的外部立体表现形式, 是指产品的外部立体表现形式,且具 有相当的体积。所谓产品的构造, 有相当的体积。所谓产品的构造,是 指产品之部件或零件的有机结合或连 产品的形状、构造的组合, 结。产品的形状、构造的组合,也是 可以获得实用3)作为实用新型对象的产品必须是可 自由移动的物品。当然, 自由移动的物品。当然,一件物品本 来是可自由移动的, 来是可自由移动的,后来被人们固定 在不能自由移动的物品上, 在不能自由移动的物品上,这样的物 品仍然可作为实用新型的对象。 品仍然可作为实用新型的对象。
外观设计
我国专利法实施细则中规定, 我国专利法实施细则中规定,外观设计是指对产品 的形状、图案、 的形状、图案、色彩或者其结合所作出的富有美 感并适合于工业上应用的新设计。根据这个规定, 感并适合于工业上应用的新设计。根据这个规定, 外观设计应当符合以下一些要求: 外观设计应当符合以下一些要求: 1.外观设计是指形状 图案、 外观设计是指形状、 1.外观设计是指形状、图案、色彩或者其结合的设 计 外观设计与发明创造、实用新型不同, 外观设计与发明创造、实用新型不同,后者是以概 念性技术方案本身为对象的, 念性技术方案本身为对象的,而外观设计则要求 在外表上有一个具体的形状或者形态作为对象, 在外表上有一个具体的形状或者形态作为对象,
返回
信息检索与分析利用
用法示例
中国专利检索示例
【例题】检索西南大学申请的车的传动或者传感装置的专利 例题】 【题解】 进入中国国家知识产权局专利数据库,选择“高级 题解】 进入中国国家知识产权局专利数据库,选择“ 检索方式” 检索方式” 传感) “名称”输入:车%(传动 or 传感)%装置 名称”输入: “申请人”输入“西南大学”,如图7-3所示: 申请人”输入“西南大学” 如图7 所示:
外观设计专利样例
信息检索与分析利用
专利信息检索工具 网络上使用最广的收费专利数据库 Scientific公司Derwent系 公司Derwent 是Thomson Scientific公司Derwent系 列专利数据库, 列专利数据库,免费专利数据库是欧洲 专利局、美国专利商标局及IBM IBM三大专利 专利局、美国专利商标局及IBM三大专利 数据库。 数据库。
信息检索与分析利用
2.关键词检索 1)中国商标检索 【例题】检索与“孩儿”汉字读音相同的商标。 例题】检索与“孩儿”汉字读音相同的商标。
信息检索与分析利用
中国商标网商标近似查询 结果:24个商标,例如“红孩儿” 结果:24个商标,例如“红孩儿”、“海尔”、“海 个商标 海尔” HAIER”等 儿”、“HAIER 等。
产品发明(包括物质发明) 产品发明(包括物质发明)是人们通过研究开发出来的关于 各种新产品、新材料、新物质等,如电子计算机、 各种新产品、新材料、新物质等,如电子计算机、超导材 料和人造卫星的发明等。 料和人造卫星的发明等。方法发明是人们为制造或者解决 某一技术客体而研究开发出来的操作方法、 某一技术客体而研究开发出来的操作方法、制造方法以及 工艺流程等技术方案,如汉字输入法、 工艺流程等技术方案,如汉字输入法、无铅汽油的提炼方 法等等。 法等等。 也有产品和方法结合的专利。 也有产品和方法结合的专利。如“活动信息会计方法和系 统 ”。一些原来不属于专利法保护范畴的新型的技术例 如商业方法、基因序列类也申请了专利。 如商业方法、基因序列类也申请了专利。发明专利是三种 专利类型当中含金量最高的, 专利类型当中含金量最高的,发明专利拥有量的多少也客 观直接地反映出一个企业对技术创新的重视和对知识产权 制度的理解。 制度的理解。
信息检索与分析利用 1.综合性检索工具
欧洲专利局esp@cenet网络数据库 欧洲专利局esp@cenet网络数据库 esp@cenet ) ()
可以查找到美国、日本等50多世界其他国家和专 可以查找到美国、日本等50多世界其他国家和专 50 利组织从1970年起的专利文献, 1970年起的专利文献 利组织从1970年起的专利文献,以及中国专利的 文摘和著录信息。 文摘和著录信息。该数据库的检索软件是一个面 向中小企业的普及型商业化软件, 向中小企业的普及型商业化软件,所以不能保证 查全率很高。 查全率很高。
实用新型
保护工业产权巴黎公约》虽然讲“实用新型” 《保护工业产权巴黎公约》虽然讲“实用新型”规 定为“工业产权”的保护对象之一, 定为“工业产权”的保护对象之一,但没有对保 护方式具体规定。所以,有些国家(如日本、 护方式具体规定。所以,有些国家(如日本、芬 德国和韩国等) 兰、德国和韩国等)单独制定实用新型专利法进 行保护;也有的国家(如巴西、墨西哥等) 行保护;也有的国家(如巴西、墨西哥等)以工 业产权法进行保护,还有的国家(中国、法国、 业产权法进行保护,还有的国家(中国、法国、 美国、西班牙等)则以专利法进行保护。 美国、西班牙等)则以专利法进行保护。对实用 新型的保护,成员国所采用方式虽然不尽相同, 新型的保护,成员国所采用方式虽然不尽相同, 但都符合《巴黎公约》 但都符合《巴黎公约》。
信息检索与分析利用 2.单一检索工具 单一检索工具包括专利公报(Gazette)、专利索引、专利 单一检索工具包括专利公报( Gazette) 专利索引、 数据库。 数据库。 1)中国国家知识产权局(http://www.sipo.gov.cn) 中国国家知识产权局(http://www.sipo.gov.cn) 中国国家知识产权局网站提供的专利信息数据库收录自 1985年4月1日以来所有已公开或公告的中国专利的文献。 1985年 日以来所有已公开或公告的中国专利的文献。 2)美国专利商标局网站专利数据库(/) 美国专利商标局网站专利数据库(/) 由美国专利和商标局提供的网上免费的专利全文数据库, 由美国专利和商标局提供的网上免费的专利全文数据库, 收录了1976 1976年 日至今的美国授权专利文本及2001 2001年 15日 收录了1976年1月1日至今的美国授权专利文本及2001年3月15日 以后的美国专利申请。 以后的美国专利申请。
这种产品可以作为外观设计的载体。 这种产品可以作为外观设计的载体。一 幅画或一个图案,就其本身而言, 幅画或一个图案,就其本身而言,并 不是外观设计。但如果把这幅画、 不是外观设计。但如果把这幅画、这 个图案印在床单、脸盆或壁纸上, 个图案印在床单、脸盆或壁纸上,那 么,这幅画或者这个图案就成为外观 设计了。 设计了。
信息检索与分析利用
专利信息及商标检索
•专利信息检索 专利信息检索 •商标信息检索 商标信息检索 •用法示例 用法示例
信息检索与分析利用
专利信息检索
基本知识
1.专利的类型 各国专利法几乎都规定了三种专利类型,分别是: 1)发明专利 2)实用新型 3)外观设计
发明
专利法所称的发明,是指对产品、 专利法所称的发明,是指对产品、方法或者 其改进所提出的方案。从词义上来看, 其改进所提出的方案。从词义上来看,发 明是指科技开发者依据自然规律原则, 明是指科技开发者依据自然规律原则,运 用自己的资金和智力创造出来的新技术方 专利意义上的发明创造有两种, 案。专利意义上的发明创造有两种,即产 品发明和方法发明。 品发明和方法发明。
信息检索与分析利用
图7-3 中国国家知识产权局专利数据库高级检索界面
信息检索与分析利用
商标检索示例
1.分类目录检索范例 【实例】进入中国商标展示网(http:///)的“中国注册商 实例】进入中国商标展示网(http:///) 界面,点击“商标目录” 比如查看“SONDA”的有关信息 的有关信息: 标”界面,点击“商标目录”,比如查看“SONDA 的有关信息:
形状指具有三维空间的产品造型, 形状指具有三维空间的产品造型,如电 视机、小汽车等的外型。 视机、小汽车等的外型。图案一般是 二维的平面设计,如床单的花样, 二维的平面设计,如床单的花样,地 毯的图案等。色彩是构成图案的成分。 毯的图案等。色彩是构成图案的成分。 外观设计可以是立体的造型、 外观设计可以是立体的造型、也可以 是平面的图案, 是平面的图案,还可以辅以适当的色 彩,有时是这三者的有机结合
相关文档
最新文档