信息存储与检索课堂笔记
信息存储与检索重点

内容的揭示深度和检索入口,并直接影响
到用户查询的检索方式和检索途径。其功
能是用系统规定的规范化词语描述用户的
检索询问,包括对用户询问进行概念分析
和概念转换两个过程,也包括按照系统的
既定规则制定检索策略和构建检索式。该
子系统完成对数据库的查找过程,并与交
互子系统共同完成信息检索系统的检索功
能。
19
《信息存储与检索》
22
2.2.1 布尔模型
❖定义 对于布尔模型而言,标引词权值变量都是二 值的,即wi,j∈{0, 1},查询q是一个常规的布尔表达 式。用qdnf表示查询q的析取范式,qcc表示qdnf的任意 合取分量。文档dj和查询q的相似度可以定义为:
sim(d
j
,
q)
1
0
如果qcc (qcc qdnf ) (ki , gi (d j ) gi (qcc )) 其它
现 实 的
(2)表示机理
信 息
需 求
(3)比较机理
输出检索结果 图1-2 信息检索的一致性匹配作用机理
(4)判断机理 (5)选择机理
5
《信息存储与检索》
1.1.2 信息检索的原理
1、提取机理:从现实的信息和现实的需求 中提取出能够揭示特定信息和特定需求的语 法特征和语义特征。可以归纳为内容特征和 形式特征。
交 互 子 系 统 用户群
词语子系统 查 询 子 系 统
数据库
匹配子系统
图1-9 信息检索系统逻辑结构
标
采
引
选
子
子
系
系
统
统
信息源
16
《信息存储与检索》
1.2.4 信息检索系统的逻辑结构
信息检索原理期末重点背诵知识点

信息检索1、信息检索概念:P12、信息检索的原理一整节内容要自己理解:P3-P4图1-1要掌握文献替代和文献整序的概念要掌握3、信息检索在历史上的不同表现:联机检索、光盘检索、网络检索的区别和特征:P6-P94、信息检索的模型概念:P95、布尔模型、向量空间模型、经典概率模型要理解并掌握各自的优缺点:P11-P126、信息检索系统的概念:P127、检索效果的评价指标:P15-P164个指标:查全率、查准率、漏检率、误检率掌握它们的含义并懂得计算8、网络检索的表达式:布尔逻辑检索、邻近检索、短语检索、截词检索的特点、区别和联系:P17-P219、信息检索的技巧要理解尤其是要掌握及时调整检索策略:P33-P3610、搜索引擎的概念:P3711、数据库知识,实验内容,特点12、引文的概念13、搜索引擎的分类:P40-41搜索引擎划分的类别以及元搜索引擎的概念要掌握12、CBR概念P11312、多媒体信息检索的原理和方法:P110-P114其中要重点理解基于内容的多媒体信息检索的检索形式(可以结合课件)13、专利的概念:P12514、专利的类型:P126(理解一下各类型的区别)15、专利文献的概念:P12716、专利文献的类型:P127(理解一下各类型的区别)17、灰色文献的概念:P14718、会议文献的概念:P15819、科技报告的概念:P16320、查新的概念:P20021、科技查新的作用:P201(每一个小标题后面要自己展开一段)关于上课讲的那几个数据库大家自己看一下PPT,掌握一下。
以上纯属个人观点题型:名词解释:5*4=20简答题:4*10=40论述题:2*20=40考试时间:1月8日上午:9:00—11:001.信息检索的概念(P1)信息检索有广义和狭义两重含义。
广义上说,信息检索是指将信息按照一定的方式组织和存储起来,并根据信息用户的需求查找相关信息的过程。
它包含信息存储和信息查找两个过程。
信息检索教程-考研笔记

信息检索教程-考研笔记考研季即将来临,为了帮助各位考生顺利备战考试,本篇文章将为大家介绍与信息检索相关的一些知识和技巧。
希望通过本教程的学习,能够帮助大家更加高效地获取所需的学习资源和资料。
一、信息检索的定义与意义信息检索,是指通过计算机或其他技术手段,从大量信息中准确快速地检索出符合用户需求的信息的过程。
在当今信息爆炸的时代,信息检索变得越来越重要。
对于考研学生而言,高效地获取相关的学术文献、重要资料以及历年真题等信息,对于备考至关重要。
二、常用的信息检索工具1.图书馆资源考研生首先可以利用学校图书馆的资源。
图书馆通常会提供各类学术期刊、论文数据库以及电子书籍等,这些资源对于到考生的研究工作非常有用。
2.学术搜索引擎除了图书馆资源外,考生还可以使用学术搜索引擎,如Google Scholar、百度学术、CNKI等。
这些搜索引擎会对全球范围内的学术论文、期刊进行索引,方便考生查找相关的研究成果。
3.在线论坛和社群考生还可以加入一些学术研究相关的在线论坛和社群,与其他同行交流心得和资源。
这些论坛和社群通常会有一些共享资源,能够为考生提供一些有用的资料和信息。
三、信息检索的技巧与方法1.关键词的选择在进行信息检索时,选择合适的关键词非常重要。
考生需要根据自己的研究课题和需求,选择与之相关的关键词,以获取更准确的检索结果。
同时,使用适当的逻辑运算符(如AND、OR、NOT)可以帮助考生缩小或扩大检索范围。
2.筛选与过滤大量的信息中往往夹杂着一些无用的内容,考生需要学会筛选与过滤。
通过设置筛选条件、选择合适的文献类型和年代范围等方式,可以快速定位到所需的信息,提高检索效率。
3.引用文献的检索引用文献是考研学习中重要的参考资源。
考生可以通过检索相关的论文,查找该论文被引用的文献,从而获得更多的研究成果和理论支持。
四、信息检索的注意事项1.了解数据库特点不同的数据库具有不同的特点和检索规则,考生在使用之前应该先了解清楚。
信息存储与检索(第1章)

《信息存储与检索》
1.1.2 信息检索的原理 从由此可见,信息存储和信息检索的直接交汇处 是至关重要的,由此形成了信息检索的一致性匹配 作用机理,如图1-2所示。 信息检索的一致 性匹配作用机理 包括5个机理: (1)提取机理 (2)表示机理 (3)比较机理 (4)判断机理 (5)选择机理
符号化表示 比较 符号化表示 判断 现 实 的 信 息 信息特征提取 选择 需求特征提取 现 实 的 需 求 输出检索结果 图1-2 信息检索的一致性匹配作用机理
《信息存储与检索》
1.1.3 信息检索的类型 (一)按照信息检索的对象性质划分 (2)数值检索 (3)事实检索 (二)按照计算机检索技术划分 (1)脱机检索(Off-line Retrieval) (2)联机检索(On-line Retrieval) (3)光盘检索(CD-ROM Retrieval) (4)网络检索(Internet Retrieval)
《信息存储与检索》
1.1.1 信息检索的概念
第二类是狭义的。对于普通用户来说,在大多数情况下, “信息检索”可以用英文Information Searching来表达, 其准确的含义是“信息查询”或“信息搜索”。也就是说, 所谓信息检索,是指按照一定的方式从现有的信息集合或数 据库中,找出并提取所需要的信息。可见,狭义的信息检索 仅指检索这一个过程,而不关心信息是如何存储的。
《信息存储与检索》
1.1.2 信息检索的原理
(3)比较机理。在检索项类型(如提名、作者、分类、关键 词)相同的情况下,对代表特定信息的特征符号与代表特定 需求符号进行对比。比较的实质是相似性比较或一致性比较, 即包括完全一致、部分一致和不一致,也包括等于、不等于、 大于、小于。比如,对于两个词或词组来说,它们可以是完 全一致、前方一致、后方一致、中间一致;对于两个编号来 说,它们可以是相等、大于、小于。 (4)判断机理。在比较的基础上,对信息是否符合需求以及 符合的程度加以判断。两者相符合的信息被检索出来(命 中),不相符合的信息被拒绝(不命中)。从符合程度来看, 可以是完全符合,也可以是部分符合。在部分符合中,还可 以进一步细化。原则上,凡是符合需求的,尽管它们符合的 程度有所不同。
信息检索学习笔记

信息检索学习笔记
信息检索(information retrieval)是一种技术,旨在从大量的数据中快速地找出
有价值的信息,它可以是文本、图片、文档等。
随着互联网的发展,大量的信息被人们积
极创建,成为信息检索的基础。
信息检索具有很大的技术复杂度和应用复杂度。
它涉及对大量的复杂数据的存储、组
织和检索,其中包括多模式检索、增强型搜索、多维搜索、自然语言检索等,目的是在有
限的时间内找出最接近用户期望的信息。
信息检索在数字图书馆、大数据管理、知识管理、学术研究、数据分析、机器学习等
领域已经应用得很广泛,在不同的领域也有不同的算法和技术,涉及的领域也很多,诸如
信息检索对象的表示、信息检索目标的分类、搭档认知模型的确定和信息检索的评价等等。
要学好信息检索,还需要掌握更多的理论,比如:文本索引、相似性检索、信息检索
模型、语言处理等概念。
学习信息检索,需要掌握一些基本的技术,如文档表示、信息检
索语言、查询检索、检索优化等;同时,也需要通过实践的方式学习信息检索,通过不断
实践,学会利用已有的技术手段去解决实际问题。
最后,要结合实际情况,进一步完善信息检索的学习,提高实际操作信息检索的能力,掌握分析和应用信息检索技术的能力。
信息检索教程-考研笔记

信息检索教程一、信息的含义广义:指自然界和一切人类活动所传达出来的信号和消息,是事物表现的一种普遍形式。
从本质上说,信息是事物自身(显示其存在方式)的属性,是客观存在的现象。
狭义:指经过搜集、记录、处理和存储的可供检索的文献,数据和事实。
它是人类对客观事物认识,是实践经验的总结,是认识的结果,是我们检索的对象。
二、信息的特征信息的两种基本状态:可存储性和可传递性1.可存储性:人们可以有意识地将流动的信息以某种方式存储在物质媒介上,使信息和物质媒介构成一种依附性很强的、相对稳定的关系,从而有效地避免信息流失,也使信息检索有源可寻2.可传递性:指信息可以通过一定的传输工具和载体进行传递,从而形成信息联系,被人们感受和接收。
信息传递有空间传递和时间传递等不同类型,需要依赖一定的物质载体,具有动态性和方向性的特征。
3.可转换性:表现在两个层面:信息在一定条件下可转化成物质,能量,金钱等其它东西,这种转换主要依靠人类对信息的正确利用。
信息可以从一种形态转换成为另一种形态,自然信息可转换为语言,文字和图像,也可转换为电磁波信号或计算机代码。
4.可处理性:信息可通过分类,整序,分析,综合,压缩,扩充等加工处理,而达到便于识别,效用更高的信息5.可共享性:同一种信息可以同时被许多人共同享用,这是信息不同于物质和能量的一个非常重要特征。
信息可以广泛地扩散和传播,信息交换的双方不会失去原有的信息,而且还会增加新的信息。
6.可识别性:信息做为表现事物特征的一种普遍形式,反映了事物的运动状态和存在方式,人类可以通过自身的器官去直接感觉和知觉信息,通过比较去认识信息,借助于先进的信息技术和手段去识别信息。
7.依附性:信息无法脱离物质而独立存在,在其存储和传递过程中必须依附于一定的物质载体,信息与物质载体构成一个整体。
8.普遍性:信息是物质的基本属性,普遍存在于自然界和人类社会之中,也存在于人类的思维或精神领域之中。
只要有物质存在的地方,就有信息的存在。
初中信息技术数据库与信息检索知识点梳理

初中信息技术数据库与信息检索知识点梳理在初中信息技术课程中,学习数据库与信息检索知识是非常重要的。
数据库是存储、组织和管理大量数据的工具,而信息检索是通过关键词检索数据库中的信息。
本文将对初中信息技术的数据库与信息检索知识点进行梳理,以帮助初中生更好地理解和掌握这些知识。
1. 数据库基础知识数据库是指按照一定的数据模型组织、存储和管理数据的集合。
以下是初中生应掌握的数据库基础知识点:(1)数据库的定义和作用:了解数据库的概念并知道数据库的作用,如存储数据、保护数据、提供数据访问等。
(2)数据表和字段:理解数据表的概念,明白字段是数据表中的列,用于存储不同类型的数据。
(3)主键和外键:了解主键的作用是唯一标识数据表中的一条记录,外键是关联两个数据表的字段。
(4)查询语言:掌握简单的查询语言,如使用SELECT语句从数据库中检索数据。
2. 关系型数据库关系型数据库是基于关系模型的数据库,是一种使用表格来表示和存储数据的数据库。
以下是初中生应了解的关系型数据库知识点:(1)关系型数据库的特点:了解关系型数据库具有的特点,如数据表具有固定的结构,支持事务处理等。
(2)关系型数据库的常见数据库管理系统:介绍一些常见的关系型数据库管理系统,如MySQL、Oracle等。
(3)SQL语句:了解SQL语句的基本语法,如创建表、插入数据、更新数据等。
3. 非关系型数据库非关系型数据库是指不遵循关系模型的数据库,通常用于存储大量的非结构化或半结构化数据。
以下是初中生应了解的非关系型数据库知识点:(1)非关系型数据库的特点:了解非关系型数据库的特点,如灵活的数据结构、高可伸缩性等。
(2)非关系型数据库的种类:介绍一些常见的非关系型数据库,如MongoDB、Redis等。
(3)NoSQL语句:了解一些NoSQL数据库的基本操作语句,如插入数据、查询数据等。
4. 信息检索基础知识信息检索是指通过关键词在数据库中搜索相关信息的过程。
信息存储与检索(第1章)

互联网的普及推动了搜索引擎的快速发展,信息检索进入全新时代。
大数据与人工智能驱动的信息存储与检索
利用大数据分析和人工智能技术,实现更高效、智能的信息检索。
02
CATALOGUE
信息存储技术
直接附加存储
定义
直接附加存储(DAS)是 一种将存储设备通过电缆 直接连接到服务器的方法 。
优点
简单易用,检索速度快,适用于大量数据的快速筛选。
缺点
关键词匹配可能存在误匹配,无法理解语义,无法处理同义词和歧义 词。
语义检索
原理
语义检索基于自然语言处理和人 工智能技术,通过理解用户输入 的语义,自动识别用户意图,并 从存储的信息中提取出相关内容 。
优点
能够理解用户意图,减少误匹配 ,提高检索准确率。
缺点
技术难度较大,需要大量的训练 数据和模型优化。
图像检索
原理
图像检索通过提取图像中的特征信息,将用户输入的图像与数据 库中的图像进行相似度匹配,从而找到相似的图像。
优点
能够快速找到相似的图像,适用于图片搜索和版权保护等领域。
缺点
对于复杂的图像和动态场景,特征提取难度较大,需要更高级的技 术支持。
边缘计算
在物联网设备端进行数据处理和分析,减轻中心服务器的负担。
信息共享
实现物联网设备之间的信息共享和交流,促进设备间的协同工作。
THANKS
感谢观看
访问控制
实施严格的访问控制策略,对不同用户设定不同的权限级别,防止 未经授权的访问。
隐私保护
采用匿名化、去标识化等技术手段,保护用户隐私信息不被泄露。
大数据处理与分析
数据清洗
对数据进行预处理,去除无效、错误或不完 整的数据。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第1章信息检索概论1.信息的定义:从认识论出发,我国大多数学者认为:信息具有物质属性,是物质的一种存在形式,它以物质的属性或运动状态为内容,并且总是借助于一定的物质载体传输或存储。
2.信息的特征:(1)传递性(2)时效性(3)共享性(4)客观性其他的特性还有开发性、存储性、价值的不定性、变换性、可伪性等。
3. 信息检索(Information Retrieval)定义:广义概念——是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,故全称:“信息存储与检索(Information Storage and Retrieval ) 。
狭义概念——仅指上述过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻(Information Search)。
4.信息检索的基本步骤课题分析,明确检索范围选择检索系统和检索工具确定检索点和检索途径构造检索式选定检索方法索取原始文献5.计算机检索的发展历程计算机检索是在计算机技术和通信技术发展的基础上建立起来的。
它产生于20世纪50年代,发展于80年代中期,90年代后随着国际互联网技术的发展而进入了一个崭新的时期。
发展历程大致可以概括为:手工信息检索阶段(1954之前)脱机信息检索阶段(1954/1964)联机信息检索阶段(1965/1971)光盘信息检索阶段(1972/1994)网络信息检索阶段(1995年至今)6.知识的定义人们通过实践对客观事物及其运动过程和规律的认识。
在这里,知识作广义的理解,包括消息、情况、事实、数据。
知识可分为理性知识和感性知识。
理性知识,是对客观事物的本质和规律性的认识,是经过思维、逻辑加工的知识,构成知识体系;感性知识,是对客观事物的描述和对现象、事实的感知,是未经逻辑加工的知识。
知识的分类知识按不同标准可作如下分类:依照反映对象的深刻性和系统性程度,知识分为生活常识和科学知识;按知识的成熟程度,分为经验知识、理论知识。
按领域:哲学知识、社会科学知识和自然科学知识;按用途:科学知识、技术知识、文化知识;按水平:低级知识、中级知识和高级知识;按性质,普通知识、专业知识;按载体:隐性知识、显性知识。
7.文献的定义和分类文献是记录有知识和信息的一切载体,是固化在载体(纸张、光盘)上的知识。
文献是物化的精神产品,或者说,文献是知识信息的物化形态。
其中,信息内容是文献的知识内核,载体材料是文献的存在形式和外壳,而符号系统和记录方式则是二者联系的桥梁和纽带。
这4个要素相互联系就构成了文献的四维框架结构。
文献的分类根据其内容性质和加工程度的不同,文献可分为以下四个级别:(1)零次文献:未经出版发行的文献,包括手稿、个人通信、原始记录等。
(2)一次文献:首次出版的各种文献,也称原始文献。
如期刊论文、科技报告、会议论文、专利说明书等。
一次文献是以科研生产活动的第一手成果为依据而创作的文献,内容丰富,参考价值大,是我们利用的主要对象。
(3)二次文献:报道和查找一次文献的检索书刊,如各种目录、题录和文摘等。
二次文献是图书情报工作者在大量收集原始文献的基础上,经过分析、归纳、重组后出版的。
二次文献是一次文献的集约化、有序化的再次出版,是贮藏、利用一次文献的主要的、科学的途径。
(4)三次文献:利用二次文献提供的线索,选用大量一次文献的内容,经综合、分析和评述再度出版的文献,如各种述评、进展报告、动态综述、手册、年鉴和百科全书等。
我们使用的各种教科书也属三次文献。
文献按存储载体可分为:(1)印刷型:通过铅印、油印和胶印等手段,将知识固化在纸张上的一类文献。
例如,图书、期刊以及各种印刷资料。
它的主要优点是便于阅读和流传,缺点是体积大,信息密度低。
(2)缩微型:以印刷型文献为母本,采用光学摄影技术,把文献的影像固化在感光材料上的一类文献。
常见的缩微型文献有缩微平片和缩微胶卷两种。
这种文献的优点是体积小,信息密度高,缺点是阅读必须借助阅读机或利用缩微复印机。
(3)声像型:一种非文字形式的文献。
常见的有各种视听资料,如唱片、录音带、电影胶片、激光声视盘(CD-ROM)、幻灯片等。
这类文献记录声音和图像,通过唱机、录音机、录像机、放影机和投影机等予以重现,可以使人闻其声、观其形。
(4)机读型:由于计算机广泛应用而产生的一种新文献。
常见是各种已录有内容的磁带、磁盘和光盘。
这种文献的存贮、阅读和查找利用都须通过计算机才能进行,所以既有信息量大、查找迅速的优点,又有设备昂贵、使用费用高的缺点。
按出版方式,文献可分为:图书Book期刊Periodical报纸Newspaper专利文献Patent Literature会议文献Conference Literature科技报告Scientific & Technical Report学位论文Dissertation for Academic Degree政府出版物Government Publication产品样品资料Product Sample BookArchivesRecords、Music Score、Map等都是文献家族中的重要成员。
在科技查新工作中利用较多的是美国国家技术信息服务局NTIS(The National Technical Information Service of the U.S Deportment of Commerce)出版的《美国政府研究报告通报与索引》,有数据库和检索刊物以及缩微平片等多种形式可利用。
检索国内学位论文可以利用《中国学位论文数据库》,检索国外学位论文可利用Dialog国际联机系统或国际大学缩微胶卷公司(University Microfilms International)编辑出版的《国际学位论文文摘》、《美国博士学位论文》以及《学位论文综合索引》等检索工具。
8.信息、文献、知识三者的关系:三者之间的联系:(1)信息概念不仅包括人与人之间的消息的交换,而且还包括人机之间、机器与机器之间的消息交换,以及动、植物界信号的交换。
(2)知识是人类通过加工吸收信息,对自然界、人类社会以及思维方式与运动规律的认识与掌握,是人的大脑通过思维重新组合的系统化信息的集合。
(3) 文献是记录有知识和信息的一切载体三者之间转换:(1)物质运动发出信息;(2)信息经人脑加工变成知识;(3)知识被记录形成文献、被传递成为情报;9.检索工具和检索语言1. 检索工具概念及作用检索工具泛指查找信息所使用的一切工具和设备,包括检索工具书、穿孔卡片、电子计算机等。
是附有检索标识的某一范围文献条目的集合,是二次文献。
检索工具的作用:1)报道作用2)存储作用3)检索作用。
2 .检索工具基本类型按照信息加工的手段或设备划分:(1)手工检索工具;(2)机械检索工具;(3)计算机检索工具。
按照信息载体形态划分:(1)书本式检索工具,包括期刊式、单卷式和附录式;(2)卡片式检索工具;(3)缩微式检索工具;(4)磁性材料式检索工具。
按收录范围划分:(1)综合性检索工具;(2)专科性检索工具;(3)专题性检索工具;(4)全面性检索工具;(5)单一性检索工具。
按时间范围划分:(1)预告性检索工具;(2)现期通报性检索工具;(3)回溯性检索工具。
按编制方法划分:目录、文摘和索引等。
3. 检索语言定义检索语言是保证和检索一致的一种共同性的人工语言,它把文献的存储与检索联系起来,使文献的标引者和检索者取得共同理解,从而实现检索。
检索语言是应文献信息的加工、存贮和检索的共同需要而编制的专门语言,它是表达概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。
检索语言的类型(1)分类语言分类语言是指以数字、字母或字母与数字结合作为基本字符,采用字符直接连接并以圆点(或其他符号)作为分隔符的书写法,以基本类目作为基本词汇,以类目的从属关系来表达复杂概念的一类检索语言。
目前,我国社会科学文献的分类与检索,主要根据三种分类语言,即《中国图书馆图书分类法》(简称《中图法》)、《中国人民大学图书馆图书分类法》(简称《人大法》)和《科学院图书馆图书分类法》(简称《科图法》)(2)主题语言主题语言是指以自然语言的字符为字符,以名词术语为基本词汇,用一组名词术语作为检索标识的一类检索语言。
以主题语言来描述和表达信息内容的信息处理方法称为主题法。
主题语言又可分为:标题词、元词、叙词、关键词。
标题词语言。
是从文献的题目和内容中抽出来,经过规范化处理的主题语言。
从标题词作为文献信息内容的标引标识和检索标识。
标题词一般分为主标题和副标题,词表中按级一一列举各级标题,把主标题和副标题加以组配,作为标引和检索使用中的依据;叙词语言。
是以表达文献主题内容的概念单元为基础,经过规范化处理,可以进行逻辑组配的一种主语语言。
以规范化的标引词形成词表,各词独立,标引时根据需要进行组配,可表达文献内容方面的复杂概念,属后组配式,适用于机检和手检;关键词语言。
直接从文献信息的标题、摘要或内容本身抽取出来的用于揭示信息主题内容的自由词。
是一种无词表的自然语言。
关键词选自文献的题目和内容,属于非规范的后组配式;单元词语言。
以文献中的单元词表达文献信息的内容性质,一般无词表。
单元词是文献内容中最基本的不能再加复分的知识单元,单元词之间可以进行组配,属后组配式;引文语言。
利用文献的引文关系而建立的一种自然语言,无词表,标引词为文献中的主要著录项目,属后组配式。
(3)代码语言代码语言是指对事物的某方面特征,用某种代码系统来表示和排列事物概念,从而提供检索的检索语言。
例如,根据化合物的分子式这种代码语言,可以构成分子式索引系统,允许用户从分子式出发,检索相应的化合物及其相关的文献信息。
第二章信息获取技术1.条形码技术把计算机所需的数据用一种条形码来表示,然后将条形码数据转换成计算机可以自动阅读的数据。
条码是由一组粗细不同、黑白或彩色相间的条、空符号组成的编码符号,用以表示一定的字符、数字及符号信息.条码技术与其它输入技术(如键盘输入、OCR输入、磁卡输入)相比,具有识别速度快、误码率低、设备便宜、应用成本低廉和技术成熟等优点,目前已被广泛应用于商业、工业、图书、医疗等领域。
条形码编码规则唯一性:同种规格同种产品对应同一个产品代码,同种产品不同规格应对应不同的产品代码。
根据产品的不同性质,如:重量、包装、规格、气味、颜色、形状等等,赋予不同的商品代码。
永久性:产品代码一经分配,就不再更改,并且是终身的。
当此种产品不再生产时,其对应的产品代码只能搁置起来,不得重复起用再分配给其它的商品。
无含义:为了保证代码有足够的容量以适应产品频繁的更新换代的需要,最好采用无含义的顺序码。