在windows下sphinx和coreseek中文检索引擎配置

在windows下sphinx和coreseek中文检索引擎配置
在windows下sphinx和coreseek中文检索引擎配置

在windows下Coreseek的配置安装与测试

一、安装:

1. 安装Python

2.6 Windows (x86)(必须,32位系统和64位系统均安装该版本):从ActiveState官方网站下载ActivePython 2.6 Windows (x86),然后安装;

您也可从华军软件园下载ActivePython 2.6 Windows (x86),然后安装;

2. 安装 Microsoft Visual C++ 2005 Redistributable Package (x86)(必须,32位系统和64位系统均安装该版本):

从微软官方网站下载Microsoft Visual C++ 2005 Redistributable Package (x86),然后安装;

3. 安装 Coreseek-3.2.13(必须):【2010年11月14日更新,支持命令行中文搜索测试】

从Coreseek官方网站下载

https://www.360docs.net/doc/9b13637443.html,/uploads/csft/3.2/coreseek-3.2.13-win32.zip

解压coreseek-3.2.13-win32.zip到coreseek-3.2.13-win32目录,重命名为sphinx,任意存放。

二、coreseek中文全文检索测试

直接运行coreseek-3.2.13-win32目录下的test.cmd文件,如果没出任何问题,则一切测试正常,相关手工命令测试请访问:

https://www.360docs.net/doc/9b13637443.html,/products-install/install_on_windows/

三、部分命令的说明使用

这一切命令的输入都在“cmd命令提示符”窗口里操作,假如:把sphinx目录放在D 盘下,以下的所有例子将以这路径操作,不再说明。

1)、创建全部索引:

(注:这里的索引不是数据库里的索引,是不同的概念,这只对于coreseek而言,

别混淆)

bin\indexer –c etc\csft_mysql.conf --all

备注:其中etc\csft_mysql.conf就是刚才的配置文件相对路径;如果修改了数据库中的数据,则要重建索引,类似于刷新,因为创建索引后会自动把数据库中的数据存储到内存中,所以必须重建索引。

2)、创建个别索引:

bin\indexer –c etc\csft_mysql.conf 索引名称1 索引名称2 …

3)、启动搜索服务:

bin\searchd –c etc\csft_mysql.conf --console

备注:启动服务后,当前的cmd窗口不能使用,使用搜索服务时不能关掉窗口,

如想在cmd窗口中进行操作,可另打开一个cmd窗口。

4)、停止搜索服务:

直接Ctrl+C

5)、搜索关键字:

bin\search –c etc\csft_mysql.conf –a 关键字1 关键字2 …

四、连接mysql数据库及搜索内容:

在etc\下有两个配置文件csft.conf 和csft_mysql.conf ,其中第一个是测试安装成功与否,跟数据库无关;第二个是与数据库连接,相关参数大家可以用编辑器打开参考(建议不要用记事本);往后要配置自己的文件,可以参考csft_mysql.conf文件内容的格式,往下我们以例子讲解。

1、创建数据库test ,编码为utf-8,数据库SQL脚本如下:

(如果不懂得这一步的,可以去参数有关mysql数据库资料)

CREATE TABLE test.documents

(

id INTEGER PRIMARY KEY NOT NULL AUTO_INCREMENT,

group_id INTEGER NOT NULL,

group_id2 INTEGER NOT NULL,

date_added DATETIME NOT NULL,

title V ARCHAR(255) NOT NULL,

content TEXT NOT NULL

);

REPLACE INTO test.documents ( id, group_id, group_id2, date_added, title, content ) V ALUES

( 1, 1, 5, NOW(), '测试文档第一条', 'this is my test document number one. also checking search within phrases.' ),

( 2, 1, 6, NOW(), '测试文档第二条', 'this is my test document number two' ),

( 3, 2, 7, NOW(), '其它文档', 'this is another group' ),

( 4, 2, 8, NOW(), '第四条文档', 'this is to test groups' );

2、配置数据库文件,这里使用官方准备好的配置文件csft_mysql.conf ,里面已配置好

与数据库test连接,及对数据表的查询等。

详细说明请访问官网:https://www.360docs.net/doc/9b13637443.html,/products-install/mysql/

3、创建索引,这里创建csft_mysql.conf配置中的全部索引

在cmd中输入bin\indexer –c etc\csft_mysql.conf --all

成功创建索引后的信息

4、启动coreseek搜索服务

在cmd中输入bin\searchd –c etc\csft_mysql.conf --console

成功启动服务后的信息

5、实现搜索功能

在documents表中,搜索字段content中的内容含有“document”字符串的记录

在另一个cmd中输入bin\search –c etc\csft_mysql.conf –a document

搜索后显示的信息

这里把搜索到的记录信息显示出来,其中title=?????? ,这是乱码问题,具体解决方法可以参考官方资料,这里不详细说明。

五、PHP与coreseek检索引擎实现搜索

如果要将搜索结果应用到自己的PHP程序之中,请使用api目录下对应的api接口测试。

1、将api目录下的sphinxapi.php 文件拷贝到PHP网站的目录下,这里我把它放在根目录下。

2、在根目录下创建index.php文件,代码如下:

//注意文件的编码格式需要保存为为UTF-8格式

require ( "sphinxapi.php" );

$cl = new SphinxClient ();

$cl->SetServer ( '127.0.0.1', 9312);

//以下设置用于返回数组形式的结果

$cl->SetArrayResult ( true );

/*

//ID的过滤

//$cl->SetIDRange(3,4);

//sql_attr_uint等类型的属性字段,需要使用setFilter过滤,类似SQL的WHERE group_id=2

//$cl->setFilter('group_id',array(2));

//sql_attr_uint等类型的属性字段,也可以设置过滤范围,类似SQL的WHERE group_id2>=6 AND group_id2<=8

//$cl->SetFilterRange('group_id2',6,8);

*/

//取从头开始的前20条数据,0,20类似SQl语句的LIMIT 0,20

//$cl->SetLimits(0,20);

//在做索引时,没有进行sql_attr_类型设置的字段,可以作为“document”,进行全文搜索

$res = $cl->Query ( ' document ', "*" ); //"*"表示在所有索引里面同时搜索,"索引名称"则表示搜索指定的

//如果需要搜索指定全文字段的内容,可以使用扩展匹配模式:

//$cl->SetMatchMode(SPH_MATCH_EXTENDED);

//$res=cl->Query( '@title 测试' , "*")

echo '

';

print_r($res['matches']);

print_r($res);

echo '

';

?>

3、创建全部索引,启动搜索服务,相关操作可参考以上“四、连接mysql数据库及搜索内容”。

4、运行index.php文件,查看搜索结果:

从结果中看,总共搜索出两条记录,全部存储在一个数组中。

Array

(

[0] => Array

(

[id] => 1

[weight] => 1

[attrs] => Array

(

[group_id] => 1

[date_added] => 1290775649

)

)

[1] => Array

(

[id] => 2

[weight] => 1

[attrs] => Array

(

[group_id] => 1

[date_added] => 1290775649

)

)

)

Array

(

[error] => 【本次查询的错误信息】[warning] =>

[status] => 0

[fields] => Array

(

[0] => title

[1] => content

)

[attrs] => Array

(

[group_id] => 1

[date_added] => 2

)

[matches] => Array 【匹配到的文档信息】(

[0] => Array

(

[id] => 1 【文档的ID】

[weight] => 1

[attrs] => Array

(

[group_id] => 1

[date_added] => 1290775649

)

)

[1] => Array

(

[id] => 2

[weight] => 1

[attrs] => Array

(

[group_id] => 1

[date_added] => 1290775649

)

)

)

[total] => 2 【本次查询返回的结果数目,例如翻页等使用】[total_found] => 2 【整个系统包含的结果数目】

[time] => 0.001 【查询使用的时间】

[words] => Array 【分词结果】

(

[document] => Array

(

[docs] => 2 【该词汇匹配到的文档数目】

[hits] => 2 【该词汇出现的次数】

)

)

)

医学文献检索复习重点

绪论 《医学文献检索学》教学的目的:在于增强大学生的信息素养,培育出能适应新世纪知识经济需要的人才。《医学文献检索学》教学的意义: 一、培养信息素养,适应知识经济的信息需求 二、加强自我发展能力,适应知识更新的速度 三、提高科研能力,适应课题查新的需求 四、增强资源共享能力,加快医药事业的发展 五、提供文献依据,加强科学决策 循证医学:慎重、准确、明智的应用当前多能获得的最好的研究证据,同时结合临床医生的个人专业技能和多年的临床经验,考虑病人的价值和愿望,将三者完美的结合,制定出病人的治疗措施。 循证医学的意义: 一、高素质的临床医生与当前最佳的临床研究证据结合,尊重患者的选择,对个体诊治做出最佳决策。 二、增强临床诊疗实践的科学性、安全性、有效性、适用性、经济性,防范、减少医疗事故和医疗纠纷。 三、对当前尚无安全有效证据的疑难病症,提供信息供临床医生进一步探索,促进临床实践发展。 四、有利于合理高效利用卫生资源,提高医疗服务的成本-效益,减少无效或有害诊疗所造成的浪费或危害,使有限的经费用于经过循证医学验证的治疗方法。 五、促使临床科学研究方法的规范化,加强临床各专业领域的合作和资源共享,提高研究质量,避免重复研究,为研究者和研究机构提供导向性的参考。 第三节《医学文献检索学》的相关学科 (一)情报学:以情报及其交流为研究对象,研究情报的构成、特征和交流过程中的规律。 (二)科技文献检索:研究文献源、检索语言、检索工具的编制和使用,各类科技文献的查检。 医学文献检索是科技文献检索的分支,在其检索原理和方法上是相同的。 (三)图书馆学:研究的是图书馆事业的发展、组织管理及图书馆工作的规律。图使馆是文献收藏最集中、管理最完善的机构。 (四)计算机的应用:计算机检索和网络检索是《医学文献检索学》教学的重要组成部分。 第一节信息、知识、情报、文献 一、信息:指物质存在或运动方式与状态的表现形式或反映,是现实世界物质的反映,他提供了客观世界事物的消息、知识,是事物的一种普遍属性。 二、知识:是人类在认识和改造客观世界实践中获得的对事物本质的认识和经验的综合,是人们通过实践对客观事物及其运动过程和规律的认识。 知识:是为人类所认识并经过加工提炼的部分信息。 三、情报:指人们以各种方式传递与交流的具有一定目的与时效的信息,是人们为一定目的搜集的有使用价值的知识或信息。 情报的四个必备属性: (一)知识性:知识性是情报最主要的属性,情报源于知识,而知识来源于信息,经过筛选、加工,为用户所需的新知识或新信息才称之为情报。 (二)传递性:传递是情报的基本形式。知识或信息转化为情报须经过交流传递,并被用户接受和利用。(三)针对性:因为情报的传递是针对特定对象的,即有人需要某种信息。 (四)效用性:情报的效用性表现为启迪思想、开阔眼界、更新知识、提高认识,帮助人们去认识和改造世界。第一节信息、知识、情报、文献 一、信息:是经过加工的数据,他对接收者的行为和决策有一定的影响,对决策者的能增加知识具有现实和潜在的价值。 二、知识:是为人类所认识并经过加工提炼的部分信息。 三、情报:是被激活了的知识,是为特定效用而经传递的部分知识。 四、文献:文献:是指以文字、图像、公式、声频、视频、代码等手段将信息、知识记录或描述在一定的物质载体上,并能起到存储和传播信息情报和知识作用的一切载体。文献:是记录有知识的一切载体。 文献必须具备三要素: (一)知识性文献的实质内容是知识,没有记录下任何知识内容的纸张、胶卷磁带都不能称之为文献。(二)物质载体性:文献必须依附在一定的载体上才得以长期保存和传播。

检索重点

检索成功的前提是:信息存储标示和检索标示相匹配 信息存储中的核心工作是标引, 标引分为人工标引和自动标引 检索匹配,匹配分为完全匹配,部分匹配,容错匹配,扩展匹配 检索过程中当检索结果偏少时.简述进行扩检的方法一、修改检索词,用同义近义词代替; 二、减少检索关键词;三、关键词之间用or连接;四、改变检索入口或检索项;五、减少限制条件;六、增大搜索范围,如时间范围等 缩小检索范围,调整策略的方法有:①增加用and 连接的检索词,或用二次检索。②增加not连接词的检索词③用特定的副主题词进行限定④用字段限定检索⑤进入更专指的分类类目中输检索词(6)进行文献类型,语种,重要期刊,临床核心期刊,年份等的检索限定(7)模糊检索改为精确检索 获取全文的方法:1.web of science 有不少记录提供全文链接,如果学校图书馆订购了该文章电子版,则可以看到全文。2.如果没有全文链接,可以链接到图书馆的馆藏目录进行查询也可以用SFX直接点击链接。3.点击WOS全文链接按钮。https://www.360docs.net/doc/9b13637443.html,(google学术搜索)。5.图书馆印刷版馆藏。6.馆际互借。7.图书馆文献传递。8.免费全文网站。9.提供免费全文的杂志。10.作者的E-mail联系方式,作者主页。 检索原理:计算机检索是建立在信息收集与信息储存的基础之上,信息的储存标识与检索标识相匹配是检索成功的前提。1.信息收集;2.信息存储与标引;3.信息检索;4.检索匹配。导致检索不匹配的原因有:1.需要的文献信息不在所查数据库收录范围之内;2.检索用词正确但标引有误;3.检索提问错误,包括检索途径用错、检索词用错、运算符用错。检索提问错误中,最常见的是没有使用数据库中规范化检索语言。 检索途径:1.自由词检索;2.主题词检索;3.分类检索;4.著者检索;5.引文检索;6.机构检索;7.刊名检索;8.默认检索;9.其他检索途径。 检索步骤:1.分析课题需求;2.选择数据库;3.选择检索途径;4.拟定检索词;5.构筑检索式; 6.浏览检索结果; 7.调整检索策略,重新检索操作; 8.输出检索结果; 9.创建文献跟踪服务。计算机检索的主要技术:1.布尔逻辑检索;2.邻近检索;3.截词检索;4.字段检索;5.限制检索;6.精确检索与模糊检索;7.扩展检索;8.智能检索;9.跨库检索。 自由词检索与主题词检索有什么区别?自由词检索:自由词又称文本词,是作者写文章时使用的自然词语,包括标题词、关键词、文摘词、全文词。自由词不受主题词约束,同一概念用词取决于著者的偏爱;主题词检索:主题词检索是一种规范化检索语言。主题词的规范作用在于对同义词、近义词、拼写变异词、全称与缩写等进行归并,以保证一词输入,多词命中,提高文献的查全。 引文检索有哪些作用?引文,就是通常所说的参考文献。引文检索,是指对文章的参考文献进行的检索,是从学术论文中引证关系入手进行检索的一种方法。文献的相互引证直接反映学术研究之间的交流与联系,通过引文检索可查找相关研究课题早期、当时和最近的学术文献,可以了解文献之间的内在联系。进而可以有效地揭示过去、现在、将来的科学研究之间的内在联系,揭示科学研究中所涉及的各个学科领域的交叉联系,协助研究人员迅速地掌握科学研究的历史、发展和动态;可以从文献引证的角度为文献计量学和科学计量学提供的重要的研究工具,分析研究文献的学术影响,把握研究趋势,从而不断推动知识创新;可以较真实客观地反映作者的论文在科研活动中的价值和地位。 请简述MEDLINE数据库主要收录的专业范围:主要收录生物医学和健康科学以及生命科学相关领域的文献,包括行为科学、健康专业所需要的化学、生物工艺学、基础研究和临床护理、公共卫生、卫生政策发展或相关教育活动内容。2000年起增加收录对生物医学实习者、研究员和教育家至关重要的专业内容,包括生物、环境科学、海洋生物、植物和动物学、

信息检索考试重点

医学信息检索 1、信息素养(Information Literacy):是指一个人“能认识到何时需要信息,和有效地搜索、评估和使用所需要的信息的能力。” 2、信息素养的内涵:包括信息意识、信息知识、信息能力、信息伦理。四者互为基础、相辅相成、相互促进。 3、ACRL标准(USA):①有信息素养的学生有能力决定所需信息的性质和范围;②有信息素养的学生可以有效地获得需要的信息;③有信息素养的学生评估信息和信息的出处,然后把挑选的信息融合到他(她)们的知识库和价值体系中;④不管个人还是作为一个团体的成员,有信息素养的学生能够有效地利用信息来实现特定的目的;⑤有信息素养的学生熟悉许多与信息使用有关的经济、法律和社会问题,并能合理合法地获取信息。 4、全球医学教育最低基本要求(GMER):包括7个宏观的教学结果和能力领域:①职业价值、态度、行为和伦理;②医学科学基础知识;③沟通能力;④临床技能;⑤群体健康和卫生系统;⑥信息管理;⑦批判性思维和研究。 5、信息:是物质的一种方式、形态或运动状态,是事物的一种普遍属性、一般指数据、消息中包含的意义,可以使消息中所描述事件的不定性减少。分类:自然信息、生物信息、机器信息、社会信息。 6、知识:是人们在认识和改造客观世界的实践中所获得的的认识和经验的总和,是人类通过对信息的感知、获取、选择、处理和加工等一系列思维过程,形成的对客观事物的本质和规律的认识。分类:知道是什么的知识、知道为什么的知识、知道怎么做的知识、知道是谁的知识。 7、情报:是“为了解决某一个特定问题去搜寻所需要的知识,它是激活了的知识。”三个基本属性:知识性、传递性、效应性(经智力加工的知识和信息,通过传递后,使问题得到了解决,产生了效用,即为情报的效用性)。 8、文献:是记录有知识的一切载体。四个基本要素:①文献以知识为内涵;②知识以符号来表现;③符号以一定手段来记录;④以一定的物质载体为文献的外在表现。文献根据对知识的加工深度划分:一次文献、二次文献、三次文献、零次文献。 9、信息、知识、情报与文献的相互关系:信息是知识的源泉,知识是系统化的信息,情报是活化的知识和信息,情报应用于实践,解决实践中存在的问题,创再出物质财富或精神财富,产生新的信息,这样就形成了一个无限循环的过程。 10、医学文献发展的特点:①数量庞大、增长速度快;②内容交叉渗透、分散重复;③文种繁多;④更新周期缩短、失效期加快;⑤交流传播及变化速度加快;⑥日益向多元化发展。 11、信息检索:是通过一定的方法和手段,是信息存储和检索这两个过程所采用的特征标识达到一致,一边有效地获取和利用文献信息的过程。广义的信息检索包括信息的存储和检索两个过程;狭义的信息检索则主要是指信息的检索过程。 12、信息检索主要类型:《中图法》由五大部类、22个大类组成。(在“R 医药、卫生”这一级类目下又分出17个二级类目)。 13、医学主题词表(MeSH):是美国国立医学图书馆(NLM)由1960年起编制的一部规范化的可扩充的动态性词表。MeSH表具有以下特点:对医学文献中的自然语言进行规范,使概念和主题词单一对应;保证文献的标引和检索过程在用词上的一致;可以对主题词进行扩检和缩检;具有动态性。 14、主题词:是规范化的、用以描述文献主题(内容特征)的有检索意义的词或词组。 15、入口词:也称款目词,不属于MeSH词表中规范化的主题词,但与主题词有同义关系,准同义关系,祖代关系,等同关系。

检索重点

1:零次信息:如未经正式发表或不宜公开和大范围内交流的比较原始的素材、底稿、手稿、书信、工作文稿、工程图纸、考察记录、实验记录、调查稿、原始统计数字,以及各种口头交流的知识、经验或意见论点等。 一次信息:如专著、期刊和报纸、科学考察报告、研究报告、会议论文、学位论文、专利说明书、技术标准、政府出版物、产品样本等。 二次信息:如书目、题录、索引和文摘等。 三次信息:如专题述评、动态综述、系统评价、进展报告、学科年度总结、年鉴、指南和百科全书等。2:图书、期刊论文、科技报告、专利文献、会议文献、政府出版物、学位论文、标准文献、产品样本、科技档案。 3:人工语言优于自然语言检索: 因为自然愿不能简单明了而又专指地表达文献及检索课题的主题概念;不能够语词与概念一一对应,不能够排除多词一义、一词多义和词义含糊现象;不能显示出概念之间的关系;不能将概念进行系统排列;不能够在检索时便于将标引用语和检索用语进行相符性比较。 而人工语言涵盖了一系列概括文献情报内容的概念及其相互关系的概念,弥补了自然语言的不足,专门用于各种手工的和计算机化的情报检索系统,表达了文献主题概念和检索课题概念 4:主题词又称叙词,在标引和检索中用以表达文献主题的规范化的词或词组。主题词是规范化的检索语言,它对文献中出现的同义词、近义词、多义词以及同一概念的不同书写形式等进行严格的控制和规范,使每个主题词都含义明确,以便准确检索,防止误检、漏检。 常用的医学主题词表:《美国医学主题词表》(mesh) 《荷兰医学文摘的主题词表》(EMTree) 《中国中医药学主题词表》 5:题录数据库是用各种索引方法制作的二次文献数据库,又称题录数据库或篇名数据库,以简略的形式向用户提供文献的信息。 全文数据库不仅记录数目信息,如题名、著者、关键词、文摘等,同时还存储了一定数量的文献全文或其中主要部分,它是比二次文献数据库有更多、更好的检索方法,其传递的信息是完整的,是一种源数据库。 6:布尔逻辑检索,位置逻辑检索,截词检索,字段检索,范围运算,精确检索,加权检索。 7:逻辑“与”:逻辑“与”一般用AND或“*”号表示 逻辑“或”:逻辑“或”一般用OR或“+”号表示。 逻辑“非”:逻辑“非”一般用NOT或“-”号表示。 优先级:非>与>或 8:如在检索框内输入:Child*,它可代表child, children, childly, childhood 9:模糊检索:用一个关键字进行查询,查询结果均包含这个关键字。例如用“张明”作为关键字,那么包含有“张明”的记录均被查询出来,例如:张明明,张明生,张明远等。 精确检索又称短语检索,是将一个短语(词组)当做一个独立的运算单元,往往用双引号括起来,进行严格匹配,以提高查准率。查询结果是仅包含该短语(词组)的条目。 各数据库基本特点: Sinomed: 数据库类型:题录型数据库(二次文献数据库) 收录学科范围:生物医学学科 收录文献类型:期刊、汇编、会议论文、博硕士论文 检索方式(以CBM库为例):基本检索、主题检索(特色)、分类检索、期刊检索、作者检索 访问方式:收费型数据库,分为主站点(中心站点)、镜像站点,校内用户直接访问 分类检索是基于:《中国图书馆分类法.医学专业分类表》

文献检索期末重点内容

通过感觉器官或相应设备同外界交换内容的总称 评价和使用信息的能力,是信息社会劳动者必须掌握的终身技能。具有信息素养的日呢,也就具备了终身学习的能力。 是调节信息生产者,信息加工者,信息传播者及信息使用者之间相互关系的行为规范的总和。 ~ 审校过程并由正式的出版发行渠道传播的信息 利用专门的工具,从大量的情报信息资料中,查找出特定的,所需要的情报信息资料的过程。 使信息存贮和检索这两个过程所采用的特征标识达到一致,以便有效的获取和利用文献信息的过程。 它不直接解答用户的提问,而是提供与提问有关的文献线索或原始文献。 利用各种统计数字、图表、化学结构式、计算式等工具来实现的。

质是一系列表达信息内容的概念及其相互关系的概念标识系统。 属性集中文献信息,提供用户从课题的学科分类角度检索文献信息的方法 分类检索语言:学科、专业属性(目的)、分类号(语言或标识)、类目(学科名)上下位类(大类和小类)、分类表(标准和依据)、分类检索(途径)2主题检索语言:主题概念(目的)、主题词/副主题词(语言或标识)、主题检索(途径)3著者检索:有关作者(目的)、作者姓名,姓前名后(语音或标识)著者途径(途径) 从课题的主题概念检索文献信息的方法 切工具和设备的统称 检索引擎,是一种能够通过Internet接受用户的查询指令,并向用户提供符合其查询要求的信息资源网址的系统。 数据库是检索系统的信息源,也是用户检索的对象。结构:1、文档,文档一般分为顺排文档和倒排文档2、记录;字段组成类型1、文献型2、事实型3、数据型4、多媒体型 分类叙述附有参考书目按词典形式编成的大型

工具书有工具书之王美称 术语及短语,并解释其概念、意义和用法的工具书 用图形或表格的形式直观的反映客观事物和科学知识,并配以简要通俗的文字说明的特定类型的参考工具书。特点:直观形象,简明清晰。 人物传记和机构名录。主要用于查找有关人物或机构的背景资料 加以浓缩并按特定的方法排检专供查阅,参考的特定类型图书。基本功能是解答有关事实和数据方面的疑难问题。 进展动向,成就成果,统计资料内容等,按年度编辑出版的一种动态性工具书 具有法律效力。 途径,提供相关资料的工具书。 利用统计学及数学逻辑思维方法等,对文献的应用和被引用现象进行分析,用来评价论文的质量,某机构或著者的学术水品和预测某学科的发展趋势的一种定量方法。

信息检索重点知识

信息:信息是事物存在的方式,运动状态及其特征的反映,是事物发出的信号,消息 信息的特征:载体依附性无线共享性永不枯竭性开发增值性应用时效性存在普遍性 知识:知识是信息的升华和结果,系统化理论化的的信息就称为就称为知识 文献:用一定的方式记录在一定的载体上的知识都称之为文献 信息源:个人为满足信息的需要而获得信息来源称之为信息源 信息源类型:①个人信息源②组织机构信息源③实物型信息源④文献信息源⑤电子型信息源①及时、新颖、传递迅速、但带有主观随意性,久传易出错②内部信息源,共管理人员分析③直观性强,信息量大,有一定隐蔽性④当今数量最大,利用率最高的信息资源⑤内容广泛、使用简便 信息资源:即作为资源的信息。 信息资源的构成要素: 信息生产者,信息,信息技术。 文献信息源分为:图书期刊学位论文科技报告专利文献标准文献产品样本会议文献政府出版物 零次文献:未经出版发行或者未进入社会交流的最原始的文献 一次文献:以作者本人取得的成果为依据而创作的作文报告等公开发表或出版的各种文献 二次文献:按照特定的目的进行筛选,即所谓用一定的检索工具进行过加工的文献 三次文献:根据二次文献提供的线索,选用大量一次文献的内容,经过筛选分类综合和浓缩而再度出版的文献 信息素养DY:能认识到何时需要信息和有效的搜索评估和使用所需要信息的能力 医学信息素养内容:信息意识信息知识信息能力信息道德(DY以医学信息获取、评价和利用等处理能力为核心) 信息检索DY:信息检索包括信息储存和信息获取两个过程,信息的存储:根据信息的外表和内部特征,按照一定的组织编排,使之成为有序化信息集合的过程。信息的获取:根据特定的需要,运用组织好的检索系统和工具,将特定信息找出来的过程。 信息检索的类型:文献检索事实检索数据检索 信息检索原理:是通过对大量分散无序的文献信息进行收集,加工,组织,存储,建立各种各样的检索系统。并通过一定量的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效的获取和利用信息源。 数据库由文档记录和字段组成 信息检索语言分类:分类语言(体系分类语言和组配语言)和主题语言信息检索的主题语言:标题词、元词、叙词、关键词 信息检索的途径:分类途径主题途径关键词途径著者途径题名途径号码途径 信息检索技术:布尔逻辑检索截词检索位置检索限定字段检索 信息检索的策略(步骤):一分析检索课题,明白目的和要求二,检索系统和数据库的选择三选择检索途径确定检索标识四编制检索表达式调整检索策略五获取原始文献 信息检索的基本要求:全面准确快速 查准率:表示检出的文献中所需要相关文献所占的比例。 查全率:表示检出的相关的文献与全部文献库中实际存储的相关文献的比例 提高查全率的措施:1尽量采取主题词语关键词相结合进行检索 2主题词检索时要进行扩展检索和使用全部副主题词检索 3 分类检索时要进行扩展检索和全部复分检索 4删除某个不甚重要的概念组面,减少AND运算 5多用同义词进行“OR”运算检索6 采用截词检索 提高查准率的的措施:1采用规范化的主题词与副主题词组配进行检索,少用或不用自由词 2采用限定主要概念主题词字段的加权方式进行检索 3增加概念组面,用AND运算符进行连接 4用NOT算符排除无关概念 5限制检索字段如文献类型语种作者刊名等 6调整放宽位置算符等 信息检索的作用 信息检索是信息素养教育的主要内容 信息检索是创新型人才的基本技能 信息检索是科学研究的重要环节 信息检索是开发信息资源的重要途径 信息检索是科学决策的重要前提。 信息素养DY是指判断何时、何地需要信息,并有效地定位、获取、评价和利用信息的一系列能力的总和。 Site:https://www.360docs.net/doc/9b13637443.html, filetype:ppt

《信息检索》考试的重点内容

《信息检索》参考资料 Web of Science引文检索包含: SCIE: Science Citation Index Expandes SSCI: Social Science Citation Index A&HCI:: Arts &Humanities Citation Index CPCI-C:: Conference Proceedings Citation Index-Science 会议论文级引文索引 CPCI-SSH:Conference Proceedings Citation Index-Social Science & Humanities Journal Citation Reports(ICR)期刊引证报告数据库 对世界权威期刊进行收录。 ISI Journal Citation Reports (JCR)是期刊评价的重要工具之一,分自然科学版(JCR Science edition)和社会科学版( JCR Social Sciences Edition两个版本,目前,自然科学版收录了全球出版的5600余种期刊,社会科学版收录了1700余种期刊。我馆购买的是两个版本的使用权。 JCR 数据来源于ISI建立的科学引文数据库(Science Citation Index,SCI)、社会科学引文数据库(Social Sciences Citation Index,SSCI),期刊范围涉及200多个专业研究领域,通过文献计量学的方法,对引文数据库的来源期刊进行引用频次和发表论文数量的统计,从被引频次、影响因子、立即影响指数、当年发文量、被引半衰期等方面提供评价期刊的定量依据,同时对7000余种期刊进行了出版信息的详细描述,内容涉及出版商、出版地、出版国、出版频率、期刊标准刊号(ISSN)、期刊使用语言和期刊分类,客观、全面地对期刊进行了详细描述。 JCR网络版用图表的方法描述某一种期刊5年影响因子的变化状况,对期刊的变化进程有直观的认识。 JCR 数据每年度更新一次,目前最新数据为2004年的数据。如要了解Journal Citation Reports 版的深入介绍,请阅读教程。

信息检索原理与技术考试大纲重点整理

《信息检索原理与技术》 第1章信息检索概论 (1)一次文献信息:是指作者以自己的研究成果为基础创作或撰写的、未经过加工的原始文献,如期刊论文、研究报告、学位论文等。 (2)二次文献信息:是指对一次信息加工整理而成的文献,如目录、文摘、索引等各种书目信息,具有汇集性、工具性、综合性、系统性的特点。 (3)三次文献信息:是对一、二次信息综合、分析等深加工的产物,如评论、进展报告、百科全书、期刊书目等。(4)文献:记录有知识的一切载体,即知识信息必须通过文献载体进行存储和传递。 (5)构成文献的要素:构成文献内核的知识信息、负载知识信息的物质载体、记录知识信息的符号和技术。 (6)文献的特征:知识性(文献的本质,离开知识信息,文献信息便不复存在);传递性(帮助人们克服时间与空间上的障碍,在时空中传递人类已有的知识,使人类的知识得以流传和发展);动态性(其所蕴含的知识随着人类社会和科技的发展在不断地、有规律地运动着) (7)信息、知识和文献的联系:信息作为物质的一种普遍属性,是生物以及具有自动控制系统的机器通过感觉器官和相应的设备与外界进行交换的一切内容,它是有形的、独立于行动和决策、经过处理改变形态、物质产品、与环境无关、可以复制的;知识作为信息的一部分,是一种特定的人类信息,也是人类社会实践经验的总结,是人的主观世界对于客观世界的概括和如实反映,它是无形的、与行动和决策相关、经过处理能改变思维、精神产品、环境改变含义、经过学习才能转让、无法复制的;文献是知识的一部分,是进入人类社会交流系统的活动着的知识。(8)文献信息流有序化阶段的三个环节: ①替代。描述文献特征,对一次文献信息进行不同程度的提炼或压缩,形成目录、文摘、索引等二次文献信息。从文献信息流的运动角度看,“替代”是文献信息流的流量、流向得到测度并合理调节。 ②改组。从一次文献信息中提取数据、事实和有关结论,按照易于查阅的提醒重新组合,其改组的结果,产生了手册、名录、辞典、目录等类型的文献信息。其目的是使一次文献信息更容易被理解和使用。 ③综合。利用二次文献对一次文献所包含的知识加以综合并融入到现有知识体系中去,成为整个知识体系的有机组成部分,产生的主要成果是不断再版的百科全书、专著、教科书及综述、评论性文章。 文献信息流失一个以研究活动为起点。按顺时针的线性顺序移动,是一次、二次、三次文献信息的演变过程。对于“文献信息链”的研究,有利于从整体的角度了解文献信息的有序化、动态性特征,从而探索文献信息的产生、演变规律及其结构形态。 (9)信息检索:广义理解分为信息的存储与检索。信息的存储主要包括在某一专业领域范围内的信息选择的基础上对信息的内外特征进行描述、加工并使其有序化,形成信息集合。信息的检索是指借助一定的设备与工具,采用一系列方法与策略从信息集合中查询所需的信息。狭义的信息检索仅指该过程的后一部分。存储是检索的基础、检索是存储的反过程。信息检索的本质是用户的信息需求和一定的信息集合的匹配。 (10)信息检索系统:指为了满足用户的信息需求而建立的存储,经过加工了的信息集合,拥有一定的输入、匹配、输出的技术设备,提供一定的检索服务功能的一种相对独立的实体。 (11)信息检索入口:又称检索点或检索知识,是指用以标识信息的外部特征和内容特征的属性值的集合。检索知识包括主题词、分类号、著者、标题、机构、代码等。 (12)信息检索的一般原理:P7 (13)检索系统由物理构成(硬件、软件和数据库)和逻辑构成(文献与数据的选择与抽取子系统、词表子系统、标引子系统、查询子系统、用户与系统交互子系统、匹配子系统) (14)检索工具的构成:编辑说明与凡例、分类表与主题表、正文、辅助索引、资料来源目录与附录。 (15)检索系统的功能:报道功能、存储功能、检索功能。 (16)信息检索理论:标引理论、检索模型、检索结果的可视化。 (17)现代信息检索技术与方法:全文检索、多媒体检索、超文本及超媒体检索、联机检索、网络信息检索、智能检索、跨语言检索、跨平台检索。 第2章信息检索模型 (1)最初的信息检索模型是以数学知识为基础的原因:第一,数学是个有几千年历史的学科,被大家所熟知,并且通俗易懂。第二,人们的信息有很大的模糊性,甚至用文字不能表达,而文字具有很大程度的抽象性和概括性,这样就很容易表达出人们信息检索的需求,能够很方便快捷地组建信息检索模型。 (2)信息检索模型的类型:P18 (3)布尔检索模型:采用布尔代数和集合论的方法,用布尔表达式表示用户提问,通过对文献标识与提问式的逻

重点内容索引表

重点内容索引表 序号重点章节重点内容提要 所在章节 位置 页码 1 施工部署工程主要施工区域,施工流水段的划分, 施工总体顺序与部署,工程总体管理目标 。 第四章23页 2 工程重点难点分 析及相应的对策 措施 针对本工程特点,结合现场情况,对工程 重点、难点进行分析并提出应对措施。 第二章第 七点 15页 3 现场组织管理机 构 现场组织机构构成:项目经理、现场(或 执行)经理、项目总工(或称为技术负责 人)、商务经理、质量检查员、安装专业 项目副经理及主要岗位人员、职责、授权 范围;以上人员必须具有同类工程工作经 验。 公司总部与现场组织机构的关系以及对现 场组织机构的授权范围。 第十四章365页 4 施工现场组织平 面图 图中应合理布置大型垂直运输机械、各类 加工制作车间、现场临时办公用房、工具 房、库房、周转材料堆放场、临时厕所、 临时道路、临时水电管线、临时出入口布 置等要点。 第十三章352页 5 施工总体进度计 划及保障措施 包括一份以横道图表示的进度计划、一份 标明关键线路的网络进度计划、 保障进度计划需要的主要施工机械设备、 劳动力需求计划及保证措施、材料设备进 场计划及保证措施等。 第七章299页 6 质量保证措施严格依照 ISO9001-2008质量体系的质量保证措施和 创优措施,保证本招标工程达到约定的工 第六章282页

程质量等级、标准和奖项,编制详细的质保方案。方案中应有防治工程质量通病的具体措施和奖惩制度;针对招标方对房屋质量(特别涉及到使用方面,例如渗漏、裂缝、排水不畅通等)的特殊要求,具体措施和奖惩制度,确保房屋的使用功能。) 7 主要分项工程施 工方案 垂直运输机械的基础施工、安装和拆除、 定位和测量放线、土方开挖、土方回填、 防水工程、钢筋混凝土结构施工方案、屋 面施工方案以及样板引路和实测实量等施 工技术方案 第五章35页 8 成品保护方案配合招标人主动编制切实可行的成品保护 方案,同时也应有责任、义务审核各参建 单位的成保方案,在整个施工过程中需严 格按照成保方案的各项条款实施专人进行 现场管理,达到工程的各项成保要求。 第十五章377页 9 附表一拟投入本工程的主要施工设备表附表一395页 10 附表二拟配备本工程的试验和检测仪器设备表附表二397页 11 附表三劳动力计划表附表三398页 12 附表四计划开、竣工日期和施工进度网络图附表四399页 13 附表五施工总平面图附表五405页 14 附表六临时用地表附表六416页 15 附表七项目管理机构人员情况表、主要人员简历 表 附表七417页 16 附表八拟分包项目情况表附表八566页

信息检索重点总结及题型

信息检索考试内容: 1名词解释(5题,共15分) 2填空(40分) 3简答(难,拉分题,35分) 4着录格式(10分) 书本基础知识: 第一章: 1 信息:是事物属性的再现,是由事物发出的消息、指令、数据等所包含的内容,广泛地存在于自然界和人类社会中。 2 知识:人们对客观事物运动规律的认识,是经过人脑加工处理过的系统化了的信息。知识是人类经验和智慧的总结,是人们科学地认识世界、改造世界的力量。 3 情报:指传递着的有特定效用的知识。是人们为了解决某个具体问题所需的新的知识信息。基本属性:知识性、传递性和效用性。信息>知识>情报。 4文献:记录有知识的一切载体。文献的三要素:知识、载体、记录方式。 5科技文献:记录有科学技术信息或知识的一切载体。 科技文献的类型: 按照载体形式划分:①印刷型文献②微缩型③声像型④电子型 按照出版形式划分:图书/期刊/会议文献/科技报告/专利文献/学位论文/技术标准/政府出版物/产品样品和说明书/技术档案/报纸。 按照加工层次分:①一次文献:作者以本人的研究成果为基本素材而创作(或撰写)的文献。包括:期刊论文、专利说明书、会议论文、科技报告、学位论文。 ②二次文献:是指文献情报工作者对一次文献进行加工整理后所得到的产物,也是为了便于管理和利用一次文献,由文献情报工作人员编辑、出版和积累起来的工具性的文献。二次文献的重要性在于可以帮助人们查找一次文献。包括:目录、题录、文摘、索引、各种数目数据库。 ③三次文献:是指利用二次文献,选用一次文献内容,经综合,分析和评述后形成的指南性文献。如综述、述评、词典、手册、百科全书、年鉴、指南数据库、专着、教科书、论文丛集、文献指南、数目的目录。6图书的主要外部特征是:书名、着者、出版社名称、出版地点、出版时间、图书总页数、国际标准书号(ISBN)。国际标准书号具有唯一性。 ①ISBN(International Standard Book Number)由10位数字分成4段组成,各段依次是:地区或语种号-出版商代号-书名号-校验号如:7-302-02372-7,表示中国大陆代号为302的(清华大学)出版社,出版的一种图书,其书号为02372、该书的校验码为7 。 ②国际标准书号由13位数字组成。前三位数字代表图书,中间的9个数字分为三组,分别表示组号、出版社号和书序号,最后一个数字是校验码 7核心期刊:某学科(或某领域)的核心期刊,是指那些发表该学科(或该领域)论文较多、使用率(含被引率、摘转率和流通率)较高、学术影响较大的期刊。 ISSN:国际标准连续性出版物编号(International Standard Serial Number)。 ISSN由8位数字分两段组成,期刊代号+末位是校验号如,ISSN1001--8867为《中国图书馆学报》的国际标准编号。 CN:我国正式出版的期刊都有国内统一刊号(CN),它由地区号、报刊登记号和《中图法》分类号组成,如CN11-2257/G3。地区号依《中华人民共和国行政区划编码表GB2260-82》取前两位,如北京为11、天津12、上海31、辽宁21、吉林22等。

信息检索重点

1、信息资源类型 (1)以内容形式划分:图书、期刊、专利文献、标准文献、科技报告、会议文献等 (2)以加工程度划分: 1)一次信息资源:期刊论文、学术报告、专利文献、会议文献、研究报告、专著、译文等——一次文献2)二次信息资源:目录、题录、索引、文摘等——检索工具 3)三次信息资源:科技动态、专题综述、情报调研报告、决策参考、述评、年鉴、进展、手册、指南等—— 参考性文献 4)零次信息资源:素材、底稿、书信、实验记录、原始统计数字、工作文稿工程图纸等——未正式发表 和大范围交流 (3)从获取难易程度: 1)白色信息资源:公开发行,易获得 2)黑色信息资源:未公开发行,处于保密状态,极难获得 3)灰色信息资源:不容易获得 (4)从载体形式:纸质型、微缩型、视听型、电子型 2、信息检索类型:数据检索、事实检索、文献检索 3、检索语言类型:分类检索语言、主题检索语言

4、关键词与叙词的区别: (1)关键词为非规范性语言,叙词为规范性语言; (2)关键词作为主题词检索时不受词表控制,叙词作为主题词检索时严格受《主题词表》控制 5、信息检索方法:常规法(顺查、倒查、抽查)、引文法、 交替法、浏览法 6、信息检索途径:题名途径、责任者途径、号码途径、分 类途径、主题途径、其他途径 (1)外表特征:书名、刊名、责任者、序号等 (2)内容特征:分类、主题、分子式等 7、检索效果指标:查全率(被检出相关文献量/相关文献 总量)和查准率(被检出文献量/被检出文献总量)8、影响检索结果的因素 (1)客观:由于当今信息爆炸,文献量大增,学科之间交叉日趋频繁,各种学科知识之间相互渗透、相互包容,这是影响查全率和查准率的主要原因 (2)主观:主要包括两个方面:一是编制者在编制检索工具或数据库时收录文献不全面、不明确,在编制过程中人为造成各种错误;二是使用者在检索课题时对课题内容分析不确切和选定错误的检索入口 9、工具书的组成:前言、凡例、目录、正文、辅助索引及 附表

信息检索考试重点

信息检索考试内容 (一) 1、计算机信息检索系统构成要素是什么? 答:服务器、通信网络、检索终端、软件、数据资源。 2、服务器的功能是什么? 答:服务器是检索系统的核心部分,在检索中处理大量的指令和数据。服务器有较高的运算和处理能力,并且具有相当大的信息储存容量。服务器决定了心痛的检索速度和存储容量。 3、URL的构成是什么? 答:URL由两个主要的部分构成:协议(Protoco1)和目的地(Destination)。 4、什么是微信息? 答:微信息即快速信息传播。 微信息是最细分最全面的综合信息社交网,集信息,电子商务,社交于一体,提供信息免费发布,共享,搜索,查找,还可以创建和加入信息群组,建立信息社交圈子,随时关注动态。 (二) 1、什么是检索工具?它的主要作用是什么? 答:检索工具是用来存储、报道和检索一次文献的工具,属于二次文献。 主要作用:报导作用、累计作用、查询作用、选择作用。 2、目录、题录、索引、文摘、文献指南各有那种类型? 答:目录可以分为国家目录、馆藏目录、联合目录、出版社与书商目录和专题目录。 题录的类型一般都是用代号表示。 索引类型可分为篇目索引和内容索引 文摘按其内容的详简程度可以分为指示性文摘和报道性文摘;按其适用对象可以分为一般性文摘和倾向性文摘;按内容性质可以分为综合性文摘和专业性文摘。 文献指南主要介绍该科学和专题的主要文献类型。 3、什么是参考工具书?它有哪些主要作用? 答:参考工具书是根据一定的社会需要,广泛汇集某一范围的知识材料,按一定方式加以编排,专供人们解释疑惑的特定类型的出版物。 作用:查字词、查事项、查人物、查机构、查产品、查物名、查地名、查年代、查数据。 4、字典和词典、百科全书、年鉴、名录、图录有哪些主要类型? 答:字典类型一般分为两种:○1详解词典○2专门词典。 词典从语种文别角度分为:○1单语言辞典○2多语言辞典。 从词量规模角度:○1大型词典○2中型词典○3小型词典。 从收录内容角度:○1百科全书○2语文词典○3专门词典。 百科全书分为两种类型:一类是概括人类一切门类知识,包括哲学、社会科学、自然科学和应用科学等所有门类知识的综合性百科全书。另一类是指内容只收内容某一学科或某个门类、某个专业的知识信息的专科性百科全书。 年鉴类型分为综合性年鉴、专业性年鉴、统计性年鉴。 名录类型分为人名录、地名录、物名录、机构名录。 图录类型分为地图录、科学技术用图集、历史图谱、文物图谱及人物图录。 (三)

文献检索重点

1. Cnki ppt 中国学术期刊网络出版总库检索项:主题:复合检索项,由篇名、关键词、摘要三个检索项组合而成。在以下范围中检索:中英文篇名、中英文关键词、机标关键词、中英文摘要。 2.可使用词频控制的检索项包括:全文、主题、摘要、参考文献 3.知网节上全部链接点可分为四类:文献、机构、人名、内容关键词。点击文献链接点,直接查看文献信息及全文;点击机构、人名、关键词,则显示知网数据库列表,通过知网数据库列表上的各数据库,可获得相应机构和人名在知识元库中的基本信息以及在相应数据库中的相关文献信息及全文。 4.PUBMED收录的文献包括4个数据库:1. Medline.2. In Process Citations 3.Publisher-Supplied Citations, 4. OldMedline。 5.布尔逻辑运算符“AND”、“OR”、“NOT”,需注意的是,逻辑运算符须用大写字母,逻辑运算符的优先顺序为从左向右的顺序,可通过加括号提高运算的优先级。 6.对于输入检索框中未加标识的检索词,PubMed依次在下列词表中查找匹配的内容: 1.MeSH translation table 2.Journals translation table 3.Full Author translation table 4.Author index 5.Full Investigator (Collaborator) translation table 6.Investigator (Collaborator) index 7.对于输入PubMed的多词词组,PubMed会查询词组索引,如果查到相应词组则将其作为一个检索词来检索。如果未查到相应词组,则将其拆分成单个词,分别进行检索并以逻辑和(AND)进行组配,如:single cell相当于检索single AND cell。可通过如下方式强制将其作为一个词组进行检索: 1. 加双引号,如:“single cell” 2.加标段标识[tw]: single cell[tw] 3.使用短横线“-”将两词连接起来:single-cell 4.使用截词符*:single cell* 8. Delete from history:从检索史中删除该条检索式 Show search results:查看该条检索策略的检索结果 Show search details:显示该条检索策略的具体执行情况 Save in My NCBI:在My NCBI中保存该条检索策略。 9.PubMed中Send to File.File:按规定格式保存为本地文件 10.注册My NCBI并登录后,可以对NCBI网站的服务进行个性化设置,可实现如下操作:保存检索策略,保存检索结果,设置在检索结果中高亮显示检索词,建立内容更新的e-mail提醒(需确认),在检索结果中显示网站资源的链接,选择过滤器对检索结果进行分组. 万方ppt 11.逻辑关系:逻辑与:and 或星号(*);逻辑或:or 或加号(+);逻辑非:not 或减号(-)。优先级为从左到右,可加()提高优先级。 12.主题:标题、摘要、关键词,从2008年起买断中华医学会系列期刊版权。基础知识

检索重点(超全版)

信息检索的概念:广义的信息检索是指将信息按一定的方式组织和存储起来,并根据用户的需要找到有关信息的过程和技术;狭义的信息检索是指从信息集合中找到所需信息的过程。 信息(information)信息是事物存在方式、运动状态及其特征的反映,是事物发出的信号、消息。信息具有共享性、存储性和传递性、价值性、时效性。 情报是指运用一定的形式,传递给用户,并产生效益的知识或信息。三个属性:知识性、传递性、效用性。 知识是优化、理论化的信息集合。 文献(document)是指记录有知识的一切载体。也就是说用文字、图形、符号、声频、视频等手段记录下来的人类知识都可以称之为文献。 四个要素:知识载体文字、图形、符号、视频、声频记录 简述信息、知识、文献的概念及其三者之间的关系。 信息:是事物存在方式、运动状态及其特征的反映,是事物发出的信号、消息。 知识:是人类对自然界、人类社会中各种现象、规律的信息反映进行思维分析,加工提炼,经过系统化、理论化的结果。 文献:记录有知识的一切载体 三者从概念范畴上看,信息大于知识大于文献,知识是信息的一部分,是理论化系统化的信息,文献是知识中记载下来的那部分。 信息素质(information literacy)是指判断何时、何地需要信息,并有效的定位、获取、评价和利用信息的一系列能力的总和。包括:计算机素养、因特网素养、媒体素养、图书馆素养、批判性思考的能力。 信息素质主要体现在: ——信息意识:是个体对信息重要性认识程度和对信息是否具有特殊的、敏锐的感受力和持久的注意力,即对信息的捕捉、分析、判断和吸收的敏感性。 ——信息能力:是对信息的搜集获取能力、分析鉴别能力和综合利用能力。 ——信息道德:是指在整个信息活动中,信息创建者、信息服务提供者和信息使用者所必须要遵守的伦理规范。 零次文献是指未公开出版的实验记录、原始录音(像)、书信、手稿、口头交流的信息或实物等。 一次文献是指作者直接以自己的工作、科研、社会活动等实践经验为依据而撰写,并公开发行进入社会流通的专著、学术论文、专利说明书、科技报告等。 二次文献是根据一次文献外表或内容特征按照一定的规则和方法进行整理、加工、浓缩,按一定顺序编排形成的有序化文献。如各种目录、索引、文摘和各种书目型数据库。 三次文献是为了一定的目的和需求,对大量一次文献信息中的有关内容进行综合、分析、提炼、重新组合而形成的再生性文献。如专题评述、综述、百科全书、参考工具书等。 按文献载体划分 手写型文献(Hand Writing Document)印刷型文献(Printed Document)缩微型文献(MicroForm Document)视听型文献(Audio-visual Document)电子型文献(Electronic Document) 按文献出版形式划分 图书(Book)期刊(Journal)特种文献(Special Document)①科技报告(国内知网国外NSTL)②专利文献 ③会议文献④学位论文⑤政府出版物⑥标准文献⑦技术档案⑧产品资料等 信息检索的概念广义的信息检索是指将信息按一定的方式组织和存储起来,并根据用户的需要找到有关信息的过程和技术。狭义的信息检索是指从信息集合中找到所需信息的过程。 信息检索的原理是:将描述特定用户所需信息的提问特征,与信息存储的检索标识进行异同的比较,从中找出与提问特征一致或基本一致的信息。本质是用户的信息需求与存储在信息集合中的信息进行比较和选择,即匹配的过程。检索语言分为分类语言和主题语言 常用的检索途径包括:(主要依据文献的外部特征和内容特征来进行编排) 自由词检索、主题词检索、分类检索、著者检索、机构检索、引文检索、限定检索等 检索步骤

相关主题
相关文档
最新文档