社会科学信息检索
第三章 社科信息检索工具编排方法

《汉语主题词表》片段:
Yanlei Kuangchuang ——汉语拼音 叙词—— 盐类矿床 [37N] —— 范畴号 Salt deposit —— 英文对应词 代项—— D 蒸发盐矿床 —— 非叙词 分项—— F 钾盐矿床 —— 下位词 石膏矿床 属项—— S 非金属矿床 —— 上位词 族项—— Z 矿床 —— 族首词 参项—— C 沉积矿床 —— 相关词
工具书中的自然顺序排检法
地序排检法:是按行政区划的次序排检文 献的方法。 多用在研究查考自然资源及经济开发的工 具书中,用这种方法编排的工具书主要是 地图和地方文献。如《中国名胜词典》 《最新中国期刊全览》等。
美国国会图书馆分类法 美国国会图书馆分类法可以在以下网络址上查到它的类目设置等内容: /catdir/cpso/lcco/lcco.html 它的主类目表如下:
杜威十进分类法 杜威十进分类法可以在以下网络址上查到它的类目设置等内容: 杜威十进分类法 /oclc/fp/
第三讲、信息检索工具的编排方法
1、字顺法 2、类序法(分类法、主题法等) 3、自然顺序法(时序、地序等)
一、字顺法
1、形序法 (一)部首法 东汉许慎《说文解字》首创(540部,始一终亥) 明梅膺祚《字汇》首创214部,始一终龠 《康熙字典》、《中华大字典》皆214部 《新华字典》、《现代汉语词典》皆189部 《汉语大字典》、《汉语大词典》皆200部 优点:符合汉字构字特点;不知字音也可查字 缺点:各字典部首体系不统一;有的字不好确定部首;需要数 笔画数,速度较慢
4)自然语言法
自然语言法是不进行标引,直接利用计 算机的功能,通过自然语言中的词汇或词组 组配对文本形式的信息资源进行匹配检索的 方法。 这种方法又称文本检索或全文检索。 随着电子文本的普及,全文检索逐渐成为的灵活性,抛 弃了人为的号码系统,代之以通用的规范语 言,并在各主题之间建立有机的参照系统, 代替了等级制的直线排列。它使用组配和索 引等方式,较好地满足多元检索的要求。用 户查找文献时,可以不考虑所需文献内容在 体系分类等级中的位置,只要按字顺查找表 达概念的主题词或相近的主题词即可。
cssci 是中文社会科学引文索引

cssci 是中文社会科学引文索引
CSSCI(Chinese Social Science Citation Index)是中文社会
科学引文索引。
它是由中国社会科学院社会科学文献出版社负责编制
和出版的一份综合引文数据库,旨在为中文社会科学研究提供系统化
的引文信息检索服务,提升中国社会科学的研究能力及学术水平。
CSSCI收录的内容包括近三十个学科领域的学术期刊和学位论文,共计约1500本,涵盖了政治学、经济学、法学、教育学、社会学、管
理学、新闻传播学、图书馆学等领域。
它的检索工具类似于SCI (Science Citation Index),可以通过作者、文献、机构、期刊等
多个维度进行关键词搜索,方便读者快速定位到自己需要的研究资料。
CSSCI的出现填补了中国社科引文检索数据库的空白,使得国内
学者不再依赖国外文献数据库,也方便了国内外学者相互引用,提升
了中国社会科学的国际影响力。
CSSCI的出版周期为每年一次,总是在下一年开学季节前出版,并涉及过去两年内的内容,每个期刊和学位
论文库的收录要经过一系列严格的审核和评估程序,因此,CSSCI被认为是公正和权威的中文社会科学引文索引。
总体来看,CSSCI的出现有效地提升了中国社会科学的研究能力
和学术水平,推动了中文社会科学论文的国际交流与合作。
相信在未
来的日子里,CSSCI会继续发挥重大作用,带动国内学术研究的发展。
社科文献检索教案

社科文献检索第一章概论教学目标:了解文献的涵义与分类,对文献信息检索的原理、类型、方式和工具等有整体认识。
教学重点:文献的涵义与分类、信息检索工具学时:2教学内容:导言关于本课程一、社会科学的概念所谓社会科学,是以社会现象为研究对象的科学,其任务是研究并阐明各种社会现象及其发展规律。
(《汉语大词典》)关于社会科学的概念,有广义和狭义之分。
我国所使用的社会科学概念是广义上的,即把除自然科学以外的大部分科学都划为社会科学。
这在反映科学知识分类的《中国图书馆分类法》中有很好的体现。
《中国图书馆分类法》将知识分为三个部类:哲学、社会科学、自然科学。
哲学包括马列毛邓、哲学宗教;社会科学包括政治、法律、军事、经济、文化、教育、体育、语言文字、文学、艺术、历史、地理等科学;自然科学则包括数理化、天文、地球、生物、医药卫生、工农业、交通运输、航空航天、环境、安全等科学。
西方一般使用狭义的社会科学概念。
《简明不列颠全书》认为社会科学研究的课题是人类在社会和文化方面的行为,包括经济学、政治学、社会学、人类学、心理学等。
西方在社会科学和自然科学之外还分有人文科学一类,包括文学、艺术、哲学、宗教、语文文字学、历史学、法学等。
西方严格意义上的社会科学是19世纪才出现的。
而人文科学则起源于古希腊,远远早于社会科学。
这里我们还是使用广义的社会科学的概念,它包含了西方所谓的社会科学和人文科学,所以有时也说人文社会科学。
知识之间是密切联系的,因此关于科学知识的划分也不是绝对的。
如历史学在西方有时被视为社会科学,有时也被划入人文科学。
随着科学的发展,人文科学也引入了其他科学的研究手段,界线更加模糊。
如现代语言学与计算机技术结合,产生了计算语言学,与神经医学结合产生了神经语言学,等等。
因此,我们对社会科学只做笼统的划分。
二、学习本课程的意义人类社会发展的过程是知识信息不断积累的过程,尤其是20世纪70年代以来,世界文献信息迅速增加,人类进入信息时代,导致了所谓的“信息爆炸”。
第三课社会科学文献信息检索原理

• 文献检索的基本原理,其实是包括了存贮和检 索两个过程的。 • 文献信息检索的实质是,将反映特定需求的提 问概念与信息存储系统中的检索标识概念进行 比较匹配、比较,两者一致或信息标引的标识 包含着检索提问标识,则含有该标识的信息就 从检索工具中输出。
文献信息检索原理图
文献信息检索的内容
• 文献检索 • 事实信息检索 • 数据信息检索
文献信息检索语言
• 检索语言,是根据信息检索系统存储和检 索的需要而编制的人工语言。 • 人工语言,依据一定的规则对自然语言进 行事先规范,将其编制成表,以供信息资 源标引和检索时使用的语言。
人工语言
检索语言ห้องสมุดไป่ตู้类型
书/刊名 著者/团体著者 出版事项 代码/序号
2、主题语言
• 主题语言是一种描述语言,即用自然语言 中的名词、名词性词组描述事物概念的中 心语义。 • 主题,一般指文献所论述的对象,在经过 筛选以后,用以表述文献主题的语词。
主题语言的特点
• //直接以特定的事物、问题、现象等主题对象揭 示文献信息,不受文献所属学科体系的限制。 P71。“鲁迅”。 • //主题词语规范,专指性强。主题法标引的依据 是“主题词表”,每一个词语都是经过专家反复 研究定夺的,能对本学科的相关知识作出规范性 的概括,具有很强的专指性。 • //主题语言的依据是主题词表。它是进行主题标 引和检索的依据。
自然语言
1、分类语言
• 又叫分类法,所谓分类,是按事物性质 进行区分和类聚,并按逻辑顺序将其排 列,用以区别事物、认识事物的一种方 法。
分类语言的特点
• 按学科知识领域来集中文献资源,能体现 出文献信息的系统性,能满足用户对文献 信息学科性检索的需求。对于文献信息的 存储起着最重要的作用。 • 分类语言用层次分明的等级结构来显示文 献的关系,既能揭示出某一学科门类所包 含的文献,同时又能显示出各个学科门类 之间的逻辑关系。
2021社会科学信息检索的特点与技巧范文3

2021社会科学信息检索的特点与技巧范文 社会科学是以社会现象为研究对象的科学,它的任务是研究与阐述各种社会现象及其发展规律。
从广义上讲,社会科学与自然科学构成了科学知识的两大块,凡属于研究人类社会现象的所有学科都称为社会科学。
社会科学包含人文科学,广义的社会科学包含哲学、经济学、文学理论、史学、社会学、政治学、法学、教育学、心理学、语言学、民族学、情报学等。
我国对社会科学的理解也是广义上的,没有把社会科学与人文科学分离开来进行研究和应用。
近年来高等院校的学科设置逐渐趋向综合性,很多理工类高校也逐步增加开设人文社科类学科,因此高校中开设的信息检索课程需要相应增加社会科学信息检索内容。
1社会科学信息的特点 社会科学信息内容庞杂、范围广泛、界限模糊,涉及社会生活的所有方面。
社会科学信息除了具有信息的一般属性外,自身还有一系列特殊性,包括内容、表达、运动等方面的特点。
社会科学信息的内容特点包括:主观因素多;社会科学信息是社会科学信息反映的多为思辨论证的定性分析,定量分析较少且精确度不高;社会科学信息是社会科学信息的内容综合性强;社会科学信息是社会科学信息比自然科学信息更加分散;社会科学信息是社会科学信息冗余度较大。
由于社会科学信息在内容上具有上述特点,它在表述上也有一些相应的特殊之处,具体体现为:①社会科学信息(除某些美感信息)都具有语言性,由于其冗余度较大,对新理论等需要进行详细的论证,要利用较多的资料、引证等,因此社会科学信息以着作形式发表的较多。
②社会科学信息术语不统一,形成了一种特殊的语言障碍。
③表达社会科学信息的内容除用规范的科学语体外,还常采用政治语体。
社会科学信息的运动特点,主要体现在以下方面:①社会科学信息的分布比自然科学的信息分布更加分散,有用的新内容包含在具有某些内容陈旧的、篇幅大的着作中,正因为如此,社会科学文献单元的冗余信息都很大。
②社会科学信息的传递有较大的局限性。
③社会科学信息老化慢、生命力强。
信息检索 第二讲 信息检索概述

通过分析信息存储和检索的全过程可以看出检索语言
大致有以下四个主要的功能:
对文献的情报信息内容及其外表特征加以规范化的标引;
对内容相同及相关的文献信息加以集中或揭示其相关性;
可使文献信息的存储集中化、系统化、组织化,便于检
索者按一定的排列秩序进行有序化检索;
便于将标引用语和检索用语进行相符性比较。
科性质进行分类和系统排列 。
特点:能集中体现学科的系统性,反映事物的
从属、源生关系,便于按学科门类进行族姓检
索。
(1)分类语言
按照分类方式的不同:
混合分类语言 体系分类语言 分类语言
体系分类法是基于概念
的划分和概括,以学科 分类为基础,把概括文
献内容与事物的各种类
目组成一层层隶属、详 细列举的等级结构体系。
文献检索
事实检索
数据检索
7
3.信息检索的类型
文献检索。以文献或其索引、文摘为检索对象, 目的是核实已知文献的不确切项目,如著者名、 年代、出处等,或查检某课题原始文献的线索 及它们的具有收藏情况。
文献检索是相关性检索,不直接回答用户所提 技术问题本身,只提供有关的文献供参考。
举例: “关于自动控制系统有些什么参考文献”
CALIS公共目录检索系统检索界面
读秀知识库检索界面
三、信息检索语言
1.检索语言的概念
2.信息检索语言的功能与作用
3.信息检索语言的类型
1.信息检索语言的概念
信息检索语言是一种专门的人工语言,又 称标引语言和索引语言,是信息系统中用 以描述信息的内容及外表特征和检索者表 达检索提问的语言,是两者相互沟通的共 同依据,是用于信息标引和检索提问的约 定语言。
信息检索知识点
计算机检索1.信息素养(信息素质、信息能力):作为具有IL(information literacy)能力的人,必须能够充分地认识到何时需要信息,并有能力去有效地发现、检索、评价和利用所需要的信息,从而具有终身学习的能力,总能够为任何任务和决策找到所需信息.2.信息检索广义:指将信息按照一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术.包括存储和检索两个过程.狭义:从信息集合中找出所需信息的过程。
信息查找(Information Search,Information Seeking)2.1信息现状分析1)信息爆炸导致文献量急剧增加,内容相互渗透,语种增多;文献分布异常分散;文献寿命愈来愈段;2)由于条件限制,人们吸收和利用信息的能力并未得到相应的提高.3.检索的作用1)促进智力资源的开发;2)协助管理者做出正确的决策;3)帮助科研人员借鉴前人的研究成果,避免重复劳动;4)信息检索是知识更新的手段.4.数据库类型(1):作为图书馆数字资源的数据库特指为科学、教学、学习所需各种参考资料的集合,以数据库的形式管理和利用。
自建数据库:馆藏目录(OPAC),本校学位论文数据库.商业性数据库:数据库商、出版商和其他机构以商业化方式提供的各种电子资源,图书馆需要支付一定的费用购买数据库的使用权再提供给一定的读者群。
免费数据库:开放获取资源、机构典藏和其他免费的网络资源。
5.数据库类型(2)从收录文献的内容分,有综合性数据库和专业性数据库之分;从收录文献的类型分,有图书数据库、期刊数据库、学位论文数据库、报纸数据库、会议文献数据库、专利文献数据库、标准数据库等;从提供文献的形式分,有全文数据库、文摘数据库、引文数据库;各数据库举例:专业数据库:Petroleum Abstract(PA)、EnCSciFinder Schoiar(CA)综合性数据库:读秀、Scopus、EI、SCI特定文献类型,如图书、期刊、学位论文等:超星、EIsevier ScienceDirect、PQDT全文数据库:CNKI、维普、SPE摘要性数据库:EI、PA引文数据库:Web of Science、CSSCI(中文社会科学引文索引)6.Science Citation Index Expanded(SCI—E)是个什么样的数据库?它是ISI检索平台中Web of Science核心合集中的一个子库它是一个摘要型数据库它是一个引文数据库它是一个期刊数据库它收录的学科范围包括科学、技术的各学科7.查文献应该如何选择数据库?学科专业:有专业型数据库时,首选专业型数据库;数据量:选择数据量大的;文献类型:根据研究的需要。
信息检索重点
一、信息检索四要素1、信息检索的前题:信息意识2、信息检索的基础:信息源3、信息检索的核心:信息获取能力4、信息检索的关键:信息利用二、信息基本特征:普遍性、客观性、扩散和传递性、增值性(创新)、可存贮性和可压缩性、可知性(信息能力)和共享性知识属性:意识性、信息性、实践性、继承性、渗透性情报属性:针对性、知识性、时间性、传递性、效用性信息、知识、情报的关系:信息经过人脑思维加工,即认识飞跃产生知识,情报属于知识的范畴。
广义的情报是信息的传递,因此,情报具有信息和知识两种性质。
三、按载体不同分为:口头信息源、实物信息源、文献信息源四、文献信息源:1、按出版形式不同可分为十种类型:图书、期刊、科技报告、会议文献、政府出版物、专利文献、标准、产品资料、学位论文、技术档案2、按记录信息的材料可分为三种类型:纸印本文献、缩微型文献、机读型文献3、按加工深度不同可划分为四种:零次文献、一次文献、二次文献、三次文献四者之间的关系:从零次文献到三次文献,是一个从分散的原始文献加工整理系统化的过程。
零次文献是一次文献的素材,一次文献是基础,是检索的对象;二次文献是检索一次文献的工具;三次文献是一次文献的浓缩,是情报信息的重要来源。
五、信息检索系统类型:⑴根据检索目标和检出文献信息形式的不同:文献检索、数据检索、事实检索⑵根据具体检索手段不同:手工检索、机械检索六、检索步骤:分析研究课题确定检索范围和检索标识选定检索工具确定检索途径查找和获取原始文献七、信息检索的方法:⒈常用法:是利用检索工具查找文献的方法.⑴顺查法⑵倒查法⑶抽查法⒉追溯法:从已知的现有文献后所列参考文献入手,逐一追查原文,从这些原文后所列参考文献再逐一追查,不断扩检的查找方法⒊循环法:指追溯法常用法混合使用的方法。
八、信息检索的途径:⒈根据外表特征划分著者途径;书名、篇名、刊名途径;序号途径⒉根据内容特征划分分类途径(SA、Ei);主题途径(SA、Ei);分子式途径(CA)九、文献检索的一般步骤:1、分析研究课题2、确定检索范围与检索标示3、选择检索工具4、确定检索途径5、查找和获取原始文献检索途径与方式:初级检索:默认的检索方式高级检索:两种检索方式组合使用,如“篇名”和“著者”。
信息检索原理和技术2015
(2)中间截断:放在词中间代表一个字 符数(中间屏蔽) 例如: wom?n 代表women、 woman 等
(3)左截断(前),放在被截词的左边 例如:*magnetic,代表 magnetic、thermomagnetic、 electro-magnetic等
按长度分为:有限截词、无限截词 截词符有“?”、“*”、“!”等, 依系统而异,各有所不同。
分类号-体系分类法
中国图书馆分类法 中国科学院图书馆图书分类法
中国图书馆分类法
1.马克思主义、列宁主
义、毛泽东思想、邓 小平理论
5大部
22大类
A 马克思主义、列宁主义 毛泽东思想、邓小平理论
2.哲学、宗教
B 哲学、宗教 C D E F G H I J K 社会科学总论 政治、法律 军事 经济 文化、科学、教育、体育 语言、文字 文学 艺术 历史、地理
截词符和屏蔽符(以EI数据库为例,其他数 据库大同小异)
1.截词符:用“*”作为截词符,有二种用法。 Use truncation (*) to search for words that begin with the same letters. (无限截词) comput* returns computer, computers, computerize, computerization Truncation can also be used to replace any number of characters internally.(中间截词) sul*ate returns sulphate or sulfate
3.社会科学
4.自然科学
N O P Q R S T U V X
信息检索
2.按信息的加工级别划分
• 零次文献(实验记录、手稿、原始录音、谈话记录等) • 一次文献(图书、期刊论文、会议论文、科技报告、专
利、标准等)
• 二次文献 (目录、题录、文摘等) • 三次文献 (文献综述、年鉴、词典)
三次文献之相互关系
读者查找
一次文献
二次文献
三次文献
作者发表
三、 信息检索的技术与方法
信息检索的技术
• 布尔逻辑检索 • 截词检索 • 限制检索
(一) 布尔逻辑检索
• 布尔逻辑组配运算是采用布尔代数中的逻辑 “与”、逻辑“或”、逻辑“非”等算符,将 检索提问式转换成逻辑表达式,限定检索词在 记录中必须存在的条件或不能出现的条件。
• 凡符合布尔逻辑所规定的条件的文献,即为命中文献。
以事实作为检索对象,查找用户所需的描述性 事实,其检索对象为机构、企业、人物的基本 情况、历史变迁等。 百科全书、工具书
(二)信息检索的意义
1.节约研究人员的时间,避免重复劳动 科学研究具有继承和创造两重性,科学 研究的两重性要求科研人员在探索未知或 从事研究工作之前,应该尽可能地占有与 之相关的信息。信息检索是研究工作的基 础和必要环节,成功的信息检索无疑会节 省研究人员的大量时间,使其能用更多的 时间和精力进行科学研究。
1. 逻辑“与”(并且)
• 符号:“and” 或“*”表示 • 表达式:A*B 或者 A and B
• 意义:检索记录中必须同时含有检索词AB的 文献,才算命中文献 • 作用:增加限制条件,即增加检索的专指性, 以缩小提问范围,减少文献输出量,提高查 准率。
2. 逻辑“或”(或者)
• 符号:“or” 或 “+”表示 • 表达式:A OR B 或 A+B • 意义:检索记录中凡含有检索词A或含有检索 词B,或同时含有检索词A、B的,均为命中文 献文章。 • 作用:放宽提问范围,增加检索结果,起扩 检作用,提高查全率。