国内主题词表研究的热点与趋势_基于词频统计与知识图谱方法_余丰民
关键词词频变化视角下学科研究发展趋势分析——以国内情报学研究为例

关键词词频变化视角下学科研究发展趋势分析——以国内情报学研究为例周鑫;陈媛媛【期刊名称】《情报杂志》【年(卷),期】2016(035)005【摘要】[目的/意义]探究学科研究发展趋势一直以来都是国内外学者们关注的重要课题,但是现有的分析方法都未能较好地利用研究数据自身含有的“时间”属性.因此,通过构建词频变化率模型进行分类处理,试图更加客观合理地呈现出学科研究发展趋势的动态变化过程.[方法/过程]以CSSCI收录的9种情报学核心期刊2000-2014年间所刊载的文献关键词作为研究对象,从研究热点、研究主题、研究范式三个方面对我国情报学研究发展趋势进行探究.采用词频变化率Z值对高频关键词进行归类总结分析,揭示出国内情报学目前的研究热点以及变化趋势;在此基础上,借用共现网络分析法以及多维尺度分析法研究各类高频关键词之间的内在联系,从而明晰国内情报学的重点研究主题及其演进趋势,研判国内情报学学科研究范式的发展趋势.[结果/结论]通过利用词频变化率Z值对所选取的高频关键词进行分类,同时结合高频关键词共现网络以及多维尺度分析法,不仅有效地从研究热点、研究主题及研究范式三个方面揭示出国内情报学研究的发展趋势,也为探究学科研究发展趋势提供了一个崭新的研究视角.【总页数】9页(P133-140,112)【作者】周鑫;陈媛媛【作者单位】黑龙江大学信息管理学院哈尔滨150080;黑龙江大学信息管理学院哈尔滨150080【正文语种】中文【中图分类】G353.1【相关文献】1.基于词频分析的国内情报学研究热点(1998~2007) [J], 肖明;李国俊;杨楠2.关键词词频变化视角下我国"科学数据"领域研究主题演化分析 [J], 姜鑫;王德庄;马海群3.国内SPOC研究热点和发展趋势分析r——基于词频分析法、共词聚类法和多维尺度分析法的研究 [J], 冯甜甜;马炅4.基于关键词共现和词频统计的学科研究热点及趋势——以情报学为例 [J], 刘晓波5.关键词频度演化视角下的研究热点挖掘方法研究 [J], 高劲松; 彭博因版权原因,仅展示原文概要,查看原文内容请购买。
基于科学知识图谱的国内外人工智能领域研究热点、前沿与比较

基于科学知识图谱的国内外人工智能领域研究热点、前沿与比较作者:陶于祥汪书悦袁野来源:《重庆社会科学》2019年第11期摘要:分别以“人工智能”“AI”为关键词,对中国知网CSSCI数据库和Web of Science SCI 拓展期刊数据库进行检索,遴选出2008—2018年1 786、8 515篇文献作为研究样本,采用词频分析、聚类分析、时间演化分析等科学计量方法,借助CiteSpace可视化软件,综合梳理国内外人工智能领域研究的热点、发展脉络和演进历程。
通过可视化图谱展示以及国外和国内对比分析,指出国内外发展差异,提出未来我国人工智能领域发展的相关建议。
研究发现,国外主要围绕遗传算法、模糊粒子群优化算法等算法层面展开,而国内纯算法的研究较少;国外多将人工智能应用在金融和医疗中,国内则主要体现在教育、图书馆建设以及出版业中。
未来研究应强调多学科整合,持续完善算法,加速人工智能应用落地并构建多层治理体系。
关键词:人工智能;CiteSpace;知识图谱;比较分析基金项目:重庆市社会科学规划项目“全球价值链背景下重庆市人工智能产业重点发展领域与政策设计”(2019YBJJ041);重庆市社会科学规划重点智库项目“中美贸易摩擦背景下重庆市大数据智能化产业发展应对策略研究”(2018ZDZK10)。
[中图分类号] F49 [文章编号] 1673-0186(2019)011-0089-012[文献标识码] A [DOI编码] 10.19631/ki.css.2019.011.0092019年5月,习近平总书记在国际人工智能与教育大会的贺信中指出人工智能是引领新一轮科技革命和产业变革的重要驱动力。
人工智能领域的研究和发展至关重要,近年来学术界围绕人工智能涌现出诸多研究成果。
从研究视角来看,吕文晶运用文献计量法对我国人工智能研究文献的时间分布、作者分布、主题分布和学科分布进行分析,并指出人工智能发展与创新交叉研究具有极大潜力[1];胡玉宁等运用TDA软件,利用文献统计分析、关键词共现分析的方法揭示国际人工智能研究热点[2];李悦等对世界人工智能领域相关研究进行统计分析,总结出人工智能领域的热点并预测未来发展方向[3];从研究主题来看,邱均平等对中外自然语言处理的发展进行对比分析[4];刘勇等则对人工智能在我国教育领域应用进行了可视化分析[5]。
基于词频分析和可视化共词网络图的国内创客研究热点分析_秦琴琴

5
19
公共图书馆
2
10 创客运动
3
20
3D 打印
2
从表 1 可以看出,20 个高频关键词的总呈现频次为 147 次,占关键词总频次的 63.9%。其
115
Vol.26 No.1 2016
中,词频排在前十位的分别是:创客空间、创客、高校图书馆、创新服务、图书馆、众创空间、 创客文化、图书馆服务、服务创新和创客运动。
图 3 国内创客高频关键词的共词网络图
从图 3 可以直观地看出:①创客处于整个共词网络图的中心位置,几乎与其它所有关键词 都发生联系。除创客外,创客空间、创客文化、众创空间等与其它关键词的关系也很紧密,说 明很多研究者正在重点研究这些关键词,并且其它相关研究也围绕着这些关键词而开展,因此 可以推断这些关键词是国内创客领域研究的热点。②处于边缘地带的一些关键词,如智慧学习、 互联网+、3D 打印等,这些节点虽然处于边缘,与其它关键词的联系较少,但这并不表示这些 关键词不重要、不值得研究。就目前来看,研究者对这些词的研究虽然相对较少,但这些词大 多出自最近发表的文章中,反映出这些关键词是创客领域未来的研究方向和趋势,更值得本研 究关注。③像清华 iCenter、项目式教学、创客运动等处于中间的关键词,它们是连接中心关键 词和边缘关键词的桥梁。
一 研究设计
1 研究样本的来源 本研究的样本来源于中国知网(CNKI)数据库。在 CNKI 上以“创客”、“创客空间”、“众 创空间”为关键词进行检索,截止到 2015 年 6 月 28 日,共检索到 73 篇相关文献;剔除政策宣 传、通知广告、领导讲话和内容重复等无关样本后,最终获得有效样本 58 篇。将这 58 篇文献 的题录信息导出并保存成文本文件,以便为后续的引文分析、词频分析和共词分析做准备。 2 研究方法 本研究主要采用引文分析法、词频分析法和共词分析法。 引文分析法就是利用各种数学及统计学的方法进行比较、归纳、抽象、概括等的逻辑方法; 也是对科学期刊、论文、著者等分析对象的引用和被引用现象进行分析,以揭示其数量特征和 内在规律的一种信息计量研究方法[3]。
我国高等教育研究的热点与趋势分析——基于近五年“全国教育规划立项课题”可视化及共现词频的方法

第42卷第6期 唐山师范学院学报 2020年11月 Vol.42 No.6 Journal of Tangshan Normal University Nov. 2020──────────基金项目:全国教育科学规划课题国家一般项目(BFA190055) 收稿日期:2020-06-17 修回日期:2020-10-11 作者简介:刘旭东(1976-),男,河北唐山人,博士,教授,硕士生导师,研究方向为高等教育管理、教育史。
-102-教育教学研究我国高等教育研究的热点与趋势分析—— 基于近五年“全国教育规划立项课题”可视化及共现词频的方法刘旭东1,赵 硕2(1. 华北理工大学 高教研究所,河北 唐山 063210;2. 曹妃甸职业技术学院 管理学院,河北 唐山 063210)摘 要:高等教育核心思想解读及发展趋势映射出现阶段我国高等教育的研究热点与形式变迁。
将热点与趋势分析作为我国高等教育发展的新航线,能有效地反映现阶段高等教育发展状况,做出顺应时代发展的战略抉择。
以2015-2019年“全国教育规划立项课题”为研究核心,通过可视化及共现词频的方法对我国高等教育的热点与趋势进行分析,旨在发挥教育的导向功能,构建现代化教育发展新形态。
关键词:高等教育;词频分析;热点;趋势;“双一流” 中图分类号:G644文献标识码:A文章编号:1009-9115(2020)06-0102-08DOI :10.3969/j.issn.1009-9115.2020.06.024Analysis on the Hot Spot and Trend of Higher Education Research in China Based on the Visualization and Co-Occurrence of Word Frequency of"National Education Planning Project" in Recent Five YearsLIU Xu-dong 1, ZHAO Shuo 2(1. Institute of Higher Education, North China University of Science and Technology, Tangshan 063210, China;2. College of Management, Caofeidian Polytechnic, Tangshan 063210, China)Abstract: Interpretation of the core ideas of higher education and the mapping of development trends reflects the researchhotspots and changes in forms of higher education at the emergence stage. Therefore, taking the hot spot and trend analysis as the new route of higher education development in our country can more effectively reflect the current situation of higher education development, and make the strategic choice to adapt to the development of the times. Based on the research of "national education planning project” in the past five years, the hot spots and trends of higher education in China are analyzed by means of visualization and co-occurrence of word frequency. It aims to give full play to the guiding function of education and construct a new form of modern education development.Key Words: higher education; word frequency analysis; hotspot; trend; "double first class"“全国教育规划立项课题”可视为我国重大教育科研需求的牵引力,体现顶尖教育科研水平、凝聚重要理论研究成果、揭示教育发展深层次规律、解决重大教育现实问题,引领着全国教育“质”与“量”变化的新形势[1],立项课题的权威性、代表性得到充分肯定。
我国深度学习研究热点及其发展趋势——基于CiteSpace可视化知识图谱分析

后,排除会议和征稿信息,最终得到和深度学习主 题直 接 相 关 的 有 效 文 献 为 219 篇, 它 们 多 发 表 在 《电化教育研究》 《中 国 电 化 教 育》 《现 代 教 育 技 术》 《远程教育杂志》 等教育技术类期刊上 。
(二) 研究过程与方法 研究过程主要包括三个阶段:首先,研究者整 理各年度发文量,分析预测发文量的变化趋势;其 次,研究 者 对 文 献 的 关 键 词 进 行 聚 类 分 析; 最 后, 研究者依据整理的数据和分析的结果对国内深度学 习的研究进行展望。 本研究主要采用了共词分析法。共词分析法主 要用于揭示某一研究领域内研究主题的研究方法, 这一方法通过对某一研究领域内主题关系的研究, 来分析研究主题的发展历史和推断主题未来的发展 趋势等。研究者通过对深度学习文献关键词的聚类 分析,考 察 了 深 度 学 习 研 究 的 发 展 脉 络 和 热 点 领域。
120 24 10 10 9 7 7 6 5
0.89 0.28 0.55 0.05 0.04 0.16 0.18 0.04 0.00
2006 2014 2007 2016 2007 2015 2017 2009 2012
深度教学 学习分析 教育信息化 问题解决 机器学习 高等教育 课堂教学改革
二、研究结果与分析
(一) 深度学习研究年发文量变化趋势分析 通过分析每年的发文量,我们可以得知深度学 习相关主题研 究 的 发 展 阶 段 。 如 图 1 所 示, 自 2012 年之后,深度学习主题的论文年度发表数量增加迅 速,呈直线上升 趋 势 ,2016—2018 年 该 主 题 的 发 文
Teacher Education Forum·教师教育论坛 4 5
图1 深度学习年度发文量变化趋势 (2007-2018年)
中国知网关键词词频统计软件设计及其在出版工作中应用研究

中国知网关键词词频统计软件设计及其在出版工作中应用研究朱玉强1 范翠丽2(1.山东师范大学 图书馆,济南 250014;2.山东科学技术出版社,济南 250002)摘 要:基于中国知网检索、导出参考文献,编制程序对作者给出的关键词进行年度频次统计,结合出版社工作实际对程序进行评估。
结果表现程序功能确切,效率较高,节省人力,适用于大量文献调研工作。
关键词:中国知网;关键词词频统计;编辑出版文献标识码:A 文章编号:1009-5462(2020)04-0051-05文献调查不容易被外界干扰,只需投入少量经费与人力,省时且效率高,可方便快捷地了解前人和他人劳动成果,是获取知识的捷径。
科研人员在申请课题、进行科学研究、撰写学术论文前往往要对研究方向进行文献调研,从而有效避免重复研究。
本文编制程序可在极短时间内对大量文献的关键词词频进行统计,为调查人员提供数据支撑及简单的可视化指标。
1 相关研究及实践文献调查往往涉及众多文献种类及格式,对其内容整理分析一般包括定性分析、定量分析及定性定量相结合分析3种。
内容分析法最早应用于新闻传播领域,20世纪60年代末西方图书情报学界将其列入图情学方法论体系,之后不断发展完善,引入了系统论、信息论、符号学、语义学、统计学等方法或技术,[1]一般通过人工编码将大量碎片化、属性化的文字转换为系统化、定量化的信息,类似概率论与数量统计中引入的随机变量,从而使研究对象易于分析、便于统计,进而归纳发现有价值的结论。
[2]广义上关键词指出现在文献篇名、摘要或正文中表达文献中心思想、有实际意义的自然语言词汇;狭义上学术论文的关键词由论文作者自行设置并写在文章“关键词”一栏,作者给出的关键词或许未能严格遵守《国家标准GB7713-87 科学论文编写格式》进行,但鉴于作者对作品把握的准确程度,其给出的关键词很具参考性。
奉国和等[3]构建时间-关键词频次矩阵,设计时间加权关键词词频分析模型,用于揭示学科研究热点及变化趋势。
国家汉语主题词表 主要科技创新内容

国家汉语主题词表主要科技创新内容在国家汉语主题词表中,主要科技创新内容是指在各个领域中,涉及到科技创新的关键概念、重要技术和前沿发展。
科技创新是国家经济发展和社会进步的重要动力,因此在国家汉语主题词表中占据了重要的位置。
本文将从多个角度对国家汉语主题词表中的主要科技创新内容进行分析和总结,以期帮助读者更全面、深刻地理解这一重要主题。
一、人工智能在当今社会,人工智能已经成为科技创新的热点领域。
国家汉语主题词表中涉及到人工智能的主要内容包括机器学习、深度学习、自然语言处理、智能交互等。
这些概念和技术在自动驾驶、智能医疗、智能家居等领域都有着重要的应用,对于推动科技创新和社会进步起到了关键作用。
二、生物技术生物技术是另一个在国家汉语主题词表中备受关注的领域。
基因编辑、生物信息学、转基因技术等都是生物技术领域的重要内容。
这些技术的应用不仅在农业、医疗、环保等领域拥有巨大潜力,也对于人类健康和社会可持续发展具有重要意义。
三、新能源随着能源危机和环境污染问题的日益突出,新能源技术的研发和应用成为了全球关注的焦点之一。
国家汉语主题词表中涉及到新能源的主要内容包括太阳能、风能、地热能等。
这些清洁能源的开发和利用对于减少对传统化石能源的依赖、保护环境生态具有重要意义。
四、数字化经济随着信息技术的快速发展,数字化经济已经成为推动经济增长和社会变革的重要引擎。
国家汉语主题词表中涉及到数字化经济的主要内容包括大数据、云计算、区块链等。
这些技术的应用正在改变着传统产业的商业模式和生产方式,对于经济结构的优化和升级产生着深远影响。
总结回顾通过对国家汉语主题词表中主要科技创新内容的分析,我们可以看到科技创新已经渗透到各个领域,对于经济社会发展起到了重要作用。
人工智能、生物技术、新能源和数字化经济都是当前和未来的重点发展方向,也是国家重点支持的领域。
在面对这些变革和挑战时,我们需要不断学习和探索,不断推动科技创新,以实现经济可持续发展和社会进步。
国内语言学近十年研究热点识别

国内语言学近十年研究热点识别杨书霞【摘要】本文以国家人文社会科学基金项目数据库为数据源,利用R语言和Gephi 等开源工具,对2007-2016年的语言学课题进行了内部文献特征分析,并将结果通过可视化技术呈现.通过对课题的年度分布、热点语种和研究领域进行考查,并对高频主题词进行共现图谱绘制,发现当前我国语言学研究正在经历实证转向,语料库语言学、认知语言学、翻译研究三个学科发展势头强劲.此外,汉语和英语是课题的重点关注语种,少数民族语言和日俄等小语种在立项数量和分析角度上均明显落后.【期刊名称】《外国语文(四川外语学院学报)》【年(卷),期】2018(034)004【总页数】8页(P87-94)【关键词】语言学课题;实证转向;强劲学科;重点语种【作者】杨书霞【作者单位】河南大学外语学院,河南开封475001【正文语种】中文【中图分类】H0-06国家人文社会科学基金自1991年设立以来,已对包括语言学在内的26个学科进行资助。
立项种类包括青年项目、一般项目、重点项目、重大项目、后期资助项目、成果文库,以及中华外译项目八个类别。
作为我国级别最高、影响力最大的人文社科研究基金,国家社科基金资助的项目一向被视为反映我国人文社会科学发展水平的重要指标(周丽琴,2015:48)。
研究表明,针对基金立项课题进行探讨,有助于识别研究热点和重点,对相关学科的发展有指引和启示作用(文秋芳等,2017:23)。
因此,本文拟借助开源工具,对2007—2016年的国家社会科学基金语言学项目(以下简称语言学项目/语言学课题)进行数据可视化分析,全面呈现国内语言学研究现状和热点,以期为今后课题的选择和申请提供有价值的参考。
1文献回顾针对语言学项目的研究可以从内容和方法两个层面进行回顾。
从研究内容来看,已有文献集中在整体考察和专项分析两个方面。
整体考察主要从宏观角度对立项课题进行分析。
例如,贾蕃(2016)从产业、高校、科研机构合作共赢的视角,对语言学项目进行了量化分析;此外,还有一些学者对语言学课题的分布特点进行了历时统计分析(苏新春等,2015;蒋跃等,2016)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
您的好帮手——《档案界》网站 理 论 探 讨21档案管理6/2012总第199期国内主题词表研究的热点与趋势:基于词频统计与知识图谱方法摘 要:通过1980年~2003年和2004年~2011年两个时间段的词频统计与可视化知识图谱等方法的比较分析与研究,展现了国内主题词表研究领域的热点和趋势,认为:国内对主题词表的研究内容在时间上有明显的分界线、研究趋势展现了知识组织的演化过程、主题词表基于语义描述语言的本体转换是目前学界研究的热点和未来研究的趋势。
关键词:主题词表;词频统计;知识图谱;研究热点;研究趋势Abstract:Based on word frequency statistics and visualization of knowledge mapping and other methods ofcomparative analysis and research in two periods of 1980-2003 and 2004-2011, the article shows the areas of research focus and trends of Thesaurus in China. That is: there is a clear dividing line in two periods, and trends show that the evolution process of knowledge organization system, Thesaurus based on semantic description language ontology conversion is currently a focus of academic research and future research trends.Keywords:Thesaurus; Word Frequency Statistics;Knowledge Mapping;Research Focus;Research Trends1 引言主题词表(叙词表)是一种情报检索语言,它在早期情报检索和知识组织中发挥着非常重要的作用。
早在1876年,美国图书馆学家卡特发表了他的《字典式目录条例》[1]。
而随着计算机技术的发展,主题词表的功能也发生了相应的变化。
另外,不断更新的网络技术,以及语义网等概念的技术实现,也为主题词表的发展注入了活力。
国内主题词表研究虽然起步较晚,但从《汉语主题词表》的问世,到《中国分类主题词表》的出版,均取得了卓越的成就。
国内的研究主要集中在主题词表的介绍、评价、编制、修订、标引方法、应用及分类主题一体化等领域[2][3][4],另外,随着计算机网络技术的发展,各类词表被大量应用到了信息检索技术、知识组织与管理等领域之中[5][6]。
那么,这些年来国内对主题词表的研究都触及了哪些主题?其研究的趋势和热点又在哪里?本文试图通过对发表在期刊上的学术论文进行研究,旨在为该领域同行了解和掌握研究方向提供些许帮助。
2 样本获取与研究方法2.1 样本获取方法。
本文获取数据样本的方法是:在“中国学术期刊网络出版总库”中,用关键词“主题词表 OR 叙词表”,检索出1980年~2011年间发表在“核心期刊”上的论文,因为《中文核心期刊要目总览》第一版在1992年才出版,上述检索结果仅命中了1992年~2011年数据;因此,作者又补充了1980年~1991年的相关主题数据。
经过人工筛选,最后,获得样本数为480篇(检索日期:2012年2月12日)。
2.2 研究方法。
本文主要应用文献计量学领域的词频统计方法和基于共词的可视化知识图谱方法。
通过关键词词频的动态统计与分析,可以反映出某时间段内研究主题的动态变化过程,如高频关键词的发展期、高峰期及衰退期等。
词共现(共词)分析方法最早是在1986年由法国文献计量学家M.Callon等学者提出的[7]。
在词共现分析方法的基础之上,我们可以运用社会网络分析方法及软件(如Pajek),绘制出各主题之间的相互联系的学科知识图谱。
3 研究结果3.1 历年论文发表情况图1 历年论文发表数量统计对480篇论文进行按年度统计,见图1。
由图1可以发现,论文数量基本上呈上升趋势:1980年~2003年为缓慢上升阶段,但1994年和1999年均有突出表现;2003年以后,呈现出了快速发展的态势。
究其原因,一方面,随着计算机技术的发展,出现了诸如本体等语义网概念的应用研究,使得主题词表研究重新得到了重视;另一方面,有关主题词表的研究得到了更多的基金资助,2004年以前,余丰民DOI:10.15950/ki.1005-9458.2012.06.024 理 论 探 讨22档案管理6/2012总第199期仅有8篇资助论文,而2004年及以后,资助论文达113篇,尤其是近两年,基金资助论文比例均达50%以上。
3.2 基于关键词词频统计。
根据上述480篇论文的研究主题(关键词),我们可以通过关键词词频统计及共现计算来分析国内主题词表研究的热点与趋势。
由于有些论文发表年代尚早,作者没有给出关键词,因此笔者对这一部分关键词进行了人工补充;同时,为了集中主题,对一些一义多词的主要关键词进行了修正,如将“《中国图书馆图书分类法》”统一简称为“《中图法》”,将“语义WEB”统一改为“语义网”,将“叙词表”统称为“主题词表”,等。
这样,我们一共可以获得893个(1827个次)关键词,篇均关键词约3.8个。
表1 关键词词频统计(总频次≥10,共22个)表2 2004年~2011年间新出现的关键词(频次≥4)表3 消失最快的关键词(1980年~2003年频次≥4)为了便于比较,本文拟把1980年~2011年划分为两个时段:1980年~2003年和2004年~2011年。
之所以这么划分,一方面,是因为从图1中可以发现,2003年以后,研究“主题词表”的论文数量增速较快;另一方面,“本体”、“语义网”、“知识组织系统”等新词汇在样本数据中均在2004年才出现;另外,两时段的论文数量也大致相当(分别是220篇和260篇),更具有可比性。
表1列出了1980年~2011年高频关键词;表2列出了2004年~2011年新出现的关键词;表3列出了2004年~2011年消失最快的关键词。
在表1中,可以发现,除“主题词表”本身外,“本体”、“《中国分类主题词表》”、“《汉语主题词表》”、“主题标引”等关键词是总频次最多的,表明了国内对“主题词表”研究的热点所在。
从关键词数量上统计,1980年~2003年频次在3次及以上的关键词有41个,2004年~2011年有64个,增幅达56.1%,而两时段论文数量增长仅为18%,这从某种意义上说明了后一时段比前一时段研究范围的扩大和研究内容的深入。
表2中的新词基本上属于“语义网”的范畴:本体是语义网的核心概念[8];SKOS(简约知识组织系统)、OWL、主题图等都是语义描述语言;Protégé是用于构建本体的软件工具;与“本体”直接相关的关键词有4个(领域本体、本体构建、分布式本体、中文叙词表本体)。
您的好帮手——《档案界》网站 理 论 探 讨23档案管理6/2012总第199期在表3中,还可以发现,某些主题的研究正在逐渐缩减,有的甚至已经消失了。
如,“自动标引”、“主题法”、“文献标引”、“检索语言”、“情报检索系统”、“情报检索”、“信息检索系统”等关键词词频均出现了不同程度的下降。
而像“分类主题一体化”研究,在后一时段内已经完全消失了。
3.3 基于关键词共现的可视化知识图谱分析。
为了与关键词词频统计相一致,我们在这里也对两个时间段进行对比分析,利用Pajek软件分别绘制出了两个时段的知识图谱,见图2、图3。
在图中,顶点大小表示关键词词频的高低,连线粗细表示两个关键词同时出现在一篇论文中(共现)次数的多少。
图2 1998年~2003年高频关键词共现图(共现次数≥2)图3 2004年~2011年高频关键词共现图(共现次数≥2) 从图2中可以看出,围绕主题词表的“词表编制”是1998年~2003年研究的焦点(连线最粗);“分类主题一体化”研究及其成果《中国分类主题词表》的修订与主题标引,也是该段时间研究的热点所在。
在图3中主题词表转换成本体的研究无疑是2004年~2011年研究的焦点(连线最粗);以本体为核心的语义网环境下的知识组织系统研究,特别是用语义描述语言SKOS(简约知识组织系统)的应用研究,在图中非常抢眼;尽管,在这个时段,“分类主题一体化”这个关键词消失了,但有关分类法与主题法及《中国分类主题词表》的研究还是吸引了不少学者。
除了有更多的热点显现外,图3与图2相比,各关键词之间的关系更加紧密了,知识图谱的网络显得更加复杂了。
另外,从图谱的结构上看,图2仅有一个中心,而图3已经形成了“双轮驱动”模式[9]。
4 结论从上世纪七八十年代开始,国内图书情报界及相关研究领域学者就进行了主题词表的研制工作,从研究主题的知识图谱来看,其研究热点主要涉及“汉语主题词表”、“分类主题一体化研究”、“中国分类主题词表”、“分类叙词表”、“语义描述语言”、“语义网”、“本体”等重要事物和概念。
这些事物和概念把国内有关主题词表研究的过程串联在了一起。
经过以上分析与研究,我们可以大致得出以下结论:在整个时间段上,其研究热点有着明显的分界线(2003年~2004年);其研究趋势基本展现了知识组织由手工阶段向自动化、网络化阶段的演化过程;主题词表基于语义描述语言的本体转换是未来研究的发展趋势。
参考文献:[1] 戴淑娟.艺术科学领域的新型标识系统——《艺术科学叙词表》[J].图书馆论坛,1993(6):56~68.[2] 黎盛荣.《汉语主题词表》评介[J]. 图书馆工作与研究,1981(1):17~21.[3] 王源,陈长旭.《汉语主题词表》简评[J ]. 情报学刊,1983(1):86~91.[4] 王金夫.《汉语主题词表》概说[J ]. 图书馆杂志,1986(2):32~34.[5] 刘春艳,曾锦丹,李佳军.语义WEB环境下知识组织体系SKOS应用研究[J].图书情报工作,2006,50(6):23~27.[6] 段荣婷.基于简约知识组织系统的主题词表语义网络化研究——以《中国档案主题词表》为例[J].中国图书馆学报,2011,37(3):54~65.[7] Callon M, Law J, Rip A. Mapping the Dynamics of Science and Technology: Sociology of Science in the Real World [M]. London: Macmillan, 1986: 225~226.[8] 唐静.叙词表转换为o n t o l o g y 的研究[J ]信息系统,2004(6):642~645.[9] 汤建民. 学术研究团队的可视化识别及评估方法研究:以科学学研究领域为例[J].情报学报, 2010(2):323-330.(作者单位:浙江树人大学科学计量学研究中心 来稿日期:2012-08-20)。