中国情报学期刊论文关键词词频分析

合集下载

词频分析研究的现状、方法及工具

词频分析研究的现状、方法及工具

词频分析研究的现状、方法及工具今天主要跟大家介绍词频分析研究现状、方法及工具。

词频分析是什么呢?词频分析(Word Frequency Analysis)是对文献正文中重要词汇出现的次数进行统计与分析,是文本挖掘的重要手段。

它是文献计量学中传统的和具有代表性的一种内容分析方法,基本原理是通过词出现频次多少的变化,来确定热点及其变化趋势。

词频分析使用现状如何?以中国知网全文数据库(期刊)为检索对象,以“篇名”为检索条件,在617篇论文题目中出现“词频”二字,其中206篇核心期刊;如果以“主题”为检索条件,则有3423条文献以“词频”为主题开展了研究,其中1722篇在核心期刊发表。

由图可知,将“词频”分析工具来队研究对象进行分析,一直都处于增长态势。

说明有越多越多的论文开始基于词频分析来开展研究工作。

由上图可知,以“词频”为主题的研究涉及多个学科,其中图书情报与数字图书馆、计算机软件及计算机应用这两个学科方向对“词频”主题的研究较为关注;中国语言文学、外国语言文学、心理学、新闻与传媒、互联网技术、高等教育、教育理论与教育管理等学科方向次之;职业教育、管理学、中医学等其他学科零星涉及“词频”相关研究主题。

要彻底了解词频分析,必须先了解次词频统计方法。

TF-IDF (term frequency–inverse document frequency)词频--反转文件频率,是一种用于情报检索与文本挖掘的常用加权技术,用以评估一个词对于一个文件或者一个语料库中的一个领域文件集的重要程度。

感兴趣的小伙伴可以通过百度百科了解该方式的原理及优缺点。

/view/920592.htm目前,有很多分词软件默认使用TF-IDF技术,后文介绍的几款软件在一定程度上应用了该技术。

SCWS是Hightman开发的一套基于词频词典的机械中文分词引擎,它能将一整段的汉字基本正确的切分成词。

它采用的是采集的词频词典,并辅以一定的专有名称、人名、地名、数字年代等规则识别来达到基本分词,经小范围测试大概准确率在90-95%之间,已能基本满足一些小型搜索引擎、关键字提取等场合运用,目前,该技术主要用于网站全文索引领域。

我国情报学研究生培养领域热点——基于期刊论文关键词的统计分析

我国情报学研究生培养领域热点——基于期刊论文关键词的统计分析


要 :本 研 究采用 文献 计量 学 的关键 词分 析 法 ,万 方数 据 库 中检 索到 的 86篇 与情 报 学研 究生培 养 相关 的 学术论 文进 9
行 关键 词分 析 ,分析 出关键词 频次 和 高频 关键词 的分 布特 征 ,并作 关键 词 共词 分 析 ,探 讨 我 国情报 学研 究培养领 域 的 热
p pes rlv n t n omain s in e ga uae e c to y W a fn tb s r ic se d te fe ue c fk y r s a r ee a twi if r to ce c rd t du ain b n a g daa a e we e d s u s d a h rq n y o e wo d h n a d d srbuin c r ceit s o ih fe u n y k y r s we e a ay e s wela he C wod.T o p t n rblmso n iti t haa trsi fh g q e c e wo d r n lz ,a l s t O— r o c r he h ts osa d p o e f ifr t n s in eg a u t d ain weedic se no mai ce c r d ae e uc t r s u s d. o o
H o s o s o n o m a i c e c Gr d a e Ed c to n t p t f I f r ton S in e a u t u a i n i Chi na
— —
Ba e n Ke wo d S ait s o o r a a e sd o y r tt i fJ u n lP p r sc

基于关键词词频分析法的档案信息开放r共享研究重点与热点

基于关键词词频分析法的档案信息开放r共享研究重点与热点

基于关键词词频分析法的档案信息开放r共享研究重点与热点陶士梅【摘要】运用关键词词频分析法,从样本关键词词频及近年来的变化中归纳出我国档案信息开放共享领域研究的重点,得出我国档案信息开放共享研究,涉及面广、内容丰富,热点更新快、持续时间短,谈共享多、论开放少,重信息安全、忌隐私泄露的结论.建议在研究的更精、更深、更专上下功夫;在扎实持久上用心用力;用行动解决实践中的问题.【期刊名称】《办公自动化(办公设备与耗材)》【年(卷),期】2017(022)011【总页数】3页(P60-61,18)【关键词】档案;档案信息;开放;共享;关键词;词频;重点;热点【作者】陶士梅【作者单位】开封市不动产登记中心开封 475000【正文语种】中文【中图分类】G272.6档案信息开放共享就要“立足于档案馆藏,面向社会档案信息需求,通过有针对性地开放、共享、开发和利用档案信息资源,建立社会化信息服务体系,达到充分发挥档案信息资源的社会效益和经济效益的目的。

”[1]关注与分析档案信息开放共享研究的重点及热点,是档案信息开放共享研究的重要内容,也是档案信息开放共享实践的需要。

所谓“关键词分析法是指以关键词信息为对象进行分析的一类方法的统称,包括了词频分析、词语共现分析、分类、聚类、耦合分析等方法。

”[2]词频分析指提取文献的关键词,统计其频次,确定高频关键词,由高频关键词分析研究对象的热点、前沿和发展趋势的一种分析方法[3]。

这种方法与文献年代、作者、机构、作者及机构合作情况分析等文献外部特征分析不同,“可以直指文献内部,是对文献内容的深入剖析。

”[4]正是基于关键词分析法的上述特点,本文选择采用词频分析、词语共现分析的方法,以2017年4月13日为检索日,对题名=档案信息共享 or题名=档案信息开放(精确匹配)检索到的100篇文献关键词,进行可视化分析。

从词词频及共现等数据中归纳出我国档案信息开放共享领域关注的主题,提炼出我国档案信息开放共享研究的重点,同时对我国档案信息开放共享研究的方向与趋势进行预测。

词频分析法在学科发展动态研究中的应用综述_张勤

词频分析法在学科发展动态研究中的应用综述_张勤

知识、学习与管理Knowledge,Learn ing &Management[基金项目] 本文系中国博士后科学基金第二批特别资助项目(200902448);北京物资学院工商管理创新基地资助项目(WYJD200904)成果之一。

[作者简介] 张勤,女,1976年生,博士,副教授,发表论文10余篇,出版学术著作、译著各1部。

词频分析法在学科发展动态研究中的应用综述Rev ie w o n the W or d Fre quency Analys is Emplo yed to Disco v er the De v elo pment o f Scienc e Rese arch in China张 勤(北京物资学院商学院,北京,101149)[摘要] 词频分析法能够用于揭示某一学科的发展动态和研究进展。

本文通过对国内词频分析法的相关学术期刊论文(112篇)进行梳理和挖掘,总结了词频分析法目前的主要运用学科领域和发展阶段,分析了词频分析法在运用中的数据处理与计量方法,发现了词频分析法在运用中存在的问题,在此基础上,对词频分析法的未来发展进行了展望,提出词频分析法的运用改进措施。

[关键词] 词频分析法 研究进展 文献综述[中图分类号] G 350 [文献标识码] A [文章编号] 1003-2797(2011)02-0095-04[Abstract] Word frequency analysis can be employed to discover the development of science res earch.This arti cle,on the basis of analyzing the 112papers on word frequency analys i s study issued in correlati ve Chinese periodicals,di scovers i ts mainly suppl yed subject fields and developmemt phases,discusses how to deal wi th the data in applying,findes out the exis-t ing problems in applying;and puts forward the countm easures to improve the m ethod i n applying.[Key words] Word frequency analysis;R esearch development;Literature review1 引言词是文献中承载学术概念的最小单位。

基于中文社会科学引文索引的中国情报学知识图谱分析

基于中文社会科学引文索引的中国情报学知识图谱分析

情报学报 ISSN1000-0135第31卷第5期470-478 2012年5月J O U R N A LO FT H EC H I N ASO C I E T YF O RSC I E N T I F I CA N DT E C H N I C A LI N F O R M A T I O N I SSN1000-0135V o I .31 N o .5 470-478M a y 2012do i Z 10.3772/j .i s s n.1000-0135.2012.05.002收稿日期Z 2011年7月19日作者简介Z 马诲群 男 1964年生 毕业于武汉大学信息管理学院 现任黑龙江大学信息管理学院院长 黑龙江大学信息资源管理研究中心研究员 博士 教授 博士生导师 主要研究方向Z 信息资源管理\信息政策与法律研究O 吕红 男 1987年生 黑龙江大学信息管理学院情报学专业在读硕士研究生 主要研究方向Z 网络信息资源管理与评价\信息政策与法律研究O E-m a i I Z I v ho ng c n@163.c o m O 1) 基金项目Z 国家社科基金项目(11B T O 028)\黑龙江省自然科学基金项目(G 201010)O基于中文社会科学引文索引的中国情报学知识图谱分析1)-./1 0 12(1.黑龙江大学信息资源管理研究中心 哈尔滨 150080;2.黑龙江大学信息管理学院 哈尔滨 150080)摘要 以来自中文社会科学引文索引数据库的8290篇中国情报学文献为研究对象 利用信息可视化工具C i t e Spa c e 1软件对相关引文数据和主题词数据进行分析和处理 以绘制知识图谱的方式分析了中国情报学的研究主体\知识基础\研究热点与研究前沿O 研究结论Z 首先 分析得出中国情报学领域内的26位高发文作者\26位高被引作者以及主要研究机构;其次 研究发现中国情报学研究的知识基础集合由7篇对中国情报学有重大影响的早期奠基性文献\18篇高频被引文献\10篇文献中心性大于或等于0.1的高中心性关键文献三个层面组成;再次 从高频关键词来看 中国情报学有竞争情报\信息检索等研究热点 从关键词节点中心性大于或等于0.1的高中心性关键词来看 有用户模型\个性化服务等研究热点及相关前沿领域O 关键词 情报学 知识图谱 可视化分析 研究前沿 Ci t e Spa c e 1K n ow l e d ge map p i n g A n al ys i s of l n f or m at i ons c i e n c e i nc h i n aB as e donc h i n e s e s oc i al s c i e n c e c i t at i onl n d e xM a H a i gun 1a nd L v H o ng2(1.R e s e ar c h C e nt e r o f l nf o r m at i o n R e s o ur c e s l anage m e nt H e i l o ngj i ang U ni u e r s i t y H ar b i n 150080;2.sc ho o l o f l nf o r m at i o n l anage m e nt H e i l o ngj i ang U ni u e r s i t y H ar b i n 150080)A b s t r ac tB a s e d o n 8290C hi ne s er e s e a r c h pa pe r si n I nf o r m a t i o n Sc i e nc ea c c o r di ngt ot heC hi ne s eSo c i a I Sc i e nc eC i t a t i o n I nde x t hi spa pe rus e si nf o r m a t i o n v i s ua I i z a t i o n t o o Io fC i t e Spa c e 1t oa na I y z et he i rc i t a t i o n da t a a ut ho r s 'kno w I e dg eba s e ho t do m a i ns a nd r e s e a r c h f r o nt s .T hef o I I o w i ngc o nc I us i o ns a r eg i v e n byt hi s s t udy Z F i r s t o f a I I w ec a n a na I y s i s o ut t he 26hi g h-y i e I d a ut ho r s 26hi g hI y c i t e d a ut ho r s a nd t he m a i n r e s e a r c h i ns t i t ut i o ns i n t he f i e I d o f i nf o r m a t i o n s c i e nc e i n C hi na f r o mt he pe r s pe c t i v e o f r e s e a r c h s ubj e c t s .Se c o nd t he kno w I e dg e ba s e c o I I e c t i o n o f i nf o r m a t i o n r e s e a r c h i n C hi nai nc I ude s t hr e ea r e a s Z 7f o unda t i o ns o f e a r I yI i t e r a t ur e s w hi c h ha v eas i g ni f i c a nt i m pa c t o n i nf o r m a t i o n s c i e nc e 18hi g h f r e gue nc y o f c i t e d I i t e r a t ur e s 10hi g h c e nt r a I i t y o f ke y I i t e r a t ur e s w i t h e a c h c e nt r a I i t yi s I a r g e r t ha n o r e gua I t o 0.1.F i na I I y j udg i ng f r o m t he hi g h f r e gue nc y ke y w o r ds t he r e s e a r c he s o f i nf o r m a t i o n s c i e nc e i n C hi na ha s s o m e r e s e a r c h ho t do m a i ns s uc h a s c o m pe t i t i v e i nt e I I i g e nc e i nf o r m a t i o n r e t r i e v a I a nd s oo n ;j udg i ngf r o m t hehi g h c e nt r a I i t yke yw o r ds i n w hi c h e a c h c e nt r a I i t y i s g r e a t e r t ha n o r e gua I t o 0.1 t her e s e a r c h ho t do m a i ns a r es uc h a s us e r m o de I i ng pe r s o na I i z e d s e r v i c e a nd s o o n.K e yw or d s i nf o r m a t i o n s c i e nc e kno w I e dg e m a p v i s ua I i z a t i o n a na I y s i s r e s e a r c h f r o nt s C i t e Spa c e 1-074-==================================================万方数据基于中文社会科学引文索引的中国情报学知识图谱分析1 引言情报学是20世纪40年代中期为克服大科学时代的情报危机而发展起来的新兴学科其基本目标和任务是提供知识信息组织的理论方法并将知识和信息组织有序化以用户认为方便的形式提供有效利用1发源于图书馆学和文献学的情报学是研究有效地运用信息知识和情报的规律性的一门科学2通过对学科的回顾与展望以及对研究前沿热点的追踪不仅有利于深入揭示学科发展的轨迹特征和规律还有助于学者更好地把握本学科的研究动态和发展趋势3近年来国际上新兴的科学知识图谱研究是以科学学为研究范式以引文分析方法和信息可视化技术为基础涉及数学信息科学认知科学和计算机科学诸学科交叉的领域是科学计量学和信息计量学的新发展4本文利用可视化技术对中国情报学近十年中文社会科学引文索引来源文献进行分析以期对中国情报学的发展脉络和演化进程有一个较为整体全面的认识和把握2 数据来源与研究工具中文社会科学引文索引以下简称C SSC I的其来源期刊具有权威性和代表性5本研究数据来源于C SSC I检索表达式L Y01L Y02L Y03L Y04L Y05L Y06L Y07L Y08L Y09L Y10X K=图书馆情报与文献学^X W=120502$文献检索所选数据库为2001~2010年来源数据库学科类别选择图书馆情报与文献学命中8290篇文献检索时间为2011年6月26日本文采用的研究工具是用来分析和可视共引网络的信息可视化软件C i t e Spa c e C i t e Spa c e可用于探测和分析学科研究前沿的变化趋势为知识领域动态演进的可视化研究提供了新的平台它能够在绘制的知识图谱上显示一个学科在一定时期中形成若干研究前沿领域的演进历程6C i t e Spa c e最新版本C i t e Spa c e1下载地址为ht t p//c I us t e r.i s c ho o I.dr e x e I.e du/~c c he n/c i t e s pa c e/c ur r e nt/c i t e s pa c e.j nI p73 中国情报学的研究主体分析在C i t e Spa c e1软件界面将时区跨度分割设为2001~2010年单个时间分区为1年主题聚类词来源为标题摘要系索词与标识符阈值选择各时区前30个高被引或高频现节点选择最小生成树算法和路径网络简化算法可视图显示为静态聚类视图和合并网络视图最小生成树是指所有生成树中根据各节点之间的距离建立不同的连通网络最后选择的总线路距离最短的连通网络Sa m o y I e nko 等用最小生成树算法对1994~2001年度SC I期刊之间的引用数据进行分析成功绘制了基于最小生成树的期刊引用关系知识图谱8路径网络简化是依据一个三角不等式检验以决定是保留还是删除某个连接其标准是一个单连接路径的长度不能超过其他多个连接的路径长度93.1 合著者网络分析按上面设置的参数并选择网络节点类型为作者进行合著者网络分析合著者知识图谱反映作者间的合作情况见图1图1 中国情报学合著者共现知识图谱图1显示出几个比较大的作者聚类群如分别以邱均平王知津张玉峰郑彦宁包昌火张晓林彭靖里为中心的作者群图中节点大小同发文频次成正比节点年环代表这位作者的发文历史一个节点年轮的厚度与某个时间分区内发文数量成正比从C SSC I来源文献看我国情报学近十年发文频次较高的前26位作者有邱均平王知津张玉峰赖茂生苏新宁冷伏海朱庆华马海群周九常夏立新韩毅毕强文庭孝郑彦宁侯汉清陈峰靖继鹏陈文勇梁战平彭靖里吴晓伟陆伟焦玉英庞景安甘利人周宁图中的红色点代表近十年C SSC I来源文献发文突增率较高的作者突增率前15位作者有张晓林陈文勇程刚张新民耿奏赵星郑彦宁赵彼媛徐仕敏邹志仁张志强李江王建冬樊松林成波174万方数据情报学报第31卷第5期2012年5月3.2 被引作者网络分析按上面设置的参数选择网络节点类型为被引作者进行被引作者网络分析被引作者知识图谱反映出作者被引频次的情况见图2图2 中国情报学领域被引作者知识图谱作者被引突显率是反映被引频次增长快慢的指标作者被引突显率越高表明其被引频次增长越快图2中红色节点是指突显率较高的节点从C SSC I 来源文献看近十年中国情报学领域作者被引突显率较高的作者有孟广均邹志仁陈光柞霍国庆张滇玉贺德方乌家培卢泰宏严怕民刘军突显率分别是13.7812.8212.0310.7110.539.59 9.479.228.848.17他们是近十年作者被引频次增长较快的作者从图2表1中可以看出基于C SSC I来源文献近十年中国情报学领域作者被引频次高于73次有的26位作者他们在中国情报学领域具有重要的地位邱均平和刘植惠的中心性分别是0.15和0.10是中心性最高的两位作者在图中以中心为五角星的紫色节点显示另外中心性较高的作者还有马费成王知津严怕民庞景安王崇德吴慰慈孟广均沈固朝邹志仁包昌火梁战平马海群中心性分别是0.090.090.080.08 0.070.050.040.040.040.030.030.03他们基本上也都是高被引作者见表13.3 研究机构网络分析按上面设置的参数选择网络节点类型为研究机构运行C i t e Spa c e进行作者研究机构网络分析可将近十年中国情报学C SSC I来源文献体现的主要研究机构共现情况显示出来见图3表1 中国情报学被引作者网络关键节点被引频次前26位列表排名序号作者被引频次作者149325333942673949536284邱均平23451361633315657454642包昌火331713172916352447474643马费成4234712109233238293638王知津51901927271527162612147严怕民6162201922151771992311赖茂生7148241024152015165712王崇德8147910192519171771113张晓林9139210911211126132511梁战平1013645314171714271817苏新宁111351314171313149121515胡昌平12125159222416910686张滇玉1310200212131115131521陈峰1496724881012101520彭靖里15861615168595255孟广均1686671018978975焦玉英17861339817775710缨其浩1885125561410151116庞景安198403558141291414秦铁辉2081121211111098152岳剑波21805153491841813沈固朝22781115127867354卢泰宏2377511391497784吴慰慈24761011856812493刘植惠2575697812107853马海群2673735105788119谢新洲注作者被引频次列表中括号里面的数字依次代表各作者在2001年2002年2010年各个年度的被引频次274万方数据基于中文社会科学引文索引的中国情报学知识图谱分析图3 中国情报学主要研究机构共现知识图谱图3中每一个节点代表一个研究机构节点越大代表该研究机构发文频次越高从C SSC I来源文献来看近十年我国情报学的主要研究机构有武汉大学信息管理学院以及武汉大学信息资源研究中心南京大学信息管理系中国科学技术信息研究所北京大学信息管理系中国科学院文献情报中心吉林大学管理学院华中师范大学信息管理系等机构突显率是反映机构发文量增长快慢的指标机构突显率越高表明其发文量增长越快在图3中以红色突显点的形式出现机构突显率较高的前三位有中国科学院国家科学图书馆南开大学国际商学院中山大学信息管理系机构突显率分别是17.4117.0916.674 中国情报学研究的知识基础分析知识基础是一个有利于进一步指明研究前沿本质的概念它可由共引聚类来表示随着不断降低共引聚类阈值共引聚类中的文章会不断增多从而相应的知识基础也逐渐增大并且知识基础在相当长的一段时间内会保持非常稳定10通过绘制文献共被引网络知识图谱对被引文献进行时间被引频次和中心性的相关分析可分别发现早期奠基性文献高频被引文献高中心性文献这三类文献是情报学的知识基础构建中国情报学的研究脉络和研究基础.1 早期经典文献设置时区分割为2001~2010年单个时间分区为1年主题聚类词来源选择为标题摘要系索词与标识符网络节点类型选择被引参考文献设定调整聚类节点与研究等关系连线的阈值调谐C C C C C V前中后阈值均为4430其中C为文献被引频次C C为两篇文献的共引频次C C V为文献的共引系数选择路径搜索算法和路径网络简化算法探索关键路径的路径算法最初应用于作者共引分析后被应用于一般的网络共引分析它用一种较最小生成树算法更复杂的连接删除算法经过模型运算剪切网络中大部分连接只保留最重要连接同时所有节点保持不动最大程度地简化网络得到一个最小值网络11~13按上述参数运行C i t e Spa c e再选择时间线视图绘制早期奠基性文献时间序列知识图谱见图4图中每个节点代表一篇文献节点越大表示该文献被引频次越高每个节点圆圈显示的不同颜色年环表明该节点文献在不同年份的引文时间序列节点颜色年环的厚度与相应年份的引文数量成正比图对中国情报学有重犬影响的早期经典奠基性文献时间序列知识图谱文献时间序列知识图谱中越靠近左边的节点出现时间越早图4显示第一篇对中国情报学有重大影响的奠基性文献是M a r k S.G r a no v e t t e r1973年在A m e r i c an o ur nal o f so c i o l o gy上发表的st r e ngt h o f W e aI T i e s该文提出了关系强度理论14包昌火2003年在情报学报发表的人际网络分析和华夏出版社出版的竞争对手分析与其联系紧密第二篇对中国情报学有重大影响的奠基性文献是严怕民1983年出版的情报学概论这是我国第一部情报学专著15该文献与张新华1992年的情报学理论流派研究纲要严怕民1996年的现代情报学理论和马费成1996年在情报学报发表的情报学的进展与深化有紧密联系对中国情报学的学科发展和理论建设具有重大作用第三篇对中国情报学有重大影响的奠基性文献是D o n R. Sw a ns o n1986年在Li b r ar y0uar t e r l y上发表的U ndi s c o u e r e d p ub l i c I no w l e dge此文为非相关文献分析研究奠定了基础16第四篇对中国情报学有374万方数据情报学报第31卷第5期2012年5月重大影响的奠基性文献是邱均平1988年出版的<文献计量学>,全书阐述了文献计量学的基本定律~理论基础及主要的定量分析方法[17]0第五篇对中国情报学有重大影响的奠基性文献是1990年We s I e y M.C o he n在'A dm i ni s t r at i u e sc i e nc e0uar t e r l y"发表的'A b s o r p t i u eC ap ac i t y:A N e w P e r s p e c t i u eo n Le ar ni ng and l nno u at i o n",该文为知识管理研究提供了理论支持[18]0第六篇对中国情报学有重大影响的奠基性文献是康耀红1990年出版的<现代情报检索理论>,该文献为我国信息检索理论发展做出了重要贡献[19]0第七篇对中国情报学有重大影响的奠基性文献是包昌火1990年出版的<情报研究方法论>,该书为情报研究方法论的发展做出了重要贡献,是中国情报学方法研究的奠基文献[20]0文献被引半衰期是衡量文献老化速度的指标,文献被引半衰期越长,其老化速度越慢,文献影响力更深远,同一文献被引半衰期在不同年度是不同的,通常取其平均值[21]0这七篇早期奠基性文献的文献被引半衰期都较长,分别是33~18~23~13~17~14~16,进一步证明这七篇文献对我国情报学相应研究领域起着重要的奠基性作用0.2 高被引文献调整<C,C C,C C V>前中后的阈值均为<3,3, 30>,选择最小生成树算法,生成c I us t e r v i e w视图,在图谱可视化窗格中将节点标签选择为按被引频次显示,见图50在图5中,标号为1~4~9和13的文献推动了中国情报学的理论研究和学科发展;标号为2~5~8和11的文献是我国文献计量学和信息计量学领域重要的基础性文献,为中国'三计学"的发展打下坚实基础;标号为3~6~10和15的文献是中国情报学竞争情报领域的重要文献,为竞争情报在中国的发展做出了重要贡献;标号为7和18的文献是有关社会网络分析的重要文献;标号为16和17的文献是知识服务方面的重要文献;标号为12和14的文献分别是情报检索和信息资源管理研究领域的重要文献0.3 高中心性文献节点中卜性是用来进行网络节点中卜性测度的指标,它指网络中经过某点并连接两点的最短路径占这两点之间的最短路径线总数之比0在图谱中,可很容易看到具有较高中间中卜性的节点0中卜性测量为发现学科演进网络中的支点提供了依据[22]0在C i t e Spa c e中,中卜性高的关键点<C e nt r a I i t y>= 0.1>通过计算后在图谱中以紫色显示0在图谱可视化窗格中,将4.2生成的知识图谱<图5>的节点标签选择为按中卜性显示,见图6图5中国情报学高被引文献知识图谱图6 中国情报学高中心性被引关键节点文献知识图谱从图6可知,中国情报学高中卜性节点有10个,并分别连接着不同的研究网络群体0中卜性第一的是2001年邱均平在<情报理论与实践>发表的<网络信息计量学及其应用研究>,中卜性为0.250这是中国网络信息计量学研究领域的关键文献,为国内该领域的研究指明了方向[23]0排在第二的是1992年张新华出版的<情报学理论流派研究纲要>,中卜性为0.190该书为我国情报学理论研究领域的关键文献[24]0排在第三的是2006年邱均平在<情报学报>发表的<搜索引擎用于测定网络影响因子时的一致性比较及原因分析>,中卜性为0.18,这是国内有关网络影响因子测度方面的关键文献0该文用嫡值法和非参数假设检验法比较测定G o o g I e~ A I I t he w e b及A I t a v i s t a检索结果的一致性,并提出适用测定网络影响因子的搜索引擎应满足的条件[25]0排在第四的是2000年赖茂生在<图书情报知识>上-474-万方数据基于中文社会科学引文索引的中国情报学知识图谱分析发表的<情报学的发展观>,中心性为0.18O这篇文章对中国情报学的学科建设及其发展起着关键作用O该文分析了情报学的诞生背景,探讨了情报学的内容结构,论述了情报学与相关学科的关系及其发展前景[26]O排在第五的是2000年邱均平在<图书情报工作>发表的<论知识管理与竞争情报>,中心性为0.16,这是连接中国知识管理和竞争情报研究的知识拐点O该文提出狭义知识管理和广义知识管理的概念,并从知识管理和竞争情报的概念入手,着重讨论了两者的关系[27]O排在第六的是1996年马费成在<情报学报>发表的<情报学的进展与深化>,中心性为0.15,该文是中国情报学学科建设及其发展的又一个重要知识拐点O从情报学产生的背景出发,讨论情报学的目标与基本任务,回顾情报学的发展历程及主要成果,并提出任何扩大情报学的对象和范围~偏离基本任务和目标的倾向都不利于情报学的学科建设,最后指出情报学深化与突破过程中需要解决的关键问题[28]O排在第七的是侯汉清等于2004年翻译E ug e ne G a r f i e I d的<引文索引法的理论及应用>一书,中心性为0.13,<引文索引法的理论及应用>是美国著名情报学家E ug e ne G a r f i e I d的经典之作,在引文索引研究中起着重要作用O该书对引文索引法的概念和历史进行了阐述,并分析了引文索引的设计与生产及其作为检索工具的重要意义和应用[29]O排在第八的是2003年包昌火在<情报学报>发表的<竞争对手分析论纲>,中心性为0.12,该文为竞争对手分析技术的研究和应用提供了研究思路,是国内该领域的重要知识拐点O 文中试图建构具有方法论意义的竞争对手分析论纲,侧重论述了三维分析法~竞争对手分析流程和竞争对手分析软件[30]O排在第九的是2000年李蕾在<情报学报>发表的<基于语义网络的概念检索研究与实现>,中心性为0.10,这是国内语义网在检索研究领域的重要文献O该文介绍了一种基于语义网络的中文搜索引擎概念检索模型,并应用此模型初步实现了特定领域的概念检索[31]O排在第十的是1996年包昌火在<情报理论与实践>发表的<I nt e I I i g e nc e和我国的情报学研究>,中心性为0.10,这是中国情报学理论建设方法的一篇关键文献O该文指出,随着国内外对I nt e I I i g e nc e~ I nt e I I i g e nc e Sc i e nc e概念与活动的深入研究以及竞争情报的出现与发展,将会推动情报学理论框架的重构和完善,使情报学真正成为指导我国信息工作实践和发展的理论基础,使情报学研究出现新局面[32]O中国情报学10篇高中心性关键节点文献中,从作者来看,邱均平占3篇,包昌火占2篇,进一步印证了他们在中国情报学领域中的重要地位;从期刊来看,<情报学报>占4篇,<情报理论与实践>占2篇,从侧面说明了这两种期刊在中国情报学领域的重要性和权威度O5 中国情报学研究热点与前沿的知识图谱分析5.1 中国情报学研究热点的知识图谱关键词是作者对文献核心的精炼,在学科领域里高频出现的关键词常被视为热点研究领域[33]O 另外,中心性高的关键词易成为关键词网络图谱演进的拐点,也在一定程度上代表学科的研究热点O 因此,我国情报学研究热点是指高频关键词和高中心性关键词,可借助C i t e Spa c e可视化软件绘制关键词聚类图,来确定中国情报学的研究热点领域O 在C i t e Spa c e中,选择关键词作为网络节点类型,设置<C,C C,C C V>前中后阈值分别为<3,3, 25>~<3,3,30>和<3,3,35>,选择最小生成树算法,分别绘制中国情报学高频关键词聚类图和高中心性关键词聚类图,这两幅图可视为中国情报学研究热点图谱,见图7~图8O图7 中国情报学研究热点视图高频关键词图8 中国情报学研究热点视图 高中心性关键词574万方数据情报学报第31卷第5期2012年5月图7图8中每个节点代表一个关键词节点大小表示关键词出现的频次高低节点间连线表示关键词间的共现关系紫色光圈节点是高中心性点C e nt r a I i t y>=0.1该类节点与其他节点间存在紧密联系是连接不同研究领域的关键节点从高频次关键词的角度分析整个视图可以分成十一个较大的研究主题分别是竞争情报信息检索情报学理论研究知识管理搜索引擎信息服务文献计量学本体数据挖掘与数据库信息资源管理信息管理与信息组织这些研究主题是中国情报学的研究热点领域从高中心性关键词的角度分析可看出中国情报学研究的热点领域有信息计量学个性化信息服务用户与系统模型信息过滤另外图8显示出一条由高中心性关键词构成的演化路径知识服务个性化信息服务系统模型信息过滤用户模型个性化服务a g e R a nk链接分析网络信息计量学信息计量学SC I这条路径打通了图谱的上下两个部分这十个高中心性节点是中国情报学十分重要的知识拐点5.2 中国情报学研究前沿的知识图谱普赖斯注意到在科学引文网络中越是频繁被引用的文献越可能是新近发表的文献即科学家似乎倾向于引用最新发表的文献并将其称为即时因子他提出了用来描述学科研究领域过渡本质的概念研究前沿某个领域的研究前沿由科学家积极引用的文献来体现34Sm a I I和G r i f f i t h将共引聚类视为研究前沿35G a r f i e I d将共引聚类与引文的总和定义为研究前沿36陈超美认为研究前沿是一组突现的动态概念和潜在的研究问题是正在兴起的理论趋势和新主题的涌现出现频次增长率快速增加的专业术语将被确定为研究前沿术语37研究学科领域研究前沿对该学科领域的研究者有重要意义使研究者及时准确地把握研究前沿和学科研究的最新动态预测学科发展方向和需要进一步研究的问题38探测研究前沿可用C i t e Spa c e1强调研究前沿和其知识基础间顺时模式的时区视图功能来获取一组最新热点研究文献构成的研究前沿39时区视图由一系列表示时区的条形区域组成时区按时间顺序从左向右排列因而研究前沿指向知识基础视图可显示学科最近几年的发展脉络以及研究前沿与知识基础间千丝万缕的联系40因此研究前沿是指时区视图中位于图谱右上角的出现频次增长率快速增加的文献节点在C i t e Spa c e中网络节点类型选择被引参考文献设置C C C C C V前中后阈值均为3330选择a t hf i nde r算法绘制中国情报学研究前沿文献的时区视图见图9图中国情报学研究前沿文献的时区视图图谱右上角显示的是由一组最新热点研究文献构成的研究前沿选取每年度被引频次前3位的文献进行显示我们选择图9右上角较近的年份2005~2009年每年度被引频次前3位的文献作为构成中国情报学研究前沿节点通过分析发现中国情报学研究前沿文献节点主要涉及以下研究内容H指数及期刊评价竞争情报共被引分析与文献计量学情报学理论人际网络知识管理研究前沿关键词是一组突现的动态概念和潜在的研究问题可利用C i t e Spa c e软件绘制前沿关键词共现网络图谱来探测某领域的研究前沿演化趋势41C i t e Spa c e软件中提供膨胀词bur s t de t e c t i o n 探测技术和算法功能通过考察词频的时间分布将其中频次变化率高的词bur s t t e r m从大量的主题词中探测出来依靠词频的变动趋势而不仅仅是频次的高低来确定前沿领域和发展趋势42在C i t e Spa c e中选择术语类型为膨胀词网络节点类型为关键词设置C C C C C V前中后阈值分别为33253330和3335选择最小生成树算法绘制中国情报学研究前沿关键词的时区视图见图10图10显示从C SSC I来源文献来看近十年中国情报学研究大致经历了三个时期第一2001~ 2004年的繁荣期大量高频关键词聚集在这个时段说明此时间段是中国情报学研究的繁荣时期竞争情报信息检索情报学知识管理信息服务文献计量学引文分析数据挖掘本体数据库信674万方数据。

我国情报类核心期刊高被引论文分析

我国情报类核心期刊高被引论文分析
Ke y wo r d s :i n f o ma r t i o n s c i e n c e ;h i g h l y — c i t e d p a p e s; r c i t a t i o n a n ly a s i s ; c i t a t i o n f r e q u e n c y ; c o r e p e i r o d i c l a
y e a r , a u t h o r a n d a u t h o r a f f i l i a t i o n , S O a s t o p r o v i d e r e f e r e n c e t o a u t h o r ’ S c o n t r i b u t i o n a n d p e r i o d i c a l e d i t o r ’ S s u b j e c 卜s e l e c t i n g .
研 究 热点及 研究 走 势 ,为作 者投 稿 和期 刊编 辑选 题
提供 一定 的视 角 。
1 数 据选 取与 处理 方法
本 文依 据 2 0 0 8年 版 中文 核 心期 刊遴 选 了情 报 类核 心期 刊 9种 ,选取 中 国学术 期 刊 网络 出版 总库
摘 要 : 以 中 国知 网 的 中 国 学术 文 献 网络 出版 总 库 为数 据 源 , 统计 分 析 8种 情 报 类 核 心期 刊 2 0 0 0 — 2 0 1 1年 的前 3 0篇 高 被 弓
论 文, 分 析 高被 引论 文 的 被 引 频 次 、 发表年份 、 作者 、 作 者 机 构 等信 息 , 为 作 者投 稿 和期 刊 编 辑 选 题 提供 参 考 。
An a l y s i s o n Hi g h l y - Ci t e d P a p e r s i n Co r e Pe r i o d i c a l s o f I n f o r ma t i o n S c i e n c e i n Ch i n a

近十年文献计量指标关键词研究进展

近十年文献计量指标关键词研究进展

近十年文献计量指标关键词研究进展摘要:关键词是表达文献主题概念的自然语言词汇,有效利用各种分析方法对关键词进行处理,并在此基础上对关键词进行研究分析,能够揭示某一学科或领域研究成果的总体内容特征,研究内容之间的内在联系和学术研究的发展脉络与发展方向等。

利用中国期刊网、维普数据库、万方数据库及EBSCO等数据库,收集近十年基于文献计量指标关键词研究的论文,对近十年的研究成果进行深入分析,从关键词研究分析方法、关键词的选取和基于关键词分析的意义三个方面进行综述,以期为今后基于文献计量指标关键词的研究提供一定的参考。

关键词:关键词;共词分析法;内容分析法;文献计量分析A Review of Studies on Key Words,One of the BibliometricIndicators, in Recent DecadeAbstract :The key words ,belonging to the vocabulary of natural language express the conception of the literature topics.To research and analyse the key words which has been processed by various analytical methods ,can reveal the characteristics of the overall content of the research in one subject or field ,the inner link of the research and the the course of development as well as the trend of academic research.This article summarizes the research briefs on the key words from the methods of researching and analysing the key words ,the selection of the key words and the signification of the study on the key words, based on the collection of research about the key words in recent decade from the databases such as CNKI,VIP,WANFANG and EBSCO ,hoping for providing some references for the further study.Key words:Key words;co-word analysis;Content Analysis;Bibliometric Analysis关键词是表达文献主题概念的自然语言词汇,一个学术研究领域较大时,域内大量学术研究成果的关键词的集合,可以揭示研究成果的总体内容特征,研究内容之间的内在联系和学术研究的发展脉络与发展方向等。

面向搜索引擎的关键词优化统计分析——以我国情报学核心网站为例

面向搜索引擎的关键词优化统计分析——以我国情报学核心网站为例

s c i e n c e ,t h e p a p e r m a k e s s t a t i s t i c a l a n a l y s i s o f k e y w o r d s o n s e r a c h e n g i n e o p t i mi z a t i o n .B a s e d o n t h e n u mb e r o f k e y wo r d p h r a s e s ,k e y —
第3 2卷
第1 期




Vo 1 . 3 2 No . 1
2 0 1 3年 1月
J OURNAL OF I NT EL LI GENCE
J a n . 2 0 1 3
面 向搜 索 引擎 的关 键 词 优 化 统 计 分 析
— —
以我 国情报 学核 心 网站 为例
中的排 名 。
关键词
情报 学 核心 网站
G 3 5 0 . 7
搜 索引擎
优化策略

关键词优化
统计 分析
1 0 0 2 — 1 9 6 5 ( 2 0 1 2 ) 0 1 — 0 0 7 7 — 0 4
中图分 类号
文献标识码
文章编号
S t a t i s t i c a l An a l y s i s o f Ke y wo r d s Op t i mi z a t i o n o n S e a r c h En g i n e :A Ca s e S t u d y i n t h e Ch i n e s e Co r e We b s i t e s i n I n f o r ma t i o n S c i e n c e
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 概 述
进行统计 , 通过词频分析描述该学科学术研究状 况 , 进而揭示情报学的研究热点和发展趋势 。
关键词是表达文献主题概念的自然语言词汇 。 一个学术研究领域较长时域内的大量学术研究成果 的关键词的集合 , 可以揭示研究成果的总体内容特 征 、研究内容之间的内在联系 、学术研究的发展脉 络与发展方向等 。文献计量学是以文献或文献的某 些特征的数量为基础 , 来论述与预测科学技术现象 与规律的情报科学分支 。关键词分析则是该学科的 重要方法 , 是一种将文献中诸多因子联系起来的引 证分析方法 , 它科学评价文献 、文献作者和文献的 学术水平 , 揭示学科热点和发展趋势[1] 。
位 , 这与大多研究者的研究对象多针对国内情报学 词中专业性很强的关键词有 “Internet”、“信息检
问题有关 , 没有特别的学科特征 。在通过关键词词 索”、“统计分析”、“文献计量学”、“文献检索”、
频分析情报学学科发展状况的过程中只分析具有很 “数据库”等 。
强情报学专业特性的关键词 , 不考虑没有特别专业
2002 年 (871 篇)
关键词 次数 词频
Internet
66 7158
情报学
44 5105
信息检索 41 4171
统计分析 40 4159
文献计量学 40 4159
中 国 38 4136
文献检索 36 4113
信息服务 36 4113
数据库 34 3190
检索方法 33 3179
“中国”词频一直在前 10 位 , 且有 7 年居前 4 “文献计量学”、“文献检索”等 ; 2002 年高频关键
收稿日期 : 2004 - 02 - 10
1 期 中国情报学期刊论文关键词词频分析
69
表 1 各年度高词频关键词词频表
1993 年 (1189 篇)
关键词 次数 词频
情报检索 196 16148 情报学 141 11186 情报工作 137 11152 情报服务 90 7157 数据库 81 6181 中 国 76 6139 情报研究 62 5121 企 业 60 5105 信息产业 43 3162 联机检索 37 3111
3 高频关键词论文主题分类分析
检索”等 ; 2001 年高频关键词中专业性很强的关
分类法是揭示 、组织情报信息的一种工具 。遵
键词有 “Internet”、“信息检索”、“数据库”、“引文 照分类法给出的分类号是通过学科知识的分类体系
分析”、“统计分析”、“情报检索”、“搜索引擎”、 来揭示文献的主题内容的 , 是反映科技文献内容的
70
情 报 科 学 23卷
第23卷第1期 2005 年 1月
情 报 科 学
Vol1 23 ,No1 1 January ,2005
中国情报学期刊论文关键词词频分析
李文兰 , 杨祖国
(天津大学图书馆 , 天津 300072)
摘 要 : 本文以重庆维普公司的《中文科技期刊数据库》为统计源 , 运用文献计量学的词频分析 方法 , 对情报学期刊论文的关键词进行统计分析 , 分析发现网络技术给情报学检索技术的发展带 来了技术支持 , 实现检索的机械化 、自动化是情报学的研究热点 。新的检索方式和方法的成熟为 情报定量研究分析创造了成熟条件 , 引文分析 、统计分析等文献计量研究趋于活跃 。 关键词 : 情报学 ; 期刊 ; 论文 ; 关键词 ; 频词分析法 ; 文献计量学 中图分类号 : G350 G25713 文献标识码 : A 文章编号 : 100727634 (2005) 0120068203
对关键词统计结果进行分析发现 , 1993~1996 退居到当年的第七 , 而 “信息检索”、“文献检索”
年间 , 前 10 位高频关键词中专业性很强的关键词 进入前 10 位高频关键词 , 这一年开始 “Internet”
只有 “情报检索”和 “数据库”两个词语 ; 1997 变成词频最高的关键词 。2000 年以后 “情报检索”
10104 7197 5135 4169 4126 4115 3193 3193 3182 3160
1997 (年 (1118 篇) 关键词 次数 词频
情报检索 281 25113 中 国 159 14122 数 据 库 146 13106 文献计量学 78 6198 情 报 学 76 6180 教 学 69 6117 计算机应用 64 5172 情报工作 59 5128 信息服务 53 4174 高 校 46 4111
国内一些研究者已经开始尝试通过分析主题 词 、篇名词或关键词的词频 , 描述某学科领域的研 究状况[1 - 5] 。本文以重庆维普公司的《中文科技期 刊数据库》为统计源 , 运用文献计量学的词频分析 方法 , 对 1993~2002 年情报学期刊论文的关键词
统计时去除了研究 、发展 、开 发 、利用 、应用 、开发利用 、发展趋势等非实质性词 语 。为了消除不同年份论文篇数波动造成的影响 , 以某年度每个关键词出现的次数占当年文章总篇数 的百分比作为该年度该关键词的词频值[5] 。1993~ 2002 年间各年度词频最高的十个关键词见表 1 。
2001 篇 (916 篇)
关键词 次数 词频 关键词 次数 词频
Internet 180 12168 Internet 92 信息检索 118 8132 信息检索 73 数据库 87 6113 中 国 49 中 国 74 5121 数据库 43 检 索 60 4123 引文分析 39 搜索引擎 54 3181 统计分析 38 检索系统 51 3159 情报检索 36 引文分析 47 3131 搜索引擎 36 文献检索 45 3117 文献计量学 35 检索工具 43 3103 文献检索 33
对关键词统计结果进行分析发现 , 1993 年除 了 “情报检索”外 , 其它高频词也大多与 “情报” 有关 。随着 “信息”概念引入情报学领域 , 以后各 年涉及 “信息”一词的概念的数目有了很大增长 , 1999 年以后 “信息检索”的词频超过了 “情报检 索”。“情报”、“信息”是情报学领域的泛指词汇 , 其高频关键词中多与这两词相关是必然的 。
年高频关键词中专业性很强的关键词有 “情报检 退出前 10 位高频关键词 , “信息检索”成为紧跟
索”、“数据库”、“文献计量学”、“计算机应用” “Internet”后面的高频关键词 。1999~2002 年 “In2
等 ; 1998 年高频关键词中专业性很强的关键词有 ternet”、“信息检索”成了情报学最活跃的研究点 。
1994 年 (925 篇)
关键词 次数 词频
情报检索 165 17184 情报工作 116 12154 数据库 83 8197 情报学 66 7114 企 业 64 6192 中 国 64 6192 信息服务 57 6116 情报研究 48 5119 信息工作 47 5108 情报服务 45 4186
2000 年 (1419 篇)
情报检索 271 22145 中 国 141 11168 数据库 129 10169 信息服务 107 8186 情报学 94 7179 情报工作 91 7154 教 学 70 5180 信息工作 59 4189 企 业 56 4164 信息资源 55 4156
加 , 但词频最高的两个关键词仍是 “情报检索”和 “数据库”。1999 年高频关键词中专业性很强的关
年增加 , 标志着情报学研究主题的多样化方向 。情 报学领域将打破一哄而上研究主题单一的的传统 ,
键词有 “Internet”、“数据库”、“信息检索”、“情报 学术思想将更加活跃 。
检索”、“文献检索”等 ; 2000 年高频关键词中专 业性很强的关键词有 “Internet”、“信息检索”、“数 据库”、“检索”、“搜索引擎”、“引文分析”、“文献
1998 (943 篇)
关键词 次数 词频
情报检索 125 13126 数据库 103 10192 中 国 93 9186
Internet 75 7195 信息资源 40 4124 信息服务 37 3192 文献计量学 36 3182 信息检索 33 3150 文献检索 29 3108 检索工具 26 2176
1999 年 (1009 篇)
关键词 次数 词频
Internet 122 12109 数据库 95 9142 中 国 90 8192 信息检索 57 5165 信息服务 49 4186 信息资源 45 4146 情报检索 40 3196 检 索 39 3187 情报学 34 3137 文献检索 34 3137
“情报检索”、“数 据 库 ”、“Internet ”、“文 献 计 量
1993~2002 年词频前 10 位的关键词中最高词
学”、“信息检索”、“文献检索”等 。1997 、1998 两 频与最低词频的差距越来越小 , 1997 年以后 , 前
年高频关键词中专业性很强的关键词数量有所增 10 位高词频词中专业特性很强的关键词的数目逐
Analysis on Frequencies of Key words in Chinese Information Science Journals Papers
LI Wen - lan , YANG Zu - guo
( Library of Tianjin University , Tianjin 300072 , China) Abstract : Taking the“VIP2Chinese Scientific and Technological Journal Database”as statistical source , this paper makes an statistical analysis on keywords in information science journal papers by using words frequency analysis method. It is shown that network technology has given information retrieval supports. Automatic re2 trieval is research focus in information science field. New search methods provide good conditions for informa2 tion quantitive research. As the research topics , citation analysis and statistical analysis have active tendency. Key words : information science ; journa ; paper ; keyword ; word frequency analysis ; bibliometrics
相关文档
最新文档