近五年来国内外索引研究的进展与趋势

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2011-9-2
第9页,共39页
2.1 期刊分布情况分析
中文期刊分布情况
中国期刊全文数据库中收录的1010篇中文文献分散 在370种期刊上,平均每种期刊载文量(x)为1010/370≈ 2.23篇,标准差(s)为3.33,离散系数(Vs=s/x)为 1.45。 根据载文量多少分成的三个分区及由此得出的核心 期刊(32种)分别如表3、表4所示。
期刊名称
中国索引 计算机工程 计算机工程与应用 计算机科学 计算机应用研究 计算机应用 小型微型计算机系统 计算机研究与发展
载文量 序号
59 54 41 31 29 26 25 21 9 10 11 12 13 14 15 16
期刊名称
电脑知识与技术 微计算机信息 软件学报 计算机工程与科学 计算机学报 武汉大学学报(信息科学 版) 现代图书情报技术 华中科技大学学报(自然 科学版)
2011-9-2
第17页,共39页
2.2 作者分布情况分析 作者分布情况分析
中文作者分布情况 作者分布情况
中文数据库中的1010篇论文由2418人次作者和1921位不同作者撰 写。中文文献中,nmax为9,所以m取整数为2。1921位作者中,排名在 前44位(19211/2≈44) 的 作者发文量都大于等于3;发文共225篇,占总 论文量的22.3%,小于论文总数的一半。因此不符合普赖斯定律,中文 核心作者群也尚未形成。这里仅列举出发文量在5篇以上的前26位作者 及其发文量(表6)。 中文文献平均合作度为2418/1010≈2.39。1010篇文献中727篇由2个 以上的作者合作完成,平均合作率为727/1010≈72%。
2011-9-2 第4页,共39页
1.2 数据来源
数据来源
中文文献
数据库:中国期刊全文数据库; 数据库 检索条件:题名或关键词包含 检索条件 “索引”; 时间范围:2005年1月至2009年 时间范围 12月; 文献数量:剔除非学术文献、重 文献数量 复录入文献和无关键词文献后, 共筛选出1010篇。
2011-9-2 第3页,共39页
1.1 研究方法
内容分析法
内容分析法是一种对研究对象的内容进行深入分析,透过现象 看本质的科学方法。对文献的特定主题内容进行定性和定量剖析, 揭示该主题内容的实质,系统、客观地把握其研究动态和趋势。 关键词是指出现在文献的篇名、摘要和正文中,用以表达文献 主题概念的、有实际意义的自然语言词汇。某一学科相关文献的关 键词的分布频次与特征,能显示该学科的总体内容特征、研究内容 之间的内在联系、学术研究的发展脉络与发展方向、学术研究的重 点与热点等。 因此,我们可以将内容分析法和以关键词为基础的词频分析法、 共词分析法相结合,即基于词频统计和共词分析的内容分析法,应 用于分析界定国内外索引研究的重点领域及其发展变化趋势。
9 9 8 8 8 8 7 7 6 6 5 5 5
14 15 16 17 18 19 20 21 22 23 24 25 26
吉根林 景宁 李建中 廖巍 林坤辉 潘鹏 汤庸 王斌 吴飞 吴玲达 徐焕 杨冬青 庄越挺
5 5 5 5 5 5 5 5 5 5 5 5 5
第19页,共39页
2.2 作者分布情况分析 作者分布情况分析
载文量 序号
10 9 8 8 7 7 7 7 25 26 27 28 29 30 31 32
期刊名称
情报理论与实践 图书情报工作 计算机技术与发展 计算机与现代化 燕山大学学报 现代情报 大学图书馆学报 地理与地理信息科学
载文量
7 7 6 6 6 6 5 5
2011-9-2
第13页,共39页
2.1 百度文库刊分布情况分析
6 6 6 6 6 5 5 5 5 5
第16页,共39页
2011-9-2
2.2 作者分布情况分析
合作度与合作率两个计量指标反映了某学科领域内作者 合作智能的发挥程度,数值越高,合作智能发挥越充分。合 作度=(一定时期内相关文献)作者总人次/(一定时期内相 关文献)论文总数;合作率=(一定时期内相关文献)合作论 文数/(一定时期内相关文献)论文总数。 外文文献的平均合作度为2099/1077≈1.95。由于1077篇文 献中有1070篇由2个以上的作者合作完成,所以平均合作率为 1070/1077≈99%。
2011-9-2
第10页,共39页
2.1 期刊分布情况分析
表3 中文期刊分区表
分区 1 2 3
载文数 5~59 2~4 1
期刊数 32 100 238
论文数 330 257 238
2011-9-2
第11页,共39页
2.1 期刊分布情况分析
表4 中文核心期刊及载文量
序号
1 2 3 4 5 6 7 8
2011-9-2 第20页,共39页
2.2 作者分布情况分析 作者分布情况分析
从国内外核心作者的分析结果可以看出,国内外索引研 究都没有形成稳定的核心作者群,核心作者没有在该领域起 到足够的学科带头作用,索引领域的研究力量还是不足的。 中文文献的合作度(2.39)虽略大于外文文献的合作度 (1.95),但由于中文文献的合作率远小于外文文献的合作 率(72%<99%),且中文文献的合作作者数最多的仅为6个, 而外文文献的合作作者数最多的高达10个,因此,国外对索 引研究的合作性更强,这也是国外索引研究更为成熟化的一 种体现。
2011-9-2 第21页,共39页
2.3 研究热点分析
词频分析法是利用能够揭示或表达文献核心内容的关键 词或主题词在某一研究领域文献中出现的频次高低来确定该 领域研究热点和发展动向的文献的计量方法。利用词频分析 法和共词分析法可以探究某领域的研究热点和发展趋势。. 通过对近五年国内外研究论文的关键词统计,并进行同 义词合并以及无关词删除等处理,共获得外文关键词1187个, 中文关键词2247个,分别对它们进行词频统计,按照频次高 低排序所得的前20位高频词的统计结果分别如表7、表8所示。
中文高产作者中,前10位作者的发文量在6篇以上, 其学科背景分别为:计算机科学与技术:卢炎生、施伯 乐、郝忠孝、王国仁;情报学:侯汉清、邱均平、张琪 玉;图书馆学:王雅戈、刘国华、平保兴。可见,发文 量最多的作者主要来自计算机科学领域,为索引技术的 研究与发展做出了贡献;其次是来自情报学和图书馆学 领域的作者,他们则致力于索引理论与应用的研究。
2011-9-2
第7页,共39页
2.1 期刊分布情况分析
表1 外文期刊分区表
分区 1 2 3
载文数 18~143 5~17 1~4
期刊数 7 46 213
论文数 337 339 380
2011-9-2
第8页,共39页
2.1 期刊分布情况分析
表2 外文核心期刊及载文量
序号 1 2 3 4 5 6 7 Scientometrics Journal of the American Society for Information Science and Technology Reference Reviews Information Processing and Management Journal of the Medical Library Association (JMLA) Journal of Information Science Online Information Review 期刊名称 载文量 143 75 34 27 21 19 18
近五年来国内外索引研究的 进展与趋势
邱均平
主任、教授、博导
中国科学评价研究中心 武汉大学信息管理学院
2011-9-2
报告内容
1
研究方法与数据来源
2 3
数据分析
国内外研究进展与趋势比较
2011-9-2
第2页,共39页
1 研究方法与数据来源
1.1 研究方法
文献计量法
文献计量学为我们提供了描述与预测科学技术现象 和规律的相关理论方法。 文献计量法是运用数学和统计学等方法,定量地分 析一切知识载体的交叉科学,它是集数学、统计学、文 献学为一体,注重量化的综合性的实用的知识体系。
在第一分区即核心区中,外文期刊有7种,每刊载文数均在18篇 以上,最多的达到143篇;而在同一区的中文期刊有32种,且以计算机 领域的期刊为主,每刊载文数在5篇以上,最多的仅59篇。由此可见, 国外刊载索引领域论文的期刊更集中。国内索引研究分析论文在期刊 中的分散规律相对更加明显,刊载该领域论文的期刊更广泛,但这些 期刊的主题主要集中在计算机技术领域。 此外,外文期刊刊载该领域论文的标准差为10.58篇,离散系数 为2.61,而该领域中文期刊的标准差为3.33篇,离散系数为1.45。由于 外文期刊载文量的离散系数远大于中文期刊载文量的离散系数 (2.61 > 1. 45),所以外文期刊的载文量更不平均,载文数量差距更大(最 大载文量143篇,而最小载文量为1篇,相差142篇),中文期刊载文量 差距则相对较小。
2011-9-2
第5页,共39页
2 数据分析 数据分析
2.1 期刊分布情况分析
英国著名文献学家布拉德福最早发现文献分散规律, 并形成了有名的“布拉德福定律”。 本文依据布氏定律对国内外索引研究的相关论文在 期刊中的分布情况进行区域分析,将期刊按照相关论文 载文量的多少以渐减的顺序排序,分别将国内外刊载索 引领域研究论文的相关期刊划分成三个区。
2011-9-2
第18页,共39页
2.2 作者分布情况分析
表6 中文核心作者中的前26位及其发文量
序号 1 2 3 4 5 6 7 8 9 10 作者 发文量 序号 作者 发文量
11 12 13
2011-9-2
卢炎生 施伯乐 郝忠孝 侯汉清 王国仁 王雅戈 邱均平 张琪玉 刘国华 平保兴 蔡益朝 贺玲 胡运发
2011-9-2
第14页,共39页
2.2 作者分布情况分析
外文作者分布情况 作者分布情况
外文数据库中的1077篇索引领域论文是由2099人次作者和1711 位不同作者撰写的。 根据普赖斯定律,核心作者应完成所有论文总数的一半,核心 作者最低发文数m的值为m=0.749×nmax1/2,其中nmax是指发文量最高 的作者发表的论文数量。外文文献中,nmax为24,所以m取整数为4。 1711位作者中,发文4篇以上的作者共40人(前20位如表5所示), 接近作者总数的平方根41(17111/2≈41);发文量共248篇,占论文 总量23.0%,小于论文总数的一半。因此,国外索引领域的研究暂未 形成稳定的核心作者群。
2011-9-2
第6页,共39页
2.1 期刊分布情况分析
外文期刊分布情况
LISA中收录的1077篇外文文献分散在266种期刊上, 平均每种期刊载文量(x)为1077/266≈4.05篇,标准差 (s)为 10.58,离散系数(Vs=s/x)为2.61。 根据布氏定律,按照载文量的多少,将刊载索引研 究领域论文的相关期刊分成三个区,三个分区及由此得 出的核心期刊(7种)分别如表1、表2所示。
2011-9-2 第15页,共39页
2.2 作者分布情况分析
表5 外文核心作者的前20位及其发文量
序号 1 2 3 4 5 6 7 8 9 10 作者 发文量 序号 作者 发文量
Egghe*, L. Leydesdorff*, Loet Rousseau*, Ronald Jacso, Peter Kumar, Vijai Tsay*, Ming-Yaeh Gupta*, B. M. Kademani*, B. S. Daniel, Hans-Dieter Kennedy, Marion
外文文献
数据库: 数据库 LISA(Library and Information Science Abstracts); 检索条件:题名或关键词包含 检索条件 有“index”或“indexes”、 “indexing” ; 时间范围:2005年1月至2009年 时间范围 12月; 文献数量:经筛选后得到外文 文献数量 文献1077篇。
载文量
15 15 14 13 12 11 11 10
2011-9-2
第12页,共39页
2.1 期刊分布情况分析
续表
序号
17 18 19 20 21 22 23 24
期刊名称
计算机应用与软件 情报科学 计算机与数字工程 科技情报开发与经济 测绘科学 计算机工程与设计 图书馆理论与实践 微电子学与计算机
24 18 14 12 9 9 7 7 6 6
11 12 13 14 15 16 17 18 19 20
MacLeod*, Roddy Markpin*, T. Sagar, Anil Sombatsompop*, N. Ure, Catherine Glanzel*, Wolfgang Guan*, Jiancheng Ho*, Yuh-Shan Surwase*, Ganesh Thelwall, Mike
相关文档
最新文档