文献计量学及其在情报分析中的应用
我国竞争情报研究的文献计量学分析

21# ̄6 01- 期
学 术论坛
我 国竞 争情报研 究的文献计 量 学 分析
蒋 一平 邵 利 勤 杨 惠 明 万跃 华 ( 江 大学图 馆)I NK 收录的有 关竞争情报的论文进行统计 , 从研 究进展 、 究领域 、 研 研究深度 、 究热点等四个 研
究 水 平 和 发 展速 度 , 因此 通 过 对 发 表 年 代 的统 计 与 分 析 , 可
以较 好 地 反 映 出 竞 争情 报 研 究 的进 展 情 况 。
营 管 理 者 的智 囊 和 参 谋 。因 此 随 着 市场 经 济 的 不 断 深 入 发 展 , 争 情 报 的 作用 日益 显现 。 竞 通 过 考 究 竞 争 情 报 领 域 相 关文 献 的 特 征 可 以 反 映 出竞 争 情 报 的研 究 状 况 , 时也 能在 一 定 程 度 上 评 价 竞 争情 报 实 同 践 工 作 的情 况 。因 此 本 文 设 定 以 下条 件 进 行 检 索 : 数据 来 源 : 国知 网 ( N ) 中 C KI ; 检 索 条 件 : 键 词 =“ 争情 报 ”; 关 竞 检 索 时 间 :9 9 2 0 。 18 - 0 9 最后 检 索 得 到 27 8篇 相 关 的 论 文 。 这 些 论 文 的文 献 7 以 特征 为基 础 , 文 对 竞 争 情 报 研 究 的 研 究进 展 、 究领 域 、 本 研 研 图 1 文 献 年 度分 布 图 从 图 l 以将 文 献 的 发 表 情 况 分 为 两 个 阶 段 : 一 阶 段 可 第 为 1 8- 19 9 9 99年 , 1 时 间 里 ,9 4年 是 我 国 竞 争 情 报 这 0年 19
在 逐 年 增 加 , 是 数 量 上 还 比 较 少 , 界 对 竞 争 情 报 的 关 注 但 业
第06章.情报科学的方法论复习笔记

6.1 情报科学研究的范式6.1.1 库恩范式理论的基本观点1.库恩的范式是一个认识世界的整体性框架的价值标准,是一个集研究主体的心里特质、科学理论、研究方法等于一体的具有相对性、层次性、结构性及多方面功能的哲学范畴,其功能体现在认识识别、规范、纲领性三大方面。
2.库恩认为,科学的发展沿着“前科学——常规科学——反常——危机——科学革命——新常规科学”的模式发展着。
6.1.2 情报科学的研究范式1.机构范式是把图书情报机构视为一种社会机构的一组思想和观念,使某一群特定的公众有可能利用其文献收藏和设施。
2.信息运动范式把信息运动过程视为核心研究现象,特别关注某系统中发生的信息运动,该系统根据用户发出的信息需求对文献进行查询和检索。
3.情报科学认知观范式指情报的接受(用户)和传递(情报系统)都需要与知识结构发生作用,并以知识结构的改变和完善为目的。
4.阐释学范式确认语词、文本的真正意义,揭示其普遍规律,关心情报的使用者、社会互动与文本的社会行为。
6.2 情报科学的方法论体系6.2.1 情报科学方法论研究各种科学方法的研究原则和选择原则,特点、特征和功能,长处与局限性,应用与效果,还有情报科学方法之间的逻辑结构、相互关系,探讨并建立情报科学方法论体系;6.2.2 情报科学方法论以一般与特殊、理论与应用、历史与现实、定性与定量、个体论与整体论、实证性与评价性等相结合为研究原则6.2.3 情报科学方法论的体系结构1.哲学方法是适用于一切科学研究的最普遍的科学方法。
2.一般研究方法指各门学科或大部分学科都采用的研究方法。
3.情报科学专有研究方法包括成熟的情报计量学方法、引文分析方法,和正在发展的情报整序方法和内容分析方法。
4.情报科学方法论体系的三个层次方法之间有区别又有联系。
6.3 情报科学的一般研究方法6.3.1 横断科学方法1.数学方法是用数学语言表述事物的状态、关系和过程,并加以推导、演算和分析,以形成对问题的解释、判断和预言的方法。
文献计量学

齐普夫定律
7 / 12
布拉德福定律
的含义:信息流的序性结构经验定律,
也叫文献分散定律。 布氏定律, 是英国文献学家布拉德福于1934 年在 《 Engineering 》 杂志上发表的《 Sources of information onspecific subjects 》 上提出的描述文分散规律的经验定律。 在其专著 《 文献工作 》 中,他又一次阐述了文献分散定律。 认为‚“在数量很大的文献体中,文献按某一规律的模型分散…… ”。 科学信息很大程度上是以科技期刊的形式出现的,借助期刊这 个载体得以交流传播,科技期刊对促进科学技术发展起着举足轻重 的作用。 布拉德福定律 (Bradford’ Law of Scattering)就是描述某一学 科论文在相关期刊中的分布规律。它定量的揭示了 ,今天仍然具有不可替代的理论价值和实 际意义。
10 / 12
区域分析
布拉德福定律的区域分析:如果将科学期刊按其登 载某个学科的论文数量的大小,以减序排序,那么 可以把期刊分为专门面向这个学科的核心区、相关 区、非相关区,3个区的论文数量相等,此时核心区、 相关区、非相关区期刊数量之比为:1∶a∶a² ,a 为 布拉德福常数。 核心区:所发表的论文来自数量不多但是效率最高 的期刊 相关区:数量较多的中等效率的期刊 非相关区:数量众多但效率最低的期刊
洛特卡定律的发展
一. 洛特卡定律的验证工作
1926年,洛特卡定律诞生; 1941年,Davis对洛特卡的结果进行验证; 1949年,Zipf在《人类行为和最小努力法则》中 肯定洛特卡定律的同时也指出它的不足之处在于只 是一种近似的计算方法,而不是一种严格意义上的 分布。 后来,众多的学者在不同的领域取得数据进行研 究,对洛特卡定律的验证、完善与发展起到一定的 作用。 (在洛特卡定律的基础上,普莱斯进一步研究了科学家人数
社会网络在情报学研究中的应用文献计量分析

论 在情 报学中得到 了一定 的应用 。本 文 以 中文期 刊全文 库 ( 维普 ) 为源数据库 , 经过 检索 和统计 , 当前社 会 网络在 情 对 报 学研 究中的应用情况进行 分析 , 希望能对在 该领域开 展更 深 入的研究提供参考 。
1 社 会 网络 概述
社 会网络是 结 点和 结点 问 的联 系 ( i ) Te 的集 合体 。社 s 会 网络 ( 或人 际关 系 网络) 一般 也称为 人 际网络 , , 是竞争 情 报 活动中备 受青睐 的一种途径 。特别 是在 中 国, 这种社会 网 络 又称 为人际情报 网络 【 ( ma ne i ne t ok 简写 2 Hu nItlg c w r , J l e Ne
第2 9卷 21 0 0年 6月
情
报
杂
志
V( . 9 ) 2 1
J OU RNAI OF I NTEI GENCE LI
J n 2 0 u . 01
社会网络在情报学研究中的应用文献计量分析
乔 振
( 开大学商学院 南 天津 309) 0 1 1
摘-要 以中文期 刊全( 维普 ) 源数据库 , 为 分别 以社会 网络和情报 学研 究 中的热 门领域为检 索词 , 索从 18 检 99
Na n为代表的社会资源理论等 2。 社 会网络理论和方法 最早通 过一 些介 绍西 方社 会学 理 论 的书籍 和国外 学 者在 国 内做 的讲 座 ( 林南 、 燕杰 )传 如 边 人 。目前 国内学 者从 事这 方面研 究 的还 不多 , 成果 d很少 。 三 仅有 的几篇 作品 d仅 限于对 此理论 的介 绍。 主要有 肖鸿 的 土
20 0 9年之 间的所有相关文献。利 用 E C L对相 关文献统计 , X E 发现其 中的规律和 存在的 问题 。
基于文献计量的2010年《情报科学》分析解读

的研 究 动态 、状况 和 发展 方 向。文 章 以 中国知 网 为
从表 1中可 以看 出 ,2 1 0 0年 《 报科 学 》 总页 情
数 为 19 ,载文 量 为 4 6篇 ( 去声 明 、来 稿 须 1 1页 0 除 知 等) ,与 2 0 0 8年 、2 0 0 9年 的 4 7篇 【 1 0 ] 1 2篇[ 、4 4 ] 基 本 持 平 。期 均 发 文 量 为 3 .3篇 .远 高 于 国 内主 要 38 中 文科 技 期 刊 载 文 量 的平 均 值 l . 5 35篇[ ] 过 查 阅 。通 文 献得 知 ,近 三 年 的篇 均 页数 都 接 近 5页 .篇 幅较 长 。 以上数 据 表 明该 刊 信 息量 大 ,吸收 和传 递 情 报 的 能力 较强 .篇 幅较 大 ,论 述 详 尽 .保 证 了该 刊 在 市场 经济 的 冲击 下 的期 刊质量 。
第 2 4卷 第 O 6期
21 0 2年 O 6月
农 业 图 书情 报 学 刊
Ju a o LbayadIfr t o r l f ir n nomaon n r i
— — — — — —
Vo .4 N O 0 1 . 2 6
r u A iu l r g c t e
— — — — — —
摘 要 :依 据 中 国 知 网数 据 库 ,运 用 网 络 计 量 学 方 法 ,对 2 1 0 0年 《 报 科 学 》 所 刊 载 的 46篇 论 文 分 别从 载 文 、 情 0
基于主题分布的我国情报学文献计量分析

CI ,tI I呐 i }吕 i 6I 0I d
dema 呻
abbi iJ
aayi te Ilss l 1 l
I siu 0 Ieep tb d n b s 叩奶 s st r 0丑 o捌 钟l
 ̄-c e m 『 . s 岫
r I f e l 蚰 i l o t . t l 0 砖sa d 邛 ns ; bbi .【c I 】to ; C ia il B ia 玎e} d I r ・ h| .
组 织
19 年 l9 91 92年 9 3 l l9 年 34 1 36 3 30 2 25 2
19 95年 9 6年 l9 l9 9 7年 1 l6 8 46 6 26 7 l
1 20 蚋 00 27 2 I4 8
% 平 均 发 展 速 度 2 9 2 6 09 66 18 .4
1 文献的二级主题分布
对情报学论文二级主题进行统计分折 ,可 以从大结构 方 面考察我 国目前情报学研究 水平 和波动发展状况 ,揭示 目前研究主流和优势 ,明确未来 研究的重点 和方 向 共 9
表 I 1 1 20  ̄ - 00年情 报 学 研 究二 级 主 题 分 布
主 题代 码 ∞ 5 0 主题 名称 情 报 学
2 1 2 8 3l 9 19 5 6 2 3 27 3
l7 15
3 7
2 2 3 5 3l 7 l2 4 l 0 3 9 l8 7
96 9
5 6
4 3 7 5 50 7 28 3 5 11 O l6 4
15 48“ 3. Nhomakorabea2 l I 8 0
∞5 1
G 5 32 G 5 33 G3 l G 5 36 ∞5 7 G5 38 G 5 39
文献计量学方法图文

文献计量学在科学评价中的应用方式
文献计量指标
通过文献的被引频次、下载量、影响因子等 指标来衡量其学术价值。
学术期刊评价
利用文献计量学方法评估学术期刊的学术水 平和质量。
学科领域发展态势分析
通过文献计量学方法分析学科领域的研究热 点和发展趋势。
科研机构和学者评价
通过文献计量学方法对科研机构和学者的研 究成果进行评价。
文献计量学在科学评价中的作用
科学评价的基本原则
01
客观性原则
科学评价应以客观事实为基础,避 免主观臆断和偏见。
准确性原则
科学评价应准确反映研究对象的实 际情况,避免误导和错误。
03
02
全面性原则
科学评价应全面考虑研究对象的各 个方面,避免片面和偏颇。
可重复性原则
科学评价应具备可重复性,以便他 人验证和进一步研究。
跨文化比较研究
随着全球化的加速,跨文化比较研究成为文献计 量学的重要发展方向,有助于深入了解不同文化 背景下的学术发展状况和趋势。
文献计量学的未来展望
深化理论体系
未来文献计量学需要进一步深化和完善自身的理论体系, 明确核心概念、原理和方法,提高学科的严谨性和科学性 。
强化方法创新
随着研究问题的复杂化,文献计量学需要不断强化方法创 新,吸收借鉴其他学科的方法和技术,提高分析的准确性 和可靠性。
。
词频分析法
总结词
通过分析文献中词汇的现频率,揭示 学科领域的研究重点和发展趋势。
VS
详细描述
词频分析法是一种通过统计文献中词汇的 出现频率,来揭示学科领域的研究重点和 发展趋势的方法。这种方法可以帮助研究 者快速了解某一学科领域的热点话题和变 化趋势。
2010年《情报科学》的文献计量学分析

表 4 2 1 年《 0 0 情报科学》 作者系统分 布 系统名称 本专业 高校 高校其 科研 公共 其他 院系 图书馆 他 院系 院所 图书馆
发 文量 19 7 l1 2 4 5 4 5 6 1 0
比例 ( %)
4 .9 4O
载 文量
46 O
引文总数 ( ) 条
47 78
篇均引文数 ( 篇 ) 条/
1 .7 17
从表 5 以看 出2 1 年 《 可 0 0 情报科学 》 刊载的论文篇均 引文数 已经 达 到 1. 条 , 1 7 高于 2 0 、0 9 7 0 8 2 1 年的 7 2 1. 条 , 明作 者的情报意识 ) . 和 18 说 3 1 逐渐 加强 , 并且有很 好 的l收 和利 用文献信息 的能力 。从另一侧 面也 吸 反映 出作者 的知识水平 、 研究 条件及对研究成果 的严谨态度 , 同时也 能 反映 出学术论文 的质量及所含的信息量。 表 6 2 1 年《 0 1 情报科学》 ) 引文语种统计 语种
时滞 篇数 比例( %) 9 0天以内 5 9 1.3 45 9 — 8 天 1 1 2 0 11O 8— 7 天 2 0 7 天以上 11 4 3 .3 47 17 1 2- 88 2 8 9
31 . 引文数量统计分析 表 5 2 1 年《 0 0 情报科学》 引文数量统计
载文量 ( ) 篇
46 0
期均发文量 篇均 页数 ( ) 篇 ( 篇) 页/
3 .3 38 4.2 7
篇 密度 ( 页) 篇/
0. 21
论 文普遍质 量较高 ; 高校其 他院系 和科 研院所并列 排在第 三位 , 9 共 0 人 , 1. %, 们是《 占 18 他 0 情报科学》 一支十分活跃的作者 队伍 , 又 他们 的 踊跃投稿 , 丰富了《 情报科 学》 的稿源 , 拓宽了情 报学的视野。从 表中可 以 明 显看 出高 校 作 者 是 《 报 科 学 》 情 的主 要 撰 稿 者 , 3 5 , 共 4人 占 8. %, 4 8 充分说明高校是图书情报研究的摇篮 , 9 高校科 研工作 者是图书 情报事业发展 的生力军 , 他们将为图书情报 事业做 出更大 的贡献 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
-理论研究及应用进展
杨立英 2008年9月
目录
• • • • • 什么是文献计量研究 文献计量方法的基本过程 文献计量分析的三种类型 文献计量研究常用的方法 文献计量学的经典定律
基本方法介绍
• 情报分析工作应用 • 文献计量研究进展
应用及进展
文献计量研究的含义
文献计量研究是以文献作为数据基础进行的定量研究,通过运用数学方 法分析科学研究的成果,描述科学的体系结构,分析科学系统的内在 运行机制,揭示科学发展的时空特征,探索整个科学活动的定量规律 性。
文献计量学的经典定律4
• 科学生产率的频次分布-洛特卡定律:是由美国 的统计学家、情报学家洛特卡( A.J.lotka )研究 出来的描述科学论文作者分布的规律。在科研活 动中,不同人的科研能力及其成果著述数量肯定 是不同的。那么,在同样的一段抽样时间内,不 同的科技工作者的论著数量分布有没有什么规律 呢? 1926 年,洛特卡发表了论文“科学生产率 的频率分布”。他在文中统计分析了化学和物理 学两大学科中一段时间内科学家们的著述情况, 提出了定量描述科学生产率的平方反比分布规律, 又被称为“倒平方定律”。
ห้องสมุดไป่ตู้ 文献计量学的经典定律1
• 科技文献数量增长的规律 经验公式:指数增长(Price),逻辑斯蒂曲 线,直线增长 • 应用范围:文献管理,情报预测
文献计量学的经典定律2
• 文献老化规律
科技文献随着其“年龄”的增长,其内容日益变得陈旧过时,失去了 作为科学情报源的价值,以及因此越来越少被科学工作者和专家们利 用的过程。科学文献老化既是一种客观的社会现象,又是一个复杂的 动态过程。 • 1971年,美国科学学家D. 普赖斯提出了一个衡量各个知识领域文献 老化的数量指标,即后人所称的“普赖斯指数”。就是在某一知识领 域内,把对年限不超过五年的文献的引文数量与引文总量之比当作指 数,用以量度文献的老化速度和程度。其计算公式如下: P(普赖斯指数)=被引文献数量(小于或等于5年)×100%/被引文献总 量。 布鲁克斯的负指数模型等等
作者同被引图示(方框表示同被引作者)
共现研究(co-occurrence and occurrence )的研究原理
研究基础:特征项之间存在文献计量关系(共现关系) 研究目的:分析共现特征项之间的关系,发现科学活动特点及规律。 研究方法: -多元统计方法(聚类分析、因子分析、多维尺度分析) -社会网络分析方法 -其它数据挖掘方法
P(x, y),其中,P是由x, y决定的论文数据集,x, y为论文 特征项
文献计量研究常用的方法2
• 基于引文特征的统计方法
论文在发表时,作者将研究过程中参考或引用过的文献列出,形成引文(参 考文献),论文的引用与被引关系形成一种重要的文献计量特征。文献计量 学家曾经对文献引用原因作过很多研究,指出引用与被引是一种相对可靠的 联系。论文的质量在很大程度上与论文受关注的程度相关。统计分析数据表 明,越是重要的研究成果被引用的频次越高,受国际同行关注的程度越大。 因而,引文特征是评价论文影响力,反映研究成果质量的计量指标。
• 应用范围:文献管理
文献计量学的经典定律3
• 专业论文在期刊中的分布规律-布拉德福定律:是由英国文献学家布 拉德福( S.C.Bradford ) 1934 年首先提出。它是定量描述科学论文 在相关期刊中集中——分散状况的一个规律。经过后来的许多研究者 的修正和研究,发展成为著名的文献分布理论。布氏定律的文字描述 为“如果将科学期刊按其刊载某个学科领域的论文数量以递减顺序排 列起来,就可以在所有这些期刊中区分出载文量最多的‘核心’区和 包含着与核心区同等数量论文的随后几个区,这时核心区和后继各区 中所含的期刊数成 1:a:a 2 …… 的关系( a>1 )。”布氏定律主要反 映的是同一学科专业的期刊论文在相关的期刊信息源中的不平衡分布 规律。布氏定律的应用研究也获得了许多切实有效的成果,应用于指 导文献情报工作和科学评价,选择和评价核心期刊,改善文献资源建 设的策略,确立入藏重点,了解读者阅读倾向,评价论文的学术价值 以节约经费、节约时间,切实提高文献信息服务和信息利用的效率和 科学评价的科学性。
R(x, y),其中,R是由x, y决定的引文频次(以下简称引 文),x, y为论文特征项。
文献计量研究常用的方法3
• 论文与引文的捆绑指标H-指数及方法
• h指数是美国物理学家Jorge E. Hirsch于2005年提出的一项个人科研绩效评价指标。 h指数的定义是:当且仅当一个科学家有h篇被引频次至少为h次的论文,同时剩 余论文的被引频次都小于h时,该科学家的成就分值为h。
• 将其它领域的数学概念、模型移植到文献计量研究中。
例如生物学“生长曲线“,”传染病模型”,经济学中的“人口增长模型”, 物理学中的”半率期“
文献计量研究常用的方法1
• 基于论文特征的统计方法
论文是科研成果的主要载体,因此,论文的数量及其变化是最基础的 统计指标。除此之外,论文中还蕴含着诸多表征科学成果特性的特征 项,例如论文的关键词、作者、作者机构、作者所在的国家、期刊等 等。这些隶属于论文的特征项从多个角度反映了学科的发展水平。
H-指数等于5
•
h指数最大的优势在于它将论文与引文捆绑在一起,可以避免单纯追求论文数量的 倾向。 h指数还可以推广到期刊、科研团队与机构以及国家的绩效评价。
文献计量研究常用的方法4
• 共现研究(co-occurrence and occurrence ) 科技论文中的共现是指相同或不同类型特征项共同出现的现象,如多篇论文 之间共同出现的主题(关键词)、共同出现的合作作者、共同出现的合作机 构以及论文与关键词、机构与作者共同出现等都属于共现研究的范畴。
文献计量研究的基本过程
数据机理分析
数据集构建 统计处理 结论
文献计量研究的三种类型
• 依据大量积累的统计数据提出经验统计模型
例如文献计量三大定律
• 依据时间序列数据的发展趋势提出合理假设,建立数学模 型,进行模拟和预测。
例如普赖斯通过观察科技期刊的增长曲线,提出科技文献指数增长规律,并成 功推广到科学交流的大部分领域。
共现研究(co-occurrence and occurrence )
文献耦合图示(方框表示耦合论文)
论文同被引图示(方框表示同被引论文)
共现研究(co-occurrence and occurrence )
共词图示(方框表示共同出现的关键词)
作者合作图示(方框表示合作作者)
共现研究(co-occurrence and occurrence )