文献计量学_文献引用规律
文献计量三定律

文献计量学三定律一、布拉德福定律布拉德福定律是由英国著名文献学家B.C.Bradford于本世纪30年代率先提出的描述文献分散规律的经验定律。
其文字表述为:如果将科技期刊按其刊载某学科专业论文的数量多少,以递减顺序排列,那么可以把期刊分为专门面对这个学科的核心区、相关区和非相关区。
各个区的文章数量相等,此时核心区、相关区,非相关区期刊数量成1:n:n2(n的平方)的关系。
布拉德福定律的应用:为文献情报部门使用有限的资金、获取情报密度最高的情报源提供定量依据。
它的作用在帮助确定核心期刊、文献检索、考察专著的分布、动态馆藏的维护、检索工具完整性的测定、学科幅度的比较、指导读者利用期刊、指导期刊订购工作等方面。
二、洛特卡定律洛特卡定律是由美国学者A.J.洛特卡在本世纪20年代率先提出的描述科学生产率的经验规律,又称“倒数平方定律”。
它描述的是科学工作者人数与其所著论文之间的关系:写两篇论文的作者数量约为写一篇论文的作者数量的1/4;写三篇论文的作者数量约为写一篇论文作者数量的1/9;写N篇论文的作者数量约为写一篇论文作者数量的1/ n2……,而写一篇论文作者的数量约占所有作者数量的60%。
该定律被认为是第一次揭示了作者与数量之间的关系。
洛特卡定律的应用:(1)在情报学图书馆学方面,一般是用它来预测发表不同数目文章的著者数量和特定学科的文献数量。
(2)在预测科学方面,从社会科学著者数量来预测文献数量的增长速度和文献流的动向;预测学者数量的增长和科学发展的规模及趋势。
(3)在科学学和人才学方面,研究科学家的活动规律,研究人才的著述特征。
三、齐夫定律美国哈佛大学教授G.K.齐夫(G.K.Zipf)1935年通过对文献词频规律的研究,认为:若把一篇较长的文章中每个词出现的频次从高到低进行递减排列,其数量关系特征呈双曲线分布。
该定律应用于情报检索用的词表的编制和情报检索系统中文档结构的设计。
齐夫定律的应用:(1)文献标引和词表编制。
文献计量学

26 / 12
洛特卡定律的应用
1、在图书馆学情报学方面,一般是用它来预测 发表不同数目文章的著者数量和特定学科的文献数 量;
2、在预测科学方面,按照洛特卡定律,可以从 统计或计算科学著者数量来预测文献数量的增长速 度和文献流的动向,便于掌握文献的交流规律,同 时从文献计量学的角度出发,也可以预测科学家数 量的增长和科学发展的规模及趋势等;
25 / 12
洛特卡定律的局限性
LOTKA 定律是有局限性的,平方反比率是科学 生产率一般的理论估计,不是一个精确的统计分布, 它是对 CA 中收录的物理、化学两个领域十年间著 者(姓氏以A A 、B B 开头)抽样研究结果的推广。 后来的学者沿着这个思路进行的研究,有些数据符 合这个规律,有些则不符合。
核心区:所发表的论文来自数量不多但是效率最高 的期刊 相关区:数量较多的中等效率的期刊 非相关区:数量众多但效率最低的期刊
11 / 12
图像分析
此外,布拉德福还对收集的数据进行图像分析:取 上述等级排列的期刊数量的对数㏒为横坐标,以相 应的论文累计数R(n)为纵坐标进行图像描述,就得 到了布拉德福分散曲线。
20 / 12
基本内容
从洛特卡定律的产生过程可以看出,该定律的目的 和基本内容是:描述科学工作者人数与其所论著论 文之间的关系。 如果设f(x)为写了x篇论文的作者数占作者总数的 比例,则洛特卡定律可表示为:
C——某特定主题领域的特正常数。 洛特卡统计的指数a约:a=2,即“平方反比率”。
21 / 12
齐夫在做了大量艰苦的统计工作后,将单词以其出现 的频次的多寡进行了等级排队,经过计算,论证了描述词 的频率与等级序号之间关系的定量形式。
文献计量学

齐普夫定律
7 / 12
布拉德福定律
的含义:信息流的序性结构经验定律,
也叫文献分散定律。 布氏定律, 是英国文献学家布拉德福于1934 年在 《 Engineering 》 杂志上发表的《 Sources of information onspecific subjects 》 上提出的描述文分散规律的经验定律。 在其专著 《 文献工作 》 中,他又一次阐述了文献分散定律。 认为‚“在数量很大的文献体中,文献按某一规律的模型分散…… ”。 科学信息很大程度上是以科技期刊的形式出现的,借助期刊这 个载体得以交流传播,科技期刊对促进科学技术发展起着举足轻重 的作用。 布拉德福定律 (Bradford’ Law of Scattering)就是描述某一学 科论文在相关期刊中的分布规律。它定量的揭示了 ,今天仍然具有不可替代的理论价值和实 际意义。
10 / 12
区域分析
布拉德福定律的区域分析:如果将科学期刊按其登 载某个学科的论文数量的大小,以减序排序,那么 可以把期刊分为专门面向这个学科的核心区、相关 区、非相关区,3个区的论文数量相等,此时核心区、 相关区、非相关区期刊数量之比为:1∶a∶a² ,a 为 布拉德福常数。 核心区:所发表的论文来自数量不多但是效率最高 的期刊 相关区:数量较多的中等效率的期刊 非相关区:数量众多但效率最低的期刊
洛特卡定律的发展
一. 洛特卡定律的验证工作
1926年,洛特卡定律诞生; 1941年,Davis对洛特卡的结果进行验证; 1949年,Zipf在《人类行为和最小努力法则》中 肯定洛特卡定律的同时也指出它的不足之处在于只 是一种近似的计算方法,而不是一种严格意义上的 分布。 后来,众多的学者在不同的领域取得数据进行研 究,对洛特卡定律的验证、完善与发展起到一定的 作用。 (在洛特卡定律的基础上,普莱斯进一步研究了科学家人数
文献计量学投稿中经常遇到的败笔

1.结论和结果脱节。
这是对学科热点前沿进行文献计量分析的论文中最近常看到的,也最让我无奈的问题。
从道理上讲,结论应当来自于对研究结果的分析,但是很多投稿的结论与数据处理后得到的结果风马牛不相干,不是对多维标度、聚类分析和社会网络分析的结果进行细致分析,经过逻辑推理后得到目前的结论,而是另找一批文献,按照自己惯有的思维方式,总结分析后得出结论。
2.方法乱用和滥用。
多维标度、因子分析、聚类分析、社会网络分析,十八般武艺全都用在一组数据上,得到了黑压压一片片的图。
这些图说明了什么?回过头来看,用这些方法和工具是为了解决什么问题?如果不是因为研究目标的需要而选择某一种方法,如果没有对结果的深入细致的分析,这些东西就都是花拳绣腿,于事无补。
3.在研究结果段落里讲述方法的基本概念。
就是在介绍结果的段落里,如“对XX数据的聚类分析”,后面要用大量的篇幅写聚类分析的定义,方法等等,这些应该是放到材料方法的内容,作者怕读者不懂,在介绍结果的时候又要啰嗦一遍。
4.方法照搬照抄,错误百出。
在研究方法部分,不少人就是把别人的研究方复制粘贴过来,然后修改其中具体的数据。
比如“通过对52个高频关键词进行两两共词检索,统计他们在2214篇文献中同时出现的频率,形成52×52的共词矩阵,如表2所示”。
其中的“他”字应该是它,但是发表的第一篇论文就写错了,所以,我现在发现很多论文在方法部分在写矩阵的成分时都写成了“他”,也许就应该用“他们”;还有Ochiai 系数,最早我错写成Ochiia系数,很多人发表的论文跟我犯了同样的错误,也写成了Ochiia系数。
还有,在我编写的《简明医学信息学教程》中,HELP决策支持系统的图少了一根连线,后来在其他教科书中遇到同样的图和同样的错误,不由得会心地一笑。
科学计量学的几个定律

科学计量学的几个定律1.描述文献增长定律——普赖斯指数文献增长定律是描述文献数量随时间而有规律地增长。
令F表示文献数量,t表示时间,则文献增长定律的数学表达形式为:Ff(t)式中f(t)的总趋势满足t增大时,F也应相应增大。
描述文献增长规律的主要函数是:线性函数、指数函数、逻辑曲线函数等。
其中以D.J.普赖斯(Price)建立的指数增长定律最为著名F(t)aebt式中,F(t)为某年(t)的文献累积数量;t为时间(以年为单位);b为文献持续增长率,即每一年文献的增长率。
图:科学期刊与文摘期刊按指数增长示意图(据普赖斯)(半对数坐标,直线实际上指数曲线经对数转换后的结果)《化学文摘》年度文献累积曲线图:图:1600—1950年代科学发明的指数增长(据赵红洲)指数增长规律只有在没有限制或干扰的情况下才会出现,如果受到智力的、物质的和经济的限制,普赖斯指出文献增长更趋于逻辑曲线。
苏联学者弗勒杜茨和B.纳利莫夫提出了著名的逻辑曲线方程式FK1aebt式中,F(t)表示t年的文献累积量,K为F(t)增长的最大值,a与b为参数。
例:有A、B两个学科,研究其引用文献的情况。
(假设研究时间为2004年底)A学科:假设全部引用文献共674篇,其中发表于近5年的文献为409篇文献B学科:假设全部引用文献共2419篇,其中发表于近5年的文献为1796篇文献则A学科的普赖斯老化指数为:409/674=60.68%B学科的普赖斯老化指数为:1796/2419=74.25%Cy(某)n某格特卡指出“这两个例子表明的指数近似等于2.0。
”于是,上式被C.K.齐普夫(zipf)称为“倒平方定律”。
但是后人的继续研究表明,指数2仅是一个特例。
1974年,J.维拉奇,对不同的学科而言,n可以从1.2浮动到3.5以上。
此外,普赖斯的一项研究也支持了上述结果:60&的人,4.科技文献离散定律──布拉德福定律科学论文在科技期刊中的分布是不均匀的,少数期刊中“拥挤”着大量的论文,大量的期刊中“稀释”着少量的论文。
文献计量学方法

03
文献计量学在科学研究中 的应用
学科发展评估
学科发展趋势分析
通过分析特定学科领域内的文献 发表情况、引用频次、关键词等 数据,评估学科的发展趋势和未 来发展方向。
学科交叉融合研究
利用文献计量学方法分析不同学 科领域之间的交叉融合情况,揭 示学科交叉对创新发展的影响。
学科结构优化建议
基于文献计量学分析结果,为学 科结构的优化提供建议,促进学 科的均衡发展。
总结词
通过共词网络分析,探究某领域内关键词之 间的关联和结构。
详细描述
利用文献计量学方法,对某领域的大量文献 进行关键词提取和共词分析,构建共词网络 ,探究关键词之间的关联和结构,从而揭示
该领域的研究重点和主题分布。
案例三:某期刊的质量评价与影响因子预测
总结词
通过文献计量学方法,评价某期刊的质量和预测其影响 因子。
共词分析法
总结词
通过分析同一篇文献中词汇或短语共同 出现的情况,揭示学科领域内主题间的 关系。
VS
详细描述
共词分析法是文献计量学中的一种重要方 法,通过分析同一篇文献中词汇或短语共 同出现的情况,可以揭示学科领域内主题 间的关系。这种方法可以帮助研究人员了 解学科领域内的主题分布、主题交叉和主 题演化,进而为学科领域的知识组织和知 识服务提供支持。
学术期刊评价
期刊质量评估
通过分析期刊发表的论文质量、影响因子、被引频次 等指标,对学术期刊的质量进行评估。
期刊影响力排名
根据学术期刊的质量、学术影响力和学术声誉等指标, 对学术期刊进行排名,为学术交流提供参考。
期刊发展建议
基于文献计量学分析结果,为学术期刊的发展提供建 议,促进期刊质量的提升和学术交流的繁荣。
文献计量学方法图文

文献计量学在科学评价中的应用方式
文献计量指标
通过文献的被引频次、下载量、影响因子等 指标来衡量其学术价值。
学术期刊评价
利用文献计量学方法评估学术期刊的学术水 平和质量。
学科领域发展态势分析
通过文献计量学方法分析学科领域的研究热 点和发展趋势。
科研机构和学者评价
通过文献计量学方法对科研机构和学者的研 究成果进行评价。
文献计量学在科学评价中的作用
科学评价的基本原则
01
客观性原则
科学评价应以客观事实为基础,避 免主观臆断和偏见。
准确性原则
科学评价应准确反映研究对象的实 际情况,避免误导和错误。
03
02
全面性原则
科学评价应全面考虑研究对象的各 个方面,避免片面和偏颇。
可重复性原则
科学评价应具备可重复性,以便他 人验证和进一步研究。
跨文化比较研究
随着全球化的加速,跨文化比较研究成为文献计 量学的重要发展方向,有助于深入了解不同文化 背景下的学术发展状况和趋势。
文献计量学的未来展望
深化理论体系
未来文献计量学需要进一步深化和完善自身的理论体系, 明确核心概念、原理和方法,提高学科的严谨性和科学性 。
强化方法创新
随着研究问题的复杂化,文献计量学需要不断强化方法创 新,吸收借鉴其他学科的方法和技术,提高分析的准确性 和可靠性。
。
词频分析法
总结词
通过分析文献中词汇的现频率,揭示 学科领域的研究重点和发展趋势。
VS
详细描述
词频分析法是一种通过统计文献中词汇的 出现频率,来揭示学科领域的研究重点和 发展趋势的方法。这种方法可以帮助研究 者快速了解某一学科领域的热点话题和变 化趋势。
科学计量学的几个定律

科学计量学的几个基本定律1.描述文献增长定律——普赖斯指数文献增长定律是描述文献数量随时间而有规律地增长。
令F表示文献数量,t表示时间,则文献增长定律的数学表达形式为:F=f)(t式中)(t f的总趋势满足t增大时,F也应相应增大。
描述文献增长规律的主要函数是:线性函数、指数函数、逻辑曲线函数等。
其中以D.J.普赖斯(Price)建立的指数增长定律最为著名bt)(F=aet式中,)(tF为某年)(t的文献累积数量;t为时间(以年为单位);b为文献持续增长率,即每一年文献的增长率。
(半对数坐标,直线实际上指数曲线经对数转换后的结果)图:《化学文摘》年度文献累积曲线图:1600—1950年代科学发明的指数增长(据赵红洲)指数增长规律只有在没有限制或干扰的情况下才会出现,如果受到智力的、物质的和经济的限制,普赖斯指出文献增长更趋于逻辑曲线。
苏联学者弗勒杜茨和B.纳利莫夫提出了著名的逻辑曲线方程式bt ae KF -+=1式中,F(t)表示t 年的文献累积量,K 为F(t)增长的最大值,a 与b 为参数。
2.描述文献老化规律──半衰期,普赖斯老化指数对于科技文献来说,除物理形态上的破损、载体的变质,随时间流逝,文献所载的科技信息逐渐过时,以致于文献本身不再被使用。
老化的量度主要有:(1)半衰期:所谓半衰期是一个时间概念,意指在该时间内发表了某一学科或领域正在被利用的全部文献一半,或者目前所利用的文献的一半是在该时间内发表的。
进行文献老化研究,可采用引用文献分析法,它是对收集文献后而所附参考文献进行研究。
例如,为了对我国化学期刊文献的老化规律进行研究,首先收集某一年,例如1988年出版的重要化学期刊40种,共得到了2000篇有关论文,然后再统计每篇论文后面所附的参考文献(或称引文),共得25000条参考文献。
再按其出版年代进行统计,其结果可用图形表示。
图中纵坐标代表引文量,可以采用绝对数量亦可采用相对数量来表示;横坐标为引文出版年龄,所谓出版年龄是指被引文献出版年代与其被引用年代之差。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
引文分析的应用
• 引文模式的研究
– 引文分析可对于文献的引用模式进行研究
• 科学评价
– 引文分析可以用来作为对于论文、学者、研究单位 的评价工具,并常被用来评价该学科的影响力和生 产力
• 信息检索
– 引用文献可以补充关键词的功能,代表文献的主题, 用来发展文献检索的策略,以辅助传统的信息检索。
引文分析的应用
–例如某一期刊因为发表名人的文章而为众人所引用,以至于 引起连锁反应,结果被引用率很高
–马太效应的心理作用,影响文献引用的真实性
大纲
• 引文分析的定义 • 引文统计与计量指标 • 引文分析的主要工具 • 科学引文的结构与分析 • 科学文献的自引分析 • 科技文献的双引分析 • 引文分析法的应用
引文分析的概念
存在
引文分析的盲点
• 引文的自引(self-citation),即著者引用自己的 著作所产生的计量问题
• 合著,是多位著者联合发表的论著在计量时会遇到 的问题
• 著者同名同姓,造成的错误 • 著者姓名相似或者异形,这种现象在翻译的时候最
常发生 • 引文来源的类型不同,也会造成计量上的差别
引文分析的盲点
• 实质:一种文献计量学研究方法 • 方法:
– 各种数学及统计学的方法 – 比较、归纳、抽象、概括等逻辑方法
• 对象:科学期刊、论文、著作等 • 指标:引用或被引用现象 • 目的:揭示其数量等特征和内在规律
引文分要用于评价期刊论文
来源文献 Source
Citing paper 引用文献
Reference 被引文献1 Cited paper
被引文献2
被引文献3
citation
被引文献4
引用的动机
• 尊敬学科开创者 • 赞誉相关研究工作的成就 • 鉴别研究方法、设备等等 • 提供背景资料 • 修正自己的著作 • 批评他人的著作 • 为自己的著作提供佐证
– J.W. Coffman, 1985
引文分析法(Citation Analysis)
• 是文献计量学中的重要研究领域 • 引文分析就是探讨分析来源文献(source
works)及被引文献(Cited works)之间的关系
• 最重要的特征就是利用各种数学、统计学的方 法,以及比较、归纳、抽象、概括等逻辑方法, 对于期刊、论文、著者等各种分析对象的引用 或被引用现象进行分析。
美国教育研 究期刊 47.0% 4.7% 25.1% 9.2% 9.9% 1.0%
3.1% 100.0%
人口统计 学 49.5% 11.3% 14.2% 8.0% 8.2% 5.8%
3.0% 100.0%
人文学研究的引用特性
• 被引文献主题较为广泛 • 被引文献所使用的文种较多 • 被引文献所涵盖的时间较长 • 被引文献的资料类型较为复杂 • 被引文献中图书的比率较高 • 文献老化的情形并不象科技文献那样明显
文献计量学
文献引用规律
科技文献的组成
• 题名 • 作者 • 摘要 • 正文
• 引用文献 • 参考文献
引用
• 信息使用者引用前人的观点或行为,称为 “citation”。
• 在科学技术的发展历史上,任何一门学科或 者研究的发展和创新,都是建立在前人的研 究成果基础之上。
引用关系
• 一个引用的行为包括两个对象:一个是来源 文献;另一个是被引文献。
造成计量上的偏差 • 主题的新颖度,会影响学者的研究兴趣的高低,同
时也影响到引用文献计量 • 研究方法和态度的改变,也会造成引用文献计量分
析的差别
引用文献时的限制
• 外在的限制
– 资料的汇集无法齐全 – 引用文献的来源过于集中
• 内在限制
– 作者个人的教育水平 – 作者个人的语言能力 – 作者个人对主题的认知和了解
引文分析
文献计量学07
引文分析法的局限性(续)
• 引文关系上假联系的影响
–两篇论文可能基于不同原因引用同一篇文章,一个可能是引 用其方法;另一个可能是引用其结果,那么这两篇文章在内 容上的关系可能就是虚假的
–目前引文分析中,对于这些引用都是同等看待,不加区分, 这也容易造成假关系
• 马太效应的影响
美国传染病 学期刊
33.4%
背景资料 11.9%
11.4%
研究方法 14.8%
9.1%
比较
5.3%
30.8%
争辩与建议 11.4%
12.6%
原始资料 2.6%
1.5%
历史回顾 0.3%
其他 合计
7.0% 100.0%
1.2% 100.0%
图书馆研究
36.4% 5.2% 21.4% 19.7% 4.6% 6.9% 4.0% 1.7% 100.0%
• 使用者研究
– 通过对研究者著作中参考书目的分析,探讨研 究者引用文献的资料类型、年代、主题
• 学科历史发展研究
– 引文分析可以对于文献的出版与参考书目的关 系作分析,利用文献追寻事件发生的历史,分 析事件彼此之间的关系与相关性
互联网的世界
• 互联网的虚拟文献空间 • 超链接的作用
引用的争议
• 自我引用 • 引用错误 • 均等引用 • 二次引用
• 通过引文分析,研究者可以了解某学科领域的 发展状况、学科领域内文献使用的特性、学科 领域内文献彼此之间的关联性,以及学科领域 研究的未来发展趋势等等。
引文分析的基本假设
• 文献的引用表示著者确实曾经使用过 • 文献的引用是文献价值、重要性、影响力的
指标 • 最好的文献才被引用 • 来源文献和被引文献之间内容必然有相关性
引用的动机
• 预告或揭示新著作 • 对散布不广、索引不良或未被索引的著作,提供检
索线索 • 证实有关数据和事实 • 鉴定引文的原始著作 • 鉴定原始著作中的概念和术语 • 否认他人的著作或者观点 • 对著者声称著作或观念先于他人的事实,予以驳斥。
引用文献的类型
动机与原因
美国社会学期 刊
48.1%
• 引用时效消失,即众所周知的学说、理论无需再特 别注明,因而计量时降低了原著的影响力
• 引文数量的起伏不定 • 不同的研究领域有不同的引用文献的行为 • 参考资料漏列 • 英文文献的优势,使得英文文献被引用几率较其他
语言高 • 著者偏好引用美国文献
引文分析的盲点
• 性别歧视,即著者习惯于引用同性别著者的作品 • 引用文献转录的错误 • 引用上的错误,使得引文与原著的本义不同,因而