信息计量学复习(1)
信息计量学

1.文献计量学:是采用数学统计方法,对各类文献的诸计量特征进行统计分析,进而揭示、研究文献情报规律,文献情报科学管理以及科学发展趋势的一门学科。
2.质量牵制原则:出版物的增长数量与其质量有关,不同质量的出版物有不同的出版速度;质量高的文献增长速度慢。
3.文献老化:科学文献随着其年龄的增长,逐渐失去了作为科学情报源的价值,越来越少的被用户利用的过程。
4.半衰期:某学科现在尚在被使用的全部文献中,较新的一半是在多长时间内发表的。
5.普赖斯指数:指在某一领域内,出版年龄不超过5年的被引证文献与被引证文献总数之比。
6.文献耦合:是指引用文献通过参考文献建立起来的耦合,如果A、B两篇文献共同引用了一篇或多篇相同的论文,则A、B两篇论文的关系即为耦合关系,也叫文献合配。
7文献信息流:文献所含情报的汇流称文献信息流。
8文献老化:科技文献随着其"年龄"的增长,其内容日益变得陈旧过时,失去了作为科学情报源的价值,以及因此越来越少被科学工作者和专家们利用的过程。
9科学生产率:个体科研人员在一定时期内所撰写的论文数量。
10引文分析:利用各种方法对科学期刊、论文、著者等分析对象的引证和被引证现象进行分析,以揭示其特征和内在规律。
11影响因子:即某期刊前两年发表的论文在统计当年的被引用总次数除以该期刊在前两年内发表的论文总数。
12信息计量学:是以信息作为对象进行计量研究的学问,采用数学、统计学等定量方法,对信息基本循环图式所描述的社会化的信息交流过程中的信息组织,存储,分布,传递,相互引用和开发利用等进行定量描述和统计分析,以便揭示社会信息交流过程的数量特征和内在规律。
13网络信息计量学是采用数学、统计学等定量分析方法,对网上信息的组织、存储、分布、传递、相互引证和开发利用等进行定量描述和统计分析,以揭示七数量特征和内资规律的一门新兴学科。
文献信息老化的主要度量指标有哪两个?两者有何异同?文献信息老化的主要度量指标是半衰期和普赖斯指数。
信息计量学(自考)前四章学习笔记

第一章1.信息计量学的产生背景:①信息计量学是在传统文献计量学及科学计量学的基础上扩展和演变而成的②信息计量学是情报科学发展的需要和必然产物③一笔杰出的学科带头人和骨干力量推动了信息计量学的发展。
2.信息计量学的研究和发展出现的新的方向和趋势:①从文献计量向信息计量发展②计算机辅助的信息计量研究和应用③网络信息计量学的研究。
3.网上信息的计量对象主要涉及的层次:①网上信息本身的直接计量问题②网上文献,文献信息及其相关特征信息地计量问题③网络结构单元的信息计量问题。
4.网络信息计量学发展的起来的原因:①信息资源电子化,网络化以及网上文献信息数量的激增,不仅为网络信息计量学的产生提供了必要的基础和条件,而且还产生了迫切的实际需求②电子文献信息资料的统计分析及研究成果,为这个学科的形成奠定了基础,累积了经验③信息计量学发展的客观需要。
5.信息计量学研究的目的:就是引进量的概念和定量分析方法,进一步揭示信息单元的体系结构和数量变化规律,从理论上提高情报学及信息管理学科的科学性和精确性,促使这些学科向定量阶段发展。
6.信息计量学的理论和方法在不同领域的应用:①促进和深化情报学理论研究方面的应用②图书馆管理中的应用③在信息分析和预测中的应用④信息检索方面的应用⑤在科学评价方面的应用⑥在其他社会学科中的应用。
7.信息计量学的内容体系:①信息计量学若干基本问题的探讨②信息的基本测度,建立“信息量”等一整套测度指标,确定信息量的准绳③几个基本定律的研究④信息流模型的研究⑤信息计量化方法的探讨⑥信息计量方法和工具的自动化实现方面的研究⑦在图书情报工作,信息资源管理,信息检索,信息分析与预测,科学学与科学评价等领域的应用。
8.信息计量的数据来源:科技图书馆;科技期刊;科技报告;会议文献;专利文献;标准文献;学位论文;产品资料;技术档案;科技报纸;光盘数据;网络数据。
9.科技图书馆:是对某专门知识或某学科进行系统的论述或概括的一种情报来源。
信息计量学第章

信息计量学第章信息计量学是一门关于信息的量化和测量的学科,它主要研究如何对信息进行度量和分析。
本章将介绍信息计量学的基本概念和方法,并探讨其在现代社会中的应用。
一、信息计量学概述信息计量学是信息科学的一个重要分支,它借鉴了数学、统计学、计算机科学等学科的方法和理论,旨在通过量化和分析信息来揭示信息的内在规律和价值。
信息计量学的研究对象是信息,包括文本信息、图像信息、音频信息等。
通过信息计量学的方法,可以对信息进行度量、分析和评价,从而提取有用的信息和知识。
二、信息计量学的基本概念在进行信息计量学的研究和应用时,需要了解一些基本概念和指标。
以下是信息计量学中常用的几个概念:1. 信息熵(Information entropy)信息熵是信息的一种度量方式,用来表示信息的不确定性。
在信息论中,熵越大表示信息的不确定性越高,反之越小表示信息的不确定性越低。
2. 信息增益(Information gain)信息增益是一种用于决策树算法中的指标,用来衡量在已知某个属性值的情况下,对结果的贡献度。
通过计算信息增益可以选择最优的属性划分。
3. 信息检索(Information retrieval)信息检索是指通过信息存储系统中的检索功能,按照用户需求找到相关信息的过程。
信息检索可以通过关键词搜索、文本匹配等方式实现。
4. 信息传输(Information transmission)信息传输是指将信息从发送者传递给接收者的过程。
在信息传输中,需要考虑传输速率、信道容量等因素。
三、信息计量学的应用领域信息计量学在现代社会的各个领域都有广泛的应用。
以下列举几个典型的应用领域:1. 信息检索与搜索引擎随着互联网的不断发展,信息检索和搜索引擎成为人们获取信息的主要方式。
信息计量学在搜索引擎的排名算法、关键词匹配等方面发挥着重要作用。
2. 社交网络分析社交网络已经成为人们重要的社交和交流平台,信息计量学可以用于分析社交网络中的信息传播、用户行为和社群结构等问题,为社交网络的运营和管理提供科学依据。
信息计量学考试

1.核心期刊的概念,核心期刊的测定方法核心期刊的概念。
“核心期刊〞(Core Periodicals),是指针对某一学科或专业领域来说,刊载大量专业论文和利用率较高的少数重要期刊,就称为该学科(专业)的核心期刊。
从测定的指导思想和目的来看,核心期刊有两种根本的类型:一是“学科核心期刊〞;二是“馆藏核心期刊〞。
两种类型:一是利用文献计量学工具和指标直接选定各学科的核心期刊。
二是利用文献计量学方法,按照一定的根本步骤来测定核心期刊。
利用布拉德福定律测定核心期刊又有3种具体做法。
1区域分析法。
2图像分析法。
3布氏定律法及百分比补偿。
3.2累积百分比法(80%法)将某一领域的期刊按相关载文量的多少递减排列,然后依次累计排在前面的n种期刊的载文量,并求出前n种期刊的累积载文量与所统计的全部期刊总载文量的百分比;假设到达了选定的要求,则前n种期刊为核心期刊,否则,还须计算n以后的期刊,直到到达这个比值为止。
3.3文摘法。
根据被二次文献摘录的频率大小将期刊依次排成顺序目录,并以此作为期刊重要程度及选择的依据。
凡期刊中被摘录或索引的论文数量较大者,可选为核心期刊。
根据期刊在一次文献中被引用的频率大小将期刊排列成顺序目录,靠前的被大量引用的期刊被认为是某学科的核心期刊。
根据期刊被读者使用(借阅)的频率,也可以产生一个反映读者实际需要的顺序目录,可作为确定核心期刊的依据。
具体来说,就是对馆藏杂志在一定期间内的出借次数、馆内阅览次数、复制量及外借文献的使用次数进展统计分析,流通频率较高者即为核心期刊。
期刊被引用、被摘录、被流通的次数都说明了期刊的利用情况,可以用来作为判断期刊的重要性、确定核心期刊的依据,但它们又各有短处。
为了取长补短,提高核心期刊测定的准确性和有效性,我们可以综合上述3种方法,提出一个较为理想的综合评价法。
2.影响因子的概念,影响因子在科学评介中的作用,存在的问题影响因子(Impact Factor,亦称效果系数):这是一种期刊中论文的平均被引率,等于期刊论文被引量与可引论文总数之比。
信息计量学期末复习资料汇总

1、信息计量学有代表性的各种定义,其有共同之处,构成的基本要素为:a是一门学科;b采用数学、统计学等方法;c以各类文献为基础;d对文献及其各种特征进行定量统计分析2、信息计量学研究的内容是由研究的对象与任务决定的,形成三大模块:时间序列、信息分布、引证研究。
是以文献计量学为基础,向网络计量学发展3、信息计量学研究的方法体系:统计分析法,数学模型分析法,引文分析法,计算机辅助信息计量分析法4、信息计量学形成的三个基本条件:文献可计量;大数量;有规律5、文献计量学的特点(现象):人为的计量、近似的统计、精确的计算6、信息计量学研究对象:消息、数据、事件、实物、文本和文献7、信息计量学研究的基本规律有哪些?文献增长/分散/老化/引用/著者/词频/利用……P198、图书馆有那些可量度的单位? 枚举图书馆常用的文献计量学单位(量度)或衡量一个图书馆的基础指标是哪些?馆藏量/馆舍/TDB/用户数。
藏书,建筑面积,年经费,工作人员…… 成为衡量一个馆大小的量度9、文献计量学特征变量:文献量/类型/读者/馆空间容量/文献信息检索点。
如:期刊,学位论文,专利,DB10、图书馆工作中的计量单位:利用率,满意度,文献购置结构,差错率,借阅率,拒借率。
藏书利用率=全年出借册数/全馆藏书总册数x100%11、从图书馆OPAC查书,(小于100),可借状态下,在架的拒借率是与什么因素有关?12、信息计量工具:SCI(WOS), SSCI A&HCI, ESI, JCR CSCD, CSSCI, CNKISPSS13、文献计量学研究的是情报的“载体”表象—形式特征。
信息计量学研究的是情报的“信息”知识—内容特征14、文献信息统计分析法类型有:出版物、著者、科技用语、引文分析、信息利用等统计15、统计一般过程:收集(聚集)\整理(分类/ 整序)\分析(找规律)\推断(预测)16、统计特征值有:中位数,极差,众数,平均值,加权,环比17、情报吸收系数I=N/M 统计时内发文总数/被利用的文献总数P26218、文献信息统计原则: 针对性,准确性,代表性,可比性,累积性19、文献增长规律研究的模型:与质量有关,指数;逻辑;滑动;直线20、增长模型。
信息计量学重点总结

信息计量学重点总结信息计量学概念:是应用数学和统计学方法对科学活动中的信息过程、信息现象和信息规律进行描述和研究的一门学科。
信息计量学主要内容:三个应用范围(核心期刊的测定、信息资源的管理、科学评价),四个方法(引文分析法、信息统计分析法、数学模型分析方法、计算机辅助分析方法),五个定律(增长规律、老化规律、集中与分散规律、著者分布规律、词频分布规律)第一章绪论“信息计量学”(原称“情报计量学”)名称最早是由德国学者布莱克特和西格尔以及昂托·纳克教授在1979年最先提出来的。
1923年,英国学者休姆首次使用了“统计书目学”术语,标志着信息计量这一学科的最早开始。
信息计量学与文献计量学和科学计量学之间的关系:相同之处表现在:研究对象方面,研究内容方面,研究方法方面差异:研究目的方面,研究对象方面,研究内容方面,研究方法方面信息计量学的发展趋势:(1)理论研究(2)规律研究(3)研究方法和手段(4)分支学科网络信息计量学(5)拓宽信息计量学的应用领域第二章信息计量学的理论基础掌握马太效应马太效应的结果——成功产生成功第三章科学信息的增长规律人物:普赖斯科学知识增长与科学文献增长的关系:(1)科学文献是科学知识的载体,是科学知识内容的客观记录;(2)科学知识的增长是科学信息增长的直接原因;(3)科学文献的数量增长情况直接反应科学知识增长的变化,所以科学文献的数量是衡量科学知识量的重要尺度之一;(4)科学文献作为科学知识主要的载体形式,它的变化情况可以作为直接反应科学发展的重要标志;(5)科学知识增长和科学文献增长具有同步性,其增长规律也具有很大的相似性。
科学信息增长模型:线性增长模型,指数增长模型,逻辑增长模型指数增长的数学模型:F(t)=ae bt(a>0,b>0) ,a为时间常数,统计的初始时刻(t=0)文献量;b为时间常数,即持续增长率。
指数增长模型中文献量的计算:文献量翻番时间(k=2)设t1,t2的信息总量为F(t1)、F(t2),且F(t2)=2 F(t1),则有ae bt2 =ae bt1△T= t2- t1=ln2/b=0.6931 文献年增加量△F(t)=F(t)(eb-1) =(eb -1)aebt第四章科学信息的老化规律科学文献老化的测度指标:半衰期与普赖斯指数,两者的异同(概念、功能、数值、使用范围)巴尔顿—凯普勒老化方程(巴-凯方程)的标准公式:科学文献增长与科学文献老化的关系:(1)科学文献的增长和老化从不同方面阐释科学的进步(2)科学文献的增长是促成科学文献老化的重要因素(3)在学科的不同发展阶段科学文献增长和老化速度不同第五章 科学信息的集中与分散规律创始人:布拉德福区域划分:如果将一定时间内的按某种学科载文量等级排列的期刊划分为三个区,使每个区所包含的相关论文数量相等,即恰好等于全部期刊发表的该学科文章总数的1/3,则可发现,第一区(核心区)所涉及的文章来自数量不多但效率最高的n 1种期刊;第二区(相关区)包括数量较大、效率中等的n 2种期刊;第三区(外围区)包括数量最大而效率最低的n 3种期刊。
信息计量学考试知识点整理
信息计量学一、信息计量学概述1。
信息计量学的由来和发展1.1 信息计量学的由来※信息计量学来自于德文Informetrie,由德国学者昂托.纳克(Otto Nache)在1979年最早提出,其后很快出现了与之对应的英文术语informetrics;※由于1987年以来的有关学术会议论文集上都有informetrics标题,因此,很多情报学家都将1987年看成是informetrics被国际情报学界正式承认的一年;※我国将informetrics译为情报计量学,将其作为对应于“情报学”的三级分支学科,1992年,我国有关部门将information从情报改译为信息,informetrics也改译为信息计量学。
1。
2 信息计量学的产生背景(1)信息计量学是在传统文献计量学及科学计量学的基础上扩展和演变而成的;(文献计量学主要服务于图书馆学,情报数量>文献数量,情报计量方法〉文献计量方法,情报学需要开辟与情报学对应的定量化研究领域);(2)信息计量学是情报学发展的需要和必然产物。
布鲁克斯提到:情报学如果不实现定量化,它将是一堆支离破碎的技艺,而不会成为科学。
情报学定量化研究不可或缺。
(3)一批杰出的学科带头人和骨干力量推动了信息计量学发展。
1。
3 信息计量学的形成与发展(1)信息量化研究的前期实践(2)信息计量规律的探索和发现(3)信息计量学的形成Statistical bibliography(1923)——Bibliometrics(1969)—-Scientometrics(1969)—-Informetrics(1979)(4)信息计量学的发展1988年,英国布鲁克斯提出informetrics代替bibliometrics;1990年,比利时埃格赫和鲁索在Introduction to informetrics:quantitative metiods in library,documentation and in formation science中提出学科演进:统计书目学—文献计量学—科学计量学-信息计量学1980年,国际文献联合会(FID)设“信息计量学委员会”(Committee on Informatrics,FID/IM),得到国际信息学界的承认研究内容逐步从文献研究到内容研究从传统的小样本抽样统计到信息计量工具的改进国内情况2。
2信息计量学的理论1
2. 检验数学模型方法
四、利用模型进行分析
1. 对过去历程的评价分析
1. 自身在过去各段不同的历史时期的比较分析 2. 不同的对象在过去历程中的比较分析
2. 对未来发展趋势的预测
1. 自身在未来一段时间发展趋势的预测 2. 不同对象在未来一段时间发展趋势的比较预测
2-.3 文献(信息)计量技术
一.文献数据收集方法
• • • • •
常用于统计: 1.词频统计 2.论文统计 3.著者统计 4.引文统计
齐普夫定律统计 布拉德福定律应用 洛特卡定律应用
• 2. 时序统计法(涉及时间序列的数据) • 常用于: • 1.文献量统计 统计文献量各年度 的变化 • 2.文献利用统计 逐年统计引文频率 或流通频率 • 3.其他统计 专利申请等 • 4.各种时间问题的比较研究
第二章 信息计量学的理论基础
1 信息计量的前提和本质
1.1信息计量学的基础
信息中非确定性因素常常是信息计量学研究 的对象(申农,1948 ) 信息的特性:计量/不可计量
(1)人类信息活动发展的历程
《周易· 系辞· 上》曰:“上古结绳而治,后世易之为书 契。” 《九家易》也说:“古者无文字,其为约誓之事, 事大大其绳,事小小其绳。结之多少随物众寡,各执以相 考,亦足以相治也。”
3、数据分组整理 1. 确定组数 2. 确定组距:a≤x1≤x2≤…≤xn≤b,则组距=(b-a) /K (K为组数) 3. 确定组界 4. 确定组中值:组中值=(上组距+下组距)/2 5. 统计样本数据的频次分布
三、建立数学模型
1. 建立模型的程序
1. 选择模型类型 经验方法 :负冥型 、指数型、线形型 2. 确定参数
3
B 齐普夫 (Zipf) 5
信息计量学期末复习资料
1、 信息计量学有代表性的各种定义,其有共同之处,构成的基本要素为:a 是一门学科;b 采用数学、统计学等方法;c 以各类文献为基础;d 对文献及其各种特征进行定量统计分析2、 信息计量学研究的内容是由研究的对象与任务决定的,形成三大模块:时间序列、信息分布、引证研究。
是以文献计量学为基础,向网络计量学发展3、 信息计量学研究的方法体系:统计分析法,数学模型分析法,引文分析法,计算机辅助信息计量分析法4、 信息计量学形成的三个基本条件:文献可计量;大数量;有规律5、 文献计量学的特点(现象):人为的计量、近似的统计、精确的计算6、 信息计量学研究对象:消息、数据、事件、实物、文本和文献7、 信息计量学研究的基本规律有哪些?文献增长/分散/老化/引用/著者/词频/利用……P198、 图书馆有那些可量度的单位? 枚举图书馆常用的文献计量学单位(量度)或衡量一个图书馆的基础指标是哪些?馆藏量/馆舍/TDB/用户数。
藏书,建筑面积,年经费,工作人员…… 成为衡量一个馆大小的量度9、 文献计量学特征变量:文献量/类型/读者/馆空间容量/文献信息检索点。
如:期刊,学位论文,专利,DB10、 图书馆工作中的计量单位:利用率,满意度,文献购置结构,差错率,借阅率,拒借率。
藏书利用率=全年出借册数/全馆藏书总册数x100%11、 从图书馆OPAC 查书,(小于100),可借状态下,在架的拒借率是与什么因素有关?12、 信息计量工具:SCI (WOS ), SSCI A&HCI, ESI, JCR CSCD, CSSCI, CNKISPSS13、 文献计量学研究的是情报的“载体”表象—形式特征。
信息计量学研究的是情报的“信息”知识—内容特征14、 文献信息统计分析法类型有:出版物、著者、科技用语、引文分析、信息利用等统计15、 统计一般过程:收集 (聚集)\整理 (分类 / 整序)\分析(找规律)\推断(预测)16、 统计特征值有:中位数,极差,众数,平均值,加权,环比17、 情报吸收系数 I=N/M 统计时内发文总数/被利用的文献总数P26218、 文献信息统计原则: 针对性,准确性,代表性,可比性,累积性19、 文献增长规律研究的模型:与质量有关,指数;逻辑;滑动;直线20、 增长模型。
1信息计量学概论
统计书目学
– 1923年 Hulme E.W. Statistical bibliography in relation to the growth of modern civilization. London,England,1923
文献计量学
– 1969年 Prichard A. Statistical bibliography or bibliometrics? Journal of Documentation,1969,25(4):348
(L.Blackert & K.Siege)以及昂托·纳克教授(Otto Nacke)在1979年最先提出来的。在其后的文献中很快就 出现了与之对应的英文术语Informetrics。
4
(1)美国西安大略大学萨克利夫(1992)认为:信息计
量学是对任何形式(不仅仅记录和书目)、任何社会组织 的信息的数量方面的研究。 (2)埃格赫(2005):一个涉及所有与信息科学关联的 定量研究领域,包括文献计量学、科学计量学和网络信息 计量学等 (3)我国学者刘达1981年 “情报计量学” ,认为:情报 计量学就是应用数学方法来研究、描述情报的过程、现象 和规律。 (4)1994年,刘廷元首次使用“信息计量学” 认为研究 内容包括消息、数据、事件、实物、文本和文献等 (5)邱均平 1994年 信息计量学分为广义和狭义概念
科学出版物评价 机构评价
科研工作评价
学科评价
37
3 信息计量的工具和方法
3.1信息计量的数据来源 3.2信息计量的工具和应用软件 3.3信息计量的方法体系
38
3.1 信息计量的数据来源
(1)科技图书 (2)科技期刊 (3)科技报告 (4)会议文献 (5)专利文献 (6)标准文献
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章绪论1.信息计量学定义:采用数学、统计学等各种定量方法,对社会化的信息交流过程中的信息的组织、存储、分布、传递、相互引证和开发利用等进行定量描述和统计,以便揭示社会信息交流过程数量特征和内在规律的一门新兴学科。
2.“三计学”关系(1).“三计学”具有极大的相似性,研究领域存在着相当程度的交叉之处。
(2).从发展历史来看,信息计量学是在传统文献计量学及科学计量学的基础上扩展和演变而成的,文献计量学和科学计量学是信息计量学的学科基础。
(3).从研究现状来看,“三计学”仍然是相互独立的科学学科。
(4).从发展趋势来看,“信息计量学”的研究范围更加广泛,“三计学”将融合到“信息计量学”这一统一的学科体系之下。
定义:文献信息流:具有一系列主题特征的科学文献的集合。
●静态特性:在一定时间内科学文献在空间的分布性质。
布拉德福定律、齐普夫定律、洛特卡定律动态特性:科学文献随时间的延续而增长和老化的性质。
文献信息增长规律、文献信息老化规律●科学知识量的急剧增长是科学文献激增的主要原因●其他原因:社会、教育、材料和加工技术等因素●分类一:绝对值指标:图书数量、期刊数量、论文数量…… 相对值指标:某个学科文献占全部文献的比例、不同类型文献的比例、不同语种文献的比例…..●分类二:非累积数(增量)累积数(总量)●内容:F(t)=ae b t(a>0,b>0)①指数增长模型表示的是“文献累积量”(总量)与时间(年)的关系,未能反映“非累积量”的变化规律。
②科学文献并不总是按指数函数关系增长。
③指数增长公式对起始时间很敏感。
④指数规律不能预测文献的未来增长趋势。
⑤指数增长模型未考虑文献“老化”、“停刊”等问题,与实际情况有出入。
内容:F(t)=k/ (1+ae-kb t) (k, a, b>0)①当t较小时,逻辑曲线与指数曲线相似;在曲线的最初阶段,科技文献是近似地按照指数规律增长的。
②当t很大时,逻辑曲线趋向于一个固定值k;此后不管经过多长时间,文献的累积量只能无限地接近一个固定的数值,但永远不会越过这一极限。
③逻辑曲线的增长速度在拐点处开始趋缓;逻辑增长曲线的拐点坐标为(lna/kb, k/2),最大增长速度为bk2/4。
●局限性分析:给科学文献的增长设定了一个增长的极限。
文献量会有一个不可逾越的有限饱和值K,意味着文献的增长最终会完全停止,知识达到饱和而不再发展了,这与科学发展的现实情况是不相符的。
科学文献随其“年龄”的增长,失去了作为科学情报源的价值,以及因此越来越少被科学家和专家们利用的过程。
一般而言,“文献老化”是针对某一类文献群体而言的,而不是指某一篇或少量具体文献的“老化” 。
文献老化:针对情报用户,情报老化:针对情报对象(客观事物)(参照系统不同)(1)定义:●历时半衰期:某学科已发表的文献中有一半已不再使用的时间。
●共时半衰期:某学科正在利用的全部文献中较新的一半是在多长一段时间内发表的。
(2)意义:●科学文献的“半衰期”反映了科学学科的稳定性。
“半衰期”短,该学科的文献新陈代谢频繁,新文献得到大量应用;“半衰期”长,该学科文献更新缓慢,文献时效性长。
“比较稳定的学科” 比“正在经历重大变化的学科”长;“基础理论学科” 比“应用技术学科”长;“历史悠久的学科”要比“新兴学科” 长。
●不同类型的文献,“半衰期”也不同。
“专著”比“期刊论文、科技报告、会议文献”长;“经典论著”比“一般论著” 长;“理论型刊物”比“报道型刊物” 长。
(1)定义:在某一个知识领域内,把对年限不超过5年的文献的引文数量与引文总量之比。
联系:文献的老化速度越快,则“半衰期” 越短,“普赖斯指数” 越大;文献的老化速度越慢,则“半衰期” 越长,“普赖斯指数” 越小。
区别:文献的“半衰期”只能衡量某一学科领域全部文献的老化情况;“普赖斯指数”既可用于某一领域的全部文献,也可用于评价某种期刊、某一机构、某一作者、某篇文章的老化特点。
●共时法:在某一确定的时间间隔内,选定某一专业领域在该时间间隔内所发表的全部文献,对这些文献的全部参考文献的出版年龄进行统计分析的方法。
历时法:首先选定某一专业领域一定数量的文献,然后再对这一确定的文献集合在以后各年被引用次数进行统计分析的方法。
(1)区域表示法:假设一定时间内(通常为一年)共有N种期刊刊载了某学科的论文(简称为“相关论文”)K篇,将这N种期刊按照所载“相关论文”的数量降序排列,然后,将该序列划分为三个区,使得每个区所包含的”相关论文“的数量相等(即“K/3篇”),则各区的期刊数量满足下列关系:n1:n2:n3=1:a:a2(2)图像表示法:假设一定时间内(通常为一年)共有N种期刊刊载了某学科的论文(简称为“相关论文”)K篇,将这N种期刊按照所载“相关论文”的数量降序排列,然后,将该序列划分为三个区,使得每个区所包含的”相关论文“的数量相等(即“K/3篇”),则前面各区的期刊累积数量满足下列关系:α:β:γ=1:b:b2(b>1)●一定时间内(通常为一年)共有N种期刊刊载了某学科的论文(简称为“相关论文”)K篇,将这N种期刊按照所载“相关论文”的数量降序排列,然后,将该序列划分为m个区,使得每个区所包含的”相关论文“的数量相等(即“K/m篇”),则:n1:n1-2:n1-3: …:n1-m=1:V:V2 : …:V m-1 (V>1)●“维氏(分散)系数”和“布氏(分散)系数”的实质:反映了科学论文在期刊中的分布情况:其值越大,表明该专业的论文在相关期刊中的分布越不均匀,集中与分散的趋势越大,相关论文高度集中在核心区少数几种期刊,其他各区的平均载文率相差也在;其值越小,则该专业的论文在相关期刊中的分布越均匀,集中与分散的趋势越小。
4.格鲁斯下垂 ● 布拉德福曲线中存在格鲁斯下垂:上升的曲线部分-直线部分-弯曲下垂部分原因 ①学科互相交叉渗透,导致文献难以准确地分类;②统计工具本身的不足;③其他因素的干扰。
(期刊的更名、停刊,文献的重复发表等等)● 科学统一性原则:每一个科学学科都或多或少,或远或近地与其他任何一个学科相关联。
因此,属于某学科的文献,不仅仅会出现在这个学科的专业期刊上,而且也时时可能出现在其他学科的期刊上。
● 成功产生成功的原则(the success-breeds-success principle ):一种期刊的文献量越大、质量越高,作者就越愿意将自己的文章刊登在这些期刊上,形成了一种“堆加效应” 。
● 饱和效应(saturation effect ):抑制核心期刊数量的无限增加,此外期刊的载文量是有限的,编辑人员不得不制定出版计划和方针,控制文献的数量● 随着时间的增加,刊登该学科文献的期刊与相关论文数成正比增加,使得布氏定律的图形成直线增长。
¡“单一化的力”:只用一个词就可以表达所有概念为“最省力”;¡“多样化的力”:每个概念都用一个不同的词来表达为“最省力”;在“单一化的力”和“多样化的力”的共同作用下,文献中的词频分布满足“齐普夫分布规律”。
设有一篇文献包含N 个词(N ≥5000),统计其中每个词出现的频次F r ,按照频次递减的顺序排列,并用自然数给这些词编上等级序号r (L ≥r ≥ 1),则:F r ×r = C 或者f r = c ×r -1 l “齐普夫公式”是“朱斯公式”的一种特殊情况。
(b=1)芒代尔布罗三参数公式齐夫第二定律——低频词分布规律¡齐夫第二定律是阐述低频词频次与词数关系的一个定律。
¡具体描述为:设I n 表示为出现频次为n 的词的个数,则I n /I 1大小与文献的长度无关,仅取决于频次n ,即:I n /I 1=2/n(n+1)第六章洛特卡定律1. 洛特卡定律内容f(x) = C / x 2:写了X 篇论文的作者数占作者总数的百分比f(x) ,与其撰写的论文数X 的平方成反比。
x :发表论文数量;lf(x):某领域中发表了x 篇论文的作者数量占作者总数的比例;C :等于在该领域中发表了1篇论文的作者数量占作者总数的比例,即C=f(1)。
f(x) = C / x nR(n) ={s n K n β/lg α)()1(N C C ≤<≤≤n n br Cr F -=x:发表论文数量;f(x):某领域中发表了x篇论文的作者数量占作者总数的比例;C:等于在该领域中发表了1篇论文的作者数量占作者总数的比例,即C=f(1);n:参数,在特定的学科领域是一常数,在不同的学科领域有波动,一般在1.5~4之间变化。
幂指数n的含义●幂指数n表示作者分布分散程度或不均匀程度以及学科或主题相互渗透水平的定量描述,它与各学科\各主题的复杂性及发展现状和规律密切相关. 幂指数n越大,作者分布越分散,即作者分布越平均.●幂指数n因为不同学科或主题研究的对象不同,使用的理论和方法,需要的研究条件和实验手段,研究人员的知识水平和素质,学科自身的难度\特点等因素不同,造成各学科研究人员的研究能力和撰文能力不同,因此不同学科的幂指数n是不同的.●幂指数n的取值大致按自然科学\技术\社科和人文科学的顺序增大.●在某一特定领域中,全部论文的半数系由该领域中全部作者的平方根的那些人撰写的。
布-齐-洛定律的理论解释(1)一般理论解释●马太效应●成功产生成功:“成功”有广泛的含义,诸如:论文的写作与发表,收入的增加,杂志声誉的提高,词汇的被选用等。
已取得的成功次数越多,就越容易在此基础上获得新的成功。
●省力法则支配的人为选择的作用:人的选择要受省力法则支配。
在这种选择作用下,当一系列同类对象被选择时,有的经常被选择,有的不常被选择,这种频度不均匀的选择结果,实际上表征着被选择对象之间个体特性方面的差异,其本身又可以反过来作为再次选择的依据。
如果我们把对象受到一次选择看成一次成功的话,那么这种成功的累积必然容易导致新的成功(2)布-齐洛定律的心理物理学机制●洛特卡定律:科学生产率是指科学家在科学上所表现出来的能力和工作效果,通常用其生产的科学文献的数量来衡量。
这种衡量说到底是人和社会对科学家的主观评价的客观描述。
科学家发表的论文数量(Φ)成为科学生产率的刺激的量表,即反映着科学生产率这种刺激的强弱(大小),该刺激在心理上的反应就是科学家生产率高低的感受(r),即科学家每发表一篇论文提高的生产率(被社会承认的程度)与他已发表的论文数量成反比。
●齐夫定律:客观信息对人产生的刺激,通过思维加工(即反映)形成意识形态的信息产品,即对信息反应的结果,而为了交流,这种反应要客观化,便需要符号,这里是词。
所以,词频大小的序号给出了信息单元的刺激强弱的客观度量,而词频是对反映的客观化的度量。