信息计量学期末复习—Conway

合集下载

信息计量学考试知识点整理-精选.

信息计量学考试知识点整理-精选.

信息计量学一、信息计量学概述1. 信息计量学的由来和发展1.1 信息计量学的由来※信息计量学来自于德文Informetrie,由德国学者昂托.纳克(Otto Nache)在1979年最早提出,其后很快出现了与之对应的英文术语informetrics;※由于1987年以来的有关学术会议论文集上都有informetrics标题,因此,很多情报学家都将1987年看成是informetrics被国际情报学界正式承认的一年;※我国将informetrics译为情报计量学,将其作为对应于“情报学”的三级分支学科,1992年,我国有关部门将information从情报改译为信息,informetrics也改译为信息计量学。

1.2 信息计量学的产生背景(1)信息计量学是在传统文献计量学及科学计量学的基础上扩展和演变而成的;(文献计量学主要服务于图书馆学,情报数量>文献数量,情报计量方法>文献计量方法,情报学需要开辟与情报学对应的定量化研究领域);(2)信息计量学是情报学发展的需要和必然产物。

布鲁克斯提到:情报学如果不实现定量化,它将是一堆支离破碎的技艺,而不会成为科学。

情报学定量化研究不可或缺。

(3)一批杰出的学科带头人和骨干力量推动了信息计量学发展。

1.3 信息计量学的形成与发展(1)信息量化研究的前期实践(2)信息计量规律的探索和发现(3)信息计量学的形成Statistical bibliography(1923)——Bibliometrics(1969)——Scientometrics(1969)——Informetrics(1979)(4)信息计量学的发展1988年,英国布鲁克斯提出informetrics代替bibliometrics;1990年,比利时埃格赫和鲁索在Introduction to informetrics:quantitative metiods inlibrary,documentation and in formation science中提出学科演进:统计书目学—文献计量学—科学计量学—信息计量学1980年,国际文献联合会(FID) 设“信息计量学委员会”(Committee on Informatrics,FID/IM),得到国际信息学界的承认研究内容逐步从文献研究到内容研究从传统的小样本抽样统计到信息计量工具的改进国内情况2.信息计量学的概念和内容体系2.1 信息计量学的概念信息计量学包含:广义和狭义信息计量学:广义信息计量学中的信息与物质和能量共同构成客观世界的3个基本要素,以系统不确定性变化的程度来度量信息;狭义的信息计量学:主要是研究情报信息(或文献情报)的计量问题,主要是采用数学、统计学的方法来分析和处理信息过程中的种种矛盾。

计量经济学复习笔记要点

计量经济学复习笔记要点

计量经济学 总复习第一部分:统计基础知识均值的概念:通常人们所说的均值就是“平均数”,统计意义上的均值是“期望值”。

方差:变量的每个样本与均值的距离大小的概念。

标准差:对方差开根号就是标准差。

数学期望值与方差的数学性质总体方差: 1.常量aE (a )=a 2σ(a)=0抽样方差: 2.变量 y=a+bxE(y)=a+bE(x)总体标准偏差: 2σ(y)=b^2 * 2σ(x)抽样标准偏差:假设检验的定义:事先做一个假设,然后再用统计方法来检验这个假设是否有统计意义。

假设检验的步骤:第一步,设定假设条件。

原定假设,H0:u=u0,和替代假设,Ha:u ≠u0。

第二步,决定用哪种检验, 如果n ≥30,用Z 检验,如果n<30, 用t 检验。

第三步,找出临界值, 根据给定的定义域的大小,即α=1%、α=5%、或 α=10% 从概率分布表中查出Zc 值,或tc 值。

第四步,计算统计值, 或者第五步,比较统计值与临界值而得出结论。

如果统计值的绝对值大于临界值,那么我们就否定原定假设; 如果统计值的绝对值小于临界值,那么我们就不能否定原定假设。

第二部分 最小二乘法最小二乘法的假设条件:(1) (2) (3) (4) (5) 文字解释:Nu x Ni ∑-=22)(σ1)(22--=∑n x xs ni2σσ=2s s =nux Z σ0*-=n s u x t 0*-=)(=X E i ε∞<=22,)(σσεi Var 0),(=j i Cov εε0),(=i i X Cov ε1),(±≠j i X X Cov(1)每个误差必须是随机的,其误差的期望值是零;(2)误差都是雷同的,其方差相等,同时其方差的变化量必须是有限的; (3)每个误差之间必须是相互独立的; (4)误差项与方程式中的自变量是无关的; (5)自变量之间无直接的线性关系。

通用最小二乘法的步骤:第一步:求出误差项:第二步:求误差的平方和最小。

计量经济学本科期末复习要点

计量经济学本科期末复习要点

一、截面数据:是指对于某一经济变量相对于同一时间点上,来自不同个体的数据集合。

时间序列数据:是指某一经济变量,按照时间先后的顺序排列,来自于某一单独个体的数据集合。

混合数据:是指时间序列数据和截面数据的组合。

面板数据也叫纵向数据,指一个截面单位的跨期调查数据。

二、随机干扰项的作用代表缺失的数据众多次要变量数据测量误差模型设定误差变量的内在随机性、三、一元回归模型的基本假设假设1:解释变量是确定性变量,不是随机变量,而且在重复抽样中取固定值。

假设2:随机干扰项具有零均值、同方差的特性。

假设3:任意两个样本点上的随机干扰项(相互独立)是不相关的。

假设4:随即干扰项与解释变量Xi之间不相关。

假设5:随机干扰项服从零均值、同方差的正态分布。

假设6(用于多元线性回归模型):解释变量之间不存在线性关系Cov(Xi,Xj)=0四、判定系数(越大,回归直线与样本点拟合得就越好)TSS(total sum of squares )=ESS(explained sum of squares )+RSS(residual sum of squares )∑yi^2=∑yi^^2+∑ei^2R^2=ESS/TSS=1-RSS/TSS五、参数显著性检验:T检验F检验Z检验显著性检验思想:若变量X 是显著的,那么其对应参数B1应该显著的不为零。

T~T(n-(k+1))通过显著性检验后,进一步衡量参数估计值与真值的接近程度缩小置信区间:增大样本容量;提高模型拟合度六、虚拟变量提高模型估计的精度,就需要根据这些因素的属性对其进行量化,通常用“1”来表示某种状态,用“0”来表示与其对立的状态,这种只取“0”或“1”的人工变量,通常称为虚拟变量或哑变量(dummy variable)。

虚拟变量的引入形式:1、仅影响截距的情况,即只改变截距的形式Y=B0+B1Xi+B2Di+ui (加法形式)2、仅影响斜率的情况B2DiXi(乘法形式)3、既影响截距又影响斜率的情况B2DiXi+B3Di虚拟变量的引入原则:每一定性变量所需的虚拟变量个数要比定性变量的类别数目少1,假如定性变量的类别数目为m,那么只需引入(m-1)即可。

(完整word版)信息论期末复习资料

(完整word版)信息论期末复习资料

书中:1.信息科学,材料科学,能源科学仪器被称为当代的“三大支柱”。

2.带宽与数据传输速率信道带宽与数据传输速率的关系可以奈奎斯特(Nyquist)准则与香农(Shanon)定律描述。

奈奎斯特准则指出:如果间隔为π/ω(ω=2πf),通过理想通信信道传输窄脉冲信号,则前后码元之间不产生相互窜扰。

因此,对于二进制数据信号的最大数据传输速率Rmax 与通信信道带宽B (B=f,单位Hz)的关系可以写为:Rmax =2.f(bps);对于二进制数据若信道带宽B=f=3000Hz ,则最大数据传输速率为6000bps 。

香农定理则描述了有限带宽、有随机热噪声信道的最大传输速率与信道带宽、信噪比之间的关系。

香农定理指出:在有随机热噪声的信道上传输数据信号时,数据传输速率Rmax 与信道带宽B 、信噪比S/N 的关系为: Rmax =B.log2(1+S/N)3.自信息量的性质:非负性、必然事件信息量为0、不可能事件信息量为无穷、信息量是概率的单调递减函数。

4.当X 和Y 相互独立时,互信息为0.5.信源熵表征信源的平均不确定度,平均自信息量是消除信源不确定度所需要的信息的量度。

6信源熵H(X)与信息率R 和信道容量C 的关系:不论何种信道,只要信息率R 小鱼信道容量C ,总能找到一种编码,能在信道上以任意小的错误概率和任意接近于C 的传输率来传送信息。

反之,若R>C,则传输总要产生失真。

又由无失真信源编码定理可知,要做到几乎无失真信源编码,信息率R 必须大于信源熵H (X )。

故三者的关系为:H(x)<=R<=C7.保真度准则下的信源编码定理:即译码平均失真度大于允许失真度。

8.香农三个基本编码定理:无失真信源编码定理、信道编码定理和限失真信源编码定理。

三个基本概念:信源熵、信道容量和信息率失真函数。

9.信源编码、信道编码和安全编码信源编码是以提高通信有效性为目的的编码。

通常通过压缩信源的沉余度来实现。

信息计量学考试

信息计量学考试

1.核心期刊的概念,核心期刊的测定方法核心期刊的概念。

“核心期刊〞(Core Periodicals),是指针对某一学科或专业领域来说,刊载大量专业论文和利用率较高的少数重要期刊,就称为该学科(专业)的核心期刊。

从测定的指导思想和目的来看,核心期刊有两种根本的类型:一是“学科核心期刊〞;二是“馆藏核心期刊〞。

两种类型:一是利用文献计量学工具和指标直接选定各学科的核心期刊。

二是利用文献计量学方法,按照一定的根本步骤来测定核心期刊。

利用布拉德福定律测定核心期刊又有3种具体做法。

1区域分析法。

2图像分析法。

3布氏定律法及百分比补偿。

3.2累积百分比法(80%法)将某一领域的期刊按相关载文量的多少递减排列,然后依次累计排在前面的n种期刊的载文量,并求出前n种期刊的累积载文量与所统计的全部期刊总载文量的百分比;假设到达了选定的要求,则前n种期刊为核心期刊,否则,还须计算n以后的期刊,直到到达这个比值为止。

3.3文摘法。

根据被二次文献摘录的频率大小将期刊依次排成顺序目录,并以此作为期刊重要程度及选择的依据。

凡期刊中被摘录或索引的论文数量较大者,可选为核心期刊。

根据期刊在一次文献中被引用的频率大小将期刊排列成顺序目录,靠前的被大量引用的期刊被认为是某学科的核心期刊。

根据期刊被读者使用(借阅)的频率,也可以产生一个反映读者实际需要的顺序目录,可作为确定核心期刊的依据。

具体来说,就是对馆藏杂志在一定期间内的出借次数、馆内阅览次数、复制量及外借文献的使用次数进展统计分析,流通频率较高者即为核心期刊。

期刊被引用、被摘录、被流通的次数都说明了期刊的利用情况,可以用来作为判断期刊的重要性、确定核心期刊的依据,但它们又各有短处。

为了取长补短,提高核心期刊测定的准确性和有效性,我们可以综合上述3种方法,提出一个较为理想的综合评价法。

2.影响因子的概念,影响因子在科学评介中的作用,存在的问题影响因子(Impact Factor,亦称效果系数):这是一种期刊中论文的平均被引率,等于期刊论文被引量与可引论文总数之比。

郑州大学信息计量学期末考试整理答案

郑州大学信息计量学期末考试整理答案

文献计量学:1、文献计量的三大规律的基本内容、发展状况、局限性和常见的应用1)、洛特卡经验规律:a、是揭示文献著者与数量关系的基本定律。

b、数字表达式为:f(x)=c/x的平方,x表示科学工作者发表的论文数量,f(x)表示发表x 篇论文的著者出现的频率。

上式也称倒数平方定律。

发表一篇论文的著者出现的频率为60%;发两篇论文的著者数量大约是发表一篇论文的著者数量的1/4;发表n篇论文的著者数量大约是发表一篇论文的著者数量的1/n的平方;C、在某一时间内,写了x篇论文的作者数占作者总数的百分比f(x)与其撰写的论文数x的平方成反比。

特点:1、科学论文在作者上集中与分散的分布现象2、采用频次排序的方法,即按某类作者出现的频次大小(实际发表论文数)的排位,而非按照作者所写的论文多少比较来对作者进行等级排序,因而等级上会有空位。

3、论文在作者上的集中与分散程度只限于平方反比关系,即只给出了这种集中与分散程度的单一描述。

4、目前对洛特卡定律的研究主要集中在两个方面:a、对洛特卡一般公式的推导,验证公式的应用范围和估计参数。

B、对洛特卡定理的机理及适用性的研究。

2)、洛特卡定律的局限性:局限性:洛特卡定律是对两组数据统计的推广,是对信息生产的一般理论估计,不是一个精确的统计分布统计,因而有其局限性。

有以下局限:A、统计数据不全,洛特卡定律是根据化学、物理学科得出的结论,其他学科应用是应作一定的修改。

B、对合作者的处理过于简单。

C、对高产作者的处理。

D、洛特卡的数学抽取方法欠科学,在数量大的情况下预测结果才比较客观。

3)、洛特卡定律的具体应用:a、在情报图书馆学方面,一般用它来发表不同数目文章的著者数量和特定学科的文献数量,从而便于掌握文献的增长趋势,进行文献情报的科学管理和情报学的理论研究。

b、在预测科学方面,从统计或估计的科学著者数量懒预测文献数目的增长速度很文献的流动方向,也可以预测科学家数量的增长和科学发展的规模及趋势。

信息论复习要点

信息论复习要点1. 非奇异码:若一个码子中各码子都不相同,则称非奇异码,否则称为奇异码;2. 唯一可以码:若任何有限长信源序列都能译成唯一的信源消息序列,则称为唯一可译码;3. 二元最优码:就某一信源,存在最优的二进制码,其中至少有两个最长的码子有相同长度且仅最后一个码位有别。

4. AWGN 信道的容量:一个加性高斯白噪声(AWGN )信道的噪声功率谱为N 0/2,输入信号平均功率为P ,信道带宽为W ,那么信道每单位时间的容量为:0log 1P C W N W ⎛⎫=+ ⎪⎝⎭(容量单位为比特/秒)5. 对于输入平均功率受限的加性高斯噪声信道,当传输速率R<=C 时,总可以找到一种编码方式,使得差错率任意小;反之,找不到使译码错误概率任意小的编码。

6. 信息率失真理论是有损数据压缩的理论基础,该理论的核心是在保真度准则下的信源编码定理,即香农第三定理。

7. 限失真信源编码定理:()D R R D >→≤存在平均失真的信源编码8. 限失真信源信道编码定理:()D C R D >→≤存在平均失真的信源信道编码9. 和信道及其容量:若一个信道分为若干子信道,且各子信道输入之间互不相交,输出之间也互不相交,信道总的输出与输入集合分为各子信道输出与输入之并集,而且每次传输只能用某个子信道,则称此信道为和信道。

和信道容量:21log 2i NC i C ==∑其中,i C 为每个子信道的容量,第i 个子信道的使用概率为:1222ii iC C Ci NC i r -===∑达到容量时的输入概率为各子信道达到容量时的输入概率乘以i r ,N 为子信道的个数。

10. 各种信息的概率公式:自信息:()()log I x p x =-;联合自信息:()()log I xy p xy =-;条件自信息:()()|log |I x y p x y =-三者的关系:()()()()()||I xy I x I y x I y I x y =+=+; 互信息:()()()()()|,loglog|p x p x y I x y p x y p x =-=; 互信息与自信息和条件自信息的关系:()()(),|I x y I x I x y =-;11. 最佳判决与译码准则: MAP 准则:(输入不等概)(1)信道转移概率矩阵乘以信道输入符号概率得到联合概率矩阵; (2)联合概率矩阵每一列中找到一个最大的概率对应的输入符号就是译码; (3)正确概率是所有译码的概率和,错误概率是1与正确概率的差; ML 准则:(输入等概)(1)信道转移概率矩阵中最大的概率对应的输入符号作为译码输出; (2)正确概率是联合概率分布中译码概率的和,错误概率是1与之的差; 无记忆二元对称信道,最大似然准则等价于最小汉明距离准则;12. 并联高斯信道的容量,能量分布和输入概率分布:(输入均值为0) (1) 并联独立高斯信道:利用注水定理对能量进行分配,计算信道容量,达到容量时,两个信道的输入是独立的,所以输入的概率密度为:()2212122212,22x x p x x σσ⎛⎫=-- ⎪⎝⎭(2) 关联相关高斯信道:将噪声自协方差矩阵分解(如下公式所示),找出等价矩阵,利用注水定理计算信道容量,得到能量分配和输入概率密度公式;41501110122211⎛⎫⎫⎛⎫= ⎪⎪ ⎝⎭⎭⎝⎝ (3) 反推得到输入概率的协方差矩阵,进而得到输入概率的密度公式; (4) 对于独立并联高斯信道,达到容量时各子信道输入是独立的; (5) 对于相关并联高斯信道,达到容量时各子信道输入是相关的; (6) 在总噪声和输入平均能量约束都相同的条件下,相关并联高斯信道的容量大于独立并联高斯信道容量。

信息分析期末复习大纲知识点整理

9.信息整理的层次信息的分类整理大致上包括形式整理和内容整理两个方面。

(1)形式整理不涉及信息的具体内容,而是凭借某一外在依据或特征对原生信息进行分门别类处理。

按承载信息的载体分类整理,按信息使用方向整理,按内容线索部分要点进行整理是三种最基本的形式整理方式。

(2)内容整理是在形式整理基础上的进一步深化,是从内容角度对信息的再处理。

通常包括信息内容的理解,信息内容的揭示,信息内容的细分归类三个阶段。

10.信息价值鉴别(1)可靠性鉴别:包括真实性、完整性、科学性、典型性四个方面的含义。

(2)新颖性鉴别(3)适用性鉴别:指原生信息对于信息接受者而言可利用的程度,一般取决于特定研究课题和信息用户两大因素。

鉴别方法:看信息发生源和信息吸收者吸收条件的相似性;看实践效果;看战略需要。

11.信息分析和提炼的本质(1)侧重于对原生信息进行精加工(2)具有综合性研究的特点(3)是一项综合性很强的思维活动12.信息分析产品的类型及特点(1)消息类产品负责跟踪监视和及时报道特定领域的国内外发展的最新水平、动态和趋势,具有明显的推荐性质。

特点:内容简洁、新颖;报道迅速、及时。

(2)数据类产品以有关课题的各种系统的资料或数据为主要对象,经过加工整理和分析研究所形成的一种信息分析产品。

特点:密度高、系统性强、完整性和准确性好。

(3)研究报告类产品信息分析产品的主力军。

以数据统计和分析、归纳提炼、论证推测为宗旨。

特点:结构严谨、分析深刻、结论明确。

第三章定性分析方法比较,分析与综合,推理,头脑风暴法3.假言推理在信息分析中的应用假言推理是从一个假言判断的结论出发,顺次推出其后件或逆向推出其前件,进而通过肯定它的后件或前件,来论证、检验原先假言判断结论的正确性的一种推理方法。

有着十分广泛的应用,特别是一些捉摸不定、含义不清、边界不明的论断。

eg:有阑尾才得阑尾炎&阑尾已经切除得到不会得阑尾炎4.推理类型的划分(1)根据前提的数量分为直接推理(一个前提)和间接推理(两个及以上)。

信息计量学重点总结

信息计量学重点总结信息计量学概念:是应用数学和统计学方法对科学活动中的信息过程、信息现象和信息规律进行描述和研究的一门学科。

信息计量学主要内容:三个应用范围(核心期刊的测定、信息资源的管理、科学评价),四个方法(引文分析法、信息统计分析法、数学模型分析方法、计算机辅助分析方法),五个定律(增长规律、老化规律、集中与分散规律、著者分布规律、词频分布规律)第一章绪论“信息计量学”(原称“情报计量学”)名称最早是由德国学者布莱克特和西格尔以及昂托·纳克教授在1979年最先提出来的。

1923年,英国学者休姆首次使用了“统计书目学”术语,标志着信息计量这一学科的最早开始。

信息计量学与文献计量学和科学计量学之间的关系:相同之处表现在:研究对象方面,研究内容方面,研究方法方面差异:研究目的方面,研究对象方面,研究内容方面,研究方法方面信息计量学的发展趋势:(1)理论研究(2)规律研究(3)研究方法和手段(4)分支学科网络信息计量学(5)拓宽信息计量学的应用领域第二章信息计量学的理论基础掌握马太效应马太效应的结果——成功产生成功第三章科学信息的增长规律人物:普赖斯科学知识增长与科学文献增长的关系:(1)科学文献是科学知识的载体,是科学知识内容的客观记录;(2)科学知识的增长是科学信息增长的直接原因;(3)科学文献的数量增长情况直接反应科学知识增长的变化,所以科学文献的数量是衡量科学知识量的重要尺度之一;(4)科学文献作为科学知识主要的载体形式,它的变化情况可以作为直接反应科学发展的重要标志;(5)科学知识增长和科学文献增长具有同步性,其增长规律也具有很大的相似性。

科学信息增长模型:线性增长模型,指数增长模型,逻辑增长模型指数增长的数学模型:F(t)=ae bt(a>0,b>0) ,a为时间常数,统计的初始时刻(t=0)文献量;b为时间常数,即持续增长率。

指数增长模型中文献量的计算:文献量翻番时间(k=2)设t1,t2的信息总量为F(t1)、F(t2),且F(t2)=2 F(t1),则有ae bt2 =ae bt1△T= t2- t1=ln2/b=0.6931 文献年增加量△F(t)=F(t)(eb-1) =(eb -1)aebt第四章科学信息的老化规律科学文献老化的测度指标:半衰期与普赖斯指数,两者的异同(概念、功能、数值、使用范围)巴尔顿—凯普勒老化方程(巴-凯方程)的标准公式:科学文献增长与科学文献老化的关系:(1)科学文献的增长和老化从不同方面阐释科学的进步(2)科学文献的增长是促成科学文献老化的重要因素(3)在学科的不同发展阶段科学文献增长和老化速度不同第五章 科学信息的集中与分散规律创始人:布拉德福区域划分:如果将一定时间内的按某种学科载文量等级排列的期刊划分为三个区,使每个区所包含的相关论文数量相等,即恰好等于全部期刊发表的该学科文章总数的1/3,则可发现,第一区(核心区)所涉及的文章来自数量不多但效率最高的n 1种期刊;第二区(相关区)包括数量较大、效率中等的n 2种期刊;第三区(外围区)包括数量最大而效率最低的n 3种期刊。

信息计量学_邱均平_模拟试卷三与答案

《信息计量学》模拟试卷三年级:专业:姓名:学号:一.单项选择1. 以下不属于目前讨论的广义上的科学评价主要范围的是()A科学出版物评价B 信用评价C 科研工作评价D 学科评价2. 科学文献的指数增长规律是由()率先提出的。

A齐普夫B 布拉德福C 普赖斯D 布鲁克斯3. 齐普夫认为,在任何语言中,凡是使用频率()的词,功能总是不会太()。

因为词义本身在这个场合中价值(),因而传递它们所需要的“力”就不()。

A低、小、小、大B 低、大、小、小C 高、小、小、大D 高、大、小、大4. 信息计量学的发生发展符合恩格斯提出的()的结构模式:若从信息计量学的内容的发生来看,它是服从()的;若从信息计量学的形式的发生来看,它是服从()的。

A双律性、他律性、自律性B 双律性、自律性、他律性C 自律性、双律性、他律性D 他律性、双律性、自律性5. 许多研究表明,引文的分布随时间呈现出一定的规律性。

一般来说,随着年度的由远而近,引文量呈()趋势,即时间愈(),被引证的文献愈()。

A减少、近、少B增长、远、多C 减少、近、少D 增长、近、多二.多项选择1. 信息计量学的三个层次的体系结构分别是()A现象学层次B 元学层次C理论学层次D数学层次E 方法学层次2. 下列指标中,属于文献信息统计中最常用的指标有()A流通量B 藏书利用率C 图书周转率D 读者借阅率E 时差系数F 情报吸收系数3. 每一篇被引文献,对于引证者(论文作者)来说,就是有了一篇(),而对于被引证者来说,则是有了一篇()。

通常将这种相互引证的关系结构称为()。

A引文网络B 参考文献C 参考网络D 引证关系E引证文献、4. 布拉德福分布存在着众多的分布模型,主要有()A 西蒙的随机模型B 布鲁克斯的混合泊松分布模型C 纳兰南的序性流模型D 阿拉麦斯库的科学势扩散模型5. 布拉德福定律得基本原理是由其()和()两部分组成的。

A 数学表达B 经验描述C 区域描述D 图像描述三.简答题1. 简述信息计量学研究的基本目的。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

信息计量学1.简述文献计量学的主要进展(7个方面)①每年发表的文献量增长较快,并逐步形成了本学科的核心情报源;②确立并提高了学科的地位;③主要分支领域的研究取得重要成果;④文献计量工具和手段的现代化取得重要进展;⑤专业教育起步快,发展迅速;⑥形成了一支骨干队伍(核心研究队伍已基本形成);⑦国际交流与合作发展势头良好。

2.信息计量学与文献计量学和科学计量学的关系(论述题)(1)信息计量学与文献计量学的关系:文献计量学是信息计量学的基础,信息计量学是文献计量学的发展方向。

①首先,信息计量学着眼于“信息”本身的计量问题,文献计量学主要以作为情报载体的“文献”为计量对象(有时也涉及文献情报)。

②其次,信息计量学较之文献计量学来说,其研究范围更广泛一些。

③再次,从任务和方法上来看,信息计量学研究的任务更为艰巨,更难找到恰当的定量方法和途径。

(2)信息计量学与科学计量学的关系:①从研究目的来看,科学计量学主要是从定量的角度来探讨科学发展的内在规律,最终促进科学技术的进步;而信息计量学的目的也在于:一是探明科学文献本身的规律,以提高信息管理的科学性;二是通过信息规律的探讨,进而揭示科学技术的规律性。

②从研究对象和方法来看,两者极为类似。

科学计量学研究的科学文献及其数量也是信息计量学的研究对象之一。

在方法上,两者都要运用数学和统计学的定量方法,对科学文献等信息进行定量的分析研究;在研究内容上,信息计量学与科学计量学在一个相当大的范围内是彼此交叉的。

③但是,应当明确指出:信息计量学与科学计量学有着很大的区别。

首先,信息计量学的范围要比科学计量学的范围广很多;其次,它们的研究目的是不一样的;最后,它们应用的领域也有所不同,信息计量学在文献,人才,学科,单位,数据评价方面发挥了很大作用,可以涉及的面非常广泛。

而科学计量学在科学机制和科学政策的制定方面发挥了非常重要和独特的作用。

3.什么叫文献信息流,文献信息流的特性。

文献信息流:在信息计量学中,通常把文献所含信息的汇流称为文献信息流。

由于文献是信息的最基本的载体形式,文献信息流是具有一系列主题特征的科学文献的集合,所以有时将文献信息流简称为文献流。

特性:静态特性和动态特性。

4.什么叫格鲁斯下垂。

格鲁斯下垂:布拉德福曲线在进入直线部分后,并非无休止的直伸下去,后来总要弯曲下垂,因而使得布拉德福的图形变为明显的三个部分:上升的曲线部分—直线部分—弯曲下垂部分。

5.什么是文献老化和半衰期。

文献老化:科学文献随其“年龄”的增长,其内容日益变得陈旧过时,作为情报源的价值不断减小,甚至完全丧失其利用价值。

(过程观认为文献老化是一种过程,状态观认为文献老化是一种状态,过程状态辩证观认为文献老化既是一种过程又是一种状态。

)半衰期:某学科(专业)现时尚在利用的全部文献中较新的一半是在多长一段时间内发表的(共时半衰期);这与该学科一半文献失效所经历的时间(历时半衰期)。

6.什么叫普赖斯指数。

普赖斯指数:在某一个知识领域内,把对年限不超过5年的文献的引文数量与引文总量之比当做指数,用以度量文献的老化速度和程度。

7.布拉德福定律的基本内容。

基本内容:①区域描述:如果将科学期刊按其登在某个学科的论文数量的大小,以渐减顺序排列,那么可以把期刊分为专门面向这个学科的核心区和包含着与核心区同等数量论文的几个区。

这时,核心期刊与相机各区的期刊数量成1:a:a2……的关系。

②图像描述(4-2分散曲线)8.齐普夫定律的理论基础。

理论基础:最省力法则(在各种人为选择中,人们都自觉或不自觉地共同遵守着这一基本的行为选择法则,即最省力法则)。

9.布拉德福定律、齐普夫定律、洛特卡定律分别称为什么?布拉德福定律又称:文献信息集中与离散分布规律齐普夫定律又称:文献信息词频分布规律洛特卡定律又称:文献信息作者分布规律10.文献信息统计的原则要求。

原则:①针对性;②准确性;③代表性;④可比性;⑤累积性11.文献信息统计分析法的基本步骤。

基本步骤:(1)统计调查:①确定具体方法。

②选准统计工具。

③明确指标项目。

④统计原始数据。

(2)统计整理: ①计算。

②排序。

③表示。

(3)统计分析:①理论指导下的分析。

②数值分析。

③图像分析。

12.何为引文分析法,试举例说明其基本步骤及意义。

引文分析:就是利用各种数学及统计学的方法和比较,归纳,抽象,概括等逻辑方法,对科学期刊,论文,著者等各种分析对象的引证与被引证现象进行分析,以便揭示其数量特征和内在规律的一种文献计量分析方法。

基本步骤:①选取统计对象:根据所要研究的学科的具体情况,选择该学科中有代表性的较权威的杂志,确定若干期或若干篇相关论文作为统计的对象。

②统计引文数据:在所选的若干篇论文中,分项统计每篇论文后面引文的数量,引文的出版年代,语种,类型,论文作者的自引量等。

③引文分析:在获取的引文数据的基础上,根据研究的目的,从引文的各种指标或其他不同的角度进行分析。

④作出结论:根据引文分析原理和其他一般原则进行判断和预测,从而作出相应的分析结论。

意义:科学引文虽然由众多学者所引证,又分别出自不同的来源期刊或文献中,而且在很大程度上受到人为控制因素的影响,具有较大的随机性。

但是,科学引文具有一定的分布结构和规律性。

13.简述SCI-E和ESI的结构,特点和主要功能。

1.SCI结构:(1)概括性的总体介绍(2)引文索引:①作者引文索引②团体作者引文索引③匿名引文索引④专利引文索引(3)团体索引:①地区部分②机构部分(4)来源索引(5)轮排主题索引SCI-E特点:①特色链接(内部和外部)②充分利用www网罗天下的强大威力,SCI网络版彻底改变了传统的文献检索方式③SCI网络版每周更新,并且每次更新即更新整个系统中的所有链接,包括被引次数,参考文献,相关文献的链接。

④SCI网络版允许检索整个数据库或指定检索年份⑤SCI网络版可以直接收录纯电子期刊便于及时反映相关研究成果。

SCI-E功能:(1)两种网络路径检索:Web版的ISI Web of Science和联机版的SCI Search(2)数据库检索方式:简易检索和全面检索(一般检索和被引文献检索)。

2.ESI结构:(1)引文排位:科学家排名,机构排名,国家排名,期刊排名,顶尖论文链接。

(2)高被引论文:高被引论文,热门论文,时间序列图链接。

(3)引文分析:基线(篇均被引频次和百分点),研究前沿。

ESI特点:①基本的分析工具②服务对象的广泛深入③综合全面的数据,论文和课题④与其他信息资源的连接与整合。

ESI功能:(1)检索功能:①引文排序②高被引论文的检索③研究前沿④检索规则(2)评价功能:①分析某个公司,研究机构,国家以及期刊的科学研究绩效②跟踪自然科学和社会科学领域内的研究发展趋势③分析评价员工,合作者,评论家以及竞争对手的能力④测定某一专业研究领域内科学研究成果的产量和影响力。

(评价功能具体体现在:对科研成果的评价,对科技人才的评价,对科研机构的评价,对科学出版物的评价,对科学学科本身的评价)14.什么是影响因子,什么是即年指标。

影响因子:评价和比较一种期刊相对于同学科中其他期刊影响力和重要性的指标。

影响因子等于某刊前两年发表论文在该年的被引证次数除以该刊前两年发表论文总数。

即年指标:评价期刊中的论文被引证的速度,或者在同一年内期刊中的论文被引证的频率。

即年指标等于该刊某年发表的论文在当年的被引次数除以当年发表论文的篇数。

15.引文耦合和同被引的概念及二者异同。

引文耦合:引证文献通过其参考文献(被引证文献)建立的耦合关系。

同被引:指两篇(或多篇)文献同时被后来的一篇或多篇论文所引证,则称这两篇论文(被引证论文)具有“同被引“关系。

相同:①都是指两篇论文通过另外一篇或多篇论文建立起来的关系,所以都可以反映出文献之间的联系程度和结构关系,在引文分析中属于同一种类型。

②这两种研究方法都可以用于研究文献关系,进行文献检索和揭示学科结构等。

不同:①引文耦合反映的是两篇引证文献之间的关系,同被引反映的是两篇被引证文献之间的关系。

②引文耦合强度是固定不变的,同被引强度则随时有可能发生变化。

③引文耦合反映的文献间的关系是一种固定的长久的关系,而同被引反映的则是变化的或暂时的关系。

④引文耦合是回溯的,属于“回向引证”,而同被引则是展望性的,属于“前向引证”。

⑤对于研究和解释科学文献的内在联系与规律,描绘科学发展的动态结构来说,“同被引”比“引文耦合”更具有优越性,更适应当代情报科学研究的对象是不断变化和发展的特点。

16.引文分析法的应用领域,应用举例和局限性。

应用领域:①测定学科的影响和重要性②研究学科结构③研究学科情报源分布④确定核心期刊⑤研究科学交流和情报传递规律⑥研究文献老化和情报利用规律⑦研究情报用户的需求特点⑧科学水平和人才的评价应用举例:农业科学研究的例子—①选取分析对象②统计引文数据③引文分析④作出结论局限性:①文献被引证并不完全等于重要②著者选用引文受到可获得性的影响③引文关系上假联系的影响④马太效应的影响17.什么叫核心期刊,核心期刊的测定意义,测定方法和主要步骤(举例)。

核心期刊:指针对某一学科或专业领域来说,刊载大量专业论文和利用率较高的少数重要期刊,就称为该学科(专业)的核心期刊。

测定步骤:(1)布氏定律法及百分比补偿:①区域分析法②图像分析法③布氏定律法及百分比补偿(2)累积百分比法(80%法)(3)文摘法:①选准统计的文摘杂志②统计期刊的被摘录量并排序③计算累积文摘率④进行交叉对比(4)引文法:①分析多种杂志的引文法②分析单一杂志的引文法③利用引文工具的引文法(5)流通率法(6)综合评价法意义:①图书情报单位科学管理上的需要②科技工作者重点阅读的需要③提高信息检索和文献信息服务效率的需要。

、18.信息计量学的基本原理和基本内容有哪些?基本原理:(1)科学文献量可以反映科学或技术发展的程度和阶段;(2)科学文献量的国家分布或语种分布,反映不同国家某项科学技术的研究力量和技术优势;(3)科学文献量的增减变化速度反映科技发展的速度,文献量的翻倍周期一般可作为衡量科学发展的尺度;(4)文献量的突变反映了科技发展的转折性变化:由增长趋势向平缓趋势,衰落的趋势转变,或从发展过程向衰退过程转变等;(5)科研机构发表的文献量可以反映该机构的技术实力和研究成果,等等。

基本内容:(1)研究科学发展特点:①科学发展速度加快②科学发展具有继承性③科学发展具有阶段性④学科间具有交叉渗透性⑤科学发展重点的转移⑥科学劳动的集体性(2)研究科学结构:①利用书目(篇目)分析法研究科学结构(1.书目结构往往反映学科结构。

2书目的数量变化往往反映学科发展的动态特征。

)②利用引文分析法研究科学结构(1.科学引文与被引文之间有着一定的内在联系。

相关文档
最新文档