从主流应用工具看科技情报的定量化研究
实时荧光定量PCR的研究进展及其应用

实时荧光定量PCR的研究进展及其应用一、本文概述实时荧光定量PCR(Real-Time Quantitative PCR,简称qPCR)是一种在分子生物学领域广泛应用的分子生物学技术,它能够在PCR 扩增过程中实时监测反应产物的积累,从而精确地定量目标DNA或RNA的初始浓度。
自20世纪90年代诞生以来,qPCR技术以其高灵敏度、高特异性、快速性和定量准确等优点,在基因表达分析、病原体检测、基因型鉴定、基因突变分析、药物研发等多个领域发挥了重要作用。
随着技术的不断发展和完善,实时荧光定量PCR已成为现代生物学研究中不可或缺的工具。
本文旨在全面综述实时荧光定量PCR技术的最新研究进展,包括其原理、方法、技术优化、应用领域的拓展以及面临的挑战等。
文章首先简要介绍qPCR技术的基本原理和常用方法,然后重点论述近年来在技术优化、多重PCR、数字化PCR等方向上的进展。
接着,本文详细探讨实时荧光定量PCR在基因表达分析、病原体检测、基因型鉴定、基因突变分析、药物研发等领域的应用案例和前景。
文章还将讨论实时荧光定量PCR面临的挑战,如引物设计、数据分析等问题,并提出相应的解决方案。
通过本文的综述,读者可以对实时荧光定量PCR技术的最新进展和应用有一个全面的了解,为相关研究提供参考和借鉴。
二、实时荧光定量PCR的基本原理与技术特点实时荧光定量PCR(Real-time Fluorescent Quantitative PCR,简称qPCR)是一种在PCR扩增过程中,通过对荧光信号的实时检测,对特定DNA片段进行定量分析的技术。
其基本原理是利用荧光染料或荧光标记的特异性探针,在PCR反应过程中实时检测PCR产物量的变化,从而得到DNA模板的初始浓度。
实时性:通过荧光信号的实时检测,可以实时了解PCR产物的生成情况,无需PCR结束后进行电泳等后续操作,大大缩短了实验时间。
定量性:通过标准曲线的建立,可以准确地计算出DNA模板的初始浓度,实现了PCR的定量分析。
第三节-文献计量学方法

普赖斯指出: 普赖斯指出:科学发展的所有明显的指数 型终将成为逻辑型模型。 型终将成为逻辑型模型。 指数型是逻辑型的发展的初始阶段, 指数型是逻辑型的发展的初始阶段,而逻 辑型是指数型最终的发展趋势。 辑型是指数型最终的发展趋势。 逻辑型曲线的局限性是导致科学发展的极 限论,增长率为零。 限论,增长率为零。 3.普赖斯—纳里莫夫循环曲线 .普赖斯 纳里莫夫循环曲线
四.文献老化规律的应用
在文献管理中的应用 1 指导剔旧工作,优化馆藏 指导剔旧工作, 2 提高文献服务的质量和效率 在科学学和科技史研究中的应用 根据文献老化曲线和量度数据, 根据文献老化曲线和量度数据 , 可以判断学科 的性质以及所处的发展阶段, 的性质以及所处的发展阶段 , 对学科的发展方 向和发展趋势作预测。 向和发展趋势作预测。
图书馆学
文献计量学
科学计量学
情报计量学
科学学
情报科学
目前发展的趋势
从文献计量向情报计量发展
-- 情报学定量化研究: 文献计量学及其应用 (46.4%);情报检 索; 情报学理论研究;情报经济学与情报成果评价. -- 计量单元:册\本为单位的文献单元->内部知识单元
计算机辅助的计量研究和应用
-- 大量\规范数据源 -- 数据处理和分析工具
局限性 --科学文献并不总是按指数函数增长,还与 学科和统计时间有关。学科范围越广泛, 符合指数规律的时间越长;开始统计的时 间越晚,增长率值越大。 -- 指数增长曲线已有平缓趋势 -- 指数规律不能预测文献的未来增长趋势
反映历史,不能预测未来 对科学文献增长的机理研究不够 没有考虑停刊因素 没有考虑老化因素
3. 期刊累计载文量大致相等的三个区域,这 期刊累计载文量大致相等的三个区域, 三个区域的期刊数量之比1 三个区域的期刊数量之比1:5:52
基于政策工具视角的我国科技人才政策文本量化分析

第23卷第10期2023年10月创新科技Innovation Science and Technology Vol.23No.10 Oct.2023基于政策工具视角的我国科技人才政策文本量化分析张毅,吴云云(华中科技大学公共管理学院,湖北武汉430074)摘要:科技人才越来越成为我国科技创新发展的关键力量,而我国科技人才政策的政策工具选择与使用尚存在不足之处。
为此,基于政策工具视角,对2011年《国家中长期科技人才发展规划(2010—2020年)》发布以来至2023年8月31日,我国国家层面发布的68份科技人才政策进行内容分析。
按照分析框架构建、分析单元定义、编码统计分析等步骤展开,借助MAXQDA这一分析软件,从政策工具和科技人才开发体系要素两个维度剖析我国科技人才政策的政策工具选择、组合的特点及问题。
研究表明,我国科技人才政策的政策工具分布广泛但结构不均衡,据此提出了未来我国科技人才政策优化的建议。
关键词:政策工具;科技人才;政策文本;内容分析中图分类号:F124.3;C964.2文献标志码:A文章编号:1671-0037(2023)10-63-13DOI:10.19345/j.cxkj.1671-0037.2023.10.0060引言党的二十大报告提出,“教育、科技、人才是全面建设社会主义现代化国家的基础性、战略性支撑”[1]。
可见,科技人才的重要性日益凸显。
因此,为推动科教兴国、人才强国战略,近年来我国制定和出台了一系列科技人才政策,为科技人才发展提供了制度保障。
与此同时,围绕科技人才政策的学术研究也逐渐深入,对科技人才政策的体系构建和整体性分析成为研究的热点话题。
科技人才政策是一类综合复杂的人才政策,既涉及科技人才管理的不同阶段,也涉及政策内部各种政策工具的设计与搭配[2]。
作为贯穿政策目标和实施效果的桥梁和纽带,科技人才政策工具的选择与应用对实现既定的政策目标具有关键性作用[3]。
因此,从政策工具视角出发对科技人才政策进行分析具有一定的理论和现实意义。
专利信息的情报功能以及定量分析方法

专利信息的情报功能以及定量分析方法作者:王宇来源:《知识文库》2016年第14期在现代社会,知识产权愈发重要,专利则是其中最关键的部分。
获得专利信息,可以有效地促进研发工作。
所谓运用专利信息,其实主要是研究和利用专利情报,即运用专利信息的情报功能,它包括经济、技术和法律。
在浩如烟海的信息中,想要获取有用的情报,就必须对信息进行分析、筛选、整理等,因此,定量分析方法应运而生。
在现代社会,知识对于经济、社会进步等的促进作用越发明显,知识产权也愈发受到人们的重视。
作为其中最重要的一部分,专利更是受到关注。
专利信息是非常重要的技术信息源,若能有效运用其中的情报,对企业、国家都大有帮助。
为了最大限度地开发和利用专业信息,得到有用的情报,有关人员研究出了实用有效的分析方法,定量分析就是其中的一种。
1.专利信息的情报功能1.1专利信息简述某项专利技术在申请专利的过程中涉及到的信息就是专利信息,如专利的申请日期、专利权的范围、法律状况等。
它以专利文献作为依据或主要内容,经过分解、标记、加工、统计、整合、分析、转化等手段处理,通过信息化方式传播,包括技术信息、经济信息、法律信息、战略信息和著录信息等。
专利信息的特点则有内容新颖广泛、分类明确和描述详细。
1.2专利信息的情报功能由于包含专利信息,专利文献可以发挥情报功能,主要包括经济情报功能、技术情报功能和法律情报功能。
把专利信息转化为有用的情报,继而进行开发和利用,以充分发挥专利信息的情报功能。
技术情报功能指的是专利文献对于某种技术的详细介绍、图文说明、可以应用的科学领域等相关信息。
通过技术情报,可以迅速了解某种技术。
另外,市场的需求促使相关人员不断研发新技术,而研发需要有一个确定的方向。
通过对技术情报进行分析,可以了解到某一技术的当前情况,如其组成和扩张、不同技术领域的关联、研究热点、成熟度等,进而迅速确定研发方向,避免不必要的花费。
经济情报与技术本身的价值及市场经济相关。
生命科学研究中的定量分析方法

生命科学研究中的定量分析方法随着科技的不断进步,生命科学研究的范围和深度越来越广泛。
在这个领域内,定量分析方法广泛应用于各种生物实验中,从蛋白质组学到基因组学,从细胞信号转导到生物图像学,都离不开定量分析方法的支持。
本文将讨论在生命科学研究中常见的一些定量分析方法及其应用。
1. 光学显微镜下的细胞成像定量分析细胞成像是生命科学研究中广泛应用的一种技术,通过光学显微镜观察并记录细胞的运动和形态变化,这些信息对于细胞的功能研究至关重要。
但是,单纯的人工分析往往存在主观性强、效率低的问题。
因此,针对细胞图像,常常需要进行数字化处理和自动化分析。
目前,常用的细胞图像分析方法包括形态学分析、图像处理、图像识别、计算机视觉等技术。
这些方法可以对细胞图像中的特征进行定量提取、分类、比较和统计,如细胞大小、颗粒数量、颗粒大小、细胞形态学特征、三维重建等。
2. 蛋白质组学中的质谱定量分析蛋白质是生命科学研究中一个重要的分子,其含量和表达水平对于细胞代谢、生长和发育等生理过程发挥重要作用。
质谱技术是当前蛋白质组学中常用的一种技术,不仅可以识别蛋白质的种类和位置,还可以对蛋白质的表达量进行定量分析。
蛋白质的定量分析通常有相对定量和绝对定量两种方法。
相对定量方法通过比较蛋白质在不同样品中的比较值,可以定量分析其表达量的差异。
而绝对定量方法则需要使用内部标记物,通过比较不同样品中内部标记物和需要测量的蛋白质的比值,计算出蛋白质的精确表达量。
3. 基因组学中的测序定量分析基因组学研究是生命科学研究中最重要的领域之一。
测序技术可以对基因组序列和基因表达水平进行分析,了解基因的功能和调控机制。
随着测序技术的不断发展,测序数据不断增加,对于这些数据进行定量分析显得尤为重要。
目前,测序定量分析主要含有两个方面。
一方面是RNA测序(RNA-seq)技术,它可以测定不同样品中的基因表达水平,从而分析基因的功能和信号通路;另一方面是 DNA测序(DNA-seq)技术,可以研究粒子浓度、物质互作等领域。
科技创新的评价指标体系研究及其应用

科技创新的评价指标体系研究及其应用随着科技的不断发展,科技创新在经济和社会的发展中起着越来越重要的作用。
科技创新的评价指标体系是科技创新发展的重要基础。
本文将从科技创新的定义、发展现状以及科技创新的评价指标体系研究与应用等方面来阐述科技创新的重要性和指标体系的积极推广和应用。
一、科技创新的定义和发展现状科技创新是指一种独特的、以技术为核心的新型价值创造方式。
科技创新可以是基础性的、应用性的、流程性的、机制性的等。
这种创新方式不仅是企业发展的基础,也是国家经济发展的重要支柱。
当前,全球科技创新正处于一个高速发展的时代。
为了在全球化的背景下更好地面对科技创新的挑战,科技创新的评价指标体系也在不断更新和完善。
针对这一趋势,目前一些主流的评价指标体系被广泛采用和应用,如美国、欧盟和中国等地区的评价指标体系。
二、科技创新评价指标体系的研究和应用科技创新评价指标体系是评价和监测科技创新发展的关键性工具之一。
科技创新评价指标体系可通过对科技创新的目标、成果、质量等方面进行综合评估,以对科技创新进行量化、定量分析和综合分析。
(一)科技创新评价指标体系的构建科技创新评价指标体系的构建是一个复杂的系统工程。
构建科技创新评价指标体系需要考虑不同科技领域的特殊性,以及不同地区和组织的科技创新具体情况。
在指标体系构建中,需要考虑以下几个方面:一是科技创新的目标,二是科技创新过程的阶段和动态特征,三是科技创新成果和质量的多维度分析,四是科技创新的贡献效应和社会影响。
(二)科技创新评价指标体系的应用科技创新评价指标体系的应用主要包括两个方面:一是科技创新政策的制定;二是科技创新质量的评价。
科技创新政策的制定需要基于科技创新的具体环境和前景,以及科技创新评价指标体系的具体应用状况。
科技创新质量的评价基于科技创新评价指标体系,可以评估科技创新质量的水平和发展趋势,以实现科技创新的质量优化。
三、科技创新评价指标体系的优势和局限科技创新评价指标体系的优势主要体现在其能够对科技创新进行全面和客观的评估。
关于科技情报研究工作的几点思考
关于科技情报研究工作的几点思考作者:高恒邢程来源:《中国科技博览》2019年第02期[摘要]随着信息时代的到来,信息的数字化、一体化和网络化建设得到了快速发展,而获取相应信息也比以往任何时候都要快速、便捷,从而给科技情报研究机构的信息服务工作带来了极大的挑战。
基于此,下文对科技情报研究工作的问题进行了分析,并提出了相应的解决措施,希望对相关人员提供帮助。
[关键词]科技情报研究;问题;措施中图分类号:R6 文献标识码:A 文章编号:1009-914X(2019)02-0254-01引言科技情报工作是科技发展的重要基础,随着科技体制改革的不断深入,科技情报机构成为了促进新知识传播的骨干力量,并且为国家的经济发展、社会信息化以及科技进步作出了巨大贡献。
同时,科技情报研究机构在面对新任务、新情况、新时期时,要把握住机遇,不断开拓创新,从而开创科技情报工作的新局面。
1科技情报研究工作的流程和服务效果科技信息工作在经过多年的发展后,已经初步形成了由众多科技信息机构组成的科技情报工作体系。
首先,建立了动态跟踪体系,其是指对某一领域的发展动向进行跟踪、积累数据并报道,从而切实发挥了“尖兵、耳目”的作用;其次,开展了一系列综合性、战略性的情报研究工作,并取得了一大批影响力较大的研究成果,从而为相关机构提供了重要的决策情报保障;最后,在情报研究的基础上,针对不同用户需求,开发了内容丰富、表现形式多样的系列情报研究产品,并取得了一定的效果。
同时,科技情报研究机构的服务意识也逐渐增强,其针对相关机构关心的重点、热点问题,积极组织力量,攻坚克难,及时服务,受到相关机构好评和肯定。
2当前科技情报研究工作存在的主要问题2.1整体人员素质不高在传统的科技情报服务机构中,所要完成的业务一般包括对文献的采集、题录和二次文献开发以及为用户提供基本的借阅服务,对工作人员的专业知识水平的要求不是很高。
然而,在进入网络时代后,信息服务的升级以及服务面的拓展对科技情报工作人员的综合素质提出了较高的要求,其不仅要掌握传统的文献分类处理基础知识,还需要掌握大数据的基本处理技术,以便对海量的文献数据完成网络线上分析、整理和推送,为读者提供实时的信息服务。
以事实型数据为基石的科技情报研究探讨
以事实型数据为基石的科技情报研究探讨摘要:科技情报工作随着经济以及科学技术的发展在不断的发展和进步,所以为了能够更好地进行相应的科技情报工作,我们就需要对科技情报进行相应的研究。
其中本文对以事实型数据为基石的科技情报研究进行了详细的分析以及探讨,全文分为三大部分,第一部分:对目前我国国内的科技情报工作的相关的研究方法的思考以及分析;第二部分:增强事实型数据资源库的相关建设对于相应的科技情报研究的重要意义;第三部分:对于国内外关于以事实型数据为基石的科技情报研究的进展详述。
关键词:事实型数据科技情报研究工作现在,关于科技情报的相关研究工作已经成为了科技情报机构的非常主要的业务之一。
在进行科技情报的主要研究工作过程中,科技情报的研究方法论对提高科技情报的相关研究工作的整体水平,或者相关的科技决定的影响力来说具有非常重要的作用。
利用事实型数据作为工作前提以及基础,将事实型数据、专用方法的工具以及相关专家的智慧进行有效的综合集成的科技情报的研究方法是一种非常有效的方法论。
该种方法论进行工作的主要思路:相关的工作人员建造、积累以及更新相应的事实型数据库,之后对于特定的相关的科技问题,组织或者成立相关的研究工作队伍,与此同时利用各种定量方法以及定性方法的有效结合的系统集成的方法,对相应的事实型数据库进行认真的分析或者研究,从而根据这些分析以及研究结果中找到某些规律,然后通过相关的方面的专家或者学者的专业知识以及智慧,提出一些具有实践性意义的指导性的意见以及建议。
现在很多科技情报机构的工作人员开始广泛的利用“事实型数据、专用方法的工具以及相关专家的智慧进行有效结合”的科技情报的研究工作方法,从而更好地完成相应的科技情报机构的相关的研究工作。
“事实型数据、专用方法的工具以及相关专家的智慧进行有效结合”的科技情报的工作研究方法论进行实际运用的前提以及基础,就是在现实的工作过程中真正的存在事实型的数据库。
1、对目前我国国内的科技情报工作的相关的研究方法的思考以及分析我国的科技情报工作经历了大约50年的发展,其中相关的研究过程主要经历了五个阶段,具体阶段就是翻译报道、学科专业研究、情报综述以及评述研究、决策支持研究和参与决策的知识服务等等这五个阶段,随着科技情报工作的不断发展以及进步使得服务于国家的科技情报工作的研究以及决策能力在很大程度上有了提升。
定量研究方法(Quantitative-Research-Method)
什么是定量研究?定量研究一般是为了对特定研究对象的总体得出统计结果而进行的。
定性研究具有探索性、诊断性和预测性等特点,它并不追求精确的结论,而只是了解问题之所在,摸清情况,得出感性认识。
定性研究的主要方法包括:与几个人面谈的小组访问,要求详细回答的深度访问,以及各种投影技术等。
在定量研究中,信息都是用某种数字来表示的。
在对这些数字进行处理、分析时,首先要明确这些信息资料是依据何种尺度进行测定、加工的,史蒂文斯(S. S. Stevens)将尺度分为四种类型,即名义尺度、顺序尺度、间距尺度和比例尺度。
[编辑]定量研究的四种测定尺度及特征名义尺度所使用的数值,用于表现它是否属于同一个人或物。
顺序尺度所使用的数值的大小,是与研究对象的特定顺序相对应的。
例如,给社会阶层中的上上层、中上层、中层、中下层、下下层等分别标为“5、4、3、2、1”或者“3、2.5、2、1.5、1”就属于这一类。
只是其中表示上上层的5与表示中上层的4的差距,和表示中上层的4与表示中层的3的差距,并不一定是相等的。
5、4、3 等是任意加上去的符号,如果记为 100、50、10 也无妨。
间距尺度所使用的数值,不仅表示测定对象所具有的量的多少,还表示它们大小的程度即间隔的大小。
不过,这种尺度中的原点可以是任意设定的,但并不意味着该事物的量为“无”。
例如,O°C 为绝对温度273°K,华氏32°F。
名义尺度和顺序尺度的数值不能进行加减乘除,但间距尺度的数值是可以进行加减运算的。
然而,由于原点是任意设定的,所以不能进行乘除运算。
例如,5℃和 10℃之间的差,可以说与15℃和20℃之间的差是相同的,都是5°C。
但不能说 20℃就是比5℃高4倍的温度。
比例尺度的意义是绝对的,即它有着含义为“无”量的原点0。
长度、重量、时间等都是比例尺度测定的范围。
比例尺度测定值的差和比都是可以比较的。
例如:5分钟与10 分钟之间的差和10分钟与15分钟之间的差都是5 分钟,10 分钟是2分钟的5倍。
新形势下科技情报研究的方法体系研究
新形势下科技情报研究的方法体系研究梁恩武 高云峰 刘全全 宋志学 张双双 冯钊 郑天宇(中海油能源发展股份有限公司工程技术分公司 天津 300452)摘要:适应大数据、智能化新形势下科技情报研究的方法体系对科技情报、科技创新工作至关重要。
该文以现阶段科技情报研究的问题为基础,结合决策者对大样本的需求,探究了科技情报工作的方法体系。
结果显示:对于公开信息研究,需从人力驱动型科技情报研究模式转向大数据智能化分析科技情报研究模式,过程中需要人员、工具、体制上的协同;对于核心情报研究,得出了核心技术资料的获取路径。
大数据智能化分析科技情报研究模式能够在有限的时间产出高质量的情报研究成果,为决策者提供支持,为技术高质量发展提供支撑。
关键词:新形势 科技情报 大数据 智能化中图分类号:G354文献标识码:A 文章编号:1672-3791(2023)19-0210-04 Research on the Method System of Scientific and Technological Information Research under the New SituationLIANG Enwu GAO Yunfeng LIU Quanquan SONG Zhixue ZHANG Shuangshuang FENG ZhaoZHENG Tianyu(CNOOC EnerTech-Drilling & Production Co., Tianjin, 300452 China)Abstract:The method system of scientific and technological information research which adapts to the new situation of big data and intelligence is very important for scientific and technological information and scientific and techno‐logical innovation work. Based on the problems of scientific and technological information research at the present stage, this paper explores the method system of scientific and technological information work in combination with the needs of decision makers for large samples. Research results shows that for open information research, it is nec‐essary to change from the human-driven scientific and technological information research mode to the scientific and technological information research mode based on intelligent big data analysis and require the coordination of per‐sonnel, tools and systems in this process, and that for core information research, the acquisition path of core tech‐nology data is obtained. The scientific and technological intelligence research mode based on intelligent big data analysis can produce high-quality intelligence research results in limited time, which provides support for decision makers and provides support for the high-quality development of technology.Key Words: New situation; Scientific and technological information; Big data; Intelligence科技情报是决策的关键,也是创新的导向。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第30卷第10期 2011年10月
情报杂志
JOURNA1 OF INTELLIGENCE Vo1.30 No.10
0ct. 201l
从主流应用工具看科技情报 的定量化研究 赵纪东 张志强 术
(中国科学院资源环境科学信息中心兰州730000;中国科学院国家科学图书馆兰州分馆兰州730000) 摘要在大量资料调研的基础上,以科技情报定量研究的三个主要方面:数据来源、数据分析、结果可视化为切入 点,从应用工具的角度出发,对相关问题作了一些探索与思考,以期能够对我国的情报研究工作有所帮助。 关键词应用工具科技情报定量研究 中图分类号C289 文献标识码A 文章编号1002—1965(2011)10—0004—05
Analysis of Scitech Information S Quantitative Studies from Popular Application Tools
ZHAO Jidong ZHANG Zhiqiang (Scientific Information Centre for Resources and Environment,Lanzhou 730000;Lanzhou Branch of National Science Library,CAS,Lanzhou 730000)
Abstract Through investigation of large amounts of literatures and from the point of application tools,we discussed related problems of scientific and technical information’S quantitative studies from three main aspects,such as data sources,data analysis and results visualiza— tion.Hoping this study could be helpful for our information studies. Key words application tools scientific and technical information quantitative studies
随着网络化、数字化时代的到来,科学研究的定量 化趋势已经日益明显。任何一门科学,无论是自然科 学还足社会科学,定量化、精确化都是其真正发展并走 向成熟的标志。情报学作为一门介于自然科学和社会 科学之间的综合性边缘学科,无论是从自然科学还是 从社会科学的角度来看,其研究方法朝着定量化或数 学计量化方向发展也已成为一种必然趋势…。而早在 20世纪80年代,英国著名情报学家布鲁克斯(B.C. Brookes)就曾指出:“情报学如果不实现定量化,它将 是一堆支离破碎的技艺,而不会成为科学 。” 日前,科技情报定量化研究的一般方法主要包括 统训‘分析,如作者/机构发文量统计、词频统计、引文统 计等,以及目前很多研究人员都感兴趣的、以共现分析 为基础的同被引分析、文献耦合分析、共词分析等。俗 话说“巧妇难为无米之炊”,而“工欲善其事,必先利其 器”,本文从分析工具的角度,以情报定量研究的一个 主要方面(数据来源、数据分析、结果叮视化)为切人 点,对科技情报的定量化研究趋势作一些探索与思考, 希望对我们未来的研究有所帮助。 1 数据来源 定量化研究是针对可计量研究对象,利用某些定 量化研究资源,采用一定的定量研究方法和手段,寻求 将数据定量表示以揭示数据之间的关系和规律的一种 研究方法 。对于情报的定量化分析而言,必须得有 与情报相关的数据。长期以来,科技情报定量分析中 使用最多的一个文献数据库就是ISI Web of Knowl— edge(WoK),特别是其核心库Web of Science(WoS, 包括三大引文索引数据库SCIE、SSCI、A&HCI),以及 被WoK有效整合的DII、ESI等。
收稿H期:2011一O5—19 修回日期:2011—06一l7 基金项目:中国科学院国家科学图书馆青年人才领域前沿项目“国际科技情报机构定量分析模型与工具研究”成果(编号:YO00051001)。 作者简介:赵纪东(1981一),男,助理研究员,研究方向:科技战略情报研究;张志强(1964一),男,研究员,研究方向:战略情报与学科情报、知 识管 研究。 第10期 赵纪东,等:从主流应用工具看科技情报的定量化研究 ・5・ 尽管WoK多年来一直致力于提供科技文献信息 方面的服务,但是,其自身仍然存在很多不足。以 WoS为例,其本身收录范围有限(限于核心期刊)、非 英语文献收录也较少、被引文献作者仅限于第一作 者 。因此,很多学者开始转向其他数据源,如Sco— pus、Goolge Scholar等。Scopus由Elsevier于2004年 推出,号称世界最大的文摘和引文数据库;Google Scholar由Google实验室在2004年推出,凭借Google 强大的网页索引量,Goolge Scholar可以说是当前世界 上网络学术资源最丰富的索引库。 可是,由于发展历史的差异,目前适用于WoK的 工具很多,而适用于Scopus、Google Scholar的工具则 似乎很少。于是,荷兰阿姆斯特丹大学的科学计量学 家Loet Leydesdofff设计开发了几个小工具 : Scop2ISI.exe(软件名称),将来源于Scopus的数据文 件转换为标签格式的WoS数据文件;Scopus.exe,将 来源于Scopus的数据文件转换为数据库文件; GScholar.exe,将来源于Google Scholar的数据文件转 换为数据库文件。 如此以来,借助这几个数据格式转换工具,我们就 可以利用其他工具(如数据库工具SQL Server,适用于 WoK的工具)对来源于Scopus、Google Scholar的数据 开展进一步的分析。需要注意的是,这几个工具均基 于DOS开发而来,使用者需要了解并掌握DOS方面 的一些知识,可能更有利于工具的使用。
2数据分析 从文献数据库获取数据之后,就要对其进行分析。 一般而言,分析过程分为两步:第一步是一次分析,包 括基础数据的抽取、统计分析、矩阵生成等;第二步是 二次分析,在一次分析的基础上进行加权统计、数量分 布统计以及聚类分析等。 2.1 一次分析对于文献数据的一次分析而言,瑞 典科学家Persson开发的Bibexcel 和澳大利亚墨尔 本大学的Anne—Wil Harzing教授设计的Publish or Perish (简称PoP)是两个可以免费使用的分析工具。 Bibexcel除可对来源于WoS、DII、Medline等数据库的 数据相关知识单元(作者、关键词、参考文献等)做初 次统计分析外,还可产生知识单元的共现关系矩阵。 PoP则可以对Goolge Scholar的数据进行文章总数、总 被引次数等的统计,同时,PoP还可进行诸如文章的篇 均被引次数、个人的论文平均数及其平均被引次数、H 指数、G指数等的计算(属于二次分析,但PoP已集成 实现)。 目前,针对文献数据库Bibexcel的使用十分广泛, 但从分析过程来看,Bibexcel的数据清洗功能似乎并 不是很强大,如果这一步产生重大问题(如作者或机 构的不同拼写形式造成的误差),那么将严重影响以 后的分析,这应该引起大家的注意;针对网络数据源 Goolge Scholar的PoP旨在帮助学者个人以最佳的方 式展示他们的研究在ISI之外的影响力,尽管PoP可 以通过Google Scholar进行更为广泛的综合性搜索, 但是该工具开发者Anne—Wil Harzing教授不建议在 其他领域工作的学者个人过渡地信赖其结果,除非能 够在IsI和Scopus中得到核实 。 2.2二次分析在一次分析的基础上,往往还要进 行二次分析。一般情况下,加权统计、数量分布统计、 年度增长统计分析、关联统计分析等,通过Excel或再 借助VBA简单编程即可实现。而相关分析、回归分 析、聚类分析等则需要借助大型的商业化统计分析软 件,如SPSS J、SAS J。 从所提供的分析功能来看,SPSS与SAS相差不 大。以聚类分析为例,SPSS提供了多种层次聚类法、 K—means非层次聚类法、两步聚类法以及快速聚类法 等,SAS则在此基础上还包含了重叠式聚类法(Over— lapping Clustering)和模糊聚类法(Fuzzy Clustering) 等。从所分析数据的结构来看,SPSS要求输入的是数 据矩阵(Data Matrix,表现为nxp形式的矩阵),而SAS 除数据矩阵外,还可处理差异矩阵(Dissimilarity Ma— trix,表现为nxn形式的矩阵),这就要求我们在输入 数据进行分析时,要格外注意,而不能对由输入数据的 错误可能造成的错误结果去强行解释。 相对于商业化的SPSS和SAS而言,R 则是一 个开源软件,并且也有非常广泛的使用。R的思想是: 它可以提供一些集成的统计工具,但更大量的是各种 数学计算、统计计算的函数。因此,与其说R是一个 统计系统,还不如说R是一个计算环境。 SPSS和SAS是统计分析领域集成度很高的工具 (需要进行软件或模块升级,才能提供更丰富的功 能),R则由于开源和很好的扩展性而具有强大的、可 供免费使用的功能。具体在分析方法方面,对于某一 种分析而言,都有好多种方法,而相关工具也大都提供 这样的分析功能,但是当前所使用的方法却较单一。 以聚类为例,其一般分为层次聚类和非层次聚类两种 方法,但当前科技情报定量分析过程中的聚类大多采 用的是层次聚类法(包括单链接聚类和全链接聚类), 而对K—means这样的非层次聚类法应用的非常少。 相比于层次聚类而言,K—means可处理的样本量大, 且聚类速度较快,同时还提供方差分析用以分辨所选 变量显著与否。因此,将来可能需要尝试并验证现在 并不经常使用的其他分析方法的有效性。