文献计量学综述
测量不确定度文献综述

AC、IUPAP、IFCC七个国际组织的批准,由ISO出版,是国际组织的重要权威文献。我国也已于1999年颁布了与之兼容的测量不确定度评定与表示计量技术规范。至此,测量不确定度评定成为检测和校准实验室必不可少的工作之一。
2、不确定度的A类评定与B类评定
用对观测列的统计分析进行评定得出的标准不确定度称为A类标准不确定度,用不同于对观测列的统计分析来评定的标准不确定度称为B类标准不确定度。将不确定度分为“A”类与“B”类,仅为讨论方便,并不意味着两类评定之间存在本质上的区别,A类不确定度是由一组观测得到的频率分布导出的概率密度函数得出:
4、测量不确定度评定的应用进展
1.化学成分分析测量结果不确定度评定
(1)化学成分分析测量结果不确定度评定导则
(2)滴定法测量结果不确定度评定
评定实例1:重铬酸钾、硫酸亚铁铵、高锰酸钾标准溶液的不确定度评定;
评定实例2:不锈钢中铬含量测定的不确定度评定;评定实例3:白云石中氧化钙和氧化镁含量的测量不确定度评定;
机计算程序田」。
尽管如此,对一般测试实验室而言,不确定度的
评估工作依然困难重重。其主要原因有①检验标准和方法数量众多,很多方法的不确定度评估在上述资料中找不到相应的实例②由于检验标准和方法还远未达到国际一致的标准化程度,即使找到了相应资料,实验室也不能将其方法完全照搬③数学模型的建立、不确定度来源的分析和对变量分布类型的判断对一般测试实验室而言有很大难度④类评定的某些资料没有可靠的保障如检定部门
提供的证书内容不完备、自由度难以判断等。
总结:
测量不确定度是现代误差理论的重要内容,用不确定度来表示测量结果的质量是势在必行。尽管还存在某些理论缺陷,其应用也有一定的问题,但在今后的较长时期内仍将在全世界得到承认和推广。中国将为不确定度在一般测试领域的应用作出应有贡献。就目前而言,一仍然是国内不确定度评估的技术规范。在新的规范未发布之前,不确定度的评估工作仍将遵照该规范进行。对一般测试实验室而言,不确定度评估工作的难度仍然是巨大的。为此,还将期待课题组的研究成。
基于文献计量的国内机构知识库研究综述

2.5论文主题分布
把握论文内容的首要标准是看论文的研究主题。对论 文主题进行统计分析,有利于弄清“机构知识库”研究的 发展现状、明确今后的发展方向和研究重点。经过对102 篇论文的分析和研究,将文章的研究主题划分为:(1)概 述性研究。包括起源、发展、定义、特征、功能、内容、 影响、优势等。(2)构建问题研究。包括构建模式、构建 原则、构建机制、版权问题、长期保存、政策和策略、开 放存取、流程设计等。(3)构建平台研究。包括软件介绍、 软件对比、技术路线、安装和测试等。(4)对国外机构知 识库的研究。包括对国外m政策及其实施情况的介绍等。 分布情况见表4。
[中图分类号]G250.73
[文献标识码]A
[文章编号]1008—0821(2010)03—0174一04
Review
on
the Research of Institutional Repository Based
Chen Hongdong Zhang Chunyan
on
Bibliometrics
(Library,Lanzhou
ቤተ መጻሕፍቲ ባይዱ
(见表1)。
表l“机构知识库”研究论文年代分布
年代论黧量所篱例 年代论黧警所瑟洲
撇
2003 2004
2005
O 0
l
O O O.98 4.9
2006 2007
15 16 30 35
14.7
15.7
29.4
2∞8
2009
5
34.3
收稿日期:2010—02—08 基金项目:本文系兰州大学馆内科研项目“Web2.0与兰州大学图书馆的服务发展”(IZUl200901)的系列研究成果之一。 作者简介:陈宏东(1978一)。男。馆员,研究方向:信息技术,发表沦文数篇。 --——174-・——
基于文献计量的新兴产业领域研究综述:1985-2012

b a s e d o n he t S c i e n c e Ci t a t i o n I n d e x a n d S o c i l a S c i e n c e s Ci t a io t n I n d e x d a t a b a s e s .Th e p a er p na a ly z e d he t p a Re ms o f p u b l i c a t i o n o u t p u t s ,
a t o t l a o f 1 6 4 e me r g i n g i n d u s t r y—r e l a t e d p u b l i c a t i o n s i n t h e p e i r o d.‘ Ma na g e me n t ’. ‘ Bu s i n e s s ’a n d‘ E c o n o mi c s’we e r he t t o p 3 mo s t
罗晓梅 黄鲁 成
( 北京工业大学 摘 要 北京 1 0 0 1 2 4 )
利 用文献计量 法对 1 9 8 5 — 2 0 1 2年 S C I 和 S S C I 数据库 中新 兴产 业领 域 的历史文 献进行 了分析 。分析 了文
献数量 、 主题 类型、 主要期刊 、 关键 词 、 地 域分布和参考文献等 。研 究结果显 示 : 1 9 8 5 — 2 0 1 2年 , 新兴产业领 域共有相
t ti a o n s .‘ I n n o v a i t o n’ ‘ F i r m/F i r ms ’ ”I nd u s t r y”,‘ P e r f o m a r nc e’ a r e h o t s p o t s i n he t ie f l d o f e me r g i n g i n d us t r y . US A ,UK nd a Ca na d a we r e he t t o p 3 mo s t p r du o c i t v e c o u n t r i e s .US A wa s he t mo s t re f q u e n t p a r t n e r i n i n t e r n a t i o n l a c o l l a b o r a io t n s .5 p i v o t a l - n de o p a er p s nd a 1 0
基于文献计量的中国图书馆法研究综述

的研 究 。
文章数量 4 4
6
笔 者 对 表 3论 文 主题 方 向进 行 统 计后 发 现 , 大
量 学者 的研 究方 向为 中 国图 书 馆 法 的立 法 文 本 , 即 图书馆 法 的主要 概 念 、 法 的基 本 原 则及 立 法 的 主 立 要 内容 等 。此外 , 有 大 量 文 章 研 究 图 书馆 法 的发 也
中 图分类 号 : 2 9 2 G 5 .0 文献 标识码 : A 文章 编号 :0 4— 6 0 2 1 )4— 0 2— 3 10 18 (02 0 0 1 0
近 年来 , 国学者 研 究 图 书 馆法 领 域 的论 文数 我
行二 次检 索 , 有关 中 国图 书 馆法 方 面 的文 章 进行 对 分类 统计 , 除无关 项 和 讨 论 外 国图 书 馆法 的论 文 去 后共 检 出相 关 文 献 6 7篇 ( 能有 漏 检 的情 况 ) 时 可 , 间分布 为 19 9 5年 至 2 1 0 1年期 间 。
论文 研究 的主要 载体 。通 过对 表 2主要 期 刊载 体进 行数 据统 计 后 , 出的结 果是 《 书情 报工 作 》 《 得 图 、 晋
图学刊》 《 、江西 图书馆学 刊》 《 、 图书馆 》 《 、 农业 图 书情报学刊》 《 、 图书与情报》 《 、河南图书馆学刊》 刊
载 的主题 论文 数量 在 3篇 及 以上 。
载体类型 图书情 报类 期刊
大 学 学 报 类 期 刊
增长, 与此 同时还会 有 大 量 学 者 从 立法 的各 个 方 面 为“ 中国图书馆 法 ” 的早 日出台奉献 自己 的力 量 。 12 中国图 书馆 法 主题论 文载 体分 布 .
文献综述范例

文献综述是文献综合评述的简称,指在全面搜集有关文献资料的基础上,经过归纳整理、分析鉴别,对一定时期内某个学科或专题的研究成果和进展进行系统、全面的叙述和评论。
一、文献综述的形式与结构要求:文献综述的形式与结构与一般研究性论文有所不同。
这是因为研究性的论文注重研究的方法和结果,而文献综述要求向读者介绍与主题有关的历史、派别、观点、动态、进展、展望以及对以上方面的评述(各自的长处与短处,对社会、经济等各方面的影响等)。
因此文献综述的格式相对多样,但总的来说,一般都包含以下四部分:即前言、主题、总结和参考文献。
前言部分,主要是说明写作的目的,介绍有关的概念及定义以及综述的范围,扼要说明有关主题的现状或争论焦点,使读者对全文要叙述的问题有一个初步的轮廓。
主题部分,是综述的主体,其写法多样,没有固定的格式。
可按年代顺序综述,也可按不同的问题进行综述,还可按不同的观点进行比较综述,不管用那一种格式综述,都要将所搜集到的文献资料归纳、整理及分析比较,阐明有关主题的历史背景、观点派别、代表人物、发展现状和今后的发展方向等,以及对这些问题的评述。
主题部分应特别注意代表性强、具有科学性和创造性的文献引用和评述。
总结部分,与研究性论文的小结有些类似,将全文主题进行扼要总结,对所综述的主题有研究的作者,最好能提出自己的见解。
参考文献,放在文末,是文献综述的重要组成部分。
因为它不仅表示对被引用文献作者的尊重及引用文献的依据,而且为读者深入探讨有关问题提供了文献查找线索。
因此,应认真对待。
参考文献的编排应条目清楚,查找方便,内容准确无误。
二、文献综述撰写内容要求文献综述是反映当前某一领域中某分支学科或重要专题的最新进展、学术见解和建议的,它往往能反映出有关问题的新动态、新趋势、新水平、新原理和新技术等等。
“综”是要求对文献资料进行综合分析、归纳整理,使材料更精练明确、更有逻辑层次;“述”就是要求对综合整理后的文献进行比较专门的、全面的、深入的、系统的论述。
文献综述的六种写作思路,及六个归纳文献方法

文献综述是什么?文献看了一大堆,怎么梳理,怎么写成文献综述?文献综述从何处落笔,写什么,怎么展开论述?文献综述有什么写作思路?这一箩筐的问题,想必每个学术新手都遇到过。
那么,今天就来说说,文献综述的这点事!文献综述就是确定选题后,对选题相关研究领域的文献进行广泛阅读和理解的基础上,进行归纳整理、综合分析和评论思考。
具体来说,包括这个领域的研究历程、研究现状(主要学术观点、前人研究成果、研究水平、研究焦点、存在的问题及可能的原因等)、新水平、新动态、新技术和新发现、发展前景和展望等,并提出自己的思考、评论和研究思路。
文献综述要注意两点:(1)大量阅读文献在撰写综述前一定要全面搜集资料,如果不能系统全面地把握研究现状,或片面理解他人研究结果,盲目地认为某问题或领域尚未被研究,就会使得自己的研究变成一种重复性劳动,或者脑洞开的太大,论文可行性不高。
(2)综合分析综述不能仅仅是将前人的观点罗列出来而未进行系统分类、归纳和提炼。
如果是“综”而不“述”,那么即便是内容有一定的系统性,充其量也只是陈述了他人的观点,达不到通过分析、评说而发现和确立论文选题的目的。
写文献综述可以采用“填充法”,简而言之就是画导图、列框架、不断细化内容。
具体如下:一个主题即确定论文选题,围绕这个选题查找、阅读、挖掘文献信息一个导图(思维导图)围绕论文选题,在阅读文献的基础上,列一个文献综述的大纲,再按照大纲一步步把内容填充进去。
尽管每个学校的要求不尽相同,但是通常毕业论文文献综述的结构是:引言/研究背景———主体/研究现状———小结/研究目的与意义———研究内容———参考文献在这个框架的基础上,进一步细化:(一)引言/背景引言不用太长,表明研究背景即可。
现实素材:统计数据、生产生活实例、政策法规等理论素材:基础理论研究的焦点、关键点、文献计量学分析等示例1:《糖肾方改善C57BLKS/J db/db小鼠脂代谢紊乱的作用及相关机制研究》,利用统计数据指出研究背景,引出主题。
基于文献计量的图书馆延伸服务研究综述

Ree r hn nbbim er b aye tn in sr ie s ac igo il o ti l r r xe so evc ci
LIBi n
( e o gi gistt o i c n eh oo yLba , a i 50 7 hn) H i n j n tue f c n e dT cn lg irr h r n10 2 , i l a n i Se a y b C a
( 统计 时 间 截至 2 1 年 l 月 1 01 1 2日) 。文 章选 用 E . x el 为统计 工 具对 数据 进行 统计 ,再利 用 文献计 量 e作
方 法 ,对 论 文 的年 代 分 布 、期 刊 分 布 、著 者 分 布 、
关键词 、主题 分布 等进行 统计 分析 。
2 统计 结果 分析
1 数 据 来 源 Fra bibliotek学科 的成 长 过程 和研 究 发展 状 况 【 1 】 。有 关 国 内 图 书
21 论 文 年 代 分 布 .
通 过文 献计 量 分 析 的方 法 。对 国 内图 书馆 延 伸 服务 的研 究 文 献进 行 分析 ,探 讨 国 内 图书馆 延 伸 服 务研 究 进展 、现状 和 主要 发 展 趋 势 ,以期 为后 继 研 究提 供参 考 。
某 一学 科 在一 段 时 期 内 的发 文 数量 可 以反 映该
t n tes ao f u osis tt nl ir u o ,ujc cmigf m ” NK o ra Da b s”e e 19 i , t t no at r,nt i a ds i t n sbet o n o C I un l t aeb t n 9 4 o h i i u h i o tb i u r J a we
社会科学成果评价研究综述——以文献计量为分析视角

影 响。赵振宇教授是在 19 96年起发表相关论文 ,主 要探讨社科成 果评价 中存在 的问题 以及应 对措施 。 邱 均平 教 授 则 是 在 国 内外 社 会 科 学 成 果 评 价 比较 、 评价方法等方面作 了大量 的研究工作 。在其他核 心 作者中,有 的从 8 O年代就开始着手研究社会科学成 果 评价 ,如 曹增 友 ,涉 足 时 间 非 常早 。有 的是 直 接 从事科研管理工作 ,如邓 毅、杨力、卢花等人 ,对 成果评价的认识更具体 , 研究更加结合实际。
9 6
3
情报资料工作 、山西高等学 校社会 科学学报 、齐鲁学 刊 、浙江社
会科学 、社会 科学研究、科 学经济 社会 、沧 桑、华 南师 范大学学 分别为 2
报 ( 社科版 ) 、科学 管理研 究、科学学 与科学技术管理 、学术界
( :未标明作者的 5篇论 文不在 表 1中显示 ) 注
l 论 文数量 分析
: 。。.。。一-.ll 。_-・。___I・ f . 山.-_.J-J. 。. . . L
.
图 1 社会 科学成 果评价论 文篇数
一
发表时间分布图 (9 9— 0 0 17 2 1 )
我们选择 C K 数据库 (99— 00年) NI 17 2 1 ,选取 主题 词 “ 社会 评选 ”、 “ 成果” ,进行 主题字段检 索 ,经过 反复筛选 去重 , 共检 出 15 0 篇文献。( :本文只统计专题研究 “ 注 社
收稿 日期 :2 1 0 0 1— 4—1 。修回 日期 :2 1 0 0 1 0 1— 6— 7 基金项 目:陕西省教育厅科研计划项 目 “ 哲学社会科学研究成果评 价体 系研究” ( 8K 4 ) 0 J 18
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
文献计量学综述 一、起源及发展 早在20世纪初,人们已经开始对文献进行定量化研究,但是当时文献计量学并没有作为一门独立的学科而存在。直到1969年,英国着名情报学家阿伦.普理查德首次提出术语“Bibliometrics”,这一术语的出现标志着文献计量学的正式诞生。
三阶段:萌芽、发展和分化 萌芽(1917-1933)这一时期文献研究人员首创文献统计方法,并在一些学科领域解剖学和化学专业进行了文献计量分析的大胆尝试,取得了一定的成果。这些研究都为文献计量学的诞生与后期的发展奠定了基础
发展(1934- 1960)年注重理论研究与规律发现,着名的文献计量学的三大基本定律中的布拉德福定律以及齐普夫定律就是在这一时期发现的到
成熟与分化阶段全面发展与分化时期(1960年至今) 这一时期文献计量学已由狭隘的理论研究发展到了广阔的应用研究和指标的研究,同时涉及的领域和主题也越来越多。
迁移衍生: 专利计量学 文献计量学 网络计量学 政策计量学 二、概念界定 文献计量学是以文献体系和文献计量特征为研究对象,采用数学、统计学等计量研究方法,研究文献信息的分布结构、数量关系、变化规律和定量管理,并进而探讨科学技术的某些结构、特征和规律的一门学科。可以定量地揭示某一学术领域的发展历程、研究重点以及未来的研究方向。目前,文献计量分析已被看作总结历史研究成果、揭示未来研究趋势的一种重要工具。学科交叉使得文献计量研究内容体系日益丰富。数学中的图论、社会学中的社会网络分析、物理学中的复杂网络等理论与方法均被移植到文献计量学的研究体系中。
三、三大定律 布拉德福定律 该定律描述文献分布规律,利用刊载某专业论文的数量来确定该专业的核心期刊,应用于指导文献情报工作和科学评价。
齐普夫定律 该定律用以统计文献中的词频,通过文献的词频分析可确定学科或行业的研究热点和研究趋势。
洛特卡定律 该定律描述着者人数与所着论文之间的关系。探讨了科学论文着者分布平衡的规律,在宏观的科学着作活动中,少数作者写出了大量文章,大多数人的着作还是很少的。依此定律推论出“杰出科学家数目仅是科学家数目的平方根”。
从表面上三大定律的统计对象各异,其结论也不尽相同,但是它们的研究方法存在着某些相似之处,事实上它们属于同一个分布体系。该体系被称为布-齐-洛体系。如果把期刊、字词、书籍、文章等称为信息发生源,将作品、论文、字词的出现、书籍的使用、文章的被引等称为产物,那么文献计量学的规律可认为是发生源数量与产物数量之间存在的函数关系。
四、主要研究方法:引文分析+数据挖掘+数据可视化 传统文献计量学方法可以分为 3类: ①基于引文的计量方法,如引用频次统计、文献同被引分析、文献耦合分析等; ②基于作者的计量方法,如作者同被引分析、合着分析等; ③基于词汇的计量方法,如词频统计、关键词共现分析等; (引文分析)
近年来趋势是①基于两种对象的交叉共现计量方法。如使用双向聚类方法 应用此方法文献计量学领域有广阔的运用前景。例如,高被引论文和引用文献的双向聚类可以反映出被引文献和引用文献的对应关系,甚至是同时实现同被引聚类分析和基于高被引论文的引文耦合分析; 作者( 或单位) 和主题词的双向聚类可以反映作者( 单位) 研究内容之间的相似性及其研究特色; 作者合着( 或单位合作) 和相应文献的双向聚类分析可以反映出作者( 单位) 合作的具体论文和成果等。 ②引文分析结和数据挖掘和数据可视化操作,更直观且准确的反应出研究现状、研究热点和趋势
1、引文分析: 作者在撰写或编辑论着时,常以尾注、脚注、文中注和参考文献的形式标明所引用的概念、理论、方法、文献资料等等的来源出处,为自己的论述提供佐证和依据,形成被引文献记录即引文(Citation)。追寻这种引证联系,可以找到一系列内容相关的文献,从中可以找出某些学术观点的演化发展脉络,某一领域的研究动态、走向和规律,某一学科的核心作者群,学术研究中的启承转合关系,以及某一名词、概念、方法出现的时间、频次和衰减情况。引文数据库可以提供以引证关系为特征的特殊的文献检索方法,客观准确地揭示文献之间跨时空、跨学科、多领域的网状联系。在科研评价中,引文数据库可以从文献的“数量”(科研产出率)和“质量”(成果影响力)方面提供有关学科分布、作者、机构、期刊和地区的多项统计数据和指标。
引文分析包括耦合分析、同引分析和引文数量分析。 多篇论文引用同一篇文献,这些多篇论文之间的关系称为耦合,耦合关系的强弱由共同引用的参考文献的篇数测定,揭示学科的内部结构,通过耦合分析可以在学科内部划分出耦合度较高的论文簇。
同引分析是指两篇文章同时被后来的文献引用,可用以跟踪学术前沿,映射研究领域。 引文数量分析,用于对期刊和论文学术价值的评价, 目前,引文分析技术日趋完善,应用不断扩大,已发展成为文献计量学的重要方法之一。
引文分析方法的应用主要有以下几个方面:? (1)测定学科或主题的影响和重要性:通过文献引用频率的分析研究可以测定某一学科的影响和某一国家某些学科的重要性。?
(2)研究学科或主题的结构:通过引文聚类分析,特别是从引文间的网状关系进行研究,能够探明有关学科之间的亲缘关系和结构,划定某学科的作者集体;分析推测学科间的交叉、渗透和衍生趋势;还能对某一学科的产生背景、发展概貌、突破性成就、相互渗透和今后发展方向进行分析,从而揭示科学的动态结构和某些发展规律。?
(3)研究学科或主题信息源分布:通过文献间的相互引证关系,分析某学科(或专业)文献的参考文献的来源和学科特性,不仅可以了解该学科与哪些学科有联系,而且还能探明其信息的来源及分布特征,从而为制定本学科的信息管理方案和发展规划提供依据。?
(4)确定核心期刊:引文分析方法是确定核心期刊的常用方法之一。这种方法的主要特点,是从文献被利用的角度来评价和选择期刊的,比较客观。加菲尔德通过引文分析,研究了文献的聚类规律。他将期刊按照期刊引用率的次序排列,发现每门学科的文献都包含有其它学科的核心文献。这样,所有学科的文献加在一起就可构成一个整体的、多学科的核心文献,而刊载这些核心文献的期刊不过1000种左右。利用期刊引文的这种集中性规律可以确定学科的核心期刊。?
(5)研究文献老化规律:目前,有关文献老化的研究一般是从文献被利用角度出发的。D.普赖斯曾利用引文分析探讨文献的老化规律。通过对“当年指标”和“期刊平均引用率”的分析,他认为期刊论文是由半衰期绝然不同的两大类文献构成的,即档案性文献和有现时作用的文献。科学文献之间引文关系的一种基本形式是引文的时间序列。对引文的年代分布曲线进行分析,可以测定各学科期刊的“半衰期”和“最大引文年限”,从而为制定文献的最佳收藏年限、对文献利用进行定量分析提供依据。同时,一个学科的引文年代分布曲线与其老化曲线极为相似。这有力地说明文献引文分布反映了文献老化的规律性。因此,从文献引用的角度研究文献老化规律是一种有效的途径和方法。?
(6)研究信息用户的需求特点:利用引文分析方法进行信息用户研究是一种重要途径。根据科学文献的引文可以研究用户的信息需求特点。一般来说,附在论文末尾的被引用文献是用户(作者)所需要和利用的最有代表性的文献。因此,引文的特点可基本反映出用户利用正式渠道获得信息的主要特点,尤其是某信息中心对其所服务的用户所发表的论文的引文分析,更具有直接的指导意义。通过对同一专业的用户所发表的论文的大量引文统计,可以获得与信息需求有关的许多指标,如引文数量、引文的文献类型、引文的语种分布、引文的时间分布、引文出处等。?
(7)评价人才:在人才评价方面,常采用引文分析方法。这是因为某着者的论文被别人引用的程度可以是衡量该论文学术价值和影响的一种测度,同时,也从科研成果被利用的角度反映了该着者在本学科领域内的影响和地位。因此,引文数据为人才评价提供了定量依据。从对历年诺贝尔奖金获得者的论文被引用情况的统计来看,物理学、化学、医学领域中诺贝尔奖金获得者中,其论文被引次数最高者(L.D.Landan)为1888次;最低的也有79次(J· H· D· Jensen);只有六名低于 200次。可见,这些科学界的精英的论文的引用次数是很高的。
近年来,引文评价方法的研究重点不再局限于定量指标的直接测算与简单排名,而是转移到引文影响力指标的总结与优化、引文数据源的覆盖率与可用性、引文现象的复杂性
对引文频次的影响这些方面的研究。除了期刊论文的结构属性之外,引文分析研究逐步拓展到论文的正文。在文本分析过程中,需要借助计算机科学领域中的自然语言处理、自动分词等方法。这些研究将促使引文分析作为学术影响力评价方法不断地去面对新的议题,逐渐完善定量评价方法的指标、数据与理念。
2、数据可视化:指的是运用计算机图形和图像处理技术,将数据转化为图形或图象在屏幕上显示出来,并进行交互处理的理论、方法和技术。
数据挖掘:数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。
操作步骤:分类-估计-预测-相关性分析-聚类-描述和可视化(复杂数据类型挖掘) 聚类分析指将物理或抽象对象的集合?分组为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学, 计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些 技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。
3、可视化操作:采用高级检索,检索条件选择 “主题”,具体检索词为“创新生态系统”,检索途径选择 “精确”,时间跨度为 2003 /10 /01—2015 /10 /01(绩效考核or绩效评价or绩效评估or绩效考评and政府财政预算)从CNKI导出数据(Refworks)或者利用litespace软件将来自SCI或SSCI等数据库的软件进行格式转化,将数据导入Citespace或TDA、书目信息共现挖掘系统进行统计和可视化操作——将小类别按照主题自