关键词共词分析、聚类分析和多维尺度分析

合集下载

水科学研究的关键词共词聚类分析

水科学研究的关键词共词聚类分析

水科学研究的关键词共词聚类分析韩宇平;袁皖华;肖恒【摘要】水科学涉及的范围十分广泛,已涌现出大量研究成果.对已发表的学术论文进行统计分析,对于明晰水科学发展的现状具有重要意义.然而,目前采用文献计量学方法开展的研究还比较少.本文在收集大量水科学研究相关期刊论文的基础上,采用Bibexcel统计分析了文献资料中的关键词,构建了由62个高频关键词组成的共词矩阵,利用网络分析、多维尺度分析和聚类分析等不同统计方法,初步归纳出近十年来水科学研究中的热点和研究现状.结果表明:气候变化、水资源承载力、水资源管理、水环境容量、水环境质量等方面研究成果相对较多;围绕大型水利工程如南水北调工程和水安全问题的研究均有所增多;研究中更加注重区域的可持续发展和生态环境保护;形成了一些研究热点地区.【期刊名称】《华北水利水电学院学报》【年(卷),期】2015(036)004【总页数】6页(P20-25)【关键词】水科学;关键词;共词分析;网络分析;聚类分析;多维尺度分析【作者】韩宇平;袁皖华;肖恒【作者单位】华北水利水电大学,河南郑州450045;华北水利水电大学,河南郑州450045;华北水利水电大学,河南郑州450045【正文语种】中文【中图分类】TV74;TM615通信作者:肖恒(1982—),男,江苏徐州人,讲师,博士,主要从事气候变化对水文水资源影响方面的研究.“水科学”(Water Science)是最近二十年来出现频率很高的一个词,已经渗透到社会、经济、生态、环境、资源利用等许多方面,也派生出许多新的学科或研究方向,成为学术研究和科技应用的热点.相应地,每年涌现出大量期刊论文,既给学者的研究工作提供了便利,但同时也给文献的管理与分析利用带来了不便[1].因此,有必要对所包含的学科主题和热点进行系统科学的梳理.左其亭 [2-3]将水科学划分为:水文学、水资源、水环境、水安全、水工程、水经济、水法律、水文化、水信息、水教育等各有侧重且相互交叉的10个具有较强关联性的研究领域,并分别对这10个方面做专题研究进展报告,及时总结了当前水科学研究的最新进展.然而,目前运用文献计量学方法来分析水科学研究中的热点与现状的成果还比较少.而这些少数研究也只侧重于水科学研究中的某一方面(如水资源领域[4])进行文献分析探讨.因此,本文利用《CNKI中国学术期刊网络出版总库》中的文献资料,采用Bibexcel统计分析涉及水科学期刊论文中的关键词,选取高频关键词构建共词矩阵,通过网络分析、多尺度分析和聚类分析等统计方法,揭示水科学研究中的热点与研究现状.1.1 资料来源从表1中可以看出,2005—2007年论文数量逐年增加(1 764~2 244篇),2008—2013年在2 600篇以上,2014年论文数量相对较少,这主要是因为开始检索的时间为2015年1月初,2014年12月份发表的部分论文未纳入统计之中.从各研究领域的论文数量上看,水资源领域期刊论文数量最多,为1 129~1 823篇,平均约1 477篇;其次是水环境领域,发表论文477~875篇,平均约714篇.这2个领域约占统计的10个水科学领域论文总量的90%,论文数量在年际上的变化主要由这2个领域论文数量所引起.2010年左右,关于水文学、水环境和水安全等的研究显著增多,一定程度上反映出国家水安全战略需求重点关注的方面(如洪涝、干旱等极端水文事件研究).涉及水经济、水法律、水文化、水信息、水教育等领域的论文数量相对较少,特别是水教育领域自2011年才有期刊论文出现,论文数量1~2篇.从表2中可以初步归纳出近十年来涉及水科学相关研究的文献具有如下特点:1)水环境、水资源承载力、可持续发展、水文学、水文化等出现频次超过100次,表明这些领域(方向)是水科学工作的重点,研究成果较多.2)虽然国内对研究气候变化、水生态文明、水文化等方面研究起步较晚,但是在变化环境下的水资源脆弱性评价和适应性、气候变化下的水资源承载能力、水生态系统的保护、水文化的宣传和普及等方面的研究得到较快发展.3)方法层面的应用研究较多.如层次分析法、主成分分析法、分布式水文模型、系统动力学、熵权法、BP神经网络、集对分析等关键词出现频次较高,这一方面表明一些较为成熟的方法得到了广泛应用;另一方面表明新的技术方法也在不断发展.4)形成了一些研究热点地区.按流域划分,主要集中在黄河流域(如全流域、渭河流域、黑河流域等)和长江流域(如全流域、汉江流域、太湖流域等);按行政区域划分,以北京市为研究区的研究最多.此外从水利工程角度分析,以研究三峡水库和南水北调工程的居多.从图1中可以看出,水环境、水资源承载力、可持续发展、水文学、水资源管理、指标体系等节点较大,处于节点的中心位置,在一定程度上反映出近十年来水科学研究的主题和主要内容.具体来说:1)水文学与气候变化的联系最为紧密,这表明,气候变化下的水文过程的响应及机理研究是当前研究的热点问题.2)水资源管理与管理模式、系统动力学、优化配置等关系较为密切,表明关于水资源管理的研究从系统动力学、优化配置技术方法层面和从管理的角度开展的较多. 3)水资源承载力与指标体系、系统动力学、主成分分析法、层次分析法等联系较为密切,表明关于水资源承载力方面的研究主要侧重于计算方法.4)水环境与水环境质量、水污染、可持续发展、水环境容量、对策等联系较为密切,表明水环境方面的研究侧重于从可持续发展的角度探讨水环境质量和水环境容量,以及相应的对策研究.1)水文学领域.研究内容侧重于气候变化、水循环、生态水文及水资源安全等,研究区域多选择半干旱地区的黑河流域和我国重大水利工程(如三峡水库),研究方法上主要采用(水文)模型进行模拟分析.2)水资源领域(方法部分).围绕区域的可持续发展,侧重开展水资源承载力、生态环境评价等研究,研究区域集中在干旱区,如石羊河流域及黄河流域.采用的方法主要是建立指标体系,多以熵权法确定指标权重,运用层次分析、主成分分析、模糊综合评价等方法进行综合评价.3)水资源领域(管理部分).流域方面侧重水资源管理模式的研究,研究区集中在长江流域,同时注重考虑流域生态需水问题;城市方面注重水资源利用的研究,地理信息系统技术在城市数字化过程中也得到了较为广泛的应用.4)水环境领域.研究围绕地表、地下水环境的容量、质量、管理等方面展开,研究区域主要是太湖流域.5)水工程领域.研究侧重于与南水北调工程相关的地质勘探、相关设备、工程监测、工程影响因素等方面.6)其它领域.研究成果较为集中地体现在采用系统动力学方法研究北京市的水环境承载力.水科学的涉及范围十分广泛,很多方面仍处于探索阶段,对水科学的学科体系、研究框架的认识还很不足,相应的关于水科学研究的成果层出不穷,文献数量越来越多.本文在收集大量文献基础上,构建由62个高频关键词组成的共词矩阵,利用网络分析、多维尺度分析和聚类分析等不同统计方法,初步归纳出近十年来水科学研究中的研究热点和研究现状.①在水文学领域中关于气候变化方面的研究、在水资源领域中关于水资源承载力和水资源管理方面的研究、在水环境领域中关于水环境容量和水环境质量方面的研究在当前研究成果中占较大比例;②围绕大型水利工程(如南水北调工程)的水工程领域的研究,以及国家日益重点关注的水安全问题的水安全领域的研究均有所增多;③水科学相关研究中更加注重区域的可持续发展和生态环境保护;④各方面的研究中都形成了一些研究热点地区.致谢:本文第一作者自2013年以来参加了由郑州大学左其亭教授主编的《中国水科学研究进展报告》系列丛书的编写工作,在编写过程中认识到用数学方法描述水科学研究进展的直观性和科学性,先期以“水资源学”为研究对象撰写的《水资源学研究的关键词共词聚类分析》一文已发表,本文则在前期研究的基础上扩展到整个水科学研究领域.在此,感谢左其亭教授及其领导的《中国水科学研究进展报告》编写团队对本文提出的指导意见![1]任智军,朱东华,谢菲.科技文本的可视化分析研究[J].北京理工大学学报(社会科学版),2007,9(1):13-17.[2]左其亭.中国水科学研究进展报告2011—2012[M].北京:中国水利水电出版社,2013.[3]左其亭.中国水科学研究进展报告2013—2014[M].北京:中国水利水电出版社,2015.[6]舒琅.基于社会网络分析的项目管理学科热点和主流知识群的研究[D].杭州:浙江大学,2010.[7]FRY J,TALJA S.The intellectual and social organization of academic fields and the shaping of digital resources[J].Journal of Information Science,2007,33(2):115-133.。

教育信息化热点问题探究

教育信息化热点问题探究

教育信息化热点问题探究摘要研究数据选自期刊《中国电化教育》和《电化教育研究》2011年文献中研究内容与“教育信息化”相关的76篇学术论文,运用共词聚类、多维尺度分析等研究方法,研究分析教育信息化的研究热点,并对相关问题进行探讨。

关键词教育信息化;共词聚类;教育技术中图分类号:g434 文献标识码:a 文章编号:1671-489x(2012)27-0009-03perspective on 2011 hot issues of educational//liu ting abstract research on 76 articles which relevant to educational informatization that from china educational technology and e-education research, using co-word cluster analysis method and multidimensional scaling analysis method. reveal the hot research topics through analysis, and then probe into the related issues.key words educational informatization; co-word clustering; educational technologyauthor’s address harbin normal university, harbin, china 1500251 研究设计1.1 数据来源与研究方法“教育信息化”一词在1999年中共中央国务院发表的《关于深化教育改革全面推进素质教育的决定》中被提出,至今已取得显著的成绩,对我国教育改革发展产生重要影响。

本文以中国期刊网全文数据库为数据平台,以教育技术学核心期刊《中国电化教育》和《电化教育研究》期刊2011年全年文献为数据源,检索主题或关键字为“教育信息化”,最终确定76篇文献作为有效数据。

我国管理科学与工程博士学位论文的共词聚类分析

我国管理科学与工程博士学位论文的共词聚类分析

工博学论的词 类析 程 士 位 文 聚 分
杨 昌明 ’教授 王
军 3 博 士生 ( 、 中国地质 1
3( 、 7 集 大学 ( 武汉 )经济管理 学院 武汉 4 0)4 2 义 马 煤 业 ( 团 )
股份 有限公 司 河南 义马
西安

420 3 7 3 0 、陕西 维德科技 股份有 限公 司
3 3 6 5
3 3 8 6 3 3 5 7 3 3 4 8 3 3 3 9 3 4 3 0 3 4 2 1
不确 定性
绩效
2 5 5 . 2
2 8 5
仿真
风险控 制 复杂 阿络 价 值链
2 2
2 2 2 2 2 2
支 持向量机 2 8 5 4 指标 体系 壹本机 构 产业 结构 定价 2 5 , 5 5
方法 , 合信 息技 术研 究解 决社 会 、经 济 、 结
设 条件是 :文章的 关键词是 文章主题 内容 的浓缩 ,共词 文章 数量越 多 ,表
明这 类 关 键 词 “ 距
g 可 持续发 展 5 筋 结掏方程 模型 3 4 9 1 3
遗传 算法 5 2 评价指 标体系 3 4 9 7 0 4 l 敦据 挖掘 5 2 1 2 8 1 知识 管理 5 2 2 2 g
序 号 关键 词
表 1 管理 科学与工 程博士学位 论文高频 关键词表
词 序关键词
诃 序
援 号
关 键词
词 撷
之 间 的 内在 关 系 ,探 索 管 理 科 学 与 工
程 专 业 博 士 学 位 论 文 研 究 现 状 、 热 点 和 变 化 趋 势 等 ,以 期 对 今 后 的研 究 有
术如 因子分析 、 聚类分析和 多维尺度分 析 等 ,则可 以按 这种 “ 离”将一个学科 内 距

共词分析法的基本原理及实现

共词分析法的基本原理及实现

1、建立词库:首先需要对文本中的词汇进行分词和标注,建立词汇库。这 个步骤可以通过一些现有的分词工具和词典来完成。
2、计算共现频率:在建立词汇库的基础上,对于每一对词汇,计算它们在 文本中共同出现的频次。
3、构建相似度矩阵:根据词汇之间的共现频率,可以计算出它们之间的相 似度,从而构建一个相似度矩阵。
4、应用聚类算法:使用一些常用的聚类算法,如K-means、层次聚类等,根 据相似度矩阵将词汇聚成一个类别。
5、分析聚类结果:对聚类结果进行分析,可以发现文本的主题和热点,进 一步挖掘文本数据的有用信息。
总之,共词分析法作为一种有效的文本挖掘方法,可以广泛应用于信息处理 和文本分析中。共词聚类分析法作为其中的一种重要方法,具有简单易行、可操 作性强等特点,可以发现文本的主题和热点以及词汇之间的关联程度,为深入研 究文本数据提供更多有用信息。随着大数据时代的到来,共词分析法将会得到更 加广泛的应用和发展。
等是机器学习的核心概念,同时还可以了解到机器学习在不同领域的应用情 况。这些信息可以作为文章论述的基础,使文章内容更具说服力和可信度。
总结共词分析法是一种有效的文本挖掘和分析工具,可以帮助我们揭示文本 中词汇之间的关联和规律,提取有用的知识结构。它的优点在于可操作性强、适 用范围广,能够从大量文本数据中挖掘出有用的信息。
2、基于主题的共词分析
基于主题的共词分析能够更深入地挖掘文献之间的和相似性。该方法首先通 过主题建模技术(如LDA、PLSA等)从文献中提取主题,然后对每个主题进行共 词分析。该方法适用于领域分析和主题挖掘等场景。
3、基于实体和关系的共词分析
基于实体和关系的共词分析能够从文献中提取实体和实体之间的关系,并对 这些实体和关系进行共词分析。该方法适用于知识图谱构建、实体关联和领域知 识挖掘等场景。

国内“ChatGPT+教育”研究热点、主题及启示--基于共词分析的可视化研究

国内“ChatGPT+教育”研究热点、主题及启示--基于共词分析的可视化研究

国内“ChatGPT+教育”研究热点、主题及启示--基于共词分
析的可视化研究
郑小军;张美虹
【期刊名称】《广西职业技术学院学报》
【年(卷),期】2024(17)3
【摘要】近两年来,ChatGPT及其与教育的融合引发了热议。

研究选取了中国知网(CNKI)中文期刊数据库的311篇“ChatGPT+教育”文献,运用共词分析法,通过高频关键词分析、社会网络分析、聚类分析和多维尺度分析等方法,探析国内“ChatGPT+教育”的发展现状。

研究发现,ChatGPT生成原理、人机协同、教育数字化转型和数字素养等是该研究领域的热点。

ChatGPT对教育生态的影响、ChatGPT与教育变革论、ChatGPT赋能教育数字化及ChatGPT的教育伦理风险与对策论是当前“ChatGPT+教育”研究的4个主题。

研究认为,未来“ChatGPT+教育”研究需加强理论研究,夯实理论基础;质性研究与实证研究并举;加强跨学科研究,拓宽研究视角;构建学术研究共同体。

【总页数】13页(P19-31)
【作者】郑小军;张美虹
【作者单位】南宁师范大学职业技术师范学院;广西职业教育发展研究中心
【正文语种】中文
【中图分类】G724.4
【相关文献】
1.国内外STEM教育研究主题热点及发展趋势——基于共词分析的可视化研究
2.国内外深度学习研究主题热点及发展趋势——基于共词分析的可视化研究
3.国内外STEM教育研究主题热点及发展趋势——基于共词分析的可视化研究
4.国内外深度学习研究主题热点及发展趋势——基于共词分析的可视化研究
因版权原因,仅展示原文概要,查看原文内容请购买。

共词分析法的基本原理及EXCEL实现_储节旺

共词分析法的基本原理及EXCEL实现_储节旺
第29卷第6期 2011 年 6 月
情报科学
Vol.29,No.6 June,2011
共词分析法的基本原理及 EXCEL 实现
储节旺,郭春侠
(安徽大学 管理学院,合肥 安徽 230039)
摘 要:共词分析法是文献研究的重要方法之一,在国内外众多学科领域都获得了广泛应用。人们
主要采用 spss、ucinet 等软件等进行构建作者和关键词矩阵以分析文献数据,但这些软件比较难以
共词分析法主要是对同一篇文献中词汇对或名
收稿日期:2011-03-01 基金项目:国家社科基金项目(10BTQ035);安徽大学创新团队项目(SKTD010B) 作者简介:储节旺(1969-),男,安徽岳西人,教授,博士,主要从事知识管理、教育管理、科技管理研究;郭春侠(1973-),女,河
北固安人,副教授.
法分列出关键词,并将所有关键词进行排列,统计得
出 I1=434。
因此 T=25.7,为阀值为 26,即核心关键词只有
知识管理、图书馆、知识经济三个。这显然不能反映
研究的根本问题。出现该问题的原因主要是所选期
1 共词分析法的基本原理
共词分析方法最早在 20 世纪 70 年代中后期由 法国文献计量学家提出的,其思想来源于文献计量 学的引文耦合与共被引概念。1986 年法国国家科
学研究中心的 Callon M 和 Law J 等人出版了第一部 关于共词分析法的学术专著【1】。共词分析经过 20 多年的发展,已经被广泛应用到人工智能、科学计量 学、信息科学和信息系统、信息检索等领域许多领 域,取得了重要研究成果。
关键词的共词矩阵构建好以后,可以直接求出 相关系数。操作方法是:选择工具栏→工具→数据 分析→相关系数。R 型聚类分析是以相关系数为基 础进行的聚类,必须对相关系数进行显著性检验。 将在某一置信度α之下显著相关的元素归为一类。 一般情况下,α值越大,相关元素个数会越多,因此 可以逐渐增大显著水平α值,将显著相关的元素逐 一归类并画出谱系图,即为学科研究的知识图谱,或 者说可视化。

多维数据的分组和聚类分析方法及应用研究

多维数据的分组和聚类分析方法及应用研究

多维数据的分组和聚类分析方法及应用研究随着数据产生和积累的飞速增长,多维数据的分组和聚类分析变得日益重要。

这些分析方法帮助人们理解和发现数据背后的模式和关系,从而为决策提供基础和洞察力。

本文将介绍多维数据的分组和聚类分析的常见方法,并探讨它们在不同领域的应用研究。

1. 多维数据分组分析方法多维数据分组分析的目标是将数据集划分为不同的组,使得每个组内的成员具有相似的特征。

以下是几种常见的多维数据分组分析方法:1.1. K-means聚类K-means聚类是一种基于距离的分组方法,将数据集划分为K个类别,使得每个数据点与其所属类别的质心之间的距离最小化。

该方法适用于连续变量和欧几里得距离度量的数据集。

K-means聚类具有简单、高效的优点,但对初始聚类中心的选择敏感。

1.2. 层次聚类层次聚类是一种自底向上或自顶向下的分组方法,通过计算样本间的距离或相似度来确定聚类结构。

该方法生成一个树形结构,可视化地表示不同类别之间的关系。

层次聚类不需要预先指定类别数量,但对于大规模数据集计算复杂度较高。

1.3. 密度聚类密度聚类方法基于数据点周围的密度来划分组,将样本点密度较高的区域作为一个组,较低的区域作为另一个组。

该方法可以识别复杂的聚类形状和噪声数据,适用于非凸数据集。

DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一种常见的密度聚类方法。

2. 聚类分析方法聚类分析的目标是将数据集划分为若干个不相交的子集,每个子集中的数据点在某种意义上具有相似性。

以下是几种常见的聚类分析方法:2.1. 分层聚类分层聚类是一种基于相似性度量的聚类方法,将数据集划分为多个子集,类别数量从1逐渐增加到N。

该方法可通过树状图表示不同层级之间的相似性关系。

分层聚类的优点是不需要预先指定聚类数量,但对于大规模数据集计算复杂度较高。

2.2. 期望最大化(EM)算法EM算法是一种基于概率模型的聚类方法,通过迭代生成最大似然估计的方法来拟合数据分布。

我国人工智能教育的研究热点与趋势分析——基于共词分析的可视化研究

我国人工智能教育的研究热点与趋势分析——基于共词分析的可视化研究

我国人工智能教育的研究热点与趋势分析——基于共词分析的可视化研究朱广袤 乜勇(陕西师范大学 教育学院,陕西 西安 710062)摘 要:人工智能与教育的融合引发教育领域新一轮研究热潮。

本文选取国内近十年来教育技术学专业领域CSSCI 检索源期刊中与人工智能教育相关的239 篇论文为研究对象,利用Bicomb 2.0、Ucinet 6.0及SPSS 20.0软件,采取共词聚类、词频分析、多维尺度分析及社会网络分析等方法,对我国人工智能教育的研究现状与研究热点进行了详细分析,最后对未来研究趋势进行了讨论。

关键词:人工智能;人工智能教育;文献计量分析;可视化研究中图分类号:G434 文献标志码:A 文章编号:2096-0069(2019)05-0008-06教育”“人工智能教育”“教育人工智能”“人工智能技术,教育”“人工智能教育应用”“人工智能教育系统”“人工智能课程”“人工智能学科”等为主题词,来源限定为国内教育技术学专业领域CSSCI 检索源期刊,检索时间为2009年到2018年。

经统计,本研究检索到相关论350篇,经筛选后最终纳入分析的样本论文数为239篇。

本研究将这239篇论文的题录信息以NoteFirst 格式导出,以SPSS 20.0、Ucinet 6.0和Bicomb 2.0 [2]为研究工具,采用知识图谱及共词分析方法进行分析。

(二)研究过程具体路线图如图1(见下页)所示。

二、研究结果与分析(一)高频关键词词频统计与分析将样本文献信息导入Bicomb 2.0,进行关键词提取操作。

最后得到718个关键词,根据普赖斯公式[3]收稿日期:2019-05-16作者简介:朱广袤(1995— ),男,安徽亳州人,陕西师范大学教育学院教育技术专业硕士研究生,主要研究方向为信息技术教育应用;乜勇(1970— ),男,青海贵德人,陕西师范大学教育学院教育技术系主任、教授、博士生导师,主要研究方向为信息技术教育应用、网络与远程教育。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

关键词共词分析、聚类分析和多维尺度分析
功能:
1、寻找近几年研究热点(热点图),为论文的选题做准备
2、直接为论文服务
方法举例:
关键词:自闭症
研究工具:Bicomb共词分析软件、、excel、中国知网(CNKI)
研究进程:
A:中国知网(官网)-左上“资源总库”-左上“中国学术期刊网络出版总库”
主题:自闭症,年限范围:2000-2014,来源类别:全选-检索
每页显示:50-一页页全选后再删除一定不要研究的文献-尽量多选择文献(最好全部)
导出/参考文献-全选-导出-自定义(支持需输出更多文献信息)-全选-导出-保存-txt
打开txt-编辑-全部替换(前面英文删除)-另存为txt-编码:ANSI【多操作几遍,不然提取不出来或会出现00000,而不是00000,00001,00002等】
B:书目共现分析系统-增加(右上角)-项目编号:1-格式类型:cnki中文txt-提取-选择文档-关键字段:关键词-提取(红色)-统计-关键字:关键词-∑统计-矩阵-关键字:关键词-≥5≤280-词篇矩阵-生成-导出至txt-保存
C:打开SPSS-文件-打开文本数据-下一步-删除第一行-度量标准:“名义”变为“度量”-分析-分类-系统聚类-V1标准个案-V2到Vn变量-统计量:选择“合并进程表”“相似性矩阵”-绘制:树状图-方法(二分类-Ochiai)-结果:近似矩阵(最大的表格)导出到excel-多维尺度分析【树状图如果是虚线,可能是spss版本问题或其他问题】
D:SPSS-excel导入-打开数据-excel-删除第一行-删除1:、2:、3:、4:、5:、、、-复制粘贴到变量视图-度量标准:“名义”变为“度量”-字符串变为数值【第一个分类不要改字符串】-分析-度量-多维尺度最后一个ALSCAL-变量移动-从数据创建距离-度量(E)-标准化:Z 得分-选项:组图。

相关文档
最新文档