中国本土管理学派研究——基于TFIDF关键词抽取算法的聚类分析与内核提取-论文

合集下载

TFIDF算法研究综述

TFIDF算法研究综述
lb N - lb n + 1
( 1)
其中 tfij 指特征项 tj 在文档 di 中出现的次数 ; idfj 指出现特征 项 tj 的文档的倒数 。 N 表示总文档数 , n j 指出现特征项 tj 的文 档数 。
2 TF I D F 算法改进
上世纪 90 年代 ,国内外都开始关注 TF I D F在文本分类中 的应用 ,很多学者分析 TF I D F 的缺陷 、 对其进行改进 , 并通过 实验验证改进的有效性 , TF I D F 也随着研究的拓展被应用到
D 2 文档中不同词条的数目 ; tfijk 指在文档集 D i 中领域 R k 中词 条 tj 出现的频率 ; tfqjk 指在输入的句子 Q 中 , 领域 R k 中 (包含
其中 TF指特征项 tj在类 ck 中出现的次数 ; D ( ck ) 指类别 ck 中 的文档数 , D F ( tj , ck ) 指类别 ck 中出现特征项 tj的文档数 ; C代 表类别数 , CF ( tj , ck ) 指出现特征项 tj 的类别数 。 2. 1. 2 类间 、 类内分布偏差 [ 6 ] TF I D F将文档集作为整体来考虑 , 其中 I D F 的计算并没 有考虑到特征项在类间和类内的分布情况 。如果某一特征项 在某个类别内大量出现 ,而在其他类别出现很少 ,这样的特征 项的分类能力显然是很强的 ,应该给予较高的权重 。但是根 据 I D F的定义可知 ,若特征项在较多文档中出现 ,则 I D F则变 小 ,导致权值变小 。 文献 [ 6 ]通过修改 TF I D F公式 (2)中 I D F的计算方法 ,增 加那些在一个类中频繁出现的特征项的权重 。设总的文档数 为 N , 包含特征项 t的文档数为 n, 其中某一类 C中包含特征项

基于TF—IDF算法的研究与应用

基于TF—IDF算法的研究与应用

基于TF—IDF算法的研究与应用TF-IDF(Term Frequency-Inverse Document Frequency)是一种常用的文本特征提取方法,通常用于信息检索、文本分类等自然语言处理任务中。

TF-IDF算法的研究和应用具有广泛的领域和深入的应用。

TF-IDF算法基于词频(TF)和逆文档频率(IDF)的概念,将词语的重要性进行量化。

TF指的是某个词在文档中出现的频率,值越大表示该词在文档中越重要;IDF指的是某个词在整个文集中的重要程度,即该词在所有文档中出现的次数的倒数。

TF-IDF算法通常使用的公式是TF-IDF=TF*IDF,通过计算词的TF值和IDF值的乘积来得到词的重要性。

TF-IDF算法的研究主要集中在两个方面:一是对TF和IDF的具体计算方式进行优化;二是对文档相似度计算方法的研究。

TF的计算方式有多种,常用的有原始词频、对数词频和归一化词频等方法。

IDF的计算方式也有多种,常用的有基础IDF和平滑IDF等方法。

研究者们通过对TF和IDF的不同计算方式进行实验比较,找到了最优的计算公式,提高了TF-IDF算法的性能。

TF-IDF算法在信息检索、文本分类、关键词提取等领域有着广泛的应用。

在信息检索中,TF-IDF算法可以用于计算查询与文档的相似度,将相关度高的文档排序展示给用户。

在文本分类中,TF-IDF算法可以用于提取文本的特征向量,通过分类算法对文本进行分类。

在关键词提取中,TF-IDF算法可以用于识别文本中的重要词语,帮助用户快速理解文本的主题和内容。

TF-IDF算法是一种重要的文本特征提取方法,通过计算词的重要性来帮助理解文本的主题和内容。

研究者们对TF和IDF的计算方式进行优化,使TF-IDF算法在各个领域都有着广泛的应用。

随着自然语言处理技术的发展,TF-IDF算法将会继续发挥重要的作用,并与其他算法相结合,为各种文本处理任务提供更加准确和高效的解决方案。

基于改进TF-IDF算法的情报关键词提取方法

基于改进TF-IDF算法的情报关键词提取方法

基于改进TF-IDF算法的情报关键词提取方法
张瑾
【期刊名称】《情报杂志》
【年(卷),期】2014(000)004
【摘要】传统的TF-IDF完全基于词频,忽略了词语的其它特征项对关键词的影响。

本文提出基于TF-IDF、词位置和词跨度的关键词自动提取的方法。

该方法通过在
传统的TF-IDF关键词权重计算方法中,加入位置权值及词跨度权值,避免单纯采用TF-IDF算法产生的偏差。

实验结果表明,该方法在情报关键词提取中有广泛的应用价值,其准确率、召回率及F1值与传统方法相比有明显提升。

【总页数】3页(P153-155)
【作者】张瑾
【作者单位】郑州轻工业学院郑州 450002
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于改进TF-IDF的中文网页关键词抽取——以新闻网页为例 [J], 钱爱兵;江岚
2.基于TF-IDF分类算法的雷达情报分发技术 [J], 余苗;杨瑞娟;程伟;高路;程红斌
3.基于改进RAKE算法的商品关键词提取方法 [J], 徐明明;杨文璐;夏斌;谢宏
4.基于改进TF-IDF算法的关键词抽取系统 [J], 胡亮;夏磊;李伟
5.改进的TF-IDF关键词提取方法 [J], 王小林;杨林;王东;镇丽华;;;;
因版权原因,仅展示原文概要,查看原文内容请购买。

(三)基于tfidf和textrank关键字提取

(三)基于tfidf和textrank关键字提取

(三)基于tfidf和textrank关键字提取前⾔关键词提取就是从⽂本⾥⾯把跟这篇⽂章意义最相关的⼀些词语抽取出来。

这个可以追溯到⽂献检索初期,关键词是为了⽂献标引⼯作,从报告、论⽂中选取出来⽤以表⽰全⽂主题内容信息的单词或术语,在现在的报告和论⽂中,我们依然可以看到关键词这⼀项。

因此,关键词在⽂献检索、⾃动⽂摘、⽂本聚类/分类等⽅⾯有着重要的应⽤,它不仅是进⾏这些⼯作不可或缺的基础和前提,也是互联⽹上信息建库的⼀项重要⼯作。

关键词抽取从⽅法来说主要有两种:第⼀种是关键词分配:就是给定⼀个已有的关键词库,对于新来的⽂档从该词库⾥⾯匹配⼏个词语作为这篇⽂档的关键词。

第⼆种是关键词提取:针对新⽂档,通过算法分析,提取⽂档中⼀些词语作为该⽂档的关键词。

⽬前⼤多数应⽤领域的关键词抽取算法都是基于后者实现的,从逻辑上说,后者⽐前者在实际应⽤中更准确。

下⾯介绍⼀些关于关键词抽取的常⽤和经典的算法实现。

基于 TF-IDF 算法进⾏关键词提取在信息检索理论中,TF-IDF 是 Term Frequency - Inverse Document Frequency 的简写。

TF-IDF 是⼀种数值统计,⽤于反映⼀个词对于语料中某篇⽂档的重要性。

在信息检索和⽂本挖掘领域,它经常⽤于因⼦加权。

TF-IDF 的主要思想就是:如果某个词在⼀篇⽂档中出现的频率⾼,也即 TF ⾼;并且在语料库中其他⽂档中很少出现,即 DF 低,也即IDF ⾼,则认为这个词具有很好的类别区分能⼒。

TF 为词频(Term Frequency),表⽰词 t 在⽂档 d 中出现的频率,计算公式:其中,ni,j 是该词 ti 在⽂件 dj 中的出现次数,⽽分母则是在⽂件 dj 中所有字词的出现次数之和。

IDF 为逆⽂档频率(Inverse Document Frequency),表⽰语料库中包含词 t 的⽂档的数⽬的倒数,计算公式:其中,|D|表⽰语料库中的⽂件总数,|{j:ti∈dj}| 包含词 ti 的⽂件数⽬,如果该词语不在语料库中,就会导致被除数为零,因此⼀般情况下使⽤ 1+|{j:ti∈dj}|。

基于改进的TF-IDF文本特征词提取算法研究

基于改进的TF-IDF文本特征词提取算法研究

基于改进的TF-IDF文本特征词提取算法研究
贾强;冯锡炜;王志峰;朱睿;秦航
【期刊名称】《辽宁石油化工大学学报》
【年(卷),期】2017(037)004
【摘要】在特征词提取算法中,TF-IDF算法是最常见的特征权重计算方法.在传统TF-IDF算法的基础上,提出新的基于文本词语长度的关鍵词提取算法.利用中文短语分词技术,识别文本中的长词与普通词汇,对于不同长度的词语利用提出的TF-IDF-WL方法重新计算权重,按权值排序结果得到关鍵词.实验对比发现,新的特征词提取算法能够更加精确地反映出特征词的词长情况,该算法与传统的TF-IDF算法相比,在准确率和召回率上都有较大的提升.
【总页数】5页(P61-64,69)
【作者】贾强;冯锡炜;王志峰;朱睿;秦航
【作者单位】辽宁石油化工大学计算机与通信工程学院,辽宁抚顺 113001;辽宁石油化工大学计算机与通信工程学院,辽宁抚顺 113001;辽宁石油化工大学计算机与通信工程学院,辽宁抚顺 113001;辽宁石油化工大学计算机与通信工程学院,辽宁抚顺 113001;辽宁省抚顺市望花区教师进修学校,辽宁抚顺 113001
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于改进TF-IDF的微博短文本特征词提取算法 [J], 邓丹君;姚莉
2.改进的 TF-IDF中文本特征词加权算法研究 [J], 申剑博
3.改进的 TF-IDF中文本特征词加权算法研究 [J], 申剑博
4.基于改进TF-IDF的微博短文本特征词提取算法 [J], 邓丹君;姚莉
5.基于TF-IDF特征词提取的不平衡文本分类 [J], 陈欢;王忠震
因版权原因,仅展示原文概要,查看原文内容请购买。

一种基于TFIDF方法的中文关键词抽取算法

一种基于TFIDF方法的中文关键词抽取算法

图 1 海量智能分词软件分词结果 从图 1中可以看出, 海量智能分词尽管能 把大部分词 语分开, 但对于包含创新点的 科技文章来说, 其中的创新 点词和未登录词尚不能准确地 识别, 分 词结果还不尽如人 意。如文中 的 / 知识 标引 0 和 / 知识 元 0 没 有被看 成一 个词, 而这些词比较好地反映 了该文的主旨, 所以该方法 还有待改进。 21 2 基于海量 智能分词的中文自动分词新算法 海量智能分词对大部分词 都作出了切分, 但不能得到 能反映中文科技文献的关键词 和创新点。为了能得到如实 反映文章语义的更精确的分词 结果, 笔 者提出了一种基于 海量智能分词初步结 果的新算法。 1) 文本过滤。由于 表征 文 章主 旨 的词 主 要 是实 词, 我们首先建立了一个虚词表, 如果海量 智能分词结果中词 的词性为虚词表中的任一种或 标点符号, 则将这个虚词或
4) 向量空间模型 ( VSM )。给定一自然语言文档 D = D ( t1, t2, , , tN ), 由于 tk在文 档 中既 可以 重 复出 现又 应该有先后次序的关 系, 分析 起来仍有一定的难度。为了 简化分析, 可 以暂不考虑 tk在文档中的先后 顺序并要求 tk 互异 (即没有重复 ) 。这时可以把 t1, t2, , , tN 看成一个 N 维的坐 标系, 而 w1, w2, , , wN 为相 应的 坐 标值, 因 而 D (w1, w2, , , wN ) 被看成是 N 维空间中的一个向量 ( 如图 4中的 D1, D 2 )。我 们称 D (w1, w2, , , wN ) 为 文档 D 的向量表示或向量空间模型。
关键词是为了文 献标引工作, 从报告、论文中选取出 来用以表示全文主题内容信息 的单词或术语。关键词自动 抽取是依靠计算机从文档中选 择出反映主题内容的词, 也 称 作 关 键 词 自 动 标 引 , 在 文 献 检 索、 自 动 文 摘、 文本聚类 /分类等方面有着 重要 的应用 [ 2] 。关 键词 可以为 文档提供一个简短的概括, 使读者能够 在短时间内了解文 档的大概内容。关键词还是信息检索系 统中对文档进行索 引、聚类等操作的基础 [ 3]。

关键词提取算法的研究与应用

关键词提取算法的研究与应用一、引言关键词提取算法是自然语言处理领域的一个重要研究方向,其通过分析文本中的关键词,可以帮助研究人员快速了解文本内容。

在本文中,我们将探讨关键词提取算法的研究与应用,并且对其中的一些代表性算法进行详细介绍。

二、关键词提取算法的研究近年来,关键词提取算法的研究得到了广泛关注。

通过使用各种自然语言处理技术,研究者们设计出了许多有效的关键词提取算法。

以下是其中几个代表性算法的介绍。

(一)TF-IDF 算法TF-IDF 算法是一种常见的关键词提取算法。

其基本思想是,一个词在一篇文档中出现的次数越多,同时在其他文档中出现的次数越少,那么这个词就越能代表这篇文档的特征。

因此,TF-IDF算法通过调整词频和文档频率的权重系数,来提取文本中最为重要的关键词。

(二)TextRank 算法TextRank 算法是一种基于图论的关键词提取算法。

该算法通过构建文本中的关键词之间的图来分析关键词之间的关系,然后通过计算各个关键词的重要性得分来提取关键词。

与其他算法相比,TextRank 算法可以更好地保留关键词之间的语义关系,因此在一些文本分类和文本摘要方面具备较为广泛的应用。

(三)LDA 算法LDA 算法是一种基于概率模型的关键词提取算法。

该算法在分析文本时,会将文本中的词分为多个主题,每个主题包含多个词。

然后通过计算每个主题的权重得分,来提取最为重要的关键词。

LDA 算法可以更好地保留文本的主题信息,因此在一些文本分类和文本分析场景中表现出色。

三、关键词提取算法的应用由于关键词提取算法的有效性和实用性,其在许多领域都得到了广泛应用。

(一)搜索引擎搜索引擎是关键词提取算法最为常见的应用领域之一。

在搜索引擎中,关键词提取算法可以帮助搜索引擎自动地分析用户的搜索意图,并且从海量的网页中提取出与用户意图最为相关的文本。

(二)文本分类在文本分类领域,关键词提取算法可以帮助研究人员自动地从一些无标注的文本中提取关键词,从而对文本进行分类。

大数据分析中的关键词提取方法研究

大数据分析中的关键词提取方法研究随着互联网技术的快速发展和数据采集、存储技术的逐渐成熟,大数据分析已成为目前最热门的领域之一。

在大数据分析过程中,关键词提取是非常重要的一项工作,它可以帮助我们从大量的文本数据中提取出与我们所关注的话题相关的关键词,为我们的决策提供有力的支持。

本文将从大数据分析中的关键词提取方法出发,详细探讨几种常见的关键词提取方法及其优缺点,并对其应用领域进行分析,为读者提供一些有益的参考和思考。

一、基于TF-IDF算法的关键词提取方法TF-IDF是一种常用的文本处理算法,它可以用来评估一篇文章中一个词的重要性。

这个算法流行于信息检索和文本数据挖掘领域。

TF-IDF算法的核心思想是:一个词的重要性与它在文章中出现的频率成正比,与它在语料库中出现的频率成反比。

在应用TF-IDF算法进行关键词提取时,我们首先需要建立一个语料库,其中包含大量与我们所关注话题相关的数据。

然后,我们计算出每个词在语料库中的出现频率,以及在当前文章中的出现频率,最后使用TF-IDF公式来计算每个词的重要性,将其排序后,即可得到文章中的关键词。

此方法的优点在于对文章的长度没有限制,可以处理任意长度的文章,并且可以应用于各种类型的文本数据。

缺点是该算法不能捕捉到上下文相关性,即同一词汇在不同上下文中的含义可能不同,容易导致关键词提取的错误和不准确。

二、基于LDA主题模型的关键词提取方法LDA是一种经典的主题模型,它可以用来发现隐藏在文本数据中的主题。

基于LDA算法的关键词提取方法是先通过LDA算法抽取出一篇文章的主题词,然后根据主题词的权重来提取出文章的关键词。

与TF-IDF算法相比,LDA算法能够更好地捕捉到文本数据中的关联性和上下文相关性,从而提高了关键词的准确率。

但是,由于LDA模型的训练时间较长,且对语料库的质量要求较高,因此该方法在大规模数据分析中的效率和可行性受到了一定的限制。

三、基于文本聚类的关键词提取方法文本聚类是一种数据挖掘技术,它可以将大量文本数据分成多个类别,每个类别中的文本数据具有相似的特征。

一种基于TF-IDF方法优化的新闻关键词提取方法及系统[发明专利]

专利名称:一种基于TF-IDF方法优化的新闻关键词提取方法及系统
专利类型:发明专利
发明人:周会祥,盛武平
申请号:CN202011521853.1
申请日:20201222
公开号:CN112256843A
公开日:
20210122
专利内容由知识产权出版社提供
摘要:本发明公开了一种基于TF‑IDF方法优化的新闻关键词提取方法及系统,包括新闻采集模块、新闻分类模块、用户管理模块。

采用TF‑IDF‑MP算法对每篇新闻进行分类,并将分类结果存入对应类别中,TF‑IDF‑MP算法结合特征词在语料库中词频的分布情况和在特征词文档中的位置信息,对那些在文档中出现高于特征词词频均值的特征词和更能体现文档主题的文档第一段以及最后一段的名词赋予较高的权重,而对那些低于特征词词频均值的特征词降低权重,通过最终权重分评分,确定新闻关键词以实现对新闻进行分类。

申请人:华东交通大学
地址:330013 江西省南昌市经济技术开发区双港东大街808号
国籍:CN
代理机构:南昌金轩知识产权代理有限公司
代理人:孙文伟
更多信息请下载全文后查看。

基于TFIDF算法的关键词提取方法

基于TFIDF算法的关键词提取方法章志华;陆海良;郁钢【期刊名称】《信息技术与信息化》【年(卷),期】2015(000)008【摘要】企业知识库数据量以爆炸性的速度增长,其中大部分信息是非结构化的文本数据,系统往往不能快速准确地满足企业用户的查询请求.为解决这一问题,提出了一种基于TFIDF算法同义替换和相邻合并的文本挖掘技术.这种技术可以降低服务器压力,使服务人员可以更快更准确的从知识库中寻找出相关信息.最后以实例验证了本算法的有效性.%Enterprise knowledge repository increases with the explosive growth rate, most of which is unstructured text data.The application often can not meet the user's query requests quickly and accurately. To solve this problem, a novel text mining technique based on TFIDF with synonymous substitutions and adjacent integrationis proposed, which can reduce the server stress and make it more efficient to extract expected information. Finally, examples demonstrate the effectiveness of the algorithm.【总页数】3页(P158-160)【作者】章志华;陆海良;郁钢【作者单位】浙江中烟工业有限责任公司浙江杭州 310009【正文语种】中文【相关文献】1.中国本土管理学派研究——基于TFIDF关键词抽取算法的聚类分析与内核提取[J], 宋孜宇;张迪2.基于TFIDF算法的全面从严治党重要论述关键词共现分析 [J], 张辛3.基于TFIDF算法的全面从严治党重要论述关键词共现分析 [J], 张辛4.基于Scopus检索和TFIDF的论文关键词自动提取方法 [J], 陈列蕾;方晖5.基于贝叶斯推理和TFIDF算法的中文关键词智能抽取 [J], 胡局新;鞠训光因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
行系统总结和提炼 ,发现这些理论学 派之
间的区别与共性 ,并考虑能否将其 中共 性
中 国 本 土 管 理 学 派 研 究
基 于 T F I D F 关 键 词 抽 取 算 法 的 聚 类 分 析 与 内 核 ' 提 I / 取
■ 宋孜 宇 张 迪 ( 呼伦 贝尔学院经 济管理 学院 内蒙古呼伦 贝尔
题 内容信息 的单词或术语 ,这种 关键词 可 以为文档提供一个精要 的概括 ,使读者 能 够在短时间 内掌握文档 的主要 内容 ( 徐 文
海等 , 2 0 0 8) 。 传统采 用人 工方式进 行关键 词抽取来完成信息检 索和提炼 ,不但耗 时 较长 ,而且很容易受到主观因素的干扰。 T F I DF 是现代信息检索技术 中最经典 、
畴 ,是 中国本土管理模式所 广泛存在的特
学诹 关键词群、 \ 东方管理学 C理论 和合管理 和谐 管理 道本管 理 中国式管理


性 ,各学派强调 的程度不 同 ,将这些关键 词的T F I DF 值加 总得 到这 一词群 的整体值 。 同样 , 关系与协 同词群包括 关系、 协调、 协
同、合作 ,从不 同侧面表达 了中国社会更 重视 关系与协 同这一特 性 ;中庸 与 中观词 群包括 中性 、中庸 、中和 、中观 。 从不同侧
整体 挂词群
1 3 2
2 6 3 2
2 4 2 8 1 3 3 8 8 9 9 6 5
8 5
5 9 7 1 5 1 8 6 2 2 9 4 8
哲学思想 的吸收和借鉴是各有侧重的 ,致
使其理论要素 组成 和架构各不相同 ,同时 又存在交 叉 ,因此任何一个学派都不能完
全代表 中国本 土管理理论 ,从而形成了百
家争 鸣、各说其是 的局 面 ,没有形成一个
最常用的检索算法 ,具有简单 、通用 、无 需复杂训练过程等优 点 ,尤其对简单文本 和小 文 本 的检 索 准确 率 很 高 ( 杨颖等 ,
土管理研 究必须深深地扎根于 中国传统哲 学之 中” 。 著 名哲学家方东美( 2 0 1 2) 认 为: “ 如果没有 中国传统 哲学作为坚实的基 础 , 中国本 土管理 研究只能成 为空 中楼 阁或夹
究 大量 涌现 ,众 多学者倾 注 了大量 的思考
和探 索 , 形成 了众 多本土管理思 想和理论 , 试 图发展 出类似于 “ Z 理 论” 式的 中国管理
的本 土理 论 成 果 。
内容 摘 要 :为 了深入 研 究 中国本 土 管理 理 论 的 六 大 学派 ,本 文 应 用基 于 T F I DF 算 法 的 关键 词抽 取 技 术 ,通过 关键 词群 的抽 取 和 提 炼 ,构 建 了 六 个 特 征 性 变
撰写的《 领先之道 》 、 王育琨 撰写的《 强者: 企业家的梦想与痴醉 》等 。本 文重点关注
管理模式的理想样貌 ,但是要想最终完成
提炼 “ Z理论 ”式 的中国管理模式这一任
过分析 《 红楼梦 》虚词的出现 频率 ,成功
判断出其前八十 回与后 四十回并非出 自同

务 ,也很难彻底抛开这些 已经相对成型 并 且 自成体 系的本土管理研究成果 。丹麦哥
本哈根商学院的李平 ( 2 0 1 3)教授 认为 :
思想 内核 进 行 了提 炼和 深 刻 阐释 。
随着信息技术 、情报 研究与统计学的
发展 ,以关键词 抽取 技术为基础的信息检
关 键词 : 中国本 土 管理 学派
法 聚 类 分 析 思 想 内核
T F I DF 算
管理模式完成 “ Z理论”式 的探索和总结。 也许 “ Z 理论 ” 的成 功在一定程 度上固 化了中国学者和理论界心 目中的中国本 土
2 0 o 91
2 O O 7 5 2 0 o 91 0 2 0 1 O . 1 1
席酉民
黄如金 齐善鸿
和 谐 管 理理 论及 其应 用 思考
制 胜
管 理 学报
多篇 文档 的关键 词矩 阵本 身也指 示 出 了这 类 文档 的 主要思 想 即 核 心要 素 ,以此 为 线 索进 行系统 归纳 即 可
手笔 的结论 , 为红学界破解 了重大谜 团。
可见对于 中国本 土管理理论 学派也 可采用
语言计量与统计 的方法进 行研 究 ,研究的
成果也将更有价值和说服力。 本文采用基于 T F I D F的关键词 抽取 技 术 ,对本土管理学派进行研究 ,并通过聚
“ 中国管理学者大多忽视 中国传统哲学对 中 国本 土管理研究的现代意义 ,并且大 多缺 乏对 中国传统哲学的基本 了解 ” 、“ 中国本
l S 8 5
2 1 2 1 9 7 9 O 8 8 1 2 3
3 0 9
3 8 8 3 O 9 3 9 2 0 5 0
3 8
3 8 2 4 8 3 2 5 3 6 1 4 9
关 系 与 协 同 词群 4 4 0 和 谐 与 和气 3 0 7
道本管理和 曾仕 强的 中国式管理 ( M理论 )
( 陈春 花等 ,2 0 1 4) 。第 二种理 论成果是在 对第一种成 果进行质疑和反思 的基 础上形 成 的 ,以思 辨和探索 为主题 ,主要集 中于 中国本土管理 的研究策略 、中国本 土管理 研 究的范式 、问题和方法论 问题 、中国传
索、文本分 类、文本 聚类以及摘要 自动生 成技术得到 了广 泛应 用。复旦大学统计学
专 家李 贤平教授应 用语言统计 学原理 ,通
中国本土 管理理论 回顾 与反思
随着 中国企业和 学界对西方管理理论 的学习 、借鉴 与研 究的不断深入 ,越来越 发现 完全移植西 方管 理理论不能完全适应 和指导 中国企业 的管理实践 。因此 ,从 2 0 世纪 8 0 年代 至今 , 有关 中国情境 的管理研
中 庸 与 中 观 词群 1 1 1 人 性 与 人 本 词群 8 8 权 变 与 变 通 词群 2 2
采用 T F I DF算 法 对 中国本 土管 理学 派
面表达 了中国社会所特 有的中道模式 ;人
性与人本词群包括人性 ( 化 ) 、人本 、以人 为本 ,反映 了中国哲学 中以人为核心的理
2 0 1 4) 。S a l t o n在 1 9 7 3年提 出了 T F I DF
( T e r m F r eq u en c y& I n v e r s e Do c u me n 一
类似于西方管理理论 的统一理论 整体 ,这
样一种缺乏整合 的理论 必然会让中国企业
无所适从。
表2 中国本 土管理学 派主要文献 关键词词群 T F I DF 值 矩阵

核 元素。 以T F I D F 算 法 为基础 提炼 出的文 献 思 想 内核 最大 限度 的 避 免了主观不确定性 , 具有很强的客观性 、 可重复性和可靠性。
(二 )研 究过 程
词 都从不 同的方面表达 了整体 性这一个范
土哲学 为基础 ,适 当融合 西方管理哲学凝
生饭 ” 。 中国本土管理学派最主要 的价值就 在于他们 完成 了对 中国古代哲学思想的梳
理和提炼 。 但是也要 看到 ,这些学派对 中国古代
ቤተ መጻሕፍቲ ባይዱ
练而成 的本 土管理理论 ,主要有苏东水 的 东方管理学 、成 中英的 C理论 、席酉 民的
和谐管理 、黄如金 的和合 管理 、齐善鸿的
学派 年份 第 一作 者 文 献 标题 出 版物
值 矩 阵 ,通 过对 该矩 阵采 用聚类 分析 ,从 而 可 以判 断不 同文献 的相 关程度 并进 行 归 类 。 同一理 论 范畴 的
管 理 学报
行词 频统 计 ,最后计算 出每篇 文档所 含关
键词 的 T F I DF 值 。这一过程 主要采用武汉 大学信 息管理学院设计 编码 的 R OS T C M6
模式 。
类分析与核心要素萃取 ,完成 对这 些本 土
管理理论 的系统 整合 与升 华。这里所指 的 关键词不是作者在论 文的开端 自行列 出的 关键词 , 而是指为了进行文献标引工作 , 而 从报告或论文 中选取 出来用 以表示全 文主
这些成 果可 以归为 3种 类型 :一种是
直接 以中国本土文化 的核心 要素即 中国本
统 哲学对 中国本 土管理研究 的价值 和意 义 等 。第三种成果 是密切跟踪与深入剖析 本
土企 业的管理实践 ,以案例方式 阐述本 土
因此 ,有必要对这些本 土管理学派进
《中文核 心期 刊要 目总览 》贸易经济 类核 心期 刊 9 7
表1 中国本土 管理学派关 键文献选 取列表
进 行归并分 类和 内核提取 , 具体 步骤如下_
0 2 1 0 0 0)
的内容提炼 出若干统一 的内核或共性 的模 式 ,才能更好地为企业所采用 。所 以 ,本 论文的重要理论价值在于 :一是可 以加深 学界对 中国本土管理学派之 间相互关 系的
理解 ,从而有利于学派 的整合与提炼 。二
是可 以不必再拘泥于不 同本土管理学派相
似 而又不同的各 自表述 ,直接萃取 出其精 华要素而代替其本体 ,从而将这些理论学
第一类研究成果 ,因为他们 已经形 成了比 较完整的 中国管理模 式 ,并且 其研 究成 果
中 国 本 土 管 理 学 派 的 比 较 研 究 方 法 和 过 程
(一 )研 究 方 法 和 思 路
量 ,同时计算出各 学派在 这六个变量上
的 TF I DF值 ,并 以此 为基 础 进行 了聚类
东方 管 理 学
2 0 0 8 . 5
2 o 0 61
苏 东 水
彭 贺
2 1 世 纪 东 西方 管 理 融 合与 发 展 睁 上 海管 理 科学 ;
相关文档
最新文档