使用Microsoft Excel进行数据的灰关联分析

合集下载

Excel小技巧使用数据表进行数据关联与分析

Excel小技巧使用数据表进行数据关联与分析

Excel小技巧使用数据表进行数据关联与分析导言:在日常工作和学习中,我们经常会使用Excel来处理和分析大量的数据。

而数据关联与分析是Excel的一项非常强大的功能,可以帮助我们更好地理解和利用数据。

本文将介绍一些Excel的小技巧,教你如何使用数据表进行数据关联与分析,提高工作效率和数据分析的准确性。

1. 数据关联的基本概念数据关联是指将两个或多个数据表中的数据通过某一列的共同值进行匹配和关联,从而可以通过关联的数据进行更深入的分析。

在Excel 中,我们可以使用vlookup()函数来进行简单的数据关联,或者使用PivotTable透视表进行复杂的关联分析。

2. 使用vlookup()函数进行简单数据关联vlookup()函数是Excel中非常强大的函数之一,它可以根据共同列的值,在一个数据表中查找并返回另一个数据表中相应列的值。

使用vlookup()函数进行数据关联的步骤如下:a. 在需要关联的数据表中,选择一个空白列,命名为数据关联列;b. 在数据关联列的第一个单元格中,输入vlookup()函数,指定需要查找的值和要返回的列,并将公式向下拖拽到所有需要关联的行;c. 将相关的数据表插入到同一工作簿的不同工作表中,可以方便进行数据关联操作。

3. 利用PivotTable透视表进行复杂数据关联和分析PivotTable透视表是Excel中非常方便和强大的数据分析工具,它可以对大量的数据进行整理、汇总和分析。

通过透视表,我们可以轻松实现多个数据表的关联和生成复杂的数据报表。

以下是使用PivotTable透视表进行数据关联和分析的步骤:a. 在需要关联的数据表中,选中所有的数据,然后点击插入菜单中的“透视表”选项;b. 在透视表的字段列表中,选择需要关联的列,并拖动到行区域或列区域;c. 如果需要关联的数据表超过两个,可以通过添加多个字段来进行关联分析,从而获取更全面的数据洞察。

4. 数据关联的常见问题和解决方法在进行数据关联分析时,可能会遇到一些常见问题,如数据不匹配、重复数据和缺失值等。

用Excel进行数据表分析发现数据之间的关联

用Excel进行数据表分析发现数据之间的关联

用Excel进行数据表分析发现数据之间的关联在日常生活和工作中,我们经常会遇到大量的数据,而理清这些数据之间的关联性对于我们做出正确的决策和提高工作效率至关重要。

而Excel作为一款主流的电子表格软件,拥有丰富的功能和工具,可以帮助我们进行数据表分析,发现数据之间的关联。

首先,我们需要导入待分析的数据表至Excel中。

点击工作簿中的“文件”选项,选择“打开”命令,定位并选择目标数据表文件,点击“打开”按钮即可将数据表导入Excel中。

接下来,我们需要对数据表的结构进行初步观察和分析。

Excel提供了丰富的表格样式和格式化工具,我们可以根据自己的需求对数据表进行美化和调整。

可以通过合并单元格,设置边框样式、填充颜色等方式,使数据表整洁美观。

在进行数据表分析之前,我们需要明确分析的目标和关联性的维度。

比如,我们可以选择比较数据表中不同列之间的关联性,或者是比较同一列中不同行之间的关联性。

根据不同的需求,我们可以选择不同的Excel功能进行分析。

一、相关性分析在Excel中,可以使用“相关函数”来计算数据之间的相关性。

相关性是指变量之间的相互关系程度,在数据分析中具有重要的意义。

通过计算相关性,我们可以了解数据之间的关联性强弱。

在Excel中,常用的相关函数有“CORREL”和“PEARSON”。

这两个函数可以用来计算数据之间的相关系数。

相关系数的取值范围为-1到1之间,其中-1表示负相关,0表示无相关,1表示正相关。

根据计算结果,我们可以判断数据之间的关联性强弱。

二、数据透视表分析数据透视表是Excel中非常强大的数据分析工具,可以帮助我们快速理解数据的整体情况,并发现数据之间的关联性。

通过数据透视表,我们可以按照不同的维度对数据进行分析,比如按照时间、地区、产品等维度进行分析。

在Excel中,创建数据透视表非常简单。

首先,选中需要进行分析的数据表区域。

然后,点击“数据”选项卡中的“透视表”按钮,选择“创建透视表”命令。

利用Excel的数据表和数据进行多表关联分析的数据分析方法技巧

利用Excel的数据表和数据进行多表关联分析的数据分析方法技巧

利用Excel的数据表和数据进行多表关联分析的数据分析方法技巧在数据分析领域,Excel是一种常用的工具,可以帮助分析师进行多表关联分析。

本文将介绍利用Excel的数据表和数据进行多表关联分析的一些方法和技巧。

一、数据准备在进行多表关联分析之前,首先需要准备好相关的数据。

这包括在Excel中创建数据表,以及将需要关联的数据导入到相应的数据表中。

1. 创建数据表在Excel中,可以使用工作表来创建数据表。

单击工作表底部的“+”按钮即可创建一个新的工作表。

可以根据需求创建多个工作表,每个工作表对应一个数据表。

2. 导入数据在各个工作表中导入相关的数据。

可以使用Excel的导入功能,将数据从外部数据源(如数据库或其他文件)导入到各个工作表中。

确保导入的数据与相应的数据表结构匹配。

二、多表关联多表关联是指将多个数据表中的数据关联起来,以便进行综合分析。

在Excel中,可以使用各种方法对多个数据表进行关联。

1. 使用VLOOKUP函数VLOOKUP函数是Excel中非常常用的函数之一,可以用于在一个数据表中查找某个特定的值。

在多表关联分析中,可以利用VLOOKUP函数在一个数据表中查找另一个数据表中相应的值,从而实现多表关联。

2. 使用INDEX和MATCH函数除了VLOOKUP函数,还可以使用INDEX函数和MATCH函数来实现多表关联分析。

INDEX函数用于返回一个数据表中某个特定位置的值,MATCH函数用于在一个数据表中查找某个值的位置。

通过组合使用这两个函数,可以实现多表关联。

3. 使用PivotTable透视表功能Excel中的PivotTable透视表功能可以帮助直观地展示多个数据表之间的关系。

通过创建透视表,可以将多个数据表中的数据汇总、分类和分析,以及展示各个数据表之间的关联。

三、数据分析技巧在进行多表关联分析时,还可以运用一些技巧来提高分析的效果和准确性。

1. 数据清洗在进行数据关联分析之前,需要对数据进行清洗。

如何使用Excel的数据表进行数据关联分析和分析数据表高级技巧

如何使用Excel的数据表进行数据关联分析和分析数据表高级技巧

如何使用Excel的数据表进行数据关联分析和分析数据表高级技巧Excel是一款功能强大的电子表格软件,广泛应用于数据管理和数据分析领域。

本文将介绍如何使用Excel的数据表进行数据关联分析,并提供一些数据表高级技巧。

一、数据关联分析在Excel中,数据关联分析可以帮助我们发现数据之间的关联性,从而更好地理解数据并做出决策。

下面介绍如何使用Excel的数据表进行数据关联分析的步骤:1. 准备数据表首先,我们需要准备要进行数据关联分析的数据表。

数据表应包含至少两列数据,每一列应代表不同的变量或维度。

2. 选择数据表在Excel中,选择要进行数据关联分析的数据表。

可以通过拖动鼠标或按住Ctrl键进行多选。

3. 插入数据表选择“插入”选项卡,在“表”组中点击“表”按钮。

在弹出的对话框中,确认选择的数据范围并勾选“我的数据包含表头”。

点击“确定”按钮。

4. 关联数据表在Excel中,选择刚插入的数据表。

在“表”选项卡的“工具”组中,点击“关联数据表”按钮。

在弹出的对话框中,选择要关联的数据表和关联字段。

点击“确定”按钮。

5. 分析数据关联完成数据关联后,可以使用Excel的各种功能和公式进行数据关联分析。

例如,使用透视表来查看关联数据的汇总信息,使用图表来可视化数据关联等。

二、数据表高级技巧除了数据关联分析,Excel还提供了许多强大的数据表高级技巧,帮助用户更好地分析和处理数据。

下面介绍一些常用的数据表高级技巧:1. 数据透视表数据透视表是Excel中最常用的数据分析工具之一。

它可以帮助我们以交叉表的形式对数据进行汇总和分析。

通过拖拽字段到透视表的行、列、值等区域,可以轻松对数据进行分组、计算和汇总。

2. 条件格式条件格式可以帮助我们根据数据的条件设置不同的样式,以便更好地辨识和分析数据。

例如,可以根据数值大小设置颜色渐变,高亮异常值等。

3. 数据验证数据验证是一种设置数据输入规则的功能。

可以通过数据验证来限制用户输入的范围、格式和数值。

Excel中的数据联动与关联技巧与实现方法

Excel中的数据联动与关联技巧与实现方法

Excel中的数据联动与关联技巧与实现方法Excel是一款功能强大的电子表格软件,广泛应用于各个领域。

在Excel中,数据联动与关联是一项非常重要的技巧,可以帮助用户更高效地处理和分析数据。

本文将介绍一些Excel中的数据联动与关联技巧与实现方法。

一、数据联动数据联动是指在Excel中,通过更改一个单元格的值,自动更新其他相关单元格的值。

这在处理大量数据时非常有用,可以减少手动操作的时间和工作量。

1. 使用公式在Excel中,可以使用公式来实现数据联动。

例如,如果有一个单元格A1中的值为10,而另一个单元格B1需要根据A1的值进行计算,可以在B1中输入公式“=A1*2”,这样B1的值就会自动根据A1的值进行更新。

2. 使用数据验证数据验证是一种限制单元格输入值的方法。

在Excel中,可以通过数据验证来实现数据联动。

例如,如果有一个单元格A1中的值只能为整数,而另一个单元格B1需要根据A1的值进行计算,可以在B1的数据验证中设置条件,使B1只能输入“=A1*2”的公式。

这样,当A1的值发生变化时,B1的值也会自动更新。

3. 使用宏宏是一种自动化操作的方法,在Excel中可以使用宏来实现数据联动。

通过录制宏的操作步骤,然后将宏与特定的单元格或事件关联起来,就可以实现数据联动。

例如,可以录制一个宏,使得当某个单元格的值发生变化时,其他相关单元格的值也会自动更新。

二、数据关联数据关联是指在Excel中,通过不同的工作表或工作簿之间的关系,实现数据的互相引用和传递。

这在处理复杂的数据分析和报表制作时非常有用。

1. 使用函数在Excel中,有许多函数可以用来实现数据关联。

例如,VLOOKUP函数可以根据一个值在某个区域中查找并返回相应的值。

而INDEX和MATCH函数可以根据给定的行和列索引,返回一个指定区域中的值。

这些函数可以帮助用户在不同的工作表或工作簿之间进行数据关联。

2. 使用数据透视表数据透视表是一种用于数据分析和报表制作的功能强大的工具。

Excel小技巧使用数据表进行数据关联分析

Excel小技巧使用数据表进行数据关联分析

Excel小技巧使用数据表进行数据关联分析Excel小技巧:使用数据表进行数据关联分析数据关联分析对于数据处理和分析来说是非常重要的环节。

然而,对于大多数人来说,处理数据关联比较困难,尤其是当涉及到多个数据表的情况。

在这里,我们将讨论使用Excel数据表进行数据关联分析的一些小技巧。

第一步:理解数据表和数据列在Excel中,一个数据表是由一系列列组成的。

每一列都有一个标题,您可以使用标题在每个列中标识数据内容。

理解您的数据表以及每列中包含的数据类型非常重要。

如果未正确地分配数据类型,您将很难对这些数据进行正确的分析。

因此,在操作任何数据之前,请确保您已正确地理解了数据表和数据列的结构。

第二步:选择正确的数据关联函数Excel中有几种不同类型的数据关联函数可以使用。

例如,使用VLOOKUP函数可以在一个数据表中查找与另一个数据表相关联的值。

如果您希望比较两个数据表中的数据,您可以使用MATCH函数。

如果您正在尝试查找数据表中匹配的值,则可以使用HLOOKUP函数。

第三步:使用条件格式化来突出显示关联数据如果您处理的数据比较复杂,则可能需要更好地可视化数据关联。

使用Excel的条件格式功能,您可以突出显示相关数据。

例如,您可以使用颜色编码将两个数据表中相关的值标记为绿色或其他颜色,而将未匹配的值标记为红色。

第四步:使用Excel提供的筛选功能Excel具有非常方便的筛选功能,可帮助您筛选数据表中的数据。

例如,如果您想要筛选某一列中的特定值,则可以使用“筛选”工具栏来完成此操作。

在使用该工具时,您可以选择您要筛选的列以及您想要隐藏的数据。

第五步:总结和清理数据最后,数据分析的重要一步就是对数据进行清理和总结。

在数据关联之后,您可能会发现您的数据表中存在重复数据或错误数据。

因此,在保存或传递数据之前,请确保正确清理数据。

总体来说,数据关联分析对于处理和分析数据来说是非常重要的。

使用Excel的数据表和上述特殊小技巧,您可以更方便,更快速地进行数据关联分析。

灰色关联度excel计算方法

灰色关联度excel计算方法

灰色关联度excel计算方法
灰色关联度是一种常用的统计方法,用于评估变量之间的相关性。

在实际应用中,往往需要使用Excel进行计算。

本文将介绍灰色关联度的Excel计算方法,以帮助读者更好地应用这一方法。

具体步骤如下:
1. 准备数据:首先需要准备两个变量的数据,并将其按照时间
顺序排列。

假设第一个变量为X,第二个变量为Y,数据分别为x1、x2、x3……xn和y1、y2、y3……yn。

2. 计算均值:分别计算X和Y的均值,记为x_bar和y_bar。

3. 计算累加差分数列:分别计算X和Y的累加差分数列,记为DeltaX和DeltaY。

具体计算方法为:DeltaX(1)=x1,DeltaY(1)=y1,DeltaX(i)=DeltaX(i-1)+x(i)-x_bar,
DeltaY(i)=DeltaY(i-1)+y(i)-y_bar。

4. 计算关联系数:根据灰色关联度的公式,计算关联系数r,
公式为:
r=min{[|DeltaY(i)-DeltaX(i)|]/[max{DeltaY(i),DeltaX(i)}]}。

5. 得出结果:将得到的关联系数r作为两个变量之间的相关性
指标。

如果r越接近1,则说明两个变量之间的关联程度越高。

反之,如果r越接近0,则说明两个变量之间的关联程度越低。

通过以上步骤,读者就可以在Excel中计算灰色关联度,进而分析变量之间的相关性。

需要注意的是,当数据量较小时,灰色关联度的计算结果可能会受到一些误差的影响。

因此,在实际应用中,需要
根据具体情况进行评估和调整。

灰色关联分析方法

灰色关联分析方法

灰色关联分析方法灰色关联分析方法(Grey Relational Analysis,GRA)是一种多指标决策方法,它用于研究因素之间的关联程度。

与传统的关联分析方法相比,灰色关联分析方法具有较强的适用性和灵活性。

它可以用于分析多个指标之间的关联程度,对于复杂决策问题具有较强的应用能力。

灰色关联分析方法的基本思想是将系统的各个指标转化为灰色数列,再利用灰色关联度来评估指标之间的关联程度。

该方法可以对多个指标进行综合评价,找出各个指标之间的关联程度,并根据关联程度来进行排序和决策。

灰色关联分析方法的具体步骤如下:1. 数据预处理:将原始数据进行标准化处理,以确保各指标在同一数量级上进行比较。

2. 构建灰色数列:将标准化后的数据转化为灰色数列,通过建立灰色微分方程来描述数据序列的发展趋势。

3. 确定关联度测度:根据灰色数列的特点,选择适当的关联度测度方法来计算指标之间的关联程度。

4. 计算关联度:根据所选择的关联度测度方法,计算每个指标与其他指标之间的关联度。

5. 排序和决策:根据计算得到的关联度值进行排序,并作出相应的决策。

灰色关联分析方法的优点有以下几个方面:1. 适用性广泛:灰色关联分析方法适用于各种类型的指标数据,包括定量指标和定性指标。

2. 考虑了指标之间的时序关系:灰色关联分析方法考虑了指标数据的时序性,能够更好地反映指标之间的演变趋势。

3. 简单易行:灰色关联分析方法不需要过多的统计方法和复杂的计算过程,容易被理解和操作。

4. 提供了多指标综合评价的能力:灰色关联分析方法可以将多个指标之间的关联程度综合考虑,对于决策问题的综合评价有着较好的效果。

然而,灰色关联分析方法也存在一些限制和局限性:1. 灵敏度不高:由于灰色关联分析方法只考虑了指标之间的线性关联程度,对于非线性关系的刻画较为困难,灵敏度较低。

2. 依赖于初始数据:灰色关联分析方法对初始数据的选取较为敏感,不同的初始数据可能导致不同的关联度结果。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Micr ocomputer Applications V ol.27,No.3,2011研究与设计微型电脑应用2011年第27卷第3期文章编号:1007-757X(2011)03-0029-02使用Microsoft Excel进行数据的灰关联分析于萍李克摘要:使用Microsoft Excel函数和数据分析工具软件进行灰关联分析,并应用于世界主要指数与原油期货走势的关联程度分析。

使用Excel计算灰关联度。

结果显示各指数与原油期货走势的关联度,依次为道指>标普>富时>上证指数>纳指>美指>深证成指。

表明使用Excel进行灰关联分析是可行的,并且易于普及和推广;道琼斯指数对原油期货的走势具有更强的关联。

关键词:灰关联分析;Excel函数;原油期货中图分类号:TP391文献标志码:B0引言为了定量的研究事物之间的关联程度,人们提出了各种形式的相关系数,如典型的相关系数和相似系数等。

这些系数都是以数理统计理论为基础的,使用时要求有大量的数据,因为数据量少会难以找出统计规律,灰关联分析方法从某种程度上弥补了这种缺憾,对于少数据、贫信息的情况同样适合,依据的是灰色系统理论。

灰色系统理论源于20世纪80年代,其主要是考察和研究信息不完备的系统[1]。

灰关联分析的目的,是确定参考序列和若干个比较序列之间的关联系数和关联度,寻求系统中各个因素间的主要关系[2]。

原油期货的走势受许多因素的影响[3],诸因素的影响程度尚不清楚,为一灰色系统,宜采用灰色关联分析法进行分析,以得出更为客观、科学的评价结果。

本文介绍了使用Excel软件进行灰关联分析的具体过程。

1材料与方法原油期货及其影响因素的原始数据来源于网上每日行情收盘价,因数据均为时间序列,不适合用多元回归、逐步回归等方法处理,故采用灰色关联分析。

在多元统计中,如某变量(y)随另一变量(x)的变化而变化,则称x为自变量,y为应变量。

而在灰关联方法中则称x为比较数列(xi),y为参考数列(x0)。

本例中,旨在分析上证指数、深证成指、英国富时、道琼斯、纳斯达克、标准普尔、美元等指数对原油期货走势的影响,故设定原油期货每日收盘价为参考数列,其余指数每日收盘价为比较数列,如图1所示。

关联分析的基本思想是通过分析比较数列指标变化对参考数列指标的影响来判断其关联度。

本文所有操作使用Excel函数及其“分析数据库”工具完成,如果没有安装这项功能,请依次选择“工具”-“加载宏”,在安装光盘中加载“分析数据库”。

加载成功后,可以在“工具”下拉菜单中看到“数据分析”选项。

2分析过程和结果2.1图1为原始数据表格,制作本实例的原始数据无特殊要求,只要满足各列中为同一属性数值即可。

图中红色数据为中国股市端午节休市期间的内插数据,最后一行为均数,Excel计算均数的方法是在单元格中输入函数式(见fx 栏),向右平行拉拽得每列均数。

原油期货每日收盘价为参考数列,其余指数每日收盘价为比较数列。

图1原始数据内容2.2原始资料变换-无量纲化原始数据由于数列单位不同或量纲不同,在进行关联分析之前,首先对各数列进行无量纲化处理,达到量纲一致。

本文采用均值化变换,即分別求出各个序列数据的平均值,再用平均值去除对应序列中的各个原始数据,所得到的商为新的数据列,即均值化数列。

在Excel中,这一过程可通过在单元格中输入函数式(见fx栏)并向右向下拉拽得图2数据。

———————————作者简介:于萍,(1962-),女,山东青岛,汕头大学医学院,助理实验师,大专,计算机应用,广东汕头,515041李克,(1954-),男,江西临川,汕头大学医学院,教授,博士,统计学,广东汕头,51504129Microcomputer Applications V ol.27,No.3,2011研究与设计微型电脑应用2011年第27卷第3期3图2对原始数据进行均值化处理2.3求差序列求各个时刻比较数列与参考数列的绝对差,计算公式参考fx 栏中函数式,拉拽后得图3数据。

图3均值化后参考序列与比较序列的绝对差2.4求两极最大值和最小值在Excel 中选择“格式”-“条件格式”后,出现属性设置框,依次选择:“单元格数值”-“等于”,使用公式:=MAX($C$49:$J$70)和=MIN($C$49:$J$70)并选择数据区域,在“格式”中选择颜色,可以找出两极最大值和最小值,并标记上颜色,本例标记为红色,见图3。

计算xi 对x0的关联系数ξi ,ξi =(MAX+ρMIN)/(xi+ρMIN),式中ρ为分辨系数,ρ∈[0,1],一般取ρ=0.5[4]。

根据此ξi 计算公式编制图4fx 栏中的函数式,拉拽后得到参考序列与各比较序列间的关联系数(图4)。

图4参考序列与各比较序列间的关联系数2.5计算关联度在灰关联系数基础上进一步求出灰关联度。

所谓关联程度,实质上是曲线间几何形状的差别程度。

因此曲线间差值大小,可作为关联程度的衡量尺度。

因为关联系数是比较数列与参考数列在各个时刻(即曲线中的各点)的关联程度值,所以它的数不止一个,因此有必要将各个时刻(即曲线中的各点)的关联系数集中为一个值,即平均值,作为比较数列与参考数列间关联程度的数量表示。

在Excel 中选择“工具”-“数据分析”-“描述统计”后,出现属性设置框,选择数据区域后,可以获得图4各列数据的平均数及其标准差,结果为:上证指数=0.9526±0.0355;深证成指=0.7091±0.1569;富时=0.9550±0.0371;道指=0.9651±0.0252;纳指=0.9515±0.0335;标普=0.9575±0.0299;美指=0.9349±0.0450。

根据关联度排序,各因素对原油期货的关联程度依次为:道指>标普>富时>上证指数>纳指>美指>深证成指,该结果不仅表明了影响原油期货走势较大的因素,同时也表明了各因素对原油期货走势的主次关系。

3讨论使用Excel 进行统计分析具有方便易于普及的优点,适合完成一些简单的统计分析,由于Excel 的统计分析直接在数据表中进行,所以便于数据的动态管理以及连续分析。

灰关联分析对于因素极性不一致时,通常要作极性转换。

按照灰关联方法的要求,极性需要一致。

所以灰关联系数并没有正负号之分,当事物之间为负的联系时,其关联度亦为正数,如本例中的原油期货与美元指数之间关系。

本文分析了世界主要股票指数以及美元指数对国际原油期货走势的影响,除美元指数为负的影响外,其它指数均为正向影响,结果表明:一是道琼斯指数对原油期货走势的影响是最强的,美元与原油期货呈现稳定的负关联,二是上证指数与原油期货的关联度强度与欧美主要股票指数相近也值得进一步研究和注意。

(下转第37页)Microcomputer Applica tions V ol.27,No.3,2011开发应用微型电脑应用2011年第27卷第3期3表2:S V M 主要参数的选取结果4.3实验结果的分析:从表1、表2可以看出,分类算法IV 的准确率、召回率和F1值是最高的;分类算法II 和分类算法III 的准确率、召回率、F1值都比分类算法I 的高;分类算法II 和分类算法III 之间的准确率、召回率、F1值相比互有优劣。

但是算法II 、III 、IV 需要的计算时间较长,原因是采用了粒子群算法对参数的选择进行了寻优。

但是,算法I 的主要参数选择,都是固定的,对参数的选择就很盲目,只能依靠经验和运气。

如果要调试传统核函数的各项参数,使得分类的效果达到最优,就必须人工进行调试。

但是,每调试一次就要花费相当长的时间(在论文中的例子约半小时),而且调试结果不一定最优。

虽然算法IV 的计算时间较长,但是只是一次性的计算就可以达到比原来的文本倾向性分类较高的准确度、精度和F1值,因此还是值得花这个时间的。

5结束语本文针对文本倾向性分类的传统办法,采取了新的组合多个不同的全局核函数和局部核函数的SVM ,并且通过粒子群算法来优化SVM 的各项参数,以及对组合核函数的组合参数进行优化,减少了训练推广时的参数选择盲目性,提高了训练的精度、提高了泛化推广能力,使得文本倾向性分类算法的分类效果有了提高。

文本倾向性分类性能的提高,也需要结合语义分析、分词、特征提取等方法的改进。

同时,还需要对本文提出的SVM 改进办法进一步改进,进一步减少训练时间,这也是我们以后工作努力的方向。

参考文献[1]Turney.P.Thumbs Up or Thumbs Down?Semantic Orientation Applied to Unsupervised Classfication of Reviews.In proceedings of the 40th Annual Meeting of the Association for Computational Linguistics,2002.[2]李艳玲,戴冠中,朱烨行.基于基于类别空间模型的文本倾向性分类方法[J].计算机应用.2007年9月第27卷第9期.[3]徐琳宏,林鸿飞,杨志豪.基于语义理解的文本倾向性识别机制[J].中文信息学报.2007年1月,第21卷,第1期.[4]金晓鸥;互联网舆情信息获取与分析研究[D];上海:上海交通大学,2008年1月[5]李程雄,丁月华,文贵华.SVM-KNN 组合改进算法在专利文本分类中的应用[J].计算机工程与应用.2122006.20.[6]Changhua Yang,Kevin Hsin-Yih,Lin Hsin-HisChen.Building Emotion Lexicon from W eblogCorpora.In proceedings of the ACL 2007Demoand Poster Sessions.(收稿日期:2010-01-19)(上接第30页)参考文献[1]邓聚龙.灰系统的基本方法[M].武汉:华中科技大学出版社,2002.[2]刘思峰,党耀国,方志耕.灰色系统理论及其应用[M].科学出版社,2005.[3]刘江永.国际政治与原油期货—真相与规律的探究[J].现代国际关系,2009,6:9-17.[4]东亚斌,段志善.灰色关联度分辨系数的一种新的确定方法[J].西安建筑科技大学学报,2008,40(4):589-592.(收稿日期:2010-07-21)选择算法C K Coef d 1λ2λ3λ传统核函数(RBF 核函数)1无无无010传统核函数且未采用PSO 优化8.7349无23.4143 1.5767010组合核函数且采用PSO 优化13.1598 4.278417.5694 2.44130.35940.46220.17847。

相关文档
最新文档