数据挖掘-WEKA实验报告一

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据挖掘-WEKA 实验报告一

一、实验内容

1、Weka 工具初步认识(掌握weka程序运行环境)

2、实验数据预处理。(掌握weka中数据预处理的使用)

对weka自带测试用例数据集weather.nominal.arrf文件,进行一下操作。

1)、加载数据,熟悉各按钮的功能。

2)、熟悉各过滤器的功能,使用过滤器Remove、Add对数据集进行操作。

3)、使用weka.unsupervised.instance.RemoveWithValue 过滤器去除humidity属性值为high的全部实例。

4)、使用离散化技术对数据集glass.arrf中的属性RI和Ba 进行离散化(分别用等宽,等频进行离散化)。

(1)打开已经安装好的weka,界面如下,点击openfile即可打开weka自带测试用例数据集weather.nominal.arrf文件

(2)打开文件之后界面如下:

(3)可对数据进行选择,可以全选,不选,反选等,还可以

链接数据库,对数据进行编辑,保存等。还可以对所有的属性进行可视化。如下图:

(4)使用过滤器Remove、Add对数据集进行操作。

(5)点击此处可以增加属性。如上图,增加了一个未命名的属性unnamed.再点击下方的remove按钮即可删除该属性.

(5)使用weka.unsupervised.instance.RemoveWithValue过滤器去除humidity属性值为high的全部实例。

没有去掉之前:

(6)去掉其中一个属性之后:

(7)选择choose里的removewithvalue:

(8)选择huminity属性:

(9)使用离散化技术对数据集glass.arrf中的属性RI和Ba进行离散化(分别用等宽,等频进行离散化)。

RI等宽:

(10)Ba等频:

二、思考与分析

.

1.使用数据集编辑器打开weather.nominal.arrf文件,实例编号为2的分类属性值是多少?

如图所示:实例编号为2的分类值属性为no

加载weather.nomina.arrf文件后,temperature属性可以有哪些合法值?

Temperature可以取值为:hot、mild、cool

Word 资料

相关文档
最新文档