[AresEP_0172_Iris]关于三种不同鸢尾花类的平行坐标轴分析

合集下载

鸢尾花数据集

鸢尾花数据集

鸢尾花数据集引言概述:鸢尾花数据集是机器学习领域中常用的一个数据集,由英国统计学家Fisher于1936年首次引入。

该数据集包含了三个不同种类的鸢尾花的测量数据,是一个用于分类问题的经典数据集。

本文将从数据集的背景介绍、数据集的特征、数据集的应用以及数据集的局限性等方面进行详细阐述。

正文内容:1. 数据集的背景介绍1.1 鸢尾花数据集的来源鸢尾花数据集是由Fisher在研究鸢尾花的遗传学特性时采集而来。

他采集了150朵鸢尾花的样本,每朵鸢尾花都测量了其萼片长度、萼片宽度、花瓣长度和花瓣宽度等四个特征。

1.2 数据集的种类鸢尾花数据集包含了三个不同种类的鸢尾花,分别是山鸢尾(Iris-setosa)、变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica)。

每一个种类的鸢尾花在特征上都有一定的差异。

1.3 数据集的规模鸢尾花数据集共有150个样本,每一个样本有四个特征。

数据集被广泛应用于机器学习和模式识别领域,成为了分类问题的经典数据集之一。

2. 数据集的特征2.1 萼片长度和宽度萼片是鸢尾花的外部结构之一,其长度和宽度是鸢尾花的重要特征之一。

通过测量萼片的长度和宽度,可以判断鸢尾花的种类。

2.2 花瓣长度和宽度花瓣是鸢尾花的另一个重要特征,其长度和宽度也可以用于鸢尾花的分类。

不同种类的鸢尾花在花瓣的长度和宽度上有一定的差异。

2.3 特征之间的关系鸢尾花数据集中的四个特征之间存在一定的相关性。

例如,花瓣的长度和宽度往往呈正相关关系,而萼片的长度和宽度则没有明显的相关性。

3. 数据集的应用3.1 机器学习算法的训练和评估鸢尾花数据集被广泛应用于机器学习算法的训练和评估。

研究人员可以利用该数据集进行分类算法的训练,并通过对算法的准确率、召回率等指标进行评估。

3.2 特征选择和降维鸢尾花数据集的特征丰富多样,可以用于特征选择和降维算法的研究。

通过对特征的选择和降维,可以提高分类算法的效果和运行效率。

鸢尾花数据集

鸢尾花数据集

鸢尾花数据集鸢尾花数据集是非常经典的机器学习数据集之一,常用于分类算法的性能评估和比较。

本文将对鸢尾花数据集进行介绍,包括数据集的来源、结构和特征,以及一些常见的应用场景和使用方法。

1. 数据集来源:鸢尾花数据集最早由英国统计学家Ronald Fisher在1936年的一篇论文中提出,并且至今仍然被广泛应用。

该数据集采集自三种不同种类的鸢尾花(Iris setosa、Iris virginica和Iris versicolor),每种鸢尾花采集了50个样本,共计150个样本。

2. 数据集结构:鸢尾花数据集包含4个特征变量和1个目标变量。

特征变量包括花萼长度(sepal length)、花萼宽度(sepal width)、花瓣长度(petal length)和花瓣宽度(petal width),目标变量为鸢尾花的种类。

每个样本都有对应的特征值和目标值。

3. 数据集特征:鸢尾花数据集的特征变量是连续型变量,而目标变量是离散型变量。

特征变量的单位是厘米(cm),目标变量包括三个类别,分别对应三种鸢尾花的种类。

4. 数据集应用:鸢尾花数据集在机器学习领域被广泛应用于分类算法的性能评估和比较。

由于数据集的结构简单且具有明显的类别差异,使得它成为学习和理解分类算法的理想选择。

5. 数据集使用方法:鸢尾花数据集可以通过多种机器学习工具和编程语言进行使用和分析。

例如,可以使用Python中的scikit-learn库加载数据集,并进行数据预处理、特征工程、模型训练和评估等步骤。

以下是一个使用Python和scikit-learn库加载鸢尾花数据集的示例代码:```from sklearn.datasets import load_iris# 加载鸢尾花数据集iris = load_iris()# 查看数据集的特征变量和目标变量X = iris.data # 特征变量y = iris.target # 目标变量# 打印数据集的特征名称feature_names = iris.feature_namesprint("特征名称:", feature_names)# 打印数据集的目标类别target_names = iris.target_namesprint("目标类别:", target_names)# 打印数据集的样本数量n_samples = len(X)print("样本数量:", n_samples)# 打印数据集的特征维度n_features = X.shape[1]print("特征维度:", n_features)```通过以上代码,我们可以加载鸢尾花数据集,并获取数据集的特征变量、目标变量、特征名称、目标类别、样本数量和特征维度等信息。

鸢尾花数据集

鸢尾花数据集

鸢尾花数据集鸢尾花数据集是一份经典的机器学习数据集,常用于分类问题的训练和测试。

该数据集由英国统计学家罗纳德·费舍尔采集于1936年,并于1938年首次发布。

它包含了150个样本,分为三个不同品种的鸢尾花:山鸢尾(Iris-setosa)、变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica),每一个品种各有50个样本。

每一个样本都有四个特征:花萼长度(sepal length)、花萼宽度(sepal width)、花瓣长度(petal length)和花瓣宽度(petal width)。

这些特征被用来描述鸢尾花的形态特征。

鸢尾花数据集的标准格式如下:1. 数据集名称:鸢尾花数据集2. 数据集描述:该数据集包含了150个样本,分为三个不同品种的鸢尾花:山鸢尾、变色鸢尾和维吉尼亚鸢尾。

每一个样本有四个特征:花萼长度、花萼宽度、花瓣长度和花瓣宽度。

3. 数据集来源:鸢尾花数据集由英国统计学家罗纳德·费舍尔于1936年采集,并于1938年首次发布。

4. 数据集结构:该数据集包含一个150行5列的矩阵,其中第一列为样本编号,第二至第五列为四个特征的数值。

每一行代表一个样本,每一列代表一个特征。

5. 数据集标签:每一个样本都有一个标签,表示鸢尾花的品种。

标签分为三类:山鸢尾、变色鸢尾和维吉尼亚鸢尾。

6. 数据集应用:鸢尾花数据集常用于机器学习领域的分类问题研究和算法评估。

通过对样本的特征进行分析和建模,可以预测鸢尾花的品种。

7. 数据集分布:该数据集通常被划分为训练集和测试集,用于模型的训练和评估。

普通采用70%的样本作为训练集,30%的样本作为测试集。

8. 数据集评估:对于分类问题,常用的评估指标包括准确率、精确率、召回率和F1值等。

可以通过对模型在测试集上的表现进行评估,来判断模型的性能。

9. 数据集示例代码:以下是使用Python编写的示例代码,用于加载和探索鸢尾花数据集:```pythonfrom sklearn.datasets import load_iris# 加载鸢尾花数据集iris = load_iris()# 查看数据集的特征print("特征名称:", iris.feature_names)print("特征数值:", iris.data)# 查看数据集的标签print("标签:", iris.target_names)print("标签数值:", iris.target)```以上是关于鸢尾花数据集的标准格式文本,详细描述了数据集的来源、结构、特征和标签等信息。

鸢尾花数据集

鸢尾花数据集

鸢尾花数据集鸢尾花数据集是机器学习领域中最经典的数据集之一,由英国统计学家Ronald Fisher在1936年收集整理而成。

该数据集用于分类问题,旨在通过鸢尾花的花萼长度、花萼宽度、花瓣长度和花瓣宽度这四个特征来预测鸢尾花的种类。

本文将按照标准格式介绍鸢尾花数据集的相关信息。

1. 数据集概述:鸢尾花数据集包含了150个样本,分为三个不同种类的鸢尾花:山鸢尾(Setosa)、变色鸢尾(Versicolor)和维吉尼亚鸢尾(Virginica)。

每个样本都有四个数值型特征:花萼长度(sepal length)、花萼宽度(sepal width)、花瓣长度(petal length)和花瓣宽度(petal width)。

2. 数据集来源:鸢尾花数据集最早由Ronald Fisher在1936年发表的论文《The use of multiple measurements in taxonomic problems》中提出,并由他收集整理而成。

该数据集目前被广泛应用于机器学习和模式识别的教学和研究领域。

3. 数据集特征:- 花萼长度(sepal length):以厘米(cm)为单位测量的鸢尾花花萼的长度。

- 花萼宽度(sepal width):以厘米(cm)为单位测量的鸢尾花花萼的宽度。

- 花瓣长度(petal length):以厘米(cm)为单位测量的鸢尾花花瓣的长度。

- 花瓣宽度(petal width):以厘米(cm)为单位测量的鸢尾花花瓣的宽度。

4. 数据集标签:鸢尾花数据集的标签是鸢尾花的种类,共分为三类:- 山鸢尾(Setosa): 0- 变色鸢尾(Versicolor): 1- 维吉尼亚鸢尾(Virginica): 25. 数据集划分:鸢尾花数据集通常被划分为训练集和测试集,常见的划分比例是70%的数据用于训练,30%的数据用于测试。

划分过程应该保持各个类别的样本比例相对均衡,以避免训练集和测试集的类别分布不一致。

鸢尾花数据集

鸢尾花数据集

鸢尾花数据集鸢尾花数据集是一份经典的机器学习数据集,用于分类问题的研究和实验。

该数据集由英国统计学家罗纳德·费舍尔于1936年收集整理,共包含150个样本,每个样本有4个特征和1个类别标签。

该数据集中的每个样本都代表一朵鸢尾花,包括三个不同种类的鸢尾花:山鸢尾(Iris-setosa)、变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica)。

每个样本的四个特征分别是:花萼长度(sepal length)、花萼宽度(sepal width)、花瓣长度(petal length)和花瓣宽度(petal width)。

下面是一份示例数据集的部分内容:样本编号 | 花萼长度 | 花萼宽度 | 花瓣长度 | 花瓣宽度 | 类别--------|---------|---------|---------|---------|-----1 | 5.1 | 3.5 | 1.4 | 0.2 | 山鸢尾2 | 4.9 | 3.0 | 1.4 | 0.2 | 山鸢尾3 | 4.7 | 3.2 | 1.3 | 0.2 | 山鸢尾4 | 4.6 | 3.1 | 1.5 | 0.2 | 山鸢尾5 | 5.0 | 3.6 | 1.4 | 0.2 | 山鸢尾... | ... | ... | ... | ... | ...146 | 6.7 | 3.0 | 5.2 | 2.3 | 维吉尼亚鸢尾147 | 6.3 | 2.5 | 5.0 | 1.9 | 维吉尼亚鸢尾148 | 6.5 | 3.0 | 5.2 | 2.0 | 维吉尼亚鸢尾149 | 6.2 | 3.4 | 5.4 | 2.3 | 维吉尼亚鸢尾150 | 5.9 | 3.0 | 5.1 | 1.8 | 维吉尼亚鸢尾根据上述示例数据集,我们可以看到每个样本都有四个特征值和一个类别标签。

特征值表示了鸢尾花的不同度量指标,而类别标签表示了鸢尾花的种类。

鸢尾花数据集

鸢尾花数据集

鸢尾花数据集引言概述:鸢尾花数据集是机器学习领域中常用的一个数据集,由英国统计学家Fisher于1936年收集整理而成。

该数据集包含了三个不同种类的鸢尾花的测量数据,是分类问题中的经典案例。

本文将对鸢尾花数据集进行详细介绍和分析,以便读者更好地了解和应用该数据集。

一、数据集概述1.1 数据来源鸢尾花数据集是由Fisher在20世纪30年代通过对鸢尾花进行测量所得。

他收集了三个品种的鸢尾花,分别是山鸢尾(setosa)、变色鸢尾(versicolor)和维吉尼亚鸢尾(virginica)。

1.2 数据特征该数据集包含了150个样本,每个样本有四个特征,分别是花萼长度(sepal length)、花萼宽度(sepal width)、花瓣长度(petal length)和花瓣宽度(petal width)。

这些特征用于描述鸢尾花的形态特征。

1.3 数据标签每个样本都有一个标签,用于表示鸢尾花的品种。

标签分为三类,分别对应三个品种:0代表山鸢尾,1代表变色鸢尾,2代表维吉尼亚鸢尾。

二、数据集的应用2.1 机器学习算法训练鸢尾花数据集作为一个经典的分类问题案例,常被用于机器学习算法的训练和测试。

通过对样本数据的学习,算法可以根据鸢尾花的特征来预测其所属的品种,从而实现分类任务。

2.2 特征选择和提取对鸢尾花数据集进行特征选择和提取,可以帮助我们识别出对分类任务最具有区分性的特征。

通过对特征的分析和比较,我们可以选择出最重要的特征,提高分类模型的准确性和效果。

2.3 数据可视化鸢尾花数据集的特征维度较低,可以方便地进行数据可视化。

通过绘制散点图、箱线图等图表,我们可以直观地观察到不同品种鸢尾花在特征上的分布情况,进一步了解其特征之间的关系。

三、数据集的分析3.1 数据分布情况通过统计和可视化分析,我们可以了解鸢尾花数据集中各个品种的样本数量分布情况。

这有助于我们判断数据集是否存在类别不平衡的问题,并采取相应的处理措施。

sklearn iris 案例

sklearn iris 案例

sklearn iris 案例Scikit-learn Iris 数据集:机器学习中的经典案例研究Scikit-learn Iris 数据集是一个经典的机器学习数据集,它被广泛用于分类任务的教学和评估。

该数据集包含 150 个鸢尾花样本,属于三个不同的物种:山鸢尾、变色鸢尾和维吉尼亚鸢尾。

数据探索数据集包含以下特征:萼片长度 (sepal length)萼片宽度 (sepal width)花瓣长度 (petal length)花瓣宽度 (petal width)这些特征描述了鸢尾花的物理特性,可用于区分不同的物种。

数据可视化为了可视化数据并理解不同物种之间的关系,我们可以使用散点图或平行坐标图。

这些可视化工具有助于识别不同特征之间的模式和相关性。

数据预处理在将数据用于机器学习模型之前,需要进行一些预处理步骤。

这些步骤包括:标准化:对特征进行缩放,使它们具有相同的量级。

划分训练集和测试集:将数据分成用于训练模型的训练集和用于评估模型的测试集。

模型训练与评估Scikit-learn 提供了各种分类算法,可用于训练鸢尾花数据集。

常见的算法包括:逻辑回归支持向量机决策树随机森林训练模型后,使用测试集评估模型的性能。

评估指标包括:准确性:模型正确预测的样本的比例。

召回率:模型正确识别目标类的样本的比例。

F1 分数:准确率和召回率的加权平均值。

基于鸢尾花数据集的应用鸢尾花数据集已被用于广泛的机器学习应用,包括:分类:将鸢尾花样本分类到正确的物种。

特征重要性:确定不同特征对分类的影响程度。

模型选择:通过比较不同模型的性能来确定最佳模型。

超参数调优:优化模型的超参数以提高性能。

总结Scikit-learn Iris 数据集是机器学习中的一个宝贵资源,它提供了以下好处:简单且易于理解:数据集相对较小,具有明确定义的特征和类别。

广泛使用:该数据集已被广泛用于教学和研究目的。

算法评估:该数据集可用于评估和比较不同的机器学习算法。

鸢尾花数据集

鸢尾花数据集

鸢尾花数据集鸢尾花数据集是机器学习领域中常用的数据集之一,用于分类算法的训练和测试。

该数据集包含了三个不同品种的鸢尾花(山鸢尾、变色鸢尾和维吉尼亚鸢尾)的测量数据,共有150个样本。

每个样本包含了四个特征的测量值,分别是花萼长度、花萼宽度、花瓣长度和花瓣宽度。

这些特征的单位都是厘米。

除了特征数据之外,每个样本还有一个对应的类别标签,用于表示鸢尾花的品种。

数据集的格式如下所示:样本编号花萼长度(cm)花萼宽度(cm)花瓣长度(cm)花瓣宽度(cm)鸢尾花品种1 5.1 3.5 1.4 0.2 山鸢尾2 4.9 3.0 1.4 0.2 山鸢尾3 4.7 3.2 1.3 0.2 山鸢尾4 4.6 3.1 1.5 0.2 山鸢尾5 5.0 3.6 1.4 0.2 山鸢尾... ... ... ... ... ...数据集共有150个样本,每个样本有5个字段,包括样本编号、四个特征数据和鸢尾花品种。

样本编号从1开始递增。

特征数据和鸢尾花品种之间使用制表符进行分隔。

通过对鸢尾花数据集的分析,我们可以训练一个分类模型,用于根据鸢尾花的特征数据来预测其品种。

常用的分类算法包括逻辑回归、决策树、支持向量机等。

在使用鸢尾花数据集进行机器学习任务时,我们通常会将数据集分为训练集和测试集。

训练集用于训练模型,测试集用于评估模型的性能。

常见的划分比例是将数据集的70%作为训练集,30%作为测试集。

对于鸢尾花数据集,我们可以通过计算各个品种的平均特征值来了解不同品种之间的差异。

同时,我们可以使用可视化工具如散点图、箱线图等来展示不同品种在各个特征上的分布情况,以便更好地理解数据。

此外,鸢尾花数据集还可以用于特征选择和降维等任务。

通过选择最相关的特征或使用降维算法,我们可以减少特征空间的维度,提高模型的训练效率和预测准确率。

总之,鸢尾花数据集是一个常用的机器学习数据集,具有清晰的数据格式和丰富的特征信息。

通过对该数据集的分析和建模,我们可以进行分类算法的训练和测试,并且可以应用于特征选择和降维等相关任务。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

关于三种不同鸢尾花类的平行坐标轴分析天津大学3014218071 王汉超摘要:该文借助数学模型课上讲的平行坐标轴表示法表示三类鸢尾花(Iris)的特征图像。

该文整理了费舍尔(Fisher)文章中的数据,对数据集包含的3个类以及每类的50个实例进行整理,并使用Matlab呈现在平行坐标轴上,并对平行坐标轴属性的优先度进行直观的排序。

得到了非常直观的结果,并表明花瓣宽度和花瓣长度(优先度顺序从大到小)可能是对鸢尾花进行区分的重要特征。

关键词:鸢尾花平行坐标轴特征属性Parallel coordinates for three different classes of IrisAbstract:This paper use Parallel Coordinates Axis learned in professer Lv’s mathematical model class to represent the features of three classes of Iris. This paper considers Fisher’s data, which contains 3 classes and 50 instances for each class. Then it uses Matlab to show the datas in the parallel coordinates axis, and get the important feature: petal width and petal length (ordered by decreasing priority).Key word:Iris features parallel coordinates目录关于三种不同鸢尾花类的平行坐标轴分析 (1)摘要: (1)关键词: (1)资料来源: (3)来源&数据集信息: (4)属性信息: (4)工作步骤: (5)1.数据导入 (5)2.视图转化 (6)3.视图优化与结论评价 (7)4.改进方向 (10)参考文献: (11)附录: (12)最终代码 (12)数据列表: (13)资料来源:来源&数据集信息:创建者:R.A.费舍尔;捐助者:迈克尔.马歇尔(MARSHALL%PLU '@' ).这一数据从费舍尔的文章提供的数据有所不同(由史蒂夫·查德威克鉴定, spchadwick '@')该数据集包含3个类,每类50个实例,其中每个类是指一类鸢尾花(Iris)。

前两类线性可分,后两类彼此非线性可分。

备注:第35样品应该是:4.9,3.1,1.5,0.2,“Iris setosa”,其中的错误是在第四特征。

第38样品:4.9,3.6,1.4,0.1,“Iris setosa”,其中的错误是在第二和第三特征。

属性信息:1. 萼片长度: Ls (cm);2. 萼片宽度: Ws (cm);3. 花瓣长度: Lp (cm);4. 花瓣宽度: Wp (cm);5. 类:Iris SetosaIris VersicolourIris Virginica工作步骤:1.数据导入从来源网站下载文档“iris.data”到文件夹“D:\Program_Files”中。

直接用Matlab读入数据:>> [speal_length, speal_width, petal_length, petal_width, class] = textread('D:\Program_Files\iris.data', '%n%n%n%n%s', 'delimiter', ',');对种类进行赋值替换(Iris-setosa = 1; Iris-versicolor = 2; Iris-virginica = 3;), >> classNo = strrep(class, 'Iris-setosa', '1');>> classNo = strrep(classNo, 'Iris-versicolor', '2');>> classNo = strrep(classNo, 'Iris-virginica', '3');>> classNo = strvcat(classNo);>> classNo = str2num(classNo);得到5个150x1 double 的列向量:2.视图转化将5个列向量依次并入矩阵IrisTable中>> IrisTable = classNo;>> IrisTable = [IrisTable, speal_length];>> IrisTable = [IrisTable, speal_width];>> IrisTable = [IrisTable, petal_length];>> IrisTable = [IrisTable, petal_width];进行平行坐标轴视图转化>> x=[1,2,3,4,5];>> for i=1:150y = IrisTable(i,:);plot (x,y)hold onend>> set(gca,'xtick',0:1:5)>> set(gca,'XTickLabel',{ 'petal width', 'Class', 'sepal length', 'sepalwidth', 'petal length', })// 注:命名顺序默认从0开始,因为图片中轴编号顺序从1开始,故命名时应循环错后一位。

于是得到下图,直观分析得出后两项(花瓣宽度,花瓣长度)较为整齐,前两项穿插较多,尤其第二项规律性不明显。

3.视图优化与结论评价对矩阵IrisTable的三种鸢尾花各属性值的平均值相对差值M和标准差Sa, Sb, Sc进行分析>> A = IrisTable(1:50,1:5);>> B = IrisTable(51:100,1:5);>> C = IrisTable(101:150,1:5);>> Ma = mean(A, 1);>> Mb = mean(B, 1);>> Mc = mean(C, 1);>> M = abs(Ma - Mb) + abs(Mb - Mc) + abs(Mc - Ma);>> Sa = std(A, 0, 1);>> Sb = std(B, 0, 1);>> Sc = std(C, 0, 1);得到:以各标准差总体由小到大,M由大到小给出最优次序: 类,花瓣宽度,花瓣长度,花萼长度,花萼宽度.重新处理:>> classNo = strrep(class, 'Iris-setosa', '1');>> classNo = strrep(classNo, 'Iris-versicolor', '2');>> classNo = strrep(classNo, 'Iris-virginica', '3');>> IrisTable = str2num (strvcat(classNo));>> IrisTable = [IrisTable, petal_width];>> IrisTable = [IrisTable, petal_length];>> IrisTable = [IrisTable, speal_length];>> IrisTable = [IrisTable, speal_width];生成优化后图像:>> x=[1,2,3,4,5];hold ony = IrisTable(i, :);plot (x, y, 'r')end>> for i = 51:100hold ony = IrisTable(i, :);plot (x, y, 'g')end>> for i = 101:150hold ony = IrisTable(i,:);plot (x, y, 'b')end>> set(gca, 'xtick', 0:1:5)>> set(gca, 'XTickLabel', {'sepal width', 'Class', 'petal width', 'petal length', 'sepal length'})>> for i = 2:4hold onplot([i,i],[0 8],'k')endfor j = 1:7hold onplot(i, j, '+k')endend调整后可以看出有一条蓝线基本出现在绿线聚集区,事实上有两个我这样的样例在后面四个轴特征与分类不是很相符,这与资料中的备注相吻合。

4.改进方向本文还可以按照吕老师课上提及的对特征量间的互信息方面进行考量。

参考文献:[1] UCI Data Set:https:///ml/datasets/Iris[2] Fisher,R.A. "The use of multiple measurements in taxonomic problems"Annual Eugenics, 7, Part II, 179-188 (1936); also in "Contributions toMathematical Statistics" (John Wiley, NY, 1950)./paper/2fb499aa4d6a7071a6ba53c679ccca7055813114[3] Duda,R.O., & Hart,P.E. (1973) Pattern Classification and Scene Analysis.(Q327.D83) John Wiley & Sons. ISBN 0-471-22361-1. See page 218./paper/e6b7a3a8c46efef785a6ab735be07dafa0713ff3[4] Dasarathy, B.V. (1980) "Nosing Around the Neighborhood: A New SystemStructure and Classification Rule for Recognition in Partially ExposedEnvironments". IEEE Transactions on Pattern Analysis and MachineIntelligence, Vol. PAMI-2, No. 1, 67-71./paper/acf9d77f6470a326f784fd50b08b7dd60be5fb9a[5] Gates, G.W. (1972) "The Reduced Nearest Neighbor Rule". IEEETransactions on Information Theory, May 1972, 431-433./paper/876f54b2ebfecb6a796590237abf245cf28d3c74See also: 1988 MLC Proceedings, 54-64.附录:最终代码:[speal_length,speal_width,petal_length,petal_width,class]= textread('D:\Program_Files\iris.data', '%n%n%n%n%s', 'delimiter', ','); classNo = strrep(class, 'Iris-setosa', '1');classNo = strrep(classNo, 'Iris-versicolor', '2');classNo = strrep(classNo, 'Iris-virginica', '3');IrisTable = str2num (strvcat(classNo));IrisTable = [IrisTable, petal_width];IrisTable = [IrisTable, petal_length];IrisTable = [IrisTable, speal_length];IrisTable = [IrisTable, speal_width];x=[1,2,3,4,5];for i = 1:50hold ony = IrisTable(i, :);plot (x, y, 'r')endfor i = 51:100hold ony = IrisTable(i, :);plot (x, y, 'g')endfor i = 101:150hold ony = IrisTable(i,:);plot (x, y, 'b')endset(gca, 'xtick', 0:1:5)set(gca,'XTickLabel',{'sepal width','Class','petal width','petal length','sepal length'}) for i = 2:4hold onplot([i,i],[0 8],'k')endfor i = 2:4for j = 1:7hold onplot(i, j, '+k')endend数据列表:5.1,3.5,1.4,0.2,Iris-setosa4.9,3.0,1.4,0.2,Iris-setosa4.7,3.2,1.3,0.2,Iris-setosa4.6,3.1,1.5,0.2,Iris-setosa5.0,3.6,1.4,0.2,Iris-setosa5.4,3.9,1.7,0.4,Iris-setosa4.6,3.4,1.4,0.3,Iris-setosa5.0,3.4,1.5,0.2,Iris-setosa 4.4,2.9,1.4,0.2,Iris-setosa4.9,3.1,1.5,0.1,Iris-setosa5.4,3.7,1.5,0.2,Iris-setosa 4.8,3.4,1.6,0.2,Iris-setosa 4.8,3.0,1.4,0.1,Iris-setosa4.3,3.0,1.1,0.1,Iris-setosa5.8,4.0,1.2,0.2,Iris-setosa 5.7,4.4,1.5,0.4,Iris-setosa 5.4,3.9,1.3,0.4,Iris-setosa 5.1,3.5,1.4,0.3,Iris-setosa 5.7,3.8,1.7,0.3,Iris-setosa 5.1,3.8,1.5,0.3,Iris-setosa 5.4,3.4,1.7,0.2,Iris-setosa 5.1,3.7,1.5,0.4,Iris-setosa4.6,3.6,1.0,0.2,Iris-setosa5.1,3.3,1.7,0.5,Iris-setosa4.8,3.4,1.9,0.2,Iris-setosa5.0,3.0,1.6,0.2,Iris-setosa 5.0,3.4,1.6,0.4,Iris-setosa 5.2,3.5,1.5,0.2,Iris-setosa 5.2,3.4,1.4,0.2,Iris-setosa 4.7,3.2,1.6,0.2,Iris-setosa4.8,3.1,1.6,0.2,Iris-setosa5.4,3.4,1.5,0.4,Iris-setosa 5.2,4.1,1.5,0.1,Iris-setosa 5.5,4.2,1.4,0.2,Iris-setosa4.9,3.1,1.5,0.1,Iris-setosa5.0,3.2,1.2,0.2,Iris-setosa 5.5,3.5,1.3,0.2,Iris-setosa 4.9,3.1,1.5,0.1,Iris-setosa4.4,3.0,1.3,0.2,Iris-setosa5.1,3.4,1.5,0.2,Iris-setosa 5.0,3.5,1.3,0.3,Iris-setosa 4.5,2.3,1.3,0.3,Iris-setosa4.4,3.2,1.3,0.2,Iris-setosa5.0,3.5,1.6,0.6,Iris-setosa 5.1,3.8,1.9,0.4,Iris-setosa4.8,3.0,1.4,0.3,Iris-setosa5.1,3.8,1.6,0.2,Iris-setosa4.6,3.2,1.4,0.2,Iris-setosa5.3,3.7,1.5,0.2,Iris-setosa 5.0,3.3,1.4,0.2,Iris-setosa6.4,3.2,4.5,1.5,Iris-versicolor 6.9,3.1,4.9,1.5,Iris-versicolor5.5,2.3,4.0,1.3,Iris-versicolor6.5,2.8,4.6,1.5,Iris-versicolor5.7,2.8,4.5,1.3,Iris-versicolor6.3,3.3,4.7,1.6,Iris-versicolor 4.9,2.4,3.3,1.0,Iris-versicolor 6.6,2.9,4.6,1.3,Iris-versicolor 5.2,2.7,3.9,1.4,Iris-versicolor 5.0,2.0,3.5,1.0,Iris-versicolor5.9,3.0,4.2,1.5,Iris-versicolor6.0,2.2,4.0,1.0,Iris-versicolor 6.1,2.9,4.7,1.4,Iris-versicolor5.6,2.9,3.6,1.3,Iris-versicolor6.7,3.1,4.4,1.4,Iris-versicolor 5.6,3.0,4.5,1.5,Iris-versicolor5.8,2.7,4.1,1.0,Iris-versicolor6.2,2.2,4.5,1.5,Iris-versicolor 5.6,2.5,3.9,1.1,Iris-versicolor5.9,3.2,4.8,1.8,Iris-versicolor6.1,2.8,4.0,1.3,Iris-versicolor 6.3,2.5,4.9,1.5,Iris-versicolor 6.1,2.8,4.7,1.2,Iris-versicolor 6.4,2.9,4.3,1.3,Iris-versicolor 6.6,3.0,4.4,1.4,Iris-versicolor 6.8,2.8,4.8,1.4,Iris-versicolor 6.7,3.0,5.0,1.7,Iris-versicolor 6.0,2.9,4.5,1.5,Iris-versicolor 5.7,2.6,3.5,1.0,Iris-versicolor 5.5,2.4,3.8,1.1,Iris-versicolor 5.5,2.4,3.7,1.0,Iris-versicolor5.8,2.7,3.9,1.2,Iris-versicolor6.0,2.7,5.1,1.6,Iris-versicolor5.4,3.0,4.5,1.5,Iris-versicolor6.0,3.4,4.5,1.6,Iris-versicolor 6.7,3.1,4.7,1.5,Iris-versicolor 6.3,2.3,4.4,1.3,Iris-versicolor 5.6,3.0,4.1,1.3,Iris-versicolor 5.5,2.5,4.0,1.3,Iris-versicolor5.5,2.6,4.4,1.2,Iris-versicolor6.1,3.0,4.6,1.4,Iris-versicolor 5.8,2.6,4.0,1.2,Iris-versicolor 5.0,2.3,3.3,1.0,Iris-versicolor5.7,3.0,4.2,1.2,Iris-versicolor5.7,2.9,4.2,1.3,Iris-versicolor6.2,2.9,4.3,1.3,Iris-versicolor 5.1,2.5,3.0,1.1,Iris-versicolor5.7,2.8,4.1,1.3,Iris-versicolor6.3,3.3,6.0,2.5,Iris-virginica 5.8,2.7,5.1,1.9,Iris-virginica7.1,3.0,5.9,2.1,Iris-virginica 6.3,2.9,5.6,1.8,Iris-virginica6.5,3.0,5.8,2.2,Iris-virginica7.6,3.0,6.6,2.1,Iris-virginica 4.9,2.5,4.5,1.7,Iris-virginica 7.3,2.9,6.3,1.8,Iris-virginica6.7,2.5,5.8,1.8,Iris-virginica7.2,3.6,6.1,2.5,Iris-virginica 6.5,3.2,5.1,2.0,Iris-virginica 6.4,2.7,5.3,1.9,Iris-virginica 6.8,3.0,5.5,2.1,Iris-virginica 5.7,2.5,5.0,2.0,Iris-virginica5.8,2.8,5.1,2.4,Iris-virginica6.4,3.2,5.3,2.3,Iris-virginica6.5,3.0,5.5,1.8,Iris-virginica7.7,3.8,6.7,2.2,Iris-virginica 7.7,2.6,6.9,2.3,Iris-virginica 6.0,2.2,5.0,1.5,Iris-virginica 6.9,3.2,5.7,2.3,Iris-virginica 5.6,2.8,4.9,2.0,Iris-virginica 7.7,2.8,6.7,2.0,Iris-virginica 6.3,2.7,4.9,1.8,Iris-virginica6.7,3.3,5.7,2.1,Iris-virginica7.2,3.2,6.0,1.8,Iris-virginica 6.2,2.8,4.8,1.8,Iris-virginica 6.1,3.0,4.9,1.8,Iris-virginica6.4,2.8,5.6,2.1,Iris-virginica7.2,3.0,5.8,1.6,Iris-virginica 7.4,2.8,6.1,1.9,Iris-virginica 7.9,3.8,6.4,2.0,Iris-virginica 6.4,2.8,5.6,2.2,Iris-virginica 6.3,2.8,5.1,1.5,Iris-virginica6.1,2.6,5.6,1.4,Iris-virginica7.7,3.0,6.1,2.3,Iris-virginica 6.3,3.4,5.6,2.4,Iris-virginica 6.4,3.1,5.5,1.8,Iris-virginica6.9,3.1,5.4,2.1,Iris-virginica 6.7,3.1,5.6,2.4,Iris-virginica 6.9,3.1,5.1,2.3,Iris-virginica5.8,2.7,5.1,1.9,Iris-virginica6.8,3.2,5.9,2.3,Iris-virginica 6.7,3.3,5.7,2.5,Iris-virginica 6.7,3.0,5.2,2.3,Iris-virginica 6.3,2.5,5.0,1.9,Iris-virginica 6.5,3.0,5.2,2.0,Iris-virginica 6.2,3.4,5.4,2.3,Iris-virginica 5.9,3.0,5.1,1.8,Iris-virginica。

相关文档
最新文档