06 项目六鸢尾花分类[20页]

合集下载

鸢尾花

中文学名：鸢尾花拉丁学名： Iris tectorum 别称：鸽子花（内蒙一带称法）界：植物界纲：单子叶植物纲
Monocotyledoneae 目：百合目 Liliales 科：鸢尾科 Iridaceae 花程式： ↑*P(3+3)A3G(3:3) 色彩：鸢尾花大多为蓝紫色
形态特征
多年生宿根性直立草本，高约30-50公分。根状茎匍匐多节，粗而节间短，浅黄色。叶为渐尖状剑形，宽 2-4公分，长30-45公分，质薄，淡绿色，呈二纵列交互排列，基部互相包叠。春至初夏开花，总状花序1-2枝，每枝有花2-3朵；花蝶形，花冠蓝紫色或紫白色，径约10公分，外3枚较大，圆形下垂；内3枚较小，倒圆形；外列花被有深紫斑点，中央面有一行鸡冠状白色带紫纹突起，花期4～6月，果期6～8月；雄蕊3枚，与外轮花被对生；花柱3歧，扁平如花瓣状，覆盖着雄蕊。花出叶丛，有蓝、紫、黄、白、淡红等色，花型大而美丽。蒴果长椭圆形，有6稜。变种有白花鸢尾，花白色，外花被片基部有浅黄色斑纹。
时，要注意湿度不能降得过快，否则会使叶片枯萎，从而导致切花品质的下降。
遮荫遮荫设备可以控制温室中的温度、湿度和光照。在光照
强的月份中，通风的温室和露地温度都过高（高于25℃），在这种情况下，遮荫同时通风可抑制切花品质的下降。参见第II章（遮荫设备）。
施肥
一般来说，种植前施基肥的方法并不可取，因为这会提高土壤中盐分的浓度，而延缓鸢尾的根系生长。种植前对土壤的抽样调查以确保土壤含有正确的营养成分。抽样一定要在对土壤处理和淋洗后进行。这样，所缺的养分可通过以后直接给土壤中补充肥料来得到。鸢尾对氟元素敏感，因此，含氟的肥料（磷肥）和三磷酸盐肥料禁止使用。反之，如二磷酸盐肥料则应使用。

鸢尾花

鸢尾属约300种，鸢尾原产于中国中部及日本，少数入药，鸢尾根茎为诱吐剂或缓下剂，具消炎作用。鸢尾花大而美丽，叶片青翠碧绿，观赏价值很高。很多种类供庭园观赏用，在园林中可用作布置花坛，栽植于水湿畦地、池边湖畔，或布置成鸢尾专类花园，亦可作切花及地被植物，是一种重要的庭园植物。

鸢尾花》于1889年5月完成.鸢尾花是同向日葵一样,凡高似乎也喜欢画这种植物. 1892年，唐基（梵高的朋友）以300法郎的价格，将这幅画卖给了评论家奥克塔夫· 米尔博。他是梵高作品最早的赏识者之一，这幅画像和许多其他的梵高的画一样，在他死后不断地买卖，1988年在拍卖会上，有人叫出了5300万美元的天价。我们由此可以看出人们对“价值” 的认识及衡量。梵高就是梵高，他的画，也对经济规律的现象作了诠释。
【中文名称】鸢尾花【英文名称】 Irises 【创作时间】 1889年 5月【创作地点】圣雷米 Saint-Ré my 【类型】画布油画 Oil on canvas 【尺寸】 71x93cm 【现存】洛杉矶 Los Angeles,Getty Center 美国马利布· 保罗—盖提博物馆。【编号】 F 608， JH 1691

梵高是荷兰画家，1853年3月30日生于津德尔特，1890年7月29日在法国瓦兹河畔，因患精神病而自杀身亡。他早年经商，后来热衷于宗教。梵高在1880年以后，才开始学习绘画。曾在巴黎结识贝尔纳、西涅克和高更等画家。他早期的作品，受印象主义和新印象主义画派的影响，其代表作有《食土豆者》等等。他曾两次在咖啡馆和饭馆等劳工阶层，展出自己的作品。不久，开始厌倦巴黎的生活，便来到法国南部阿尔勒。重新追求一种更有表现力的画法技巧，因受革新文艺思潮及日本绘画的启发，他便大胆地探索自由，奔放抒发自己内心地感受，追求自己的绘画风格，达到线条和色彩的自身表现力与画面的装饰性、寓意性想融合。这时期，他的代表作《向日葵》《咖啡馆夜市》等等。我们今天分析这些作品，很容易觉察到画所包含的那深刻悲剧潜意识，还有梵高那强烈的个性主义和形式上很独特的个人追求。这就是我们今天所认识的梵高，一个神秘、张扬、抽象的“疯子”。

鸢尾花分类所用的算法

鸢尾花分类所用的算法
鸢尾花分类是机器学习领域中一个经典的问题，常用的算法包括K近邻算法（K-Nearest Neighbors, KNN）、支持向量机（Support Vector Machine, SVM）、决策树（Decision Tree）、随机森林（Random Forest）、朴素贝叶斯（Naive Bayes）和神经网络等。

K近邻算法是一种基于实例的学习方法，它根据新样本与已知样本的距离来进行分类，选择距离最近的K个样本进行投票决定分类结果。

支持向量机是一种监督学习算法，它通过将数据映射到高维空间，找到一个最优的超平面来进行分类。

决策树是一种树形结构的分类器，通过一系列的规则对数据进行划分，最终得到分类结果。

随机森林是一种集成学习方法，它由多个决策树组成，通过对多个决策树的结果进行投票来进行分类。

朴素贝叶斯是一种基于贝叶斯定理的分类算法，它假设特征之间相互独立，通过计算样本属于每个类别的概率来进行分类。

神经网络是一种模仿人脑神经元网络结构的算法，通过多层神经元的连接和权重调整来进行分类。

这些算法在鸢尾花分类问题中都有较好的表现，选择合适的算法取决于数据集的特征、样本量、计算资源和准确度要求等因素。

同时，也可以通过交叉验证等方法来评估不同算法的性能，以选择最适合的算法进行鸢尾花分类。

鸢尾花数据集

鸢尾花数据集引言概述：鸢尾花数据集是机器学习领域中常用的一个数据集，由英国统计学家Fisher于1936年收集整理而成。

该数据集包含了三个不同种类的鸢尾花的测量数据，是分类问题中的经典案例。

本文将对鸢尾花数据集进行详细介绍和分析，以便读者更好地了解和应用该数据集。

一、数据集概述1.1 数据来源鸢尾花数据集是由Fisher在20世纪30年代通过对鸢尾花进行测量所得。

他收集了三个品种的鸢尾花，分别是山鸢尾（setosa）、变色鸢尾（versicolor）和维吉尼亚鸢尾（virginica）。

1.2 数据特征该数据集包含了150个样本，每个样本有四个特征，分别是花萼长度（sepal length）、花萼宽度（sepal width）、花瓣长度（petal length）和花瓣宽度（petal width）。

这些特征用于描述鸢尾花的形态特征。

1.3 数据标签每个样本都有一个标签，用于表示鸢尾花的品种。

标签分为三类，分别对应三个品种：0代表山鸢尾，1代表变色鸢尾，2代表维吉尼亚鸢尾。

二、数据集的应用2.1 机器学习算法训练鸢尾花数据集作为一个经典的分类问题案例，常被用于机器学习算法的训练和测试。

通过对样本数据的学习，算法可以根据鸢尾花的特征来预测其所属的品种，从而实现分类任务。

2.2 特征选择和提取对鸢尾花数据集进行特征选择和提取，可以帮助我们识别出对分类任务最具有区分性的特征。

通过对特征的分析和比较，我们可以选择出最重要的特征，提高分类模型的准确性和效果。

2.3 数据可视化鸢尾花数据集的特征维度较低，可以方便地进行数据可视化。

通过绘制散点图、箱线图等图表，我们可以直观地观察到不同品种鸢尾花在特征上的分布情况，进一步了解其特征之间的关系。

三、数据集的分析3.1 数据分布情况通过统计和可视化分析，我们可以了解鸢尾花数据集中各个品种的样本数量分布情况。

这有助于我们判断数据集是否存在类别不平衡的问题，并采取相应的处理措施。

朴素贝叶斯算法对鸢尾花分类

朴素贝叶斯算法对鸢尾花分类一、概述鸢尾花分类是机器学习中一个经典的分类问题。

朴素贝叶斯算法是一种基于贝叶斯定理的分类算法，它能够通过概率推理对样本进行分类。

在本篇文章中，我们将介绍如何使用朴素贝叶斯算法对鸢尾花数据集进行分类。

二、数据集介绍鸢尾花数据集是一个包含150个样本的多元分类问题，每个样本有四个特征：花萼长度、花萼宽度、花瓣长度和花瓣宽度。

这四个特征可以描述鸢尾花的外观，而目标标签是鸢尾花的种类，包括山鸢尾（Iris-setosa）、变色鸢尾（Iris-versicolor）和维吉尼亚鸢尾（Iris-virginica）。

三、朴素贝叶斯算法原理朴素贝叶斯算法是一种基于贝叶斯定理的分类算法。

它假设每个特征之间是相互独立的，因此不需要对特征进行相关性分析。

朴素贝叶斯算法通过概率推理来计算每个类别的概率，并选择概率最大的类别作为样本的预测结果。

四、使用Python实现朴素贝叶斯算法在Python中，可以使用Scikit-learn库中的朴素贝叶斯分类器对鸢尾花数据集进行分类。

以下是一个简单的示例代码：```pythonfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.naive_bayesimportGaussianNBfromsklearn.metricsimportaccuracy_score#加载鸢尾花数据集iris=load_iris()X=iris.datay=iris.target#划分训练集和测试集X_train,X_test,y_train,y_test=train_test_split(X,y,test_s ize=0.2,random_state=42)#使用高斯朴素贝叶斯分类器gnb=GaussianNB()gnb.fit(X_train,y_train)#预测测试集结果并计算准确率y_pred=gnb.predict(X_test)accuracy=accuracy_score(y_test,y_pred)print("Accuracy:",accuracy)```在上述代码中，我们首先加载了鸢尾花数据集，并将其划分为训练集和测试集。

鸢尾花雌蕊类型

鸢尾花雌蕊类型鸢尾花雌蕊类型鸢尾花是一种美丽的多年生草本植物，其花朵颜色艳丽，形态优美，是园艺爱好者们非常喜爱的植物。

而在鸢尾花的结构中，雌蕊是一个非常重要的部分。

下面将介绍鸢尾花雌蕊类型。

一、什么是鸢尾花雌蕊鸢尾花的雌蕊是指植物生殖器官中的女性部分，主要包括柱头、柱颈和子房三部分。

柱头上有许多粘液质地的柄状物，称为柱头乳突，其作用是吸附和传递花粉。

二、鸢尾花雌蕊类型1.正常型：正常型雌蕊由子房、柄和柱头组成。

子房位于最底部，它可以产生胚珠并成熟为种子。

柄连接着子房和柱头，起到支撑和输送养分的作用。

而柱头则位于顶端，接受来自异色同株或异色异株的花粉。

2.花萼型：花萼型雌蕊是指柱头和柄之间没有子房，只有一个小的、呈圆锥形的花萼。

花萼型鸢尾花通常是由一些基因突变引起的，它们通常不能产生种子，但仍然可以通过无性繁殖来繁殖。

3.小球型：小球型雌蕊是指柱头和柄之间有一个非常小的、呈圆球形的子房。

这种类型的鸢尾花也是由基因突变引起的，它们通常不能产生种子。

4.双重柱头型：双重柱头型雌蕊由两个柱头组成，每个柱头都可以接收异色同株或异色异株的花粉。

这种类型的鸢尾花也是由基因突变引起的。

5.无柄型：无柄型雌蕊是指没有明显的连接子房和柄之间的部分。

这种类型的鸢尾花通常不会产生种子，但仍然可以通过无性繁殖来繁殖。

三、鸢尾花雌蕊类型对人类有何意义了解鸢尾花雌蕊类型对人类具有重要意义。

首先，对于园艺爱好者来说，了解雌蕊类型可以帮助他们更好地选择和种植鸢尾花，从而获得更好的收成。

其次，对于植物学家来说，了解鸢尾花雌蕊类型可以帮助他们更好地理解植物的生长和繁殖机制，并为研究基因突变和遗传学提供重要的参考。

最后，对于普通人来说，了解鸢尾花雌蕊类型可以增加人们对自然界的认识和理解，从而更好地保护和利用自然资源。

有导师学习神经网络的分类——鸢尾花种类识别

有导师学习神经网络的分类——鸢尾花种类识别1、案例背景有导师学习神经网络以其良好的学习能力广泛应用于各个领域中，其不仅可以解决拟合回归问题，亦可以用于模式识别、分类识别。

本章将继续介绍两种典型的有导师学习神经网络（GRNN和PNN），并以实例说明其在分类识别中的应用。

植物的分类与识别时植物学研究和农林业生产经营中的重要基础工作，对于区分植物种类、探索植物间的亲缘关系、阐明植物系统的进化规律具有重要意义。

目前常用的植物种类鉴别方法是利用分类检索表进行鉴定，但该方法花费时间较多，且分类检索表的建立是一件费时费力的工作，需投入大量的财力物力。

叶片的识别植物的重要组成部分，叶子的外轮廓是其主要形态特征。

在提取叶子形态特征的基础上，利用计算机进行辅助分类与识别成为当前的主要研究方向，同时也是研究的热点与重点。

现采集到150组不同类型鸢尾花（Setosa、Versicolour和Virginica）的四种属性：萼片长度、萼片宽度、花瓣长度和花瓣宽度，样本编号与四种属性的关系如图26-3所示（其中，样本编号1-50为Setosa，51-100为Versicolour，101-150为Virginica）。

从图中大致可以看出，花瓣长度、花瓣宽度与鸢尾花类型间有较好的线性关系，而萼片长度、萼片宽度与鸢尾花类型间呈现出非线性的关系。

现要求：（1）利用GRNN和PNN分别建立鸢尾花种类识别模型，并对模型的性能进行评价。

（2）利用GRNN和PNN分别建立各个属性及属性组合与鸢尾花种类间的识别模型，并与（1）中所建模型的性能及运算时间进行对比，从而探求各个属性及属性组合与鸢尾花种类的相关程度。

2、案例目录：26.1 理论基础26.1.1 广义回归神经网络（GRNN）概述1. GRNN的结构2. GRNN的学习算法3. GRNN的特点4. GRNN的MATLAB工具箱函数26.1.2 概率神经网络（PNN）概述1. PNN的结构2. PNN的学习算法3. PNN的MATLAB工具箱函数26.2 案例背景26.2.1 问题描述26.2.2 解决思路及步骤26.3 MATLAB程序实现26.3.1 清空环境变量26.3.2 训练集/测试集产生26.3.3 模型建立26.3.4 性能评价26.3.5 绘图26.3.6 结果分析26.4 延伸阅读26.5 参考文献3、主程序：%% 清空环境变量clear allclc%% 训练集/测试集产生% 导入数据load iris_data.mat% 随机产生训练集和测试集P_train = [];T_train = [];P_test = [];T_test = [];for i = 1:3temp_input = features((i-1)*50+1:i*50,:);temp_output = classes((i-1)*50+1:i*50,:);n = randperm(50);% 训练集——120个样本P_train = [P_train temp_input(n(1:40),:)'];T_train = [T_train temp_output(n(1:40),:)'];% 测试集——30个样本P_test = [P_test temp_input(n(41:50),:)'];T_test = [T_test temp_output(n(41:50),:)']; end%% 模型建立result_grnn = [];result_pnn = [];time_grnn = [];time_pnn = [];for i = 1:4for j = i:4p_train = P_train(i:j,:);p_test = P_test(i:j,:);%% GRNN创建及仿真测试t = cputime;% 创建网络net_grnn = newgrnn(p_train,T_train);% 仿真测试t_sim_grnn = sim(net_grnn,p_test);T_sim_grnn = round(t_sim_grnn);t = cputime - t;time_grnn = [time_grnn t];result_grnn = [result_grnn T_sim_grnn'];%% PNN创建及仿真测试t = cputime;Tc_train = ind2vec(T_train);% 创建网络net_pnn = newpnn(p_train,Tc_train);% 仿真测试Tc_test = ind2vec(T_test);t_sim_pnn = sim(net_pnn,p_test);T_sim_pnn = vec2ind(t_sim_pnn);t = cputime - t;time_pnn = [time_pnn t];result_pnn = [result_pnn T_sim_pnn'];endend%% 性能评价% 正确率accuracyaccuracy_grnn = [];accuracy_pnn = [];time = [];for i = 1:10accuracy_1 = length(find(result_grnn(:,i) == T_test'))/length(T_test);accuracy_2 = length(find(result_pnn(:,i) == T_test'))/length(T_test);accuracy_grnn = [accuracy_grnn accuracy_1];accuracy_pnn = [accuracy_pnn accuracy_2];end% 结果对比result = [T_test' result_grnn result_pnn]accuracy = [accuracy_grnn;accuracy_pnn]time = [time_grnn;time_pnn]%% 绘图figure(1)plot(1:30,T_test,'bo',1:30,result_grnn(:,4),'r-*',1:30,result_pnn(:,4),'k:^')grid onxlabel('测试集样本编号')ylabel('测试集样本类别')string = {'测试集预测结果对比(GRNN vs PNN)';['正确率:' num2str(accuracy_grnn(4)*100) '%(GRNN) vs ' num2str(accuracy_pnn(4)*100) '%(PNN)']};title(string)legend('真实值','GRNN预测值','PNN预测值')figure(2)plot(1:10,accuracy(1,:),'r-*',1:10,accuracy(2,:),'b:o')grid onxlabel('模型编号')ylabel('测试集正确率')title('10个模型的测试集正确率对比(GRNN vs PNN)')legend('GRNN','PNN')figure(3)plot(1:10,time(1,:),'r-*',1:10,time(2,:),'b:o')grid onxlabel('模型编号')ylabel('运行时间(s)')title('10个模型的运行时间对比(GRNN vs PNN)') legend('GRNN','PNN')4、运行结果：。

鸢尾花分类项目

鸢尾花分类项目鸢尾花分类项目是一个经典的机器学习案例，也是数据科学的一个入门项目。

该项目主要通过收集不同种类的鸢尾花的数据特征，来训练机器学习模型，以分类鸢尾花的种类。

本文将讨论鸢尾花分类项目的背景、实现方式和优化方法。

项目背景鸢尾花是一种不同种类的花卉，如维基百科所述："Iris是一个属名，包括275个品种，生长在北半球中温带区域。

"。

每个品种的鸢尾花都有不同的特征，这种特征可以帮助我们区分不同品种的鸢尾花。

鸢尾花分类项目就是要了解这些特征，并且训练模型来正确地识别每个品种的鸢尾花。

项目实现该项目的实现是通过`scikit-learn`机器学习库中的`load_iris()`函数，读取包含150个样本的数据集。

每个样本都包含4个特征：花瓣长度、花瓣宽度、萼片长度和萼片宽度。

将这些特征与标签一起用于监督式学习模型分类。

数据集中有三种类型的鸢尾花：Setosa、Versicolor和Virginica。

我们使用算法来训练模型并对新的鸢尾花进行分类。

分类算法下面介绍两个常用的分类算法：逻辑回归（Logistic Regression）：逻辑回归是一个线性模型，可以用来预测具有二元结果的输出。

在鸢尾花分类项目中，可以将数据集分为两个类别，并在此基础上训练逻辑回归模型。

该模型将根据所提供的特征来预测一个给定的鸢尾花的种类。

决策树（Decision Tree）：决策树是一种集成算法，可以处理特征之间的非线性关系，并能够处理多元回归问题。

在鸢尾花分类项目中，我们可以利用决策树来快速生成可视化分类器，查询数据的流程就像一个问题对话。

通过对问题的回答，可以判断鸢尾花的类别。

优化方法鸢尾花分类项目中的优化包括以下几个方面：数据集划分：将数据集分为测试集和训练集，并使用训练集来训练模型，测试集来验证模型的准确性。

例如通常要将数据集按80:20的比例进行划分。

网格搜索（Grid Search）：网格搜索是一种用于确定模型参数设置的方法。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

X = df[['SepalLengthCm', 'SepalWidthCm', 'PetalLengthCm', 'PetalWidthCm']]
Y = df[['Cluster','Species']]
# 可视化展现
grr=pd.plotting.scatter_matrix(X,c=np.squeeze(Y[[' Cluster']]),figsize=(8,8),marker="o",hist_kwds={'bins ':20},s=60,alpha=.8,cmap=plt.cm.Paired) plt.show()
二、使用随机森林对鸢尾花进行分类
模型训练过程
1、初始化分类器
3、预测predict
2、拟合fit
4、准确性评估
from sklearn.ensemble import RandomForestClassifier
#随机森林分类预测
clf = RandomForestClassifier(n_jobs=3)
预测准确度:0.97
Prediction 0 1 2
Actual Values
0
15 0 0
1
0 11 1
2
0 0 11
上机时间：20min
• 数据读取 • 模型训练 • 模型评估 • 实验报告步骤1
二、使用随机森林对鸢尾花进行分类
随机森林就是集成学习思想下的产物，其实质是将bagging方法与决策树相结合，将决策树作为基准估计量，然后采用bagging技术训练一大堆小决策树，最后将这些小决策树组合起来，这样就得到了一片森林（随机森林），并合起来用来预测最终结果。
项目六鸢尾花分类
陈清华
知识回顾：机器学习的方法
机器学习算法
监督学习
无监督学习
分类预测
回归分析
聚类分析
关联规则
半监督学习
强化学习
时间差 Q-learning 学习
知识回顾：分类(Classification)
项目：使用身高、体重数据进行性别、肥胖程度分类 ✓ Logistic Regression: 逻辑回归 ✓ Bayes: 朴素贝叶斯 ✓ Decision Tree: 决策树 ✓ SVM: 支持向量机学习目标：了解各种方法及其使用
y_pred=knn.predict(x_test)
# 模型评估结果
print("预测准确度 :{:.2f}".format(knn.score(x_test,y_test[['Cluster']]))) print(pd.crosstab(y_test['Cluster'], y_pred, rownames=['Actual Values'], colnames=['Prediction']))
#coding:utf-8 import pandas as pd
df= pd.read_csv('iris.csv', delimiter=',') df.head()
一、使用K近邻对鸢尾花进行分类
• 2 数据准备种类 • 标签映射
from sklearn import preprocessing
维吉尼亚鸢尾（virginica）
P4
一、使用K近邻对鸢尾花进行分类
K近邻方法的核心思想是：在特征空间中，如果一个样本的K个最相邻的样本的大多数属于某一个类别，则该样本也属于这个类别，并具有这个类别上样本的特性。
一、使用K近邻对鸢尾花进行分类
• 1 数据读取
• 花萼长度（spepal length） • 花萼宽度（spepal width） • 花瓣长度（petal length） • 花瓣宽度（petal width）
clf.fit(x_train, y_train[['Cluster']] .values.ravel()) y_pred=clf.predict(x_test)
print("预测准确度 :{:.2f}".format(clf.score(x_test,y_test[['Cluster']]))) print(pd.crosstab(y_test['Cluster'], y_pred, rownames=['Actual Values'], colnames=['Prediction']))
主要教学内容
监督学习
– K近邻 – 随机森林 – 神经网络
项目：鸢尾花分类
– 数据读取 – 数据准备 – 数据可视化 – 模型训练 – 模型评估
重点：
了解不同分类算法的概念及应用了解sklearn中相应算法的使用
难点：
对不同分类算法的理解及调参
山鸢尾（setosa）变色鸢尾（versicolor）
# 对类别进行数值化处理
le = belEncoder() df['Cluster'] = le.fit_transform(df['Species'])
df.head()
一、使用K近邻对鸢尾花进行分类
• 3 数据展现
• 四个特征值相关性
import numpy as np import matplotlib.pyplot as plt plt.rcParams['font.sans-serif'] = ['SimHei&rediction 0 1 2
Actual Values
0
13 0 0
1
0 15 0
2
0 28
二、使用随机森林对鸢尾花进行分类
# KNN近邻分类预测
knn = KNeighborsClassifier(n_neighbors=5) knn.fit(x_train,np.squeeze(y_train[['Cluster']])) y_pred=knn.predict(x_test)
一、使用K近邻对鸢尾花进行分类
• 6 模型评估
一、使用K近邻对鸢尾花进行分类
• 4 数据集切分
from sklearn.model_selection import train_test_split x_train, x_test,y_train, y_test=train_test_split(X,Y)
• 5 模型训练 from sklearn.neighbors import KNeighborsClassifier