遗传算法权重确定

合集下载

遗传算法在机器学习中的应用方法详解

遗传算法在机器学习中的应用方法详解

遗传算法在机器学习中的应用方法详解随着人工智能的快速发展,机器学习成为了解决复杂问题的重要工具。

在机器学习中,遗传算法被广泛应用于优化问题的求解。

本文将详细介绍遗传算法在机器学习中的应用方法。

一、遗传算法简介遗传算法是一种模拟生物进化过程的优化算法。

它通过模拟“自然选择”、“遗传”和“变异”等机制,不断优化问题的解。

遗传算法的基本思想是从一个初始的解空间中随机生成一组解,然后通过交叉、变异等操作,不断演化出更好的解。

二、遗传算法在机器学习中的应用1. 参数优化在机器学习中,模型的参数选择对模型的性能至关重要。

遗传算法可以通过优化参数的组合来提高模型的性能。

首先,我们需要定义一个适应度函数来评估每个参数组合的好坏程度。

然后,通过遗传算法的迭代过程,不断更新参数组合,直到找到最优解。

2. 特征选择在机器学习中,特征选择是一个重要的问题。

过多或过少的特征都会影响模型的性能。

遗传算法可以通过选择和交叉特征来优化模型的特征集合。

首先,我们需要定义一个适应度函数来评估每个特征集合的好坏程度。

然后,通过遗传算法的迭代过程,不断更新特征集合,直到找到最优解。

3. 神经网络结构优化神经网络是机器学习中常用的模型之一,而神经网络的结构对其性能有着重要影响。

遗传算法可以通过优化神经网络的结构来提高其性能。

首先,我们需要定义一个适应度函数来评估每个神经网络结构的好坏程度。

然后,通过遗传算法的迭代过程,不断更新神经网络结构,直到找到最优解。

4. 集成学习集成学习是一种将多个模型组合起来进行预测的方法。

遗传算法可以通过优化模型的组合权重来提高集成学习的性能。

首先,我们需要定义一个适应度函数来评估每个模型组合的好坏程度。

然后,通过遗传算法的迭代过程,不断更新模型组合的权重,直到找到最优解。

5. 强化学习强化学习是一种通过试错来学习最优策略的方法。

遗传算法可以通过优化策略的参数来提高强化学习的性能。

首先,我们需要定义一个适应度函数来评估每个策略的好坏程度。

遗传算法中的随机数

遗传算法中的随机数

遗传算法中的随机数遗传算法是一种启发式优化算法,其模拟了自然界中遗传和进化的过程。

在遗传算法中,随机数起到了重要的作用,影响了算法的过程和求解结果。

一、随机数的概念和作用随机数是在一定范围内,按照一定的规律产生的数字序列。

在遗传算法中,随机数被广泛应用于以下几个方面:1.初始化种群:遗传算法的基本思想是通过模拟自然界中的进化过程来最优解。

在算法的初期阶段,需要随机生成一组个体作为种群的初始解,即初始种群。

而种群的初始化采用随机数可以增加算法收敛到全局最优解的可能性。

2.个体变异:遗传算法中,个体的变异是模拟自然界中遗传物种遭遇突变的现象。

变异操作对个体的遗传编码进行随机扰动,以增加种群的多样性和空间的覆盖范围。

变异概率通常很小,但通过随机数的引入,可以保证在几代中每个个体都有一定的变异概率。

3.交叉操作:遗传算法中的交叉操作模拟了自然界中物种的交配过程。

交叉是通过从两个父代个体中选择一部分遗传信息,交换、组合并生成新的后代个体。

在交叉操作中,需要随机选择交叉点,即随机选择两个父代个体中的遗传信息进行交换。

随机数的引入,可以增加交叉点的随机性,使得交叉操作能够更好地保持种群多样性。

4.选择操作:遗传算法中的选择操作模拟了自然界中适者生存的机制,即根据个体的适应度值选择优秀的个体作为父代。

选择操作通常采用轮盘赌选择策略,即根据每个个体的适应度值与总适应度值之比将选中概率作为选中个体的概率。

而为了满足轮盘赌选择策略的要求,需要生成随机数来进行概率计算。

二、合理使用随机数的原则在遗传算法中,合理使用随机数是保证算法能够收敛到全局最优解的重要因素之一、以下是合理使用随机数的几个原则:1.随机数的范围和分布:在遗传算法中,生成随机数的范围和分布需要根据问题的特点来确定。

一般来说,随机数的范围应该包含问题解空间的边界,并根据问题的特点选择合适的分布,如均匀分布或正态分布等。

2.随机数的种子:种子是用于生成伪随机数序列的初始值。

遗传算法权重确定

遗传算法权重确定

遗传算法权重确定遗传算法是一种启发式算法,主要用于解决优化问题。

它通过模拟自然界的进化过程,通过遗传和突变的操作来不断优化解的质量。

权重的确定是遗传算法中的一个重要步骤,下面将详细介绍遗传算法权重确定的步骤和方法。

对于权重确定的问题,首先需要明确目标函数和约束条件。

目标函数是需要最优化的函数,而约束条件则是对解的限制条件。

在确定权重之前,需要对目标函数和约束条件进行数学建模,使其成为数学表达式。

接下来,需要确定适应度函数。

适应度函数是用于评估染色体或解的质量的函数。

在很多情况下,目标函数本身可以作为适应度函数。

但是,在一些情况下,需要对目标函数进行转换或者对其进行标准化处理,以便更好地评估解的质量。

然后,需要确定染色体表示。

染色体表示了解的结构和特征。

在权重确定的问题中,染色体可以使用二进制编码或者实数编码。

例如,对于二进制编码,可以使用一个二进制串来表示解,其中每个基因位表示一些权重的取值。

确定染色体表示后,需要确定遗传算法的操作。

遗传算法的主要操作包括选择、交叉和突变。

选择操作根据适应度函数选择适应度较高的染色体,并将其复制到下一代。

交叉操作通过交换染色体的部分基因信息来产生新的解。

突变操作随机改变染色体的一些基因位,以增加解的多样性。

最后,可以使用遗传算法进行优化。

遗传算法通常需要迭代多次,每次迭代称为一代。

在每一代中,根据适应度函数选择染色体,并进行交叉和突变操作。

通过不断迭代,可以逐渐改进解的质量,直到找到最优解或者满足停止条件为止。

在权重确定的问题中,遗传算法可以应用于多个权重的优化。

可以将每个权重作为基因位,以染色体的形式表示多个权重的组合。

通过不断迭代,可以找到最优的权重组合,从而得到最优解。

总之,权重的确定是遗传算法中的一个重要步骤。

通过明确目标函数和约束条件,确定适应度函数和染色体表示,选择合适的遗传算法操作,可以使用遗传算法找到最优的权重组合,从而得到最优解。

(完整word版)遗传算法及在物流配送路径优化中的应用

(完整word版)遗传算法及在物流配送路径优化中的应用

遗传算法及在物流配送路径优化中的应用一、遗传算法1.1遗传算法定义遗传算法(Genetic Algorithm)是模拟达尔文的遗传选择和自然淘汰的生物进化过程的计算模型, 是一种通过模拟自然进化过程搜索最优解的方法, 它是有美国Michigan大学J.Holland教授于1975年首先提出来的, 并出版了颇有影响的专著《Adaptation in Natural and Artificial Systems》, GA这个名称才逐渐为人所知, J.Holland教授所提出的GA通常为简单遗传算法(SGA)。

遗传算法是从代表问题可能潜在的解集的一个种群(population)开始的, 而一个种群则由经过基因(gene)编码的一定数目的个体(individual)组成。

每个个体实际上是染色体(chromosome)带有特征的实体。

染色体作为遗传物质的主要载体, 即多个基因的集合, 其内部表现(即基因型)是某种基因组合, 它决定了个体的形状的外部表现, 如黑头发的特征是由染色体中控制这一特征的某种基因组合决定的。

因此, 在一开始需要实现从表现型到基因型的映射即编码工作。

由于仿照基因编码的工作很复杂, 我们往往进行简化, 如二进制编码, 初代种群产生之后, 按照适者生存和优胜劣汰的原理, 逐代(generation)演化产生出越来越好的近似解, 在每一代, 根据问题域中个体的适应度(fitness)大小选择(selection)个体, 并借助于自然遗传学的遗传算子(genetic operators)进行组合交叉(crossover)和变异(mutation), 产生出代表新的解集的种群。

这个过程将导致种群像自然进化一样的后生代种群比前代更加适应于环境, 末代种群中的最优个体经过解码(decoding), 可以作为问题近似最优解。

1.2遗传算法特点遗传算法是一类可用于复杂系统优化的具有鲁棒性的搜索算法, 与传统的优化算法相比, 主要有以下特点:1. 遗传算法以决策变量的编码作为运算对象。

带货物权重的车辆路径问题及遗传算法

带货物权重的车辆路径问题及遗传算法
中 图分类 号 : 1 . U16 2 文 献标 识码 : A 文章 编号 :10 —9 0 (07 0 —0 2 —0 0 7 8 7 20 )3 0 3 7
0 引 言
车辆 路 径 问题 (eier t gpol vh l o i rbe c un m,V P R) 在 整个 分 销 网络 的 优 化 中扮 演 着 非 常 重 要 的 角
带 货物 权 重 的 车 辆 路径 问题 及 遗 传 算 法①
潘震 东 , 加福 , 唐 韩 毅
( 东北大学系统工程研究所 , 东北大学教育部暨辽宁省流程工业综合 自 动化重点实验室, 沈阳 100 ) 04 1 摘要 : 考虑一个分销 中心、 多个零售商组成 的分销 网络 系统 中具有柔性车辆能力的带货物权 重的车辆路径问题 . 并根据车辆的满载情况采用了不同的运输策略 , 即单点运输和多点运输方
索上拥有优势 . 大量学者都 已经开始使用遗传算
法求 解 V P问题 _ 5. R 1 卜l J 考虑 到实 际应 用 中零 售 商 数 目可 能会 很 多 , 本文根 据 问题 模 型 的 特 点 , 出一 种基 于划 分 的 提
生业务流程外包的需求 , 以提高管理成本的边际收

收稿 日期 : 0 5 8— 3 修 订 日期 : 0 6 0—1 . 20 —0 2 ; 20 —1 6 基 金项 目:国家 自然科学基金资助项 目(07 08 76 10 ;7 303 、 74 12 ; 0004 0 10 ) 教育部科技研究重点项 目(004 ;教育 部新 世纪优 秀人才支持 4 146 ) 计划 ( C T一0 —20 ;辽宁省 自然科学基金资助项 目(020 9 . NE 4 8) 20 2 1) 作 者简介 : 潘震东 (9O , ,辽宁人 , 士生 ,E i il 6 .o 18 一) 男 博 ma :i @13 em. l m

利用云模型和遗传算法优化BP神经网络权值

利用云模型和遗传算法优化BP神经网络权值

利用云模型和遗传算法优化BP神经网络权值摘要:标准BP算法主要根据训练样本确定神经网络的权值,由于BP算法采用沿梯度下降的搜索算法,因而其结果对初始权值非常敏感,收敛速度慢,易陷入局部极小。

结合正态云模型云滴的随机性和稳定倾向性,以及遗传算法的全局搜索能力,收敛速度快等特性优化神经网络的权值和阈值。

分类实验结果表明,该算法比标准BP算法收敛速度快,分类正确率高。

关键词:云模型;遗传算法;标准BP算法;神经网络0 引言BP算法(Back Propogation Algorithm)是目前应用最为广泛的神经网络学习算法,但由于BP算法采用沿梯度下降的搜索算法,因而其结果对初始权值非常敏感,不同的初始权值可能导致不同的结果以及易陷入局部极小等问题。

本文结合遗传算法的高度并行、随机、自适应的全局性概率搜索以及正态云模型云滴的随机性和稳定倾向性特点优化神经网络的权值和阈值。

该算法中的交叉概率、变异概率由X条件云发生器产生。

1 优化原理先利用神经网络试探出最好的网络隐层结点数,再利用本文提出的算法调整网络的权值以及阈值,然后再用调整好的权值和阈值进行分类。

编码:对于包含一层隐藏层模式为m-n-l多层神经网络共有q=m*n+n*l+n+l个权值和阈值需要优化,其中m为输入层结点数,n 为隐藏层结点数,l为输出层结点数。

将这q个权值和阈值记为W=(W 1,W2,…,W q),采用实数编码,将行向量W看作是一条染色体,而其中每个实数W i(i=1,2,…,q)是染色体的一个基因位。

选择算子:采用轮盘赌和精英保留选择策略。

每个染色体产生后代的数目正比于它的适应度值的大小,并且每一代中染色体的总数保持不变,这种方法也称为轮盘赌选择。

假设群体的大小为n,个体A i的适应度值为f(A i),则个体A i被选择的概率P(A i)为:P(A i)=f(A i)∑ni=1f(A i)交叉算子:随机产生二串长度为q的二进制串,设有两个父代,P=(P1,P2,…,P q)以及M=(M1,M2,…,M q),采用下面的方式得到两个子代:C=(C1,C2,…,C q) 和D=(D1,D 2,…,D q),用其中的一个二进制串产生子代C,用另一个二进制串产生子代D。

一种基于遗传算法的特征选择和权重确定方法

一种基于遗传算法的特征选择和权重确定方法

一种基于遗传算法的特征选择和权重确定方法张栋冰【摘要】在模式识别中,特征选择是其中非常重要的步骤,特征集的选择直接影响分类器的精度.该文提出了一种基于遗传算法的特征权重确定方法,首先使用传统遗传算法进行特征的初步选择,得到一个粗选的特征集;然后使用实数编码的遗传算法在第一步的基础上进一步精选特征,并确定每个入选特征的权重.通过实验和一些传统特征选择方法进行对比,结果显示,该文提出的算法取得了较好的效果.【期刊名称】怀化学院学报【年(卷),期】2015(000)005【总页数】4【关键词】特征选择;特征权重;遗传算法特征选择,是从一个初始特征集中挑选出一些特征组成最优特征子集,依据这些子集构建的分类器能够使某种评估标准达到最优,具有较高的预测精度.特征选择可以提高构建的分类或回归模型的泛化能力,降低特征维度的同时还提高了计算效率,所以特征选择方法的研究成为目前模式识别研究领域中的一个热点问题.本文首先讨论了目前常用的一些特征选择方法,分析了这些方法存在的一些问题,随后针对这些问题,本文提出了一种新的基于遗传算法的特征权重确定方法.最后我们通过实验验证了所提算法的效果.1 特征选择的相关工作特征选择可以看作是一个搜索寻优的过程.1997年,M.Dash提出了特征选择的一般框架,清楚的描述了这个过程,如图1所示[1].从图1中可以看到,特征选择过程由四步组成:子集产生、子集评价、终止和验证方法.第一步为产生子集,即由一部分特征组成的集合,接着对这个特征集进行评估,直到停止的条件满足,选择的过程才结束.如果没有条件未满足,则重复前面的工作,直到完成.目前学者们的研究集中于搜索策略和评价标准两方面.特征选择的任务,实际上是将特征的维数从M压缩至对于描述类别是最有效的m维,这样,所有的可能的特征集的组合数为(1)选择哪些特征组成最优特征子集需要一个标准进行评价.这些标准可以分为以下五类:信息相关的度量、距离相关的度量、依赖性相关的度量、一致性相关的度量和分类错误相关的度量等[1].前四类方法根据数据内在的特性来对所选择的特征子集进行评价,独立于特定的算法,常用于过滤模式(filter method)的方法中;分类错误率度量标准则经常与特定的学习算法联系,常用于封装模式(wrapper method)的方法中[2].不同的评价标准会得到不同的特征子集.另外,使用穷举法,对所有的可能的特征组合进行评估,计算量会非常大,也是不实际的.所以,寻找一种理想的搜索算法变得非常必要.根据能否搜索到最优组合,搜索算法可以分为最优搜索算法、次优搜索算法.到目前为止,唯一可以得到最优结果的搜索方法就是分支界定法[3].虽然分支界定法在效率上比穷举法高,但是对于高维度特征空间,计算量还是太大而难以实现.单独最优特征组合是最简单的搜索算法,但是,即使各特征统计独立,组合起来不一定最优.后来出现的搜索算法有顺序前进法(Sequential Forward Selection,SFS)[4]和顺序后退法(Sequential Backward Selection,SBS)[5].SFS没有考虑入选特征之间的相关性,而且不能剔除已入选而品质变低劣的特征.而SBS则无法入选已被剔除而品质变优良的特征,且由于其是一种自上而下的方法,在高维空间运算,计算量比SFS大.由于特征选择实际上是一个组合优化问题,因此也可以使用解决优化问题的方法来解决特征选择问题,比如基于启发式搜索策略的禁忌搜索(Tabu Search,TS)算法[6],基于随机搜索策略的粒子群算法(Particle Swarm Optimization,PSO)[7]、模拟退火算法(Simulated Annealing)[6]和遗传算法(genetic algorithm,GA)[8]等.这些方法都是近似方法,在求解时间和质量上都较为理想,被广泛应用.根据分类器与评价函数的关系,特征选择的模式目前可以分为过滤式、封装式以及混合(Hybird)模式[2].基于过滤式的方法独立于分类器,其方法是使用一定的函数,对于候选的部分特征进行分类能力的评估,同时用某种策略从中选择最好的一些特征.这种方法实现简单,效率高,但是由于独立于分类器,容易和分类器产生偏差.基于封装式的方法则将分类器封装于其中,直接以分类的正确率作为特征选择的目标,分类正确率最高的那一部分特征将被作为最后的特征集被选中.在这种方法中,分类学习算法就封装在特征选择过程里面,分类算法的识别正确率直接成为了特征子集的评价准则,所以其精度一般较过滤模式方法高,但是每次对特征子集的评价都要计算分类器的精度,所以其效率不高.目前一些学者结合这两类方法的优点,把两者结合起来形成了一类混合模式的方法,也取得了较好的效果[9].遗传算法由生物进化的过程启发而产生.生物从最简单的低等生物发展出复杂的高级生物,期间经历了漫长的进化,通过遗传和变异等,按照“物竞天择,适者生存”的规则演变而来.遗传算法对求解问题的模型,没有特别的要求,是一种非数值优化方法,所以适应性比较广泛.其次,在搜索时,遗传算法采用群体搜索策略,从一个群体进化到另外一个群体,提高了效率,且不易陷入局部最优.这些优点,让遗传算法被广泛应用于特征选择中.2 基于遗传算法的特征选择和权重确定方法遗传算法是一种基于封装模式的特征选择方法.这种方法把分类器封装于其中,直接以分类器的精度作为评价特征子集的选择标准.由于每次需要计算分类器精度,所以效率不是很高.另外,也没有考虑到特征的权重,事实上每个特征对于分类的贡献不是同等的.所以,我们提出了一种基于遗传算法的特征选择和权重确定方法.这种方法的过程如下图2所示.这种方法主要分为以下两步进行.第一步:由传统的GA算法初选出候选特征集.这一步主要是从原始特征集中选出比较好的一些初始特征集,用于后续的精选和权重确定.使用二进制位编码的方法创建一个二进制位串代表一个染色体C.一个特征fi使用一个二进制位,也就是一个基因位gi来表示,则有下面一个关于fi和gi函数关系:(2)从式2中,我们可以看到基因位和特征一一对应,有多少特征就需要有多少基因位来表示.当基因取值为1时,表明特征被选中,反之则反.第一步流程图如图3所示.第二步:由可以确定权重的GA算法在第一阶段初选出候选特征集的基础上,继续精简特征集,同时也求得最终入选的特征对应的权重.可以确定特征权重的GA与传统GA方法的流程大致相同,我们介绍与GA中不同的几个地方,主要是个体编码方式、解码方式和交叉遗传操作.(1)个体编码方式如表1所示,在GA中,我们用x位二进制位表示一个特征的权重,这样,如果由第一阶段GA选出来的候选特征集的位数为n位,则特征权重位的位数为nx,即整个染色体的长度.(2)染色体解码因为确定权重GA算法中染色体的编码与传统GA中不同,相应的解码方式也不同,先将每一个特征fi对应的二进制基因位串转化为一个十进制整数qi,然后,就可以求得每个特征的权重:(3)(3)交叉遗传操作由于在第二步的GA中,基因的编码方式与传统GA不同,我们使用了x位表示一个权重位,为了在进行交叉操作后,尽量不会因为交叉使得一个特征的权重被严重改变,我们在进行交叉操作时,交叉点选择为n的整数位处,也是随机选择,但是不处于这一点时就重新再选择,直到满足这个条件位置为止,这与在GA中采用的传统的方法那样完全随机选择交叉点不同.通过上述的两个步骤,我们就可以得到一个精选的特征子集及其对应的权重.3 实验及结果为了验证所提算法的效果,开展了以下一系列的实验.3.1 数据来源和实验方案实验的数据来源于南佛罗里达大学(University of South Florida)的DDSM(Digital Database for Screening Mammography,DDSM)[10].我们构建了一个基于钼靶乳腺X线摄片和多特征最近邻算法[11]的乳腺肿块计算机辅助诊断系统.在训练阶段,先建立一个大规模参考库,主要由含有正常组织的感兴趣区域(Region of Interest,ROI)和含有肿块的ROI两类区域组成.随后使用分割算法对参考库中的所有ROI进行可疑肿块轮廓提取.当分割完成后,在分割结果上应用特征提取和计算方法计算所有ROI的特征集.这样就得到了参考ROI特征数据库.在整个特征数据库上,使用特征选择、权重确定算法及分类决策算法,并引入已经确诊的金标准(Truth File)对上述结果进行判定.分割算法我们使用的是一种基于动态规划法的方法[11].在诊断阶段,使用基于图像内容检索(Computer Aided Diagnose using Content-based Image Retrieval,CBIR CAD)方法,针对放射科医师任意感兴趣的区域去进行检测,CAD系统除了返回待查询的区域和肿块的相似度分数和/或肿块是良性还是恶性的分类分数,还有最相似的K幅参考感兴趣区域图像.3.2 参数设置(1)种群规模和个体初始化时阈值种群的大小用来控制种群的规模.显然,种群规模越大,相当于增大了搜索的群体以及种群多样性,找到理想解的可能性就越大,但是计算量肯定会增大.本文中种群大小设置为40.(2)进化代数进化代数用来控制遗传算法的结束时间.一般来说,代数越多,越可能找到理想解,但搜索时间会增加.在本文中,这个值设置为300.(3)交叉概率交叉概率用于控制参与交叉的个体数量,这个值不宜过小,也不宜过大.过小的话,则会使得算法收敛速度过快而陷入局部最优,过大则会使大量优秀个体遭到破坏,而使算法不收敛.在本文中设置为0.7.(4)变异概率变异概率用来控制参与变异的个体数量.它的影响主要是在进化的后期,和交叉概率的作用类似.在本文中,设置为0.001.3.3 实验结果为了测试和评估所提出的新特征和新的特征选择方法的效果,我们对7种方法进行了实验.这些方法中,有使用所有特征且权重都为1的AF-KNN方法和GA-KNN方法以及本文方法.实验结果如表2所示,表中K值为KNN算法所选出的与待测ROI最相似的参考ROI的数目.在本文实验中,是在遗传算法的染色体中设定相应的基因位,一起训练出来的.95%置信区间是本文实验结果要求达到的95%可信度所跨度的范围.受试者操作特性曲线(Receiver Operating Characteristic Curve,ROC曲线)[12]是广泛采用的评价CAD系统性能的工具,有别于单阈值分析的方法,通过设置很多阈值进行决策,可以获取到含有多对灵敏度和假阳性率值组成相应的二元有序点对集合,再分别以假阳性率、灵敏度值为横、纵坐标,既可以通过二维坐标系,在二维空间中描述这些点,连接这些点而成的曲线就是ROC曲线.Az为ROC曲线下包络的面积,是描述受试者操作特性曲线最重要的指标,该值越大,表明系统性能越好.从表2中可以发现由传统的GA方法选出了34个特征作为候选特征子集,对63维特征进行了初步降维,然后本文方法在这个基础上最终选出了24个特征,并确定了特征相应的权重.在临床中,一般认为Az值:0.5~0.7之间时诊断价值较低,在0.7~0.9之间时诊断价值中等,而在0.9以上时诊断价值较高.本文的方法,全特征法以及GA特征选择方法得到的Az下的面积分别为:0.8782±0.0078,0.8632±0.0081和0.8478±0.0088,从数据上看,进行GA 特征选择后,入选特征为34个,特征维数明显降低,而CAD性能也明显提高,说明特征选择对分类器性能的提高有很重要的作用.而且用本文所提出的方法特征数进一步降为24个,CAD的性能却比前面的两种方法有更大的提升,说明本文所提方法行之有效.4 结论特征选择是模式识别中非常关键的一步,挑选出最优特征子集的同时还能降低特征维度,提高计算效率.很多算法在进行特征选择的时候没有考虑到特征的权重,简单的将特征的分类效力同等对待,这是不合理的.本文提出了一种两步选择特征的方案,先用遗传算法初选出一个特征子集,在此基础上再用能够确定特征的遗传算法进一步精选特征,并确定特征的权重.实验结果显示,我们的算法取得了较好效果.参考文献:[1]Dash M,Liu H.Feature selection for classification[J].Intelligent data analysis,1997,1(3):131-156.[2]郑雅敏.基于遗传算法的特征选择方法的改进研究[D].重庆:重庆大学通信工程学院,2008.[3]刘亦韬,胡维华.一种处理Top-k逆向查询的分支界定算法[J].杭州电子科技大学学报,2014(6):76-79.[4]Liu B,Li S,Wang Y,et al.Predicting the protein SUMO modification sites based on Properties Sequential Forward Selection(PSFS)[J].Biochemicaland biophysical research communications,2007,358(1):136-139.[5]Xue B,Zhang M,Browne W N.Particle swarm optimisation for feature selection in classification:Novel initialisation and updating mechanisms[J].Applied Soft Computing,2014(18):261-276.[6]许鹏飞,苗启广,李伟生.基于函数复杂度的自适应模拟退火和禁忌搜索新算法[J].电子学报,2012,40(6):1218-1222.[7]张丹,韩胜菊,李建,等.基于改进粒子群算法的BP算法的研究[J].计算机仿真,2011,28(2):147-150.[8]Handbook of genetic algorithms[M].New York:Van Nostrand Reinhold,1991:20-65.[9]Fischer U,Hermann K,Baum F.Digital mammography:current state and future aspects[J].European radiology,2006,16(1):38-44.[10]Keller J M,Gray M R,Givens J A.A fuzzy k-nearest neighbor algorithm[J].IEEE Transactions on Systems,Man and Cybernetics,1985(4):580-585.[11]Song E,Xu S,Xu X,et al.Hybrid segmentation of mass in mammograms using template matching and dynamic programming[J].Academic radiology,2010,17(11):1414-1424.[12]Eltonsy N H,Tourassi G D,Elmaghraby A S.A concentric morphology model for the detection of masses in mammography[J].IEEE Transactions on Medical Imaging,2007,26(6):880-889.基金项目:安徽省高等学校自然科学研究项目“基于视觉主题模型的视觉场景认知理解方法研究”(KJ2014B23).。

遗传算法

遗传算法

缺点:该算法只是对每个落点进行单独的考虑,没有反应不同组 合所产生的共同效果,所以只是近似的算法,不能获得最优的结果。 基于单个的优化不能保证在整体情况下能获得最大值。 如果对所有的可能方案进行评价,找到最佳方案。例如在N*N的
栅格空间中确定n个 目标的最佳位置,则所要对比的组合高达
2.遗传算法和GIS结合解决空间优化问题
所谓交叉运算,是指对两个相互配对的染色体依据
交叉概率 Pc 按某种方式相互交换其部分基因,从而形 成两个新的个体。
交叉前: 00000|011100000000|10000 11100|000001111110|00101 交叉后: 00000|000001111110|10000 11100|011100000000|00101 染色体交叉是以一定的概率发生的,这个概率记为Pc
行一点或多点交叉的操作,但这样很容易产生断路或环路。针对路径 的具体需要,这里采用只允许在除首、尾结点之外的第一个重复结点位
置交叉且只进行一点交叉的操作方式。例如:设从起始结点1到目标结
点9的一对父代个体分别是G1和G2,分别如下表示: G1(1,3,5,6,7,8,9)
G2(1,2,4,5,8,9)
是一种有效的解最优化问题的方法。 其基本思想是:首先随机产生种群,对种群中的被选中染色体进行交
叉或变异运算生成后代,根据适值选择部分后代,淘汰部分后代,但种群
大小不变。经过若干代遗传之后,算法收敛于最好的染色体,可能是问题 的最优解或次优解。
适应度函数
遗传算法对一个个体(解)的好坏用适应度函数
值来评价,适应度函数值越大,解的质量越好。适应 度函数是遗传算法进化过程的驱动力,也是进行自然
篇论文。此后Holland教授指导学生完成了多篇有关遗传算法研究的论
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档