遗传算法

合集下载

遗传算法遗传算法

11
（5）遗传算法在解空间进行高效启发式搜索，而非盲目地穷举或完全随机搜索；
（6）遗传算法对于待寻优的函数基本无限制，它既不要求函数连续，也不要求函数可微，既可以是数学解析式所表示的显函数，又可以是映射矩阵甚至是神经网络的隐函数，因而应用范围较广；
（7）遗传算法具有并行计算的特点，因而可通过大规模并行计算来提高计算速度，适合大规模复杂问题的优化。
26
（4）基本遗传算法的运行参数有下述4个运行参数需要提前设定：
M：群体大小，即群体中所含个体的数量，一般取为 20~100； G：遗传算法的终止进化代数，一般取为100~500； Pc：交叉概率，一般取为0.4~0.99；
Pm：变异概率，一般取为0.0001~0.1。
27
10.4.2 遗传算法的应用步骤
遗传算法简称GA（Genetic Algorithms）是1962年由美国Michigan大学的Holland教授提出的模拟自然界遗传机制和生物进化论而成的一种并行随机搜索最优化方法。
遗传算法是以达尔文的自然选择学说为基础发展起来的。自然选择学说包括以下三个方面：
1
（1）遗传：这是生物的普遍特征，亲代把生物信息交给子代，子代总是和亲代具有相同或相似的性状。生物有了这个特征，物种才能稳定存在。
18
（3）生产调度问题在很多情况下，采用建立数学模型的方法难以对生
产调度问题进行精确求解。在现实生产中多采用一些经验进行调度。遗传算法是解决复杂调度问题的有效工具，在单件生产车间调度、流水线生产车间调度、生产规划、任务分配等方面遗传算法都得到了有效的应用。
19
（4）自动控制。在自动控制领域中有很多与优化相关的问题需要求
10

遗传算法

1.3 遗传算法与传统方法的比较
传统算法起始于单个点遗传算法起始于群体
改善（问题特有的）
否
改善（独立于问题的）否
终止？
终止？是结束
是
结束
1.3.1遗传算法与启发式算法的比较
启发式算法是通过寻求一种能产生可行解的启发式规则，找到问题的一个最优解或近似最优解。该方法求解问题的效率较高，但是具有唯一性，不具有通用性，对每个所求问题必须找出其规则。但遗传算法采用的是不是确定性规则，而是强调利用概率转换规则来引导搜索过程。
1.2 遗传算法的特点
遗传算法是一种借鉴生物界自然选择和自然遗传机制的随机搜索法。它与传统的算法不同，大多数古典的优化算法是基于一个单一的度量函数的梯度或较高次统计，以产生一个确定性的试验解序列；遗传算法不依赖于梯度信息，而是通过模拟自然进化过程来搜索最优解，它利用某种编码技术，作用于称为染色体的数字串，模拟由这些串组成的群体的进化过程。
1.2.2 遗传算法的缺点
（1）编码不规范及编码存在表示的不准确性。（2）单一的遗传算法编码不能全面地将优化问题的约束表示出来。考虑约束的一个方法就是对不可行解采用阈值，这样，计算的时间必然增加。（3）遗传算法通常的效率比其他传统的优化方法低。（4）遗传算法容易出现过早收敛。（5）遗传算法对算法的精度、可信度、计算复杂性等方面，还没有有效的定量分析方法。
上述遗传算法的计算过程可用下图表示。
遗传算法流程图
目前，遗传算法的终止条件的主要判据有以下几种：
• 1）判别遗传算法进化代数是否达到预定的最大代数； • 2）判别遗传搜索是否已找到某个较优的染色体； • 3）判别各染色体的适应度函数值是否已趋于稳定、再上升否等。

遗传算法

适应度越高的染色体被选择的可能性越大，其遗传基因在下一代群体中的分布就越广，其子孙在下一代出现的数量就越多。
2019/12/10
4
轮盘法
6.5% 25.4%
42.2%
(1) 计算每个染色体xi 的适应度f(xi)；
35.9%
popsize
(2) 找出群体的适应度之和；SUM f ( xi )
群体(population) 由染色体组成的集合。
代遗传操作遗传操作作用于群体而产生新的群体。
2019/12/10
2
二、基本算法
用于比较不同的解以确定哪一个解是更好的一个措施。
2019/12/10
3
三、基本遗传算子
选择算子(Selection)
用于模拟生物界去劣存优的自然选择现象。它从旧种群中选择出适应性强的某些染色体，放人匹配集(缓冲区)，为染色体交换和变异运算产生新种群作准备。
1
一、相关概念
染色体(chromosome)或个体(individual) 把每一个可能的解编码为一个向量，用来描述基本的遗传结构。例如，用0，1 组成的串可以表示染色体。
基因
向量中的每一个元素
适应度(fitness) 每个染色体所对应的一个适应值。在优化问题中，适应度来自于一个目标评价函数。
(7) 重复执行(5)(6)直到缓冲区中有足够多的染色体。
2019/12/10
5
交叉算子(Crossover)
具体做法：
(1) 缓冲区中任选两个染色体(双染色体)；
(2) 随机选择交换点位置J，0<J<L(染色体长度)；
(3) 交换双亲染色体交换点右边的部分。（单点交叉）

遗传算法

1 遗传算法1.1 遗传算法的定义遗传算法(GeneticAlgorithm，GA)是近多年来发展起来的一种全新的全局优化算法，它是基于了生物遗传学的观点，是模拟达尔文的遗传选择和自然淘汰的生物进化过程的计算模型，是一种通过模拟自然进化过程搜索最优解的方法。

它通过自然选择、遗传、复制、变异等作用机制，实现各个个体的适应性的提高，从而达到全局优化。

遗传算法151解决一个实际问题通常都是从一个种群开始，而这个种群通常都是含有问题的一个集合。

这个种群是由一定数目的个体所构成的，利用生物遗传的知识我们可以知道这些个体正好组成了我们知道的染色体，也就是说染色体是由一个个有特征的个体组成的。

另外我们还知道，遗传算法是由染色体组成，而染色体是由基因组成，可以这么说，基因就决定了个体的特性，所以对于遗传算法的最开始的工作就需要进行编码工作。

然后形成初始的种群，最后进行选择、交叉和变异的操作。

1.2遗传算法的重要应用在现实应用中，遗传算法在很多领域得到很好的应用，特别是在解决多维并且相当困难的优化问题中时表现出了很大的优势。

在遗传算法的优化问题的应用中，其中最为经典的应用就是我们所熟悉的函数优化问题，它也是对遗传算法的性能进行评价的最普遍的一种算法;另外的一个最重要的应用，也就是我们本文所研究的应用—组合优化问题，一般的算法很难解决组合优化问题的搜索空间不断扩大的局面，而组合优化问题正好是解决这种问题的最有效的方法之一，在本文的研究中，比如求解TSP问题、VRP问题等方面都得到了很好的应用;另外遗传算法在航空控制系统中的应用、在图像处理和模式识别的应用、在生产调度方面的应用以及在工人智能、人工生命和机器学习方面都得到了很好的应用。

其实在当今的社会中，有关于优化方面的问题应用于各行各业中，因此有关于优化问题已经变得非常重要，它对于整个社会的发展来说都是一个不可改变的发展方向，也是社会发展的一个非常重要的需要。

1.3 遗传算法的特点遗传算法不同于传统的搜索与优化方法，它是随着问题种类的不同以及问题规模的扩大，能以有限的代价来很好的解决搜索和优化的方法。

什么是遗传算法

什么是遗传算法遗传算法的基本意思就是说象人的遗传一样，有一批种子程序，它们通过运算得到一些结果，有好有坏，把好的一批取出来，做为下一轮计算的初值进行运算，反复如此，最终得到满意的结果。

举个例子，假如有一个动物群体，如果你能让他们当中越强壮的越能优先交配和产籽，那么千万年后，这个动物群体肯定会变得更加强壮，这是很容易理解的。

同样，对于许多算法问题，特别是NP问题，比如说最短路径，如果有400个城市，让你找出最短的旅游路线，采用穷举比较，复杂度为O（n！），这时，你可以先随机产生100种路径，然后让他们之中路程越短的那些越能优先互相交换信息(比如每条里面随机取出10个位置互相交换一下),那么循环几千次后，算出来的路径就跟最短路径非常接近了（即求出一个近似最优解）。

遗传算法的应用还有很多，基本思想都一样，但实现上可能差别非常大。

现在有许多搞算法的人不喜欢遗传算法，因为，它只给出了一种“有用”的方法，却不能保证有用的程度，与此相反，能保证接近最优程度的概率算法更受青睐。

遗传算法（Genetic Algorithm）是一类借鉴生物界的进化规律（适者生存，优胜劣汰遗传机制）演化而来的随机化搜索方法。

它是由美国的J.Holland教授1975年首先提出，其主要特点是直接对结构对象进行操作，不存在求导和函数连续性的限定；具有内在的隐并行性和更好的全局寻优能力；采用概率化的寻优方法，能自动获取和指导优化的搜索空间，自适应地调整搜索方向，不需要确定的规则。

遗传算法的这些性质，已被人们广泛地应用于组合优化、机器学习、信号处理、自适应控制和人工生命等领域。

它是现代有关智能计算中的关键技术之一。

1.遗传算法与自然选择达尔文的自然选择学说是一种被人们广泛接受的生物进化学说。

这种学说认为，生物要生存下去，就必须进行生存斗争。

生存斗争包括种内斗争、种间斗争以及生物跟无机环境之间的斗争三个方面。

在生存斗争中，具有有利变异的个体容易存活下来，并且有更多的机会将有利变异传给后代；具有不利变异的个体就容易被淘汰，产生后代的机会也少的多。

遗传算法

5.3.3 多交配位法
单交配位方法只能交换一个片段的基因序列，但多交配位方法能够交换多个片段的基因序列 1101001 1100010 1100000 1101011
交配前
交配后
5.3.4 双亲单子法
两个染色体交配后，只产生一个子染色体。通常是从一般的交配法得到的两个子染色体中随机地选择一个，或者选择适应值较大的那一个子染色体
6.1.4 基于共享函数的小生境实现方法
6.1.1 小生境遗传算法的生物学背景
•小生境是特定环境下的生存环境
•相同的物种生活在一起，共同繁衍后代 •在某一特定的地理区域内，但也能进化出优秀的个体 •能够帮助寻找全部全局最优解和局部最优解（峰顶）
6.1.2 基于选择的小生境实现方法
•只有当新产生的子代适应度超过其父代个体的适应度时，才进行替换，否则父代保存在群体中 •这种选择方式有利于保持群体的多样性 •这种方法有利于使得某些个体成为它所在区域中的最优个体
5.1.3 实数编码的实现方法(续)
•适合于精度要求较高的问题 •便于较大空间的遗传搜索 •改善了遗传算法的计算复杂性，提高了效率 •便于遗传算法与经典优化算法混合使用 •便于设计针对问题的专门知识型算子 •便于处理复杂的决策约束条件
5.2 选择算子
5.2.1 概率选择算子
5.2.2 适应值变换选择算子
•pm: 变异概率，一般取0.0001—0.1
4.1 问题描述 4.2 问题转换和参数设定 4.3 第0代情况 4.4 第0代交配情况 4.5 第1代情况 4.6 第1代交配情况 4.7 第1代变异情况 4.8 第2代情况 4.9 第2代交配情况
4. 基本遗传算法举例
4.1 问题描述

(完整版)遗传算法简介及代码详解

遗传算法简述及代码详解声明：本文内容整理自网络，认为原作者同意转载，如有冒犯请联系我。

遗传算法基本内容遗传算法为群体优化算法，也就是从多个初始解开始进行优化，每个解称为一个染色体，各染色体之间通过竞争、合作、单独变异，不断进化。

遗传学与遗传算法中的基础术语比较染色体：又可以叫做基因型个体(individuals)群体/种群(population)：一定数量的个体组成，及一定数量的染色体组成，群体中个体的数量叫做群体大小。

初始群体：若干染色体的集合，即解的规模，如30，50等，认为是随机选取的数据集合。

适应度(fitness)：各个个体对环境的适应程度优化时先要将实际问题转换到遗传空间，就是把实际问题的解用染色体表示，称为编码，反过程为解码/译码，因为优化后要进行评价（此时得到的解是否较之前解优越），所以要返回问题空间，故要进行解码。

SGA采用二进制编码，染色体就是二进制位串，每一位可称为一个基因；如果直接生成二进制初始种群，则不必有编码过程，但要求解码时将染色体解码到问题可行域内。

遗传算法的准备工作:1) 数据转换操作，包括表现型到基因型的转换和基因型到表现型的转换。

前者是把求解空间中的参数转化成遗传空间中的染色体或者个体(encoding)，后者是它的逆操作(decoding)2) 确定适应度计算函数，可以将个体值经过该函数转换为该个体的适应度，该适应度的高低要能充分反映该个体对于解得优秀程度。

非常重要的过程。

遗传算法基本过程为:1) 编码，创建初始群体2) 群体中个体适应度计算3) 评估适应度4) 根据适应度选择个体5) 被选择个体进行交叉繁殖6) 在繁殖的过程中引入变异机制7) 繁殖出新的群体，回到第二步实例一：（建议先看实例二）求 []30,0∈x 范围内的()210-=x y 的最小值1) 编码算法选择为"将x 转化为2进制的串"，串的长度为5位（串的长度根据解的精度设定，串长度越长解得精度越高）。

遗传算法

缺点：该算法只是对每个落点进行单独的考虑，没有反应不同组合所产生的共同效果，所以只是近似的算法，不能获得最优的结果。基于单个的优化不能保证在整体情况下能获得最大值。如果对所有的可能方案进行评价，找到最佳方案。例如在N*N的
栅格空间中确定n个目标的最佳位置，则所要对比的组合高达
2.遗传算法和GIS结合解决空间优化问题
所谓交叉运算，是指对两个相互配对的染色体依据
交叉概率 Pc 按某种方式相互交换其部分基因，从而形成两个新的个体。
交叉前： 00000|011100000000|10000 11100|000001111110|00101 交叉后： 00000|000001111110|10000 11100|011100000000|00101 染色体交叉是以一定的概率发生的，这个概率记为Pc
行一点或多点交叉的操作，但这样很容易产生断路或环路。针对路径的具体需要,这里采用只允许在除首、尾结点之外的第一个重复结点位
置交叉且只进行一点交叉的操作方式。例如:设从起始结点1到目标结
点9的一对父代个体分别是G1和G2,分别如下表示: G1(1,3,5,6,7,8,9)
G2(1,2,4,5,8,9)
是一种有效的解最优化问题的方法。其基本思想是:首先随机产生种群,对种群中的被选中染色体进行交
叉或变异运算生成后代,根据适值选择部分后代,淘汰部分后代,但种群
大小不变。经过若干代遗传之后,算法收敛于最好的染色体,可能是问题的最优解或次优解。
适应度函数
遗传算法对一个个体（解）的好坏用适应度函数
值来评价，适应度函数值越大，解的质量越好。适应度函数是遗传算法进化过程的驱动力，也是进行自然
篇论文。此后Holland教授指导学生完成了多篇有关遗传算法研究的论

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

以变异概率Pm改变染色体的某一个基因,当以二进制编码时，变异的基因由0变成1，或者由1变成0。平均约1-2%。
1
1
0
1
0
0
0
1
变异基因
变异基因
0
1
0
1
0
1
0
1
比起选择和交叉操作，变异操作是GA中的次要操作，但它在恢复群体中失去的多样性方面具有潜在的作用
停止准则(Termination Criteria)
如何编码？
选择
交叉
变异
遗传算法的基本操作
选择(selection):
根据各个个体的适应值，按照一定的规则或方法，从第t代群体 P(t)中选择出一些优良的个体遗传到下一代群体P(t+1)中。
交叉(crossover):
将群体P(t)内的各个个体随机搭配成对，对每一个个体，以某个概率Pc (称为交叉概率，crossover rate)交换它们之间的部分染色体。
在完全图中寻找一个最小圈
旅行商问题的应用
例5. 碎纸片的拼接复原破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。传统上，拼接复原工作需由人工完成，准确率较高，但效率很低。特别是当碎片数量巨大，人工拼接很难在短时间内完成任务。随着计算机技术的发展，人们试图开发碎纸片的自动拼接技术，以提高拼接复原效率。请讨论以下问题： 1. 对于给定的来自同一页印刷文字文件的碎纸机破碎纸片（仅纵切），建立碎纸片拼接复原模型和算法，并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预，请写出干预方式及干预的时间节点。复原结果以图片形式及表格形式表达（见【结果表达格式说明】）。
适应函数(Fitness Function)
适应函数常见形式：
直接将目标函数转化为适应函数
• 若目标函数为最大化问题：
Fitness(f(x)) = f(x)
• 若目标函数为最小化问题：
Fitness(f(x)) = -f(x)
适应函数(Fitness Function)
界限构造法
• 目标函数为最大化问题
选择(Selection)---轮盘赌演示
染色体被选的概率
染色体编号
1 01110 8
0.16 0.16
2 11000 15
0.3 0.46
3 00100 2
0.04 0.5
4 10010 5
0.1 0.6
5 01100 12
0. 24 0.84
6 00011 8
0.16 1
染色体
适应度被选概率累积
例子.单点交叉(1-point crossover)
随机产生一个交叉点在交叉点位置分离双亲染色体互换交叉点位置右边的基因码
父代 1 1 1 1 1 1 1 1 1 1 1 1
0
交叉点位置
0
0
0
0
0
0
0
0
0
0
0
子代
1
0
1
0
1
0
1
0
0
1
0
1
0
1
0
1
0
1
0
1
0
1
0
1
交叉(crossover处理—有约束最优化问题
有约束最优化问题:
Minimize f ( x1 , x2 , xn ) gi ( x) 0, i 1, 2, , m hi ( x) 0, i 1, 2, , l li xi ui , i 1, 2, , n
方法一：把约束问题转化为无约束问题，在用无约束问题方法求解，如罚函数法；方法二：“巧妙”地设计交叉和变异方式，尽量避免后代跑出可行域。
f ( x) Cmin , f ( x) Cmin Fitness( f ( x)) 0， others
其中Cmin为f(x)的最小估计值 • 目标函数为最小化问题
Cmax f ( x), f ( x) Cmax Fitness( f ( x)) 0， others
变异（基因突变）
生物进化与遗传算法对应关系
生物进化
个体个体的竞争力
遗传算法
问题的一个解适应函数
适者生存
染色体
适应值最大的解被保留的概率最大
解的编码
基因
群体
编码的元素
被选定的一组解
种群
交叉变异
根据适应函数选择的一组解
以一定的方式由双亲产生后代的过程编码的某些分量发生变化的过程
例子求函数f(x)=x2的最大值，x为自然数且0≤x≤31.
贪婪算法
min f(x)=xcos(πx) s.t. 0<x<6.
局部最优解全局最优解
X=1.09
X=3.03
X=6
X=5.02
贪婪算法
“困于”局部最优；过分依赖初始点的选取；
智能优化算法
应对困于局部最优的问题；应对大规模穷举带来的计算时间过长的问题
2017/1/
问题
传统算法寻找附近的局部最小值（以求目标函数极小为例）
TSP复杂性
搜索空间庞大
TSP涉及求多个变量的函数的最小值，求解很困难。其可能的路径条数随着城市数目n成指数增长，如， 5个城市对应12条路径；10个城市对应181 440条路径；100个城市对应4.6663X10155条路径。如此庞大的搜索空间，常规解法和计算工具都遇到计算上的困难。只能寻找近似解法。
被选的染色体
随机数
0.27
0.93
0.45
0.70
0.13
0.56
所选号码
2
6
00011
2
11000
5
01100
1
01110
4
10010
所选染色体 11000
选择(Selection)
其他选择法：
随机遍历抽样(Stochastic universal sampling) 局部选择(Local selection) 截断选择(Truncation selection) 竞标赛选择(Tournament selection)
其中Cmaxn为f(x)的最大估计值
选择(Selection)
选择(复制)操作把当前种群的染色体按与适应值成正比例的概率复制到新的种群中主要思想: 适应值较高的染色体体有较大的选择(复制)机会 “轮盘赌”选择(Roulette wheel selection) 将种群中所有染色体的适应值相加求总和，染色体适应值按其比例转化为选择概率Ps 求选择概率的累加序列产生一个在0与总和之间的的随机数r 观察r落在累加序列的什么位置
交叉(crossover, Recombination)
从交配池中随机选取两个个体，以概率Pc(交叉概率) 进行遗传交叉(杂交、交配)。交配后，产生两个具有双亲的部分基因特点的新染色体. 交叉产生两个子染色体，他们与其父代不同，且彼此不同，每个子染色体都带有双亲染色体的遗传基因。
种群中个体的最大适应值超过预设定值种群中个体的平均适应值超过预设定值种群中个体的进化代数超过预设定值
基本步骤
约束的处理--无约束最优化问题
无约束最优化问题:
Min f ( x1 , x2 , xn )
GA编码：
st li xi ui i 1, 2,, n
X=(x1,x2,…,xn)的各个变量可以按二进制编码方法分别编码。对于变量xi的上、下限约束li≤xi ≤ ui(i=1,2,…,n)，依据解的精度要求(有效位数)求得各个变量X=(x1,x2,…,xn)的二进制
例子:部分匹配交叉(PMX)
双亲P1,P2随机选取两个交叉点，得到一个匹配段,根据交叉点中间段给出映射关系。
P1
1 2 3 4 5 6 7 8 9 9 3 7 8 2 6 5 1 4
映射关系： 4 8、5 2、7 5
P2

交换两个交叉点之间的编码,(X表示未定码)
c1 c2
码位数(m1,m2,…,mn)(确定方法类似于SGA实例2)，因此将 n个二进制位串顺序连接起来，构成一个个体的染色体编码，编码的总位数m＝m1+m2+…+mn。
2017/1/
约束的处理--无约束最优化问题
GA解码：
解码时仍按各个变量的编码顺序分别实现常规的二进制编码解码方法。
二进制遗传编码示意图如下：
关于交叉概率：交叉概率Pc 一般范围为(60%, 90%)，平均约80% 例如，交叉概率为0.8，则80%的“夫妻”会生育后代。每两个个体通过交配产生两个新个体，代替原来的“老”个体，而不交配的个体则保持不变。 GA利用选择和交叉操作可以产生具有更高平均适应值和更好染色体的群体
变异(Mutation)
传统做法
生成新的点进行尝试；评价函数；如果改进了之前的解，则接受新的解.
2017/1/
智能优化算法
如果不想在局部困住，则：不能贪婪，不能总是接受好的解；对于新的解，即使比之前的差，有时也会被接受. 采用随机搜索（按照某种机制）本质上是对某种自然现象的模拟对不同现象的模拟，启发了对不同机制的设定
选择(Selection)---轮盘赌演示
设种群的规模为N xi是i为种群中第i个染色体
染色体xi被选概率
ps ( xi )
F ( xi )
F (x )
j 1 j
N
1/6 = 17%
A
B