Primal-Dual Algorithm Examples(原始对偶算法的例子)

合集下载

primal-dual 原始对偶算法

primal-dual 原始对偶算法一、概述Primal-Dual算法是一种用于解决复杂优化问题的算法，尤其在机器学习、统计学习、物流工程等领域有着广泛的应用。

该算法基于原始-对偶问题的思路，通过交替优化原始变量和其对偶变量，最终达到全局最优解。

二、算法原理Primal-Dual算法的基本思想是将原问题转化为一系列对偶问题，通过交替优化原始变量和其对偶变量，最终达到全局最优解。

具体步骤如下：1. 初始化：选择一个初始点作为原始变量的近似解，以及一个初始的解空间。

2. 迭代：在每次迭代中，根据当前解空间，求解对偶问题并更新对偶变量。

同时，根据对偶问题的解更新原始变量的近似解。

3. 终止条件：当满足终止条件（如达到最大迭代次数或解的改变小于预设阈值）时，算法停止。

算法的核心在于通过交替优化原始变量和其对偶变量，逐渐逼近原始问题的最优解。

具体来说，通过求解对偶问题，可以找到与原始问题解空间相关的潜在优化方向，进而通过原始-对偶变量的交替更新，逐渐逼近最优解。

三、算法步骤1. 初始化：选择一个初始点作为原始变量的近似解，以及一个初始的解空间。

2. 迭代：a. 对原始变量进行优化：求解原始问题的对偶问题，得到当前对偶变量的近似解。

根据对偶问题的解，更新原始变量的近似解。

b. 对对偶变量进行优化：根据更新后的原始变量的近似解，重新构造原始问题，并求解原始问题得到新的原始变量近似解。

根据新的原始变量近似解，更新对偶变量的近似解。

3. 终止条件：检查是否满足终止条件（如达到最大迭代次数或解的改变小于预设阈值），若满足则停止迭代，否则返回第二步。

四、优缺点Primal-Dual算法具有以下优点：1. 算法具有较强的自适应性，能够根据问题的特性自动调整优化方向，从而更有效地找到最优解。

2. 算法适用于处理大规模复杂优化问题，能够处理高维、非线性、非凸等复杂问题。

3. 算法具有全局搜索能力，能够找到全局最优解。

然而，Primal-Dual算法也存在一些缺点：1. 算法的收敛性依赖于初始点的选择，如果初始点选择不当，可能会导致算法陷入局部最优解或无法收敛。

内点法介绍(Interior Point Method)

内点法介绍（Interior Point Method）在面对无约束的优化命题时，我们可以采用牛顿法等方法来求解。

而面对有约束的命题时，我们往往需要更高级的算法。

单纯形法（Simplex Method）可以用来求解带约束的线性规划命题（LP），与之类似的有效集法（Active Set Method）可以用来求解带约束的二次规划（QP），而内点法（Interior Point Method）则是另一种用于求解带约束的优化命题的方法。

而且无论是面对LP还是QP，内点法都显示出了相当的极好的性能，例如多项式的算法复杂度。

本文主要介绍两种内点法，障碍函数法（Barrier Method）和原始对偶法（Primal-Dual Method）。

其中障碍函数法的内容主要来源于Stephen Boyd与Lieven Vandenberghe的Convex Optimization一书，原始对偶法的内容主要来源于Jorge Nocedal和Stephen J. Wright的Numerical Optimization一书（第二版）。

为了便于与原书对照理解，后面的命题与公式分别采用了对应书中的记法，并且两者方法针对的是不同的命题。

两种方法中的同一变量可能在不同的方法中有不同的意义，如μ。

在介绍玩两种方法后会有一些比较。

障碍函数法Barrier MethodCentral Path举例原始对偶内点法Primal Dual Interior Point Method Central Path举例几个问题障碍函数法（Barrier Method）对于障碍函数法，我们考虑一个一般性的优化命题：minsubject tof0(x)fi(x)≤0,i=1,...,mAx=b(1) 这里f0,...,fm:Rn→R 是二阶可导的凸函数。

同时我也要求命题是有解的，即最优解x 存在，且其对应的目标函数为p。

此外，我们还假设原命题是可行的（feasible）。

最小二乘模型下图像恢复的原-对偶算法的研究

最小二乘模型下图像恢复的原-对偶算法的研究何姣姣;庹谦;陈剑鸣【摘要】由于正则化方法进行图像恢复过程中，往往需要调正则化参数，不同的图像要想得到较好的恢复效果，正则化参数可能并不相同。

这里建立最小二乘模型进行模糊图像恢复，不需要调节正则化参数，简化了恢复过程。

文中采用一阶原－对偶方法解带约束的最小二乘问题的图像恢复，并在原－对偶的解法上加以改进，采用整体代换的方法计算。

实验证明，采用最小二乘模型的原－对偶的改进算法大大节省了迭代运算的时间，且在恢复无噪声的图像时不管是视觉感受上还是从PSNR 峰值来看，恢复效果比原－对偶算法好。

%As the regularization method is used to carry out the process of image restoration,the regu-larization parameter is often needed.There should be different regularization parameter for the different im-age.The least square method is used to recover the fuzzy image,and it is not required to adjust the regulari-zation parameter,and the recovery process is simplified.In this paper,the first-order original-dual method is used to solve constraint least squares problem of image recovery,and an improved algorithm is put forward which using the method of overall substitution calculation.The experimental results show that the primal dual algorithm for least squares model using iterative computation time is greatly saved,and the improved primal-dual algorithm in the noise free image restoration effect is better than that of the primal dual algo-rithm.【期刊名称】《曲阜师范大学学报（自然科学版）》【年(卷),期】2016(000)001【总页数】6页(P72-77)【关键词】正则化参数;模糊图像;图像恢复;最小二乘算法;原-对偶算法【作者】何姣姣;庹谦;陈剑鸣【作者单位】昆明理工大学理学院，650500，云南省昆明市;昆明理工大学理学院，650500，云南省昆明市;昆明理工大学理学院，650500，云南省昆明市【正文语种】中文【中图分类】TP751.1随着人们生活水平的提高，对生活质量的要求也越来越高，及时有效获取清晰的图像也显得尤为重要．但在图像的获取、压缩、传输的过程中往往会发生模糊，所以我们需要采取有效的方法来使图像变得清晰．图像恢复是图像退化的逆过程，往往需要使用图像退化的先验知识来恢复图像，根据不同的退化原因，建立相应的数学模型来求解原始图像．李国立等[1]使用最小二乘滤波器以及平滑约束最小二乘滤波器来实现模糊图像的恢复；何蕾等[2]采用先对模糊图像进行四阶偏微分方程的方法对图像的噪声进行处理，再使用最小二乘正则化方法来恢复模糊图像，有效解决模糊图像当中噪声问题；鲁晓东[3]基于奇异值分解和重构的方法对运动模糊图像进行恢复处理，避免了图像恢复的病态问题；段立晶[4]提出基于方向测度的约束最小二乘算法，在边缘信息保持与噪声平滑之间取得了更好的折中．最小二乘正则化方法往往需要考虑正则化参数的选取，给图像恢复处理带来了一定困难．文中使用最小二乘正则化模型，采用原-对偶算法及其改进算法解最小二乘问题，避免了正则化参数的选择．仿真实验表明，采用文中算法及其改进算法大大减少了恢复处理时间，图像的恢复效果也较好．1.1 退化模型图像模糊的过程用数学表达式可以表示为g=Ax+n，式中g表示模糊图像，A表示模糊矩阵，n是模糊图像的加性噪声．文中以最小二乘正则化为模型，其中A∈Rm×n，m≥n，g∈Rm，λ∈R．由于图像像素值的有界性，x满足式(1)的约束条件，A为模糊矩阵，g是观察图像[5]．文中采用两种方法来解上述最小二乘问题，原-对偶算法以及改进的原-对偶算法．1.2 原-对偶算法原理对偶理论是最优化中很重要的理论．对每一个线性规划问题，可以构造另一个与之相应且密切相关的线性规划问题，如果前者称为原始问题，那么后者就称为对偶问题[6]．对一些线性规划问题，求其对偶问题有时更便捷．对某些解这样需要构造新的问题来解决问题的方法，称为原-对偶法．定义假设函数F(x，y)关于变量x是凸函数，而关于变量y是凹函数．如果存在(x*，y*)，对任意的x∈X，y∈Y使得成立，我们就称(x*，y*)是函数F(x，y)的鞍点．Chambolle和Pock[7]研究了如下最小最大问题的解其中φ(x)，ψ(y)是下半连续的、正常的凸函数．K是一个线性矩阵．他们结合以往的算法，得到新的迭代形式：其中参数s，t>0分别表示原变量步长、对偶变量步长．θ是一个组合参数，如果选择适当的值可以保证算法的收敛性．当(k+1)=x(k+1)，即θ=0时，我们知道，上面的迭代算法等价于古典的Arrow-Hurwicz算法[8]．当步长满足2且θ=1时，算法以O(1/k)速度收敛．如果函数φ(x)，ψ(y)关于x，y具有分离的结构，则该算法没有求矩阵逆的运算，迭代算法只进行矩阵与向量乘的运算，在实际中应用广泛．该算法推广至一般求鞍点问题为1.3 原-对偶算法的计算由于x是有约束的，而解最小二乘问题时，针对文中问题的原-对偶问题，令2，z=x，那么φ，则原-对偶问题所对应的Lagrange函数为其中，满足x-z=0，x∈RN，α≤z≤β，这样x变为无约束的变量．问题则由求约束最小二乘变为求解无约束问题[9]．定义变量K=(I，-I)，其中I为单位矩阵，我们的问题就类似于式(3)的最小最大问题，即那么，即是求将上式(12)配方代换求导后解得x(k+1)的迭代公式．给定初值x(0)，z(0)，y(0)，求解第k次迭代形式为算法过程为算法1为了简化原-对偶算法的迭代过程，对原-对偶算法进行了改进，上一节当中我们是令z=x，这里我们是令z=Ax-g，进而进行整体迭代，则求最小二乘最小化问题的原-对偶问题变为求2，s.t.x=A-1(z+g)，其对应的Lagrange函数为这时x称为无约束变量，显然当z=A-Ty时，式(16)有最小值．则函数等价于如下形式其中c=A-1g．接下来化简求解即可．由计算过程可知计算步骤明显减少，这就意味着迭代更简洁．改进的原-对偶算法过程如下．本节分别应用原-对偶算法和改进的原-对偶算法进行仿真实验．实验环境为CPU：Pentium Dual E2200处理器，主频：2.2GHz．内存2GB，2.2GHz．实验平台为MATLAB2012a版本．在最小二乘模型当中，A为散焦半径为3的模糊矩阵．观察图像g=Ax+ην，其中η为噪声水平，ν为高斯噪声，对模糊图像进行恢复仿真实验，理论上采用峰值信噪比(PSNR)[10]来评价恢复的图像，表达式为,其中i和xi分别表示恢复图像和真实的图像．显然，PSNR值越大，恢复图像越接近真实图像，恢复效果越好．我们从峰值信噪比方面，当噪声水平为1，3，5，7时，对两种算法的PSNR峰值比较，结果见表1．由表1可知改进的PD算法的PSNR峰值要高于PD算法，即使在噪声水平增加的情况下，效果也略好．由表1可知，改进的原-对偶算法相比而言具有一定的抗噪性．图1给出噪声水平为1时PSNR与CPU Time(s)变化曲线值，显然update-PD算法的PSNR值随时间增加的要快．图2给出图像处理结果对比图．3幅不同的灰度图像经运动模糊并加噪声，后采用PD算法以及改进的PD算法的恢复效果图，仔细观察发现，改进的PD算法的视觉效果优于PD算法．本文研究了以最小二乘算法为模型使用原-对偶方法来求解的模糊图像恢复算法，并对原-对偶算法进行了改进．由实验结果可知，针对不同大小尺寸的图像，原-对偶算法及其改进的算法运算时间均为十秒左右．在相同峰值信噪比的情况下，改进的原-对偶算法所需的时间更短．改进的原-对偶算法在一定程度上能够较好的恢复出模糊图像，显而易见噪声水平为1时其PSNR峰值比原-对偶算法的平均高0.7dB．。

普里姆算法—Prim算法

普⾥姆算法—Prim算法普⾥姆算法—Prim算法算法思路：⾸先就是从图中的⼀个起点a开始，把a加⼊U集合，然后，寻找从与a有关联的边中，权重最⼩的那条边并且该边的终点b在顶点集合：（V-U）中，我们也把b加⼊到集合U中，并且输出边（a，b）的信息，这样我们的集合U就有：{a,b}，然后，我们寻找与a关联和b关联的边中，权重最⼩的那条边并且该边的终点在集合：（V-U）中，我们把c加⼊到集合U中，并且输出对应的那条边的信息，这样我们的集合U就有：{a,b,c}这三个元素了，⼀次类推，直到所有顶点都加⼊到了集合U。

（普⾥姆算法是允许负数的，狄杰斯特拉算法不⽀持）下⾯我们对下⾯这幅图求其最⼩⽣成树：1.假设我们从顶点v1开始，所以我们可以发现（v1,v3）边的权重最⼩，所以第⼀个输出的边就是：v1—v3=1:2.然后，我们要从v1和v3作为起点的边中寻找权重最⼩的边，⾸先了（v1,v3）已经访问过了，所以我们从其他边中寻找，发现(v3,v6)这条边最⼩，所以输出边就是：v3—-v6=43.然后，我们要从v1、v3、v6这三个点相关联的边中寻找⼀条权重最⼩的边，我们可以发现边(v6,v4)权重最⼩，所以输出边就是：v6—-v4=2.4.然后，我们就从v1、v3、v6、v4这四个顶点相关联的边中寻找权重最⼩的边，发现边（v3，v2）的权重最⼩，所以输出边：v3—–v2=55.然后，我们就从v1、v3、v6、v4，v2这2五个顶点相关联的边中寻找权重最⼩的边，发现边（v2，v5）的权重最⼩，所以输出边：v2—–v5=36.最后，我们发现六个点都已经加⼊到集合U了，我们的最⼩⽣成树建⽴完成。

Prim算法#include<stdio.h>#include<stdlib.h>#include<malloc.h>#include<string.h>#define MAX 100#define INF (~(0x1<<31))typedef struct Graph{char vexs[MAX];int vexnum;int edgnum;int matrix[MAX][MAX];} Graph,*PGraph;typedef struct EdgeData{char start;char end;int weight;} EData;static int get_position(Graph g,char ch){int i;for(i=0; i<g.vexnum; i++)if(g.vexs[i]==ch)return i;return -1;}Graph* create_graph(){char vexs[]= {'A','B','C','D','E','F','G'};int matrix[][7]={{0,12,INF,INF,INF,16,14},{12,0,10,INF,INF,7,INF},{INF,10,0,3,5,6,INF},{INF,INF,3,0,4,INF,INF},{INF,INF,5,4,0,INF,8},{16,7,6,INF,2,0,9},{14,INF,INF,INF,8,9,0}};int vlen=sizeof(vexs)/sizeof(vexs[0]);int i,j;Graph *pG;if((pG=(Graph*)malloc(sizeof(Graph)))==NULL) return NULL;memset(pG,0,sizeof(pG));pG->vexnum=vlen;for(i=0; i<pG->vexnum; i++)pG->vexs[i]=vexs[i];for(i=0; i<pG->vexnum; i++)for(j=0; j<pG->vexnum; j++)pG->matrix[i][j]=matrix[i][j];for(i=0; i<pG->vexnum; i++){for(j=0; j<pG->vexnum; j++){if(i!=j&&pG->matrix[i][j]!=INF)pG->edgnum++;}}pG->edgnum/=2;return pG;}void print_graph(Graph G){int i,j;printf("Matrix Graph: \n");for(i=0; i<G.vexnum; i++){for(j=0; j<G.vexnum; j++)printf("%10d ",G.matrix[i][j]);printf("\n");}}EData* get_edges(Graph G){EData *edges;edges=(EData*)malloc(G.edgnum*sizeof(EData)); int i,j;int index=0;for(i=0; i<G.vexnum; i++){for(j=i+1; j<G.vexnum; j++){if(G.matrix[i][j]!=INF){edges[index].start=G.vexs[i];edges[index].end=G.vexs[j];edges[index].weight=G.matrix[i][j];index++;}}}return edges;}void prim(Graph G,int start){int min,i,j,k,m,n,sum;int index=0;char prim[MAX];int weight[MAX];prim[index++]=G.vexs[start];for(i=0; i<G.vexnum; i++)weight[i]=G.matrix[start][i];weight[start]=0;for(i=0; i<G.vexnum; i++){//i⽤来控制循环的次数，每次加⼊⼀个结点，但是因为start已经加⼊，所以当i为start是跳过 if(start==i)continue;j=0;k=0;min=INF;for(k=0; k<G.vexnum; k++){if(weight[k]&&weight[k]<min){min=weight[k];j=k;}}sum+=min;prim[index++]=G.vexs[j];weight[j]=0;for(k=0; k<G.vexnum; k++){if(weight[k]&&G.matrix[j][k]<weight[k])weight[k]=G.matrix[j][k];}}// 计算最⼩⽣成树的权值sum = 0;for (i = 1; i < index; i++){min = INF;// 获取prims[i]在G中的位置n = get_position(G, prim[i]);// 在vexs[0...i]中，找出到j的权值最⼩的顶点。

用原始_对偶算法求解过指定顶点的最短路

西北纺织工学院学报
Jo ur nal o f Nort hw est Insti tut e of T ex ti le Science and T echno logy
第 10卷第 3期 (总 39期 )
1996年 9月
Vo l. 10, No. 3( Sum No. 39)
用原始 -对偶算法求解过指定顶点的最短路
图1
如图 1,求 vs到 vt 经 v1 , v3 点的最短路 . 解 c= ( ys , y1 , y2 , y3 , y4 , z1 , z3 ) , y1 , z1 与 v1 对应 , y3 , z3 与 v3 对应 ,其余 yi 与 vi 对应 , i = s, 2, 4, 将各变量取值分别写在对应的顶点旁 .
的最优解 .而 J 中由 vs到 vt 经 v 1 , v 2 ,…… , vk
的任何路均为最优 ,或问题 ( P) 无可行解 .
实际应用时 ,由问题 ( D)及 ( DRP)中变
量的意义 ,可将解写在对应的顶点上 ,即对
应于指定顶点 ,有两个变量与之对应 ,其它
顶点 ,有一个变量与之对应 .
4 应用举例
作为一个优化问题 ,此问题的可行解集 F = { P = ( ej 1 , ej 2 ,… , ejl )|P 为一个弧序列 ,且
∑ 为 vs 到 vt 过指定顶点 v1 , v2 ,… , vk 的有向路 } ,价值函数为 C ( P ) = C ( eji ) .
ej
∈ i
P
1 线性规划模型的建立
mi n CT f
1
0
Af = 0 m行
, f ≥ 0.
( P)
1
1
其中 A =

应用运筹学基础：线性规划（4）-对偶与对偶单纯形法

应⽤运筹学基础：线性规划（4）-对偶与对偶单纯形法这⼀节课讲解了线性规划的对偶问题及其性质。

引⼊对偶问题考虑⼀个线性规划问题：$$\begin{matrix}\max\limits_x & 4x_1 + 3x_2 \\ \text{s.t.} & 2x_1 + 3x_2 \le 24 \\ & 5x_1 + 2x_2 \le 26 \\ & x \ge0\end{matrix}$$ 我们可以把这个问题看作⼀个⽣产模型：⼀份产品 A 可以获利 4 单位价格，⽣产⼀份需要 2 单位原料 C 和 5 单位原料 D；⼀份产品 B 可以获利 3 单位价格，⽣产⼀份需要 3 单位原料 C 和 2 单位原料 D。

现有 24 单位原料 C，26 单位原料 D，问如何分配⽣产⽅式才能让获利最⼤。

但假如现在我们不⽣产产品，⽽是要把原料都卖掉。

设 1 单位原料 C 的价格为 $y_1$，1 单位原料 D 的价格为 $y_2$，每种原料制定怎样的价格才合理呢？⾸先，原料的价格应该不低于产出的产品价格（不然还不如⾃⼰⽣产...），所以我们有如下限制：$$2y_1 + 5y_2 \ge 4 \\ 3y_1 + 2y_2 \ge3$$ 当然也不能漫天要价（也要保护消费者利益嘛- -），所以我们制定如下⽬标函数：$$\min_y \quad 24y_1 + 26y_2$$ 合起来就是下⾯这个线性规划问题：$$\begin{matrix} \min\limits_y & 24y_1 + 26y_2 \\ \text{s.t.} & 2y_1 + 5y_2 \ge 4 \\ & 3y_1 + 2y_2 \ge 3 \\ & y \ge 0\end{matrix}$$ 这个问题就是原问题的对偶问题。

对偶问题对于⼀个线性规划问题（称为原问题，primal，记为 P） $$\begin{matrix} \max\limits_x & c^Tx \\ \text{s.t.} & Ax \le b \\ & x \ge 0\end{matrix}$$ 我们定义它的对偶问题（dual，记为 D）为 $$\begin{matrix} \min\limits_x & b^Ty \\ \text{s.t.} & A^Ty \ge c \\ & y \ge 0\end{matrix}$$ 这⾥的对偶变量 $y$，可以看作是对原问题的每个限制，都⽤⼀个变量来表⽰。

运筹学术语(新版11)

翻译以下英文术语，并深入了解术语的含义。

1.optimal solution：最优解，使目标函数取得最大值的可行解。

P352.objective function：目标函数,指需优化的量，即欲达的目标，用决策变量的表达式表示。

P123.feasible region：可行域，指所有可行解的集合。

P284. simplex method：单纯形法：是一种迭代的算法，其核心思想是不仅将取值范围限制在顶点上，而且保证每换一个顶点，目标函数值都有所改善．P1175. BF solutions：基可行解，满足变量非负约束条件的基解称为基可行解。

P1816. sensitivity analysis：敏感性分析：指对系统或事物因周围条件变化显示出来的敏感程度的分析。

P1467. algorithm：算法，指系统的求解过程。

p1078. spanning tree：生成树，若有限图的生成子图是一棵树，则称为该图的生成树。

树指不含有圈的连通网。

P3799. states：状态，各阶段开始时的客观条件. P44510.directed arc：有向弧，指通过一条弧的流只有一个方向的弧。

P37611. unbounded：无界，指约束条件不能阻止目标函数值在有利的方向上（正的或者负的）增长。

P3512. CPF solution：顶点（角点）可行解，指位于可行域顶点的解。

P3713. functional constraints：约束条件，指决策变量取值时受到的各种资源条件的限制，通常表达为含决策变量的等式或不等式。

P3414 multiple optimal solutions：多个最优解的问题，指有无穷多解，每一个解都有相同的目标函数值的问题。

P12215. slack variable：松弛变量，添加x i到约束条件的不等式中使其变为等式的变量P10816. augmented solution：增广解，指原始变量（决策变量）取值再加入相应的松弛变量取值后而形成的解。

2.2.3初始对偶可行基本解的获得

3. 初始对偶可行基本解的获得⏹刚才所讲的对偶单纯形法是要求有一个初始的对偶可行基本解。

如果我们拿到的是一个不含初始对偶可行基本解，但又要求我们用对偶单纯形法求解时，我们就无能为力了，为此我们还必须研究初始的对偶可行基本解的获得。

⏹这里需要我们构造一个扩充问题，试图通过求解扩充问题而获得初始的对偶可行基本解。

不妨设原问题：1111111221122211110m m k k n n m m k k n n m mm m mk k mn n mm m k k n n x a x a x a x b x a x a x a x b x a x a x a x b c x c x c x z +++++++++++++=+++++=+++++=+++++=−构造的扩充问题为：1111111*********m m k k n nm m k k n nm mm m mk k mn nm x a x a x a x b x a x a x a x b x a x a x a x b +++++++++++=+++++=+++++=max ..0B j j j n mz cx s t x P x bx ∈−=+=≥∑11m k n n x x x x M++++++++= 110m m k k n nc x c x c x z +++++++=− 即：1max ..(*)0,1,,1B j j j n mj n j n mj z cxs t x P x bx x Mx j n ∈−+∈−=+=+=≥=+∑∑其中M 是很大的数。

则系数矩阵前m 列和第n+1列组成的m+1阶单位矩阵可为扩充问题的一个基，立即得到：1,0,B Bj n x b x x j n m x M +′===∈−这个基不一定是对偶可行的。

不失一般性，我们假设是不可行的，但需要说明的是，由此出发可以求得该扩充问题的一个对偶可行基。

即：现在假定让新加入的变量x n+1离基，由于对偶基不可行，必然有判别数大于0，选取最大判别数的非基变量进基，即σk =max {σj |σj >0}则通过旋转运算后的新判别数为：11kj j m jm ka a σσσ++′=−0j j k σσσ′∴=−≤所以旋转运算后所得的新基为对偶可行基。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

+1 0 . . 0

fj ≥ 0 for all j fj = 0 j ∈ /J xa i ≥ 0
3
Restricted primal (RP) min ξ =

m−1 a i=1 xi
a Af + x =
+1 0 . . 0

fj ≥ 0 for all j fj = 0 j ∈ /J xa i ≥ 0
RP ⇒ DRP DRP max w = πs πi − πj ≤ 0 πi ≤ 1 πi ≷ 0 πt = 0
∀(i, j ) ∈ J
4
Have seen P ⇒ D ⇒ RP ⇒ DRP Note differences between D and DRP Dual max πs πi − πj ≤ cij (i, j ) ∈ E πi ≷ 0 πt = 0 J = {(i, j ) ∈ E : πi − πj = cij }
DRP: π =( 1, 0, 0, 0, 0)
5
2
0
0
6
J= {7, 6, 5, 4, 2} 5 4 Iteration 5
0
0
0
D: π =( 6, 5, 5, 2, 4)
DRP: π =( 0, 0, 0, 0, 0)
10
We will now see that the Primal-dual algorithm is, essentially, a disguised version of Dijkstra’s shortest path algorithm. For simplicity, assume that all edge costs are ≥ 0 so we can start with feasible dual π = 0. An iteration will be one step of solving DRP and updating D. Let W = {j : t is reachable from j using edges in J }. When we ﬁrst start, J = ∅ so W = {t}. Lemma: Once a node enters W it never leaves W . Each iteration adds at least one new node to W . Lemma: The algorithm terminates in < V iterations. Lemma: Once j enters W , πj never changes. At any time, all i ∈ W share same value πi.
Af =
+1 0 . . 0
←− Row s
f ≥0
Dual is
max πs πi − πj ≤ cij ∀(i, j ) ∈ E πi ≷ 0 ∀ i πt = 0
Note that πt = 0 must be added in for consistency; in this case πt is a constant and not a variable.
7
Our algorithm only terminates if there is a path from s to t in J which we saw implied optimality (shortest path). So, to prove optimality, sufﬁces to prove that algorithm terminates. Technically, the proof for ﬁniteness of generic PrimalDual algorithm doesn’t work for this case since it assumed that we used simplex to solve RP to give optimal solution to DRP. Since we solved DRP directly without solving RP, that proof doesn’t apply here. Finiteness, and therefore optimality, will follow, though, from two simple observations about DRP. Lemma: Once edge (i, j ) becomes admissible (enters J ) it never leaves J at any later stage. Lemma: At every iteration of DRP, at least one new (i, j ), the one that deﬁnes θ1, becomes admissible.
arcs(i,j )∈ /J s.t. π ¯i−π ¯j >0
min
{cij − (πi − πj )} {cij + πj }
= −α +
i∈W, j ∈W
min
Lemma: When (i, j ) becomes admissible, i enters W with πi = ci,j + πj Proof: π ∗ = π + θ1π ¯ ∗ = π + (c − (π − π ))1 = c + π Then πi i ij i j ij j
Primal-Dual Algorithm Examples We just saw the general primal-dual algorithm schema. We will now see how to apply it to the Shortest Path Problem and the Max Flow Problem
π ¯i =
1 If i is reachable from s using arcs in J
0 If t is reachable from i using arcs in J
1 Otherwise
We then set θ1 =
arcs(i,j )∈ /J s.t. π ¯i−π ¯j >0
DRP max w = πs πi − πj ≤ 0 πi ≤ 1 πi ≷ 0 πt = 0
(i, j ) ∈ J
5
DRP max w = πs πi − πj ≤ 0 πi ≤ 1 πi ≷ 0 πt = 0 (i, j ) ∈ J
The generic Primal-Dual algorithm solves RP using simplex and then uses the optimal solution of RP to derive optimal solution π ¯ of DRP. In this case it turns out to be easy to derive optimal solution to DRP directly. First note that if there is a path from s to t using only edges in J then optimal cost of RP is ξ = 0 (why?) and we have reached optimality in the original primal and dual. We may therefore assume that there is no path from s to t using only edges in J .
1
1
D: π =( 0, 0, 0, 0, 0)
DRP: π =( 1, 1, 1, 1, 1)
2
2
1
0
2
J = {7}
1 θ1=2 for arc e6
2
2 Iteratio
DRP: π =( 1, 1, 1, 0, 1)
4
2
1
0
4
J = {7, 6}
11
W = {j : t is reachable from j using edges in J }.
Lemma: When (i′, j ′) becomes admissible it satisﬁes ci′,j ′ + πj ′ =
i∈W, j ∈W
min
{ci,j + πj }.
Proof: Let α = πi for all i ∈ W at start of current iteration.Then θ1 =
min
{cij − (πi − πj )}
π = π + θ1 π ¯ update J and continue with our new DRP. Note that we have replaced solving the original Primal, Shortest Path problem, with the repeated application of the simpler DRP, Finding reachable nodes problem.
12
W = {j : t is reachable from j using edges in J }. We start with J = ∅ and W = {t}. Each iteration of the algorithm ﬁnds Edge (i, j ) that achieves mini∈W, j ∈W {ci,j + πj } and then i) adds the new edge(s) to J ii) adds i to W with cost πi = ci,j + πj . But this is exactly the same as running Dijkstra’s shortest path algorithm backwards from t.