约束优化方法--惩罚函数法

2023-10-04 07:13:16

基本介绍

考虑一般的约束优化问题
$\begin{align*} &\min f(\mathbf{x})\\ &s.t.\quad g_i(\mathbf{x})\le 0, i=1,2,...,m,\\ &\quad\qquad h_j(\mathbf{x})=0, j=1,2,...,p,\\ &\quad\qquad\mathbf{x}\in X\subset\mathbf{R^n},\mathbf{x}=(x_1,x_2,...,x_n)^T. \end{align*}$
其中 $f,g_i,h_j\in C^1$ .

惩罚函数法的基本思想是：把约束问题转化为一个或一系列无约束问题求解, 所以也称为序列无约束极小化技术(Sequential Unconstrained Minimization Technique), 简称SUMT法.

具体思路：根据约束的特点，构造某种惩罚函数加入到目标函数中建立无约束问题，利用惩罚策略，对于无约束问题求解过程中企图违反约束的迭代点给予很大的目标函数值，迫使无约束问题的极小点无限靠近可行域或保持在可行域内移动，直至迭代点列收敛到原约束问题极小点。

构造方法

下面以仅含等式约束的优化问题为例给出相应的构造方法：
$\begin{align*} & \min f(\mathbf{x}),\mathbf{x}\in \mathbf{R^n}\\ & s.t \quad c_i(\mathbf{x})=0,i\in E=\{1,...,l\}. \end{align*}$
构造形如
$F(\mathbf{x},M)=f(\mathbf{x})+M\sum_{i=1}^l|c_i(x)|^{\beta}, \beta\ge1$
的函数, 其中 $M > 0$ 为参数, 称为罚因子.

若记原约束问题的可行域为 $D$ , 对于惩罚项 $p(\mathbf{x})=\sum_{i=1}^l|c_i(x)|^{\beta},\beta\ge 1$ ,

当 $\mathbf{x}$ 为可行解, 即 $\mathbf{x}\in D$ 时, $c_i(x)=0,p(x)=0,F(\mathbf{x},M)=f(x)$ , 不受惩罚；
当 $\mathbf{x}$ 不是可行解时, 即$\mathbf{x}\notin $D时, $c_i(x)\ne 0,p(x)>0, F(\mathbf{x},M)=f(x)+p(x)>0$ , 即约束条件被破坏是一种惩罚, 且 $M$ 越大, 惩罚越重.

此时, 为使 $F(\mathbf{x},M)$ 取得极小值, $p (x)$ 应充分小, 即 $F(\mathbf{x},M)$ 的极小点应充分逼近可行域, 当然也希望它能够逼近最优解.

从上述过程中, 我们可以体会到惩罚项及罚函数的意义, 即惩罚破坏约束的迭代点从而使目标函数的极小点逼近可行域或在可行域中移动.

此外, 我们还可以得出惩罚项构造要满足的条件：

$p(\mathbf{x})$ 连续；
$\forall \mathbf{x}\in\mathbf{R^n}, p(\mathbf{x})\ge 0$ ;
$\forall \mathbf{x}\in S, p(\mathbf{x})=0$ .

下面考虑不等式约束的优化问题：
$\begin{align*} & \min f(\mathbf{x}), \mathbf{x}\in \mathbf{R^n}\\ & s.t. \quad c_i(\mathbf{x})\ge 0, i\in I=\{1,2,...,m\}. \end{align*}$
类似地构造如下函数
$F(\mathbf{x},M)=f(\mathbf{x})+Mp(\mathbf{x}),\quad M>0,$
其中
$p(\mathbf{x})= \begin{cases} & 0,\quad c_i(\mathbf{x})\ge 0,\\ & \sum_{i=1}^{m}|c_i(\mathbf{x})|^{\alpha}, \alpha\ge 1, c_i(\mathbf{x})<0. \end{cases}$
也可以写成
$p(\mathbf{x})=\sum_{i=1}^m|\min(0,c_i(x))|^\alpha=\sum_{i=1}^m(\frac{|c_i(x)|-c_i(x)}{2})^\alpha, \quad \alpha\ge 1.$
同样地, 惩罚项仍符合前述的惩罚策略.

最后, 对于一般的约束优化问题
$\begin{align*} &\min f(\mathbf{x})\\ & s.t. \quad c_i(\mathbf{x})=0, i\in E={1,2,...,l},\\ & \quad\qquad c_i(\mathbf{x})\ge 0,i\in I={l+1,...,m}. \end{align*}$
其可行域为 $D=\{\mathbf{x}\in \mathbf{R^n}|c_i(x)=0,i\in E; c_i(x)\ge 0,i\in I\}$ .

构造如下函数
$F(\mathbf{x},M)=f(\mathbf{x})+Mp(\mathbf{x}), M>0,\quad(1)$
其中
$p(\mathbf{x})=\sum_{i=1}^l|c_i(\mathbf{x})|^\beta+\sum_{j=l+1}^m|\min(0,c_j(\mathbf{x}))|^\alpha, \alpha\ge1,\beta\ge 1.\quad(2)$
显然, 当 $\mathbf{x}\in D$ 时, $p(\mathbf{x})=0$ ; 当 $\mathbf{x}\notin D$ 时, $p(\mathbf{x})>0$ .

式 $(1)$ 称为约束问题的增广目标函数, $(2)$ 是一般约束问题的罚函数, $M > 0$ 是罚因子, 通常取 $\alpha=\beta=2$ .

也就是说, 一般约束问题的求解转化为求增广目标函数的无约束极小, 即 $\min F(\mathbf{x},M_k),\{M_k\}$ 为正的数列, 且 $\{M_k\}\rightarrow \infty$ . 此外, 还要注意的是, 无约束问题最优解的极限是原问题的最优解.

应用举例

例1

求解约束问题
$\begin{align*} & \min \quad f(x)=(x_1-3)^2+(x_2-2)^2\\ & s.t. \quad h(x)=x_1+x_2-4=0. \end{align*}$
解：
$F(\mathbf{x},M)=(x_1-3)^2+(x_2-2)^2+M(x_1+x_2-4)^2.$
则有
$\begin{align*} & \frac{\partial F}{\partial x_1}=2(x_1-3)+2M(x_1+x_2-4),\\ & \frac{\partial F}{\partial x_2}=2(x_2-2)+2M(x_1+x_2-4). \end{align*}$
令 $\frac{\partial F}{\partial x_1}=0,\frac{\partial F}{\partial x_2}=0$ , 得
$x_1=\frac{5M+3}{2M+1},x_2=\frac{3M+2}{2M+1}.$
又由 $\frac{\partial^2 F}{\partial x_1^2}=2(M+1),\frac{\partial^2 F}{\partial x_2^2}=2(M+1),\frac{\partial^2 F}{\partial x_1\partial x_2}=2M$ ，可得
$\nabla^2 F= \begin{bmatrix} 2(M+1)& 2M\\ 2M & 2(M+1) \end{bmatrix} .$
$M>0\Rightarrow\nabla^2 F$ 正定. 因此, $F(\mathbf{x},M)$ 在 $(\frac{5M+3}{2M+1},\frac{3M+2}{2M+1})^T$ 取得极小值. 令 $M\rightarrow +\infty$ , 则原约束问题的最优解为
$x^{*}=\lim_{M\rightarrow+\infty} \mathbf{x}(M)=(\frac{5}{2},\frac{3}{2})^T.$

例2

求解约束问题
$\begin{align*} & \min \quad f(x)=x_1^2+x_2^2\\ & s.t. x_1+1\le 0. \end{align*}$
解：

首先要将约束条件改写成 $-x_1-1\ge 0$ ！
$F(\mathbf{x},M)=x_1^2+x_2^2+M[\min(0,-x_1-1)]^2= \begin{cases} x_1^2+x_2^2, x_1+1\le 0,\\ x_1^2+x_2^2+M(x_1+1)^2,x_1+1>0. \end{cases}$
故
$\frac{\partial F}{\partial x_1}= \begin{cases} 2x_1,x_1<-1,\\ 2x_1+2M(x_1+1),x_1>-1. \end{cases} \frac{\partial F}{\partial x_2}=2x_2.$
令 $\frac{\partial F}{\partial x_1}=0,\frac{\partial F}{\partial x_2}=0$ , 得
$x_1=\frac{-M}{M+1},x_2=0.$
类似地, 有 $M>0\Rightarrow\nabla^2 F$ 正定. 因此, $F(\mathbf{x},M)$ 在 $(\frac{-M}{M+1},0)^T$ 取得极小值. 令 $M\rightarrow +\infty$ , 则原约束问题的最优解为
$x^{*}=\lim_{M\rightarrow+\infty} \mathbf{x}(M)=(-1,0)^T.$
且
$F(\mathbf{x},M)=(-\frac{M}{M+1})^2+M(\frac{1}{M+1})^2=\frac{M}{M+1}\rightarrow f(x^{*})=1.$
Remark: 虽然 $\mathbf{x}(M)\rightarrow x^{*}(M \rightarrow +\infty)$ , 但 $\mathbf{x}(M)$ 往往不满足约束条件, 如在例1中 $x_1(M)+x_2(M)=\frac{4M}{2M+1}\ne 1$ , 在例2中 $x_1(M)=-\frac{M}{M+1}>-1$ , 且 $\mathbf{x}(M)$ 都从可行域外部趋向于 $x^*$ , 因此惩罚函数法也称为外罚函数法.

算法流程

已知约束问题, 取控制误差 $\varepsilon>0$ 和罚因子放大系数 $\varepsilon=10^{-4},c=10)$ .

步骤1 给定初始点 $x_0$ (可以不在可行域内)和初始惩罚因子 $M_1=1$ , 令 $k = 1$ .

步骤2 以 $x_{k-1}$ 为初始点求无约束问题
$\min F(\mathbf{x},M_k)=f(\mathbf{x})+M_kp(x)$
得最优解 $\mathbf{x}_k=\mathbf{x}(M_k)$ .

步骤3 若 $M_kp(\mathbf{x_k})<\varepsilon$ , 则以 $\mathbf{x}_k$ 为近似最优解, 停止; 否则令 $M_{k+1}=cM_k,k=k+1$ , 转步骤2.

计算实例

求解约束问题
$\begin{align*} & \min f(\mathbf{x})=(x_1-2)^4+(x_2-2x_1)^2\\ & s.t. \quad x_1^2-x_2=0. \end{align*}$
易知该问题的最优解为 $2,4)^T$ .

取 $\mathbf{x}_0=(2,1)^T,M_1=0.1,c=10,\varepsilon=0.01,\beta=2,$ 求解
$\min F(\mathbf{x},M)=(x_1-2)^4+(x_2-2x_1)^2+M_k(x_1^2-x_2)^2.$
经过两次迭代, $M_2p(\mathbf{x}_2)=1.805074\times 10^{-10}<\varepsilon$ , 算法停止. 近似最优解为 $x^*=(1.999998,4.000007)^T$ .

Code(简易版)

% 主程序
function SUMT
global M
x0=[2,1]';
M=0.1;
c=10;
eps=0.01;
k=1;
while M*p(x0)>=epsx0=fminsearch('Aim',x0);M=c*M;k=k+1;
end
format long
disp('最优解:')
disp(x0)
disp('迭代次数')
disp(k)
disp('终止条件')
disp(M*p(x0))
end

function r=p(x)
% 罚函数
r=(x(1)^2-x(2))^2;
end

function r=Aim(x)
global M
r=(x(1)-2)^4+(x(2)-2*x(1))^2+M*p(x);
end

算法缺点及改进

每个近似最优解 $\mathbf{x}(M_k)$ 不是可行解. 改进: 内罚函数法.
由收敛性知, $M_k$ 越大越好, 而这会造成 $F(\mathbf{x},M)$ 的Hessen矩阵条件数越大, 趋向于病态, 给无约束问题求解增加困难, 甚至于无法求解. 改进: 乘子法.

Reference

@book{唐焕文2000实用最优化方法,title={实用最优化方法.第2版},author={唐焕文 and 秦学志},publisher={实用最优化方法.第2版},year={2000},
}
@book{肖柳青2000实用最优化方法,title={实用最优化方法},author={肖柳青 and 周石鹏},publisher={实用最优化方法},year={2000},
}

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > 详解flex布局做骰子案例
下一篇 > 裴波那契数列问题和爬楼梯问题的解法（递归和动态规划）

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce