条件约束下的最优化问题–拉格朗日乘数法与KKT条件

文章目录

- 条件约束下的最优化问题--拉格朗日乘数法与KKT条件
等式约束优化问题 (拉格朗日乘数定理)
- 简单的例子
不等式约束优化问题 (KKT条件)
- 简单的例子

等式约束优化问题 (拉格朗日乘数定理)

$\min_x f(x) \\ s.t. \quad g(x) = 0$
为方便分析，假设 $f$ 与 $g$ 是连续可导函数;构造Lagrange函数
$L(x,\lambda) = f(x) + \lambda g(x)$
计算 $L$ 对 $x$ 与 $\lambda$ 的偏导数并设为零，可得最优解的必要条件：
$\frac{dL}{dx} = f'(x) + \lambda g'(x) = 0 \\ \frac{dL}{d\lambda} = g(x) = 0 \\$

简单的例子

求此方程的最小值：
$f(x,y) = x^2 y$
同时未知数满足约束
$x^2 + y^2 = 1 \\ g(x,y) = x^2 + y^2 - 1 = 0$
构造拉格朗日函数
$\lambda g(x,y) = x^2 y + \lambda(x^2 + y^2 - 1) \\ \begin{cases} \frac{\partial{L}}{\partial{x}} = 2xy + 2\lambda x = 0 \\ \frac{\partial{L}}{\partial{y}} = x^2 + 2\lambda y = 0 \\ \frac{\partial{L}}{\partial{\lambda}} = x^2 + y^2 - 1 = 0 \\ \end{cases}\Rightarrow \begin{cases} x = -\sqrt{\frac{2}{3}} , x=\sqrt{\frac{2}{3}} \\ y = -\sqrt{\frac{1}{3}} , y=-\sqrt{\frac{1}{3}} \\ \lambda = \sqrt{\frac{1}{3}} , \lambda=\sqrt{\frac{1}{3}} \\ \end{cases}$

不等式约束优化问题 (KKT条件)

$\min_x f(x) \\ s.t. \quad g(x) \leq 0$
约束不等式 $\leq 0$ 称为原始可行性(primal feasibility)，据此我们定义可行域(feasible region) $K=\{x\in R^n|g(x)\leq 0\}$ 。假设 $x^*$ 为满足约束条件的最佳解，分开两种情况讨论：

$g (x) < 0$ 最佳解位于 $K$ 的内部，称为内部解(interior solution)，这时约束条件是无效的(inactive)；
$g (x) = 0$ 最佳解落在 $K$ 的边界，称为边界解(boundary solution)，此时约束条件是有效的(active)。

这两种情况的最佳解具有不同的必要条件。

内部解：在约束条件无效的情形下， $g (x)$ 不起作用，约束优化问题退化为无约束优化问题，因此驻点 $x^*$ 满足 $0且\lambda = 0$ (因为 $0且\lambda \neq 0$ ，那么 $L$ 的最优就不是 $f$ 的最优)
边界解：在约束条件有效的情形下，约束不等式变成等式 $g (x) = 0$ ，这与前述Lagrange乘数法的情况相同。我们可以证明驻点 $x^*$ 发生于 $\triangledown f\in span\{\triangledown g\}(\triangledown g张成的空间)$ ;换句话说，存在 $\lambda$ 使得 $\triangledown f = -\lambda \triangledown g$ ，但这里的正负号是有其意义的。因为我们希望最小化 $f$ ，梯度 $\triangledown f$ (函数 $f$ 在点 $x$ 的最陡上升方向)应该指向可行域 $K$ 的内部(因为你的最优解最小值是在边界取得的)，但 $\triangledown g$ 指向 $K$ 的外部(即 $g (x) > 0$ 的区域，因为你的约束是小于等于0)，因此，称为对偶可行性(dual feasibility)。

因此，不论是内部解或边界解， $\lambda\triangledown g=0$ 恒成立，称为互补松弛性(complementary slackness)。整合上述两种情况，最佳解的必要条件包括Lagrangian函数 $L(x,\lambda)$ 的定常方程式、原始可行性、对偶可行性，以及互补松弛性：
$\min_x f(x) \\ s.t. \quad g(x) \leq 0 \\ L = f(x) + \lambda g(x) \\ \begin{cases} \frac{\partial{L}}{\partial{x}} = \triangledown f + \lambda \triangledown g = 0 \\ g(x) \leq 0 \\ \lambda \geq 0 \\ \lambda g(x) = 0 \end{cases}$
这些条件合称为Karush-Kuhn-Tucker (KKT)条件。如果我们要最大化 $f (x)$ 且受限于 $\leq 0$ ，那么对偶可行性要改成 $\lambda \leq 0$ 。

上面结果可推广至多个约束等式与约束不等式的情况。

考虑标准约束优化问题(或称非线性规划)：
$\min_x f(x) \\ \begin{aligned} s.t. \quad & g_j(x) = 0, j=1,\dots,m \\ & h_k(x) \leq 0, k=1,\dots,p \\ \end{aligned}$
构造Lagrangian函数
$L(x,\{\lambda_j\},\{\mu_k\}) = f(x) + \sum_{j=1}^m\lambda_jg_j(x) + \sum_{k=1}^p \mu_kh_k(x)$
KKT条件为：
$\begin{cases} \triangledown_x L = 0 \\ g_j(x) = 0, j=1,\dots,m \\ h_k(x) \leq 0 \\ \mu_k \geq 0 \\ \mu_k h_k(x) = 0, k=1,\dots,p \\ \end{cases}$

简单的例子

$\min x_1^2 + x_2^2 \\ \begin{aligned} s.t. \quad & x_1 + x_2 = 1 \\ & x_2 \leq a \end{aligned}$
构造拉格朗日函数
$x_1^2 + x_2^2 + \lambda(1-x_1-x_2) + \mu(x_2-a)$
利用KKT条件
$\begin{cases} \frac{\partial{L}}{\partial{x_i}} = 0,i=1,2 \\ x_1 + x_2 = 1 \\ x_2-a \leq 0 \\ \mu \geq 0 \\ \mu(x_2-a) = 0 \\ \end{cases} \Rightarrow \begin{cases} x_1 = \frac{\mu}{4} + \frac{1}{2} \\ x_2 = -\frac{\mu}{4} + \frac{1}{2} \\ -\frac{\mu}{4} + \frac{1}{2} \leq a \\ \end{cases}$
对 $a$ 分类讨论

当 $a\geq\frac{1}{2}$ 时， $\mu=0\Rightarrow x_2-a < 0$ 不等式无效， $x_1^*=x_2^*=\frac{1}{2},f_{min}(x)=\frac{1}{2}$
当 $a<\frac{1}{2}$ 时, 约束不等式有效, $x_2^*=a,x_1^*=1-a,f_{min}(x)=(1-a)^2+a^2$

本文参考-- 不等式约束的优化问题 https://zhuanlan.zhihu.com/p/146837325

本文含有隐藏内容，请开通VIP 后查看

条件约束下的最优化问题--拉格朗日与KKT条件

条件约束下的最优化问题–拉格朗日乘数法与KKT条件

文章目录

等式约束优化问题 (拉格朗日乘数定理)

简单的例子

不等式约束优化问题 (KKT条件)

简单的例子

微信公众号

今日签到

热门文章

最新发布