lec4:
保持函数凸性的操作
非负加权和
Note
若 \(f_1, \dots, f_n\) 为凸,定义域均为 \(R^n\),则
为凸。
非负积分
Note
若 \(f(x, y)\) 对任意 \(y\in A\) 均为关于 x 的凸函数,设 \(w(y) \le 0, \forall y \in A\) 有
为凸函数。
仿射映射
Note
若 \(f\) 为凸,则 \(g\) 为凸。
Success
令 \(x, y \in {\rm dom}\ g, \theta\in [0, 1]\)
两个函数的极大值函数
Note
若 \(f_1, f_2\) 为凸,\(f(x) = \max \{f_1(x), f_2(x)\}\) 为凸集
Success
推广:任意多个函数的极大值函数
Note
若 \(\forall y \in A, f(x, y)\) 对于 x 为凸,则
为凸。
Example
-
从一点到集合 \(C\) 的最远点的距离(无论 C 是否为凸):
\[ f(x) = \sup\limits_{y\in C} ||x-y||_2 \] -
实对称矩阵的最大特征值
\[ f(x) = \lambda_{max} (x), \quad {\rm dom}\ f = S^n \\ f(x) = \sup\limits_{y\in R^n}\{y^Tx y |\ ||y||_2 = 1\} \]Question
为什么上下两条式子等价?
函数的组合
Note
Success
-
考虑简单情况:一维 \(n = k = 1\),全空间,\(h, g\) 均为二阶可微 (凸 \(\leftrightarrow f''(x)\ge 0\))
\[ f'(x) = h'(g(x)) g'(x) \\ f''(x) = h''(g(x))(g'(x))^2 + h'(g(x))g''(x) \]若 \(g\) 为凸(\(g''(x) \ge 0\), \(h\) 为凸且不降 \(h''(g(x))\ge 0, h'(g(x))\ge 0\),则 \(f''(x)\ge 0\)
凹,凸,不增 \(\to\ f\) 凸
凹,凹,不降 \(\to\ f\) 凹
凸,凹,不增 \(\to\ f\) 凹
-
扩展到复杂情况: 高维,非全空间(凸扩展或凹扩展),\(h, g\) 均不二阶可微
\(g\) 凸,\(h\) 凸 且 \(\widetilde{h}\) 不降,则 \(f\) 为凸(类似上面)
Example
-
若 \(g\) 凸,\(\exp \{g(x)\}\) 也为凸,(\(h = \exp\),凸,不降)
若 \(g\) 凹,\(g>0\), \(\log \{g(x)\}\) 为凹,(\(h = \log\),凹,\(\widetilde{h}\) 不降)
若 \(g\) 凹,\(g > 0\),\(\frac{1}{g(x)}\) 也为凸,(\(h(y) = \frac{1}{y}\),凸,\(\widetilde{h}\) 不增)
-
满足 \(\widetilde{h}\) 单调性,但不满足 \(h\) 单调性
\(g(x) = x^2, \quad {\rm dom}\ g \in R\) 凸
\(h(y) = 0, \quad {\rm dom}\ h = [1, 2]\),凸,单调不增/单调不减
\(f = h\cdot g = 0, \quad x^2\in[1, 2]\),故 \(f\) 非凸。
Tip
问题在于 \(\widetilde{h}\) 不单调!
透视函数
Note
结论:若 \(f\) 为凸,则 \(g\) 为凸,若 \(f\) 为凹,则 \(g\) 为凹。
如何证明?
Tip
首先证明:\({\rm dom}\ g\) 为凸集
其次证明:\(g(x, t)\) 为凸(注意,是联合凸)
Example
-
欧几里得范数平方的透视
\[ f(x) = x^Tx, \quad {\rm dom}\ f = R^n \]为凸
\[ g(x, t) = t(f\frac{x}{t})^T(\frac{x}{t}) = \frac{x^Tx}{t}, \quad x \in {\rm dom}\ f = R^n, t\in R_{++} \] -
负对数函数的透视
\[ f(x) = -\log x, \]
函数的共轭(conjugate)
Note
无论 \(f\) 是否为凸,\(f^*\) 均为凸
是关于 \(y\) 的仿射函数,关于 \(y\) 为凸。
凸集与凸函数的关系
Note
\(\alpha\) 次水平集 (\(\alpha - sublevel\ set\))
对于函数 \(f: R^n \to R\),定义其 \(\alpha\) 次水平集为
-
凸函数的 \(\alpha\) 次水平集为凸集
\[ \forall x, y \in C_{alpha} \to f(x)\le \alpha, f(y)\le \alpha, \forall \theta \in [0, 1] \\ f(\theta x + (1 - \theta)y) \le \theta f(x) + (1 - \theta)f(y) \le \alpha \] -
若函数 \(\alpha\) 次水平集均为凸集,该函数并不一定为凸集(例如 \(-e^x\))
Example
画出 \(\alpha\) 次水平集