01-凸集


01-凸集

凸優化從入門到放棄完整教程地址:https://www.cnblogs.com/nickchen121/p/14900036.html

一、仿射和凸集

[直線和線段]\(x_1\ne x_2\)\(R^n\) 中的兩點, \(y=\theta x_1+(1-\theta)x_2\)\(\theta\in R\) 表達了過點 \(x_1,x_2\) 的一條直線,當 \(\theta\)\(0,1\) 之間的數時,點 \(y\)\(x_2\) 移動到 \(x_1\) ,對應着 \(x_1,x_2\) 之間的線段。

  • 另一種表達式: \(y=x_2+\theta(x_1+x_2)\) 給出另一種解釋—— \(y\) 是從基點 \(x_2\) 出發,沿方向 \((x_1-x_2)\) 延申 \(\theta\) 倍處的點。
  • 注:直線和線段的判斷其實就是參考 \(\theta\) 的取值,也就是看通過\(\theta\)形成的點 \(y\) 是在\(x_1\)\(x_2\) 連線的內部還是外部。

[仿射集 Affine sets] 一個集合 \(C\subseteq R^n\) 是仿射的,如果C中任意兩不同點之間點的直線都在 \(C\) 中。也就是 \(\forall x_1,x_2\in C, \theta\in R\) ,有 \(\theta x_1+(1-\theta)x_2\in C\) .

  • \(C\) 中包含了 \(C\) 中任意兩點的線性組合。

[仿射組合 Affine combination] 我們稱形如 \(\theta_1x_1+....+\theta_k x_k\)\((\theta_1+...+\theta_k=1)\) 的點為點 \(x_1,...,x_k\) 的仿射組合。

  • 一個仿射集包含其所有點的所有仿射組合。
  • 注:仿射組合,其實就可以看成是二維空間內的一條條直線,也就是點與點的線性組合

[仿射集的子空間] 如果 \(C\) 是一個仿射集, \(x_0\in C\) 那么集合 \(V=C-x_0=\{x-x_0| x\in C\}\) 是一個子空間,也就是對加法和標量乘法封閉。

證明:假設 \(v_1,v_2\in V\)\(\alpha,\beta\in R\) , 我們有 \(v_1+x_0\in C\) , \(v_2+x_0\in C\) . 並且 \(av_1+\beta v_2+x_0= \alpha(v_1+x_0)+\beta(v_2+x_0)+(1-\alpha-\beta)x_0\in C\) , 所以 \(\alpha v_1+\beta v_2 \in V\) .

因此仿射集 \(C\) 可以寫成: \(C=V+x_0=\{v+x_0|v\in V\}\) . 也就是一個子空間加上一個平移 (offset)。

注:子空間,可以想象成我隨便找一個定點 \(x_0\),然后空間內的任意點與定點的連線形成一個新的空間,這個空間就是一個子空間。

[仿射集的維數] 我們定義仿射集 \(C\) 的維數為其子空間 \(V=C-x_0\) 的維數, \(x_0\) 可以是 \(C\) 中的任意元素。

[仿射包 Affine hull] 一個集合 \(C\subseteq R^n\) 中所有點的所有仿射組合的集合叫做C的仿射包,記作 \(aff\,C\) :

\(aff\,C=\{\theta_1x_1+...+\theta_kx_k| x_1,...,x_k\in C, \theta_1+...+\theta_k=1\}.\)

  • 仿射包是包含 \(C\) 的最小仿射集: 如果 \(S\) 是任意帶有 \(C\in R^n\) 的仿射集,那么 \(aff\,C\subseteq S\) .
  • 注:仿射包其實就是仿射集合的無限延伸,下面講到凸包的時候容易理解“包”的概念

[仿射維度] 定義集合 \(C\) 的仿射維度為它的仿射包的維度。

例如 \(R^2\) 內的單位元 \(\{x\in R^2| x_1^2+x_2^2=1\}\) ,它的仿射包是整個 \(R^2\) ,所以仿射維度是2維。

[相對內部 relative interior] 如果一個集合 \(C\subseteq R^n\) 的仿射維度小於 \(n\) ,那么這個集合在仿射集里 \(aff\,C\ne R^n\) ,我們將集合C的相對內部定義為 \(relint\, C = \{x\in C | B(x,r)\cap aff\,C \subseteq C, \; for\, some\; r>0 \}\)

其中 \(B(x,r)=\{y| ||y-x||\leq r\}\) 是以 \(x\) 為中心, \(r\) 為半徑的球。

注:相對內部其實就是自己在集合內部定義一個范圍出來

[相對邊界 relative boundary] 集合 \(C\) 的相對邊界定義為 \(cl\,C \backslash relint\,C\)\(cl\,C\)\(C\)閉包

[凸集 convex set] 一個集合 \(C\) 是凸的,如果 \(C\) 中任意兩點之間的線段都在 \(C\) 中。也就是 \(\forall x_1,x_2\in C\) , \(\forall \theta \in [0,1]\)\(\theta x_1+(1-\theta)x_2\in C.\)

注:仿射集和凸集的主要區別,可以這樣去想,仿射集是可以無限延伸的,而凸集一般都是有限定范圍的。就類似於直線和線段的理解。

和仿射的區別:仿射中 \(\theta\in R\)

img

[凸組合] 形如 \(\theta_1x_1+...+\theta_k x_k, \theta_1+...+\theta_k=1,\theta_i\geq0,i=1,...,k\) 的點稱為點 \(x_1,...,x_k\) 的凸組合。

點的凸組合,可以看作是這些點的加權平均。

[凸包 convex hull] 集合 \(C\) 的凸包,是 \(C\) 中所有點的所有凸組合的集合,記作 \(convC\)\(convC=\{\theta_1x_1+...+\theta_kx_k | x_i\in C, \theta_i\geq 0, i=1,...,k, \theta_1+...+\theta_k=1\}.\)

注:從凸包理解仿射包,其實就是對非凸集合做一個延伸擴展,讓其可凸

img

[錐 cone,凸錐] 一個集合 \(C\) 被稱為一個錐或者 nonnegative homogeneous 如果對於每個點 \(x\in C\)\(\theta \geq 0\) 都有 \(\theta x\in C\)

一個集合 \(C\) 被稱為凸錐,如果它是凸集且是一個錐。也就是對於任意的 \(x_1,x_2\in C\)\(\theta_1,\theta_2\geq 0\) 我們有 \(\theta_1x_1+\theta_2x_2\in C\) . 如圖,就像一塊披薩:

注:錐很好理解的,其實就可以看成射線的延伸。凸錐其實就是從原點開始兩條射線的延伸的形成的范圍

img

[錐組合] 一個形如 \(\theta_1x_1+...+\theta_kx_k, \theta1,...,\theta_k\geq 0\) 的點叫做點 \(x_1,...,x_k\) 的錐組合(或非負線性組合)。

  • 如果點 \(x_i\) 在凸錐 \(C\) 中,那么 \(x_i\) 的每個錐組合都在 \(C\) 中。

[錐包 conic hull] 一個集合 \(C\) 的錐包是 \(C\) 中所有點的所有錐組合的集合。也就是 \(\{\theta_1x_1+...+\theta_kx_k | x_i\in C, \theta_i\geq 0 , i=1,...,k\}\) .

  • 錐包是包含 \(C\) 的最小的錐。

img


二、一些重要的例子

[簡單的例子]

  • 空集和任何單一的點 \(\{x_0\}\) 和整個空間 \(R^n\)\(R^n\) 的仿射子集(凸)。
  • 任意直線都是仿射的,如果它過零點,那么它是一個子空間,於是也是一個凸錐。
  • 一個線段是凸的,但是不是仿射的(除非退化成一個點)。
  • 一個射線(ray)形如 \(\{x_0+\theta v| \theta\geq 0\}\) , \(v\ne 0\) 是凸的,但是不是仿射的。如果基點 \(x_0\)\(0\) 的話,它就是一個凸錐。
  • 任何子空間都是仿射的,也是一個凸錐。

[超平面 Hyperplane] 一個超平面是集合 \(\{x|a^Tx=b\}\) ,,其中 \(a\in R^n\) , \(a\ne0\) , \(b\in R\) .

  • 從分析的角度說,它是一個線性方程的解集(是仿射的)。
  • 從幾何的角度說,是和向量 \(a\) 有相等的內積的點的集合。注:或者說一個法向量為 \(a\) 的超平面,而 \(b\) 就是超平面離原點的平移。可以寫成 \(\{x| a^T(x-x_0)=0\}\) , \(x_0\) 是平面上任意一點。

img

[半空間 Halfspace] 一個(閉的)半空間是一個集合 \(\{x| a^Tx\leq b\}\) 其中 \(a\ne 0\) .

  • 它是一個線性不等式的解集。
  • 它是凸的,但是不是仿射的。
  • 幾何解釋:半空間可以寫成: \(\{x| a^T(x-x_0)\leq 0\}\) 它是由點 \(x_0\) 加上和向量 \(a\) 成鈍角的任意向量組成的。
  • 注:半空間其實很好理解,就是對一個超平面進行了分割,也就是對一個無限延伸的空間進行了切分

img

注:接下來講的幾個凸集,可以通過圖片就很容易判斷了,具體的證明其實假設存在兩個點 \(x_1\)\(x_2\),然后套用仿射集、凸集、錐的定義看是否滿足條件就行了。

[歐幾里得球 Euclidean balls] 一個 \(R^n\) 中的(歐幾里得)球是 \(B(x_c,r)=\{x\;|\; ||x-x_c||_2\leq r\}=\{x| (x-x_c)^T(x-x_c)\leq r^2\}\) , \(r>0\) 表示歐幾里得范數,也就是 \(||u||_2=(u^Tu)^{1/2}\) 。歐幾里得球是一個凸集。

[球 norm ball,錐 norm cone]\(\|\cdot\|\)\(R^n\) 上的任意范數,norm ball 是集合 \(\{x| \| x-x_c\| \leq r\}\) 是凸的。norm cone 是集合 \(C=\{(x,t) | \|x\|\leq t\}\subseteq R^{n+1}\) .

img

[多面體 Polyhedra] 多邊形是有限個線性方程和不等式的解集 \(P=\{x| a^T_jx\leq b_j, j=1,...,m, c^Tx=d_j, j=1,...,p\}\) .

  • 是多個半空間和超平面的交集
  • 是凸集

img

[單純形 Simplexes] 單純形是多面體的另一個重要的類,令 \(k+1\) 個點 \(v_0,...,v_k\in R^n\)仿射獨立的,意思是 \(v_1-v_0,...,v_k-v_0\) 都是線性無關的。這些點確定的單純形是凸包 \(C=conv\{v_0,...,v_k\}=\{\theta_0v_0+...+\theta_kv_k\;| \; \theta \succeq 0,1^T\theta=1\}.\)

  • 單純形的仿射維數是 \(k\) ,也叫做 \(k\) -單純形。
  • 0-單純形是點,1-單純形是線段,2-單純形是三角形,3-單純形是四面體,而4-單純形是一個五胞體。

三、保持凸性的運算

[交集] 交集保持凸性,如果 \(S_1,S_2\) 是凸的,那么 \(S_1\cap S_2\) 也是凸的。這個性質可以推廣到有限個集合的交集。

[仿射函數] 一個函數 \(f: R^n\rightarrow R^m\) 是仿射的,如果它是一個線性函數和常數的和。也就是形如 \(f(x)=Ax+b\) , \(A\in R^{m\times n}\) , \(b\in R^m\) .

注:仿射函數,其實很容易理解,就可以看成是一個二維空間中的一個平面圖形的伸縮和平移,只不過這里是對高維空間進行了統一。假設,在二維空間有一個三角形,你無論怎么做伸縮和平移,它仍然是一個三角形,而三角形屬於單純型,單純型又都是凸的

如果 \(S\subseteq R^n\) 是凸的並且 \(f: R^n\rightarrow R^m\) 是一個仿射函數,那么 \(S\)\(f\) 映射下的像 \(f(S)=\{f(x)| x\in S\}\) 是凸的。類似地, \(S\)\(f\) 下的逆象也是凸的。

  • 一個凸集的縮放 \(\alpha S\) 和平移 \(S+\alpha\) 是凸的.
  • 一個凸集到它某個維度的投影是凸的: if \(S\subseteq R^m\times R^n\) , then \(T=\{x_1\in R^m| (x_1,x_2)\in S , for\, some\, x_2\in R^n\}\) is convex.
  • 凸集的和是凸的。
  • 凸集的積是凸的, \(S_1\times S_2=\{(x_1,x_2)|x_1\in S_1, x_2\in S_2\}\) .
  • 凸集的部分和是凸的, \(S_1,S_2\in R^n\times R^m\) , \(S=\{(x,y_1+y_2)| (x,y_1)\in S_1, (x,y_2)\in S_2\}.\)

[透視函數 perspective function] 我們定義透視函數 \(P: R^{n+1}\rightarrow R^n\)\(P\) 的定義域 \(domP=R^n\times R_{++}\)\(P(z,t)=z/t\) .

注:透視函數其實也很容易理解,無非就是投影。依然拿二維空間舉例,從透視函數的定義,可以看出,無非是對某一維進行了降維,也就是二維圖像降維成了一維的,可以想象,三角形降維成一維的就是一條線段,如果是非凸非封閉的三角形透視之后就是有間隙的線段,也就是說透視之后非凸

\(R_{++}\) 是指正數的集合: \(R_{++}={x\in R|x>0}\)

  • 透視函數可以縮放向量,或歸一化向量——使其最后一個元素為1,然后去掉最后一個元素。
  • 如果 \(C\subseteq domP\) 是凸的,那么 \(C\)\(P\) 映射下的像 \(P(C)\) 也是凸的。

img

[線性-分數 函數 Linear-fractional function] 一個Linear-fractional function 是透視函數和一個仿射函數的復合。

注:線性分式,很好理解咯,無非就是伸縮平移之后再投影(降維),一個道理,仍然保持凸性

設仿射函數 \(g: R^n\rightarrow R^{m+1}\)\(g(x)=\begin{bmatrix}A\\c^T\end{bmatrix}x + \begin{bmatrix}b\\d\end{bmatrix}\) . 其中 \(A\in R^{m\times n}, b\in R^m, c\in R^n, d\in R.\)

則函數 \(f: R^n\rightarrow R^m\)\(f=P\circ g\) ,也就是

\(f(x)=(Ax+b)/(c^Tx+d)\) ,
$domf= {x|c^Tx+d>0} $

是一個Linear-fractional function。

  • Linear-fractional function 保留凸性。

img


四、廣義不等關系

[proper cone] 一個錐 \(K\subseteq R^n\) 稱為 proper cone 如果它滿足以下性質:

  • K是凸的
  • K是閉的
  • K是實的(solid),也就是有非空的內部(interior)。
  • K是尖的(pointed),也就是不含有線( \(x\in K, -x\in K \Rightarrow x=0\) ).

[廣義不等關系] 是一個 \(R^n\) 上的偏序。令 \(K\) 是一個proper cone,定義:

注:廣義不等式其實就是規定了兩個比較對象的維度,而這種比較就需要考慮到各個維度的比較,比如 \(\begin{bmatrix} 1 \\ 2 \end{bmatrix}\)\(\begin{bmatrix} 0 \\ 3\end{bmatrix}\) 就不可以比較,兩者之差 \(\begin{bmatrix} 1 \\ -1\end{bmatrix}\)不屬於錐內部了,比如 \(\begin{bmatrix} 1 \\ 2 \\ 3 \end{bmatrix}\)\(\begin{bmatrix} 0 \\ 1\end{bmatrix}\) 同樣不可以比較,兩者維度都不一樣

\(x\preceq_K y \Longleftrightarrow y-x\in K\) .

\(x\prec_K y \Longleftrightarrow y-x\in intK\) .

  • \(K=R_+\) 偏序 \(\prec_K\) 就是普通的 \(R\) 上的 \(\leq\)
  • 廣義不等關系 \(\preceq_K\) 滿足許多性質:加法不變,傳遞性,非負縮放不變,自反性,反對稱性,取極限不變。

\(y-x\) 是以 \(x\) 為起點以 \(y\) 為終點的向量,畫圖就明白了。

[最小元素 minimum] \(x\in S\)\(S\) 中的最小元素,如果對每個 \(y\in S\)\(x\preceq_K y\) . 最大元素同理。 一個集合中的最小(最大)元素如果有就是唯一的。

[極小元素 minimal] \(x\in S\)\(S\) 中的極小元素,如果 \(y\in S\) , \(y\preceq_k x\) 僅當 \(y=x\) . 極大元素同理。一個集合中可以有多個極小(極大)元素。

注:為了便於理解,判斷最小元素和極小元素可以從分量的角度去考慮,最小元素的所有分量都是最小的,比如比如 \(\begin{bmatrix} 1 \\ 2 \end{bmatrix}\)\(\begin{bmatrix} 2 \\ 4\end{bmatrix}\),兩個分量都是最小的 ;而極小元素可能只是某個分量為較小的,或者說極小元素的有些分量無法做出最小的判斷,比如比如 \(\begin{bmatrix} 1 \\ 0 \end{bmatrix}\)\(\begin{bmatrix} 0 \\ 1\end{bmatrix}\) ,第一個分量前一個大,第二個分量前一個小。可以通過下圖自行從分量的角度理解

  • 一個點 \(x\in S\) 是集合 \(S\) 的最小元素,當且僅當 \(S\subseteq x+K\) , 其中 \(x+K\) 表示所有大於或等於 \(x\)\(\preceq_K\) )的點。
  • 一個點 \(x\in S\) 是集合 \(S\) 的極小元素,當且僅當 \((x-K)\cap S=\{x\}\) , 其中 \(x-K\) 表示所有小於或等於 \(x\)\(\preceq_K\) )的點。

img


五、分離超平面和支撐超平面 (Separating and Supporting Hyperplane)

[超平面分離定理]\(C\)\(D\) 都是非空且不相交的凸集, \(C\cap D =\emptyset\) . 那么存在 \(a\ne 0\)\(b\) ,使得 \(a^Tx\leq b\) 對於所有的x \(\in C\) ,和 \(a^Tx\geq b\) 對於所有的 \(x\in D\) 。超平面 \(\{x| a^Tx=b\}\) 叫做集合 \(C,D\)分離超平面,它分離集合 \(C\)\(D\)

如果把不等式的等號去掉就叫做嚴格分離

img

[逆超平面分離定理] 任意兩個凸集 \(C,D\) ,其中至少一個是開集,它們不相交,當且僅當存在一個分離超平面。

[支撐超平面]\(C\subseteq R^n\)\(x_0\) 是一個位於邊界 \(bd\,C\) 的點, \(x_0\in bd\,C=clC\backslash intC\) . 如果 \(a\ne 0\) 滿足對所有 \(x\in C\)\(a^Tx\leq a^Tx_0\) ,那么超平面 \(\{x| a^Tx=a^Tx_0\}\) 叫做 \(C\) 在點 \(x_0\)支撐超平面

注:支撐超平面其實就是一個凸集找到一條切線,並且這個凸集要在這個切線分離的其中一個半空間內

img

[支撐超平面定理] 對於任意非空凸集 \(C\) ,和任意點 \(x_0\in bd C\) 都有一個 \(C\) 在點 \(x_0\) 上支撐超平面。

[部分逆支撐超平面定理] 如果一個集合是閉的,有非空的內部,且在邊界上的每個點處有支撐超平面,那么它是凸的。注:只針對凸集


六、對偶錐和廣義不等關系

[對偶錐 Dual cone]\(K\) 是一個錐,集合 \(K^*= \{y | x^Ty\geq 0, \; for all \; x\in K\}\) 叫做 \(K\) 的對偶錐。 \(K^*\) 是一個 錐,並且總是凸的,即使原來的錐 \(K\) 不是凸的。

注:其實很容易理解,就是從 \(x^Ty\geq 0\) 這個角度去考慮,可以把它看成是 \(x\)\(y\) 的內積,這就是表明 \(x\)\(y\) 形成的夾角小於 90° ,下圖中法向量 \(z\) 和 錐\(K\) 的一部分形成了鈍角,所以 \(z \notin k^*\)

向量 y和 K中任意向量x成銳角。

img

[對偶錐的性質]

  • \(K^*\) 是閉且凸的。
  • \(K_1\subseteq K_2\) 意味着 \(K^*_2\subseteq K^*_1\) .
  • 如果 \(K\) 有非空的內部,那么 \(K^*\) 是尖的(pointed).
  • 如果 \(K\) 的閉包是pointed 那么 \(K^*\) 有非空的內部。
  • \(K^{**}\)\(K\) 凸包的閉包。(所以如果 \(K\) 是凸且閉的,那么 $ K^{ ** }=K$ )注:對偶的對偶是原錐

以上性質表明,如果 \(K\) 是一個 proper cone,那么它的對偶錐 \(K^*\) 也是 proper cone,並且 \(K^{**}=K\) .

[對偶廣義不等關系] 令錐 \(K\) 是凸且proper的,由它給出一個廣義不等關系 \(\preceq_K\) 。然后它的對偶錐也是proper的,於是也給出一個廣義不等關系 \(\preceq_{K^*}\) ,作為 \(\preceq_K\) 的對偶。有以下性質:

  • \(x\preceq_K y\) 當且僅當 \(\lambda^Tx\leq \lambda^Ty\)\(\forall \lambda\succeq_{K^*} 0\) .
  • \(x\prec_K y\) 當且僅當 \(\lambda^T x< \lambda^Ty\)\(\forall \lambda\succeq_{K^*} 0\) , \(\lambda\ne 0\) .

注:對於最小元素的對偶性質和極小元素的對偶性質的具體理解,可以參考這篇博客https://www.zhihu.com/question/264853229

[最小元素的對偶性質] 根據不等關系 \(\preceq_K\) , \(x\)\(S\) 中的最小元素,當且僅當對於所有的 \(\lambda \succ_{K^*} 0\)\(x\) 是唯一使得 \(\lambda^T z\) , \(z\in S\) 取最小值的元素。

用幾何的觀點看,這意味着對於任意 \(\lambda\succ_{K^*}0\) ,超平面 \(\{z| \lambda^T(z-x)=0\}\)\(S\) 在點 \(x\) 上的嚴格支撐超平面(嚴格就是超平面和 \(S\) 只在點 \(x\) 相交),注意此處 \(S\) 不需要是凸集。

注:依然是從內積角度去看待這個問題

img

[極小元素的對偶性質] 如果存在 \(\lambda \succ_{K^*}0\) 並且 \(x\) 使得 \(\lambda^T z, z\in S\) 取最小值,那么 \(x\) 是極小值。

注:這樣去理解下述圖像可能容易點,也就是 \(x_1\)\(\lambda_1\) 方向上的最優解。這樣有什么好處呢,比如對於一個 \(\lambda_1\)\(\lambda_2\),我們想知道 \(\lambda_1 x_1\)\(\lambda_2 x_2\) 的大小,這是很困難的,但是我們知道 \(\lambda_1\)\(\lambda_2\) 屬於 \(K^*\),那么我們比較 \(\lambda_1\)\(\lambda_2\)\(K^*\) 上的大小就行了。

img

定理反過來是不對的,也就是存在這種情況: \(x\) 是極小元素,但不能使任何的 \(\lambda^Tz, z\in S\) 取最小值,如圖:

方形陰影是錐 \((x-K)\) , 回顧廣義不等關系那節: \(x\) 是極小元素,當且僅當錐 \((x-K)\)\(S\) 僅在 \(x\) 點相交。同時,對於任意的 \(\lambda\)\(\lambda^Tx\) 都不是最小的,最小值總是在凸的地方取到。

img

如果加上條件: \(S\) 是凸集,那么以上逆定理就正確了,對於任意極小元素 \(x\) ,有非零的 \(\lambda\succeq_{K^*}0\) 使得 \(\lambda^Tz, z\in S\)\(x\) 處取得最小值。

  • 但是如果此時,把條件強化為 \(\lambda\succ_{K^*}0\) 就又不對了,如圖:

img

七、最小元和極小元和對偶錐的再解釋

復習:最小元與極小元
下面兩幅圖分別表示最小元和極小元

img

利用對偶錐,我們可以獲得最小元的等價定義,即
\(x\) 是集合 \(S\) 關於 \(\preceq_{K}\) 的最小元 \(\iff\) 對任意的 \(\lambda \succ_{K*} 0\)\(x\)\(\lambda^Tz\) 在集合 \(S\) 上的唯一最小解

什么意思呢?也就是說任意的 \(\lambda\in K^*\),實際上都代表了一個法向量,也就是一個支撐超平面。如果 \(x\) 是最小元,則意味着對任意一個 (\(K^*\)所定義的) 支撐超平面來說,\(x\) 都是支撐點,就像下面這條幅圖一樣

img

極小元的定義是什么呢?

  • 充分條件:若對於某些 \(\lambda \succ_{K*} 0\)\(x\) minimizes \(\lambda^Tz\) over \(S\)\(\Longrightarrow\)\(x\) 為極小元
  • 必要條件:\(x\)凸集\(S\) 的極小元,\(\Longrightarrow\) 存在非 0 的 \(\lambda \succ_{K*} 0\) 使得 \(x\) minimizes \(\lambda^Tz\) over \(S\)

我們來看充分條件,只需要存在某一個 \(\lambda\in K^*\),使得 \(x\) 為對應支撐超平面的支撐點就可以了。比如下面這幅圖,藍色的點,我們可以找到這樣一個藍色的支撐超平面,使其為支撐點,所以它就是一個極小元;而對於紅色的點來說,無論如何不可能找到一個支撐超平面,使其為支撐點,因此他就有可能不是極小元,因為這只是充分條件(對這個例子來說他就不是極小元)。

img

簡單總結一下:

  • 最小元:無論沿着錐 \(K^*\) 里邊哪一個方向走,\(x\) 都是最小值點,那么他就是最小元;
  • 極小元:如果沿着其中某一個方向走,\(x\) 是最小值點,那么他就是極小元。

參考文獻:Stephen Boyd, Lieven Vandenberghe: Convex Optimization

參考資料:https://www.zhihu.com/column/c_1174389256402771968


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM