18. 對偶理論(五)錐和極射線以及多面體的表示


錐和極射線

我們已經知道如果線性規划問題的最優解是有限的,那么我們總可以通過有限次尋找找到最優解(是因為基本可行解個數有限,可參考線性規划中的幾何(二))。而在這一部分,我們將說明最優值為\(-\infty\)的情況。具體的,最優值為\(-\infty\)當且僅當存在一個能夠使目標函數值下降且無論如何不婚離開可行域的方向。

錐(cone)

定義: 集合\(C\subset\mathbb{R}^n\)稱為是指對於所有\(\lambda \geq 0\)以及所有\(x\in C\)都有\(\lambda x\in C\)

注意,如果\(C\)是一個非空的錐,那么必然有\(0\in C\)(因為\(\lambda\)的值總可以取到0)。另外,一個形如\(P=\{x\in\mathbb{R}^n\mid Ax\geq 0\}\)的多面體顯然是一個非空的錐(注意定義中右側為0不是b),稱為多面體錐 (polyhedral cone)。下圖給出兩個錐的例子:

考慮多面體錐中的一個非\(0\)元素\(x\)。由於\(3x/2\in C\)\(x/2 \in C\),以及\(x\)\(3x/2\)\(x/2\)的中點,可知\(x\)不是\(C\)的一個極點,因此此時唯一的極點可能就是零向量。如果零向量確實是多面體錐的極點,那么這個錐稱為尖錐 (pointed cone)。那多面體錐是否是尖錐呢?下面的定理給出了評價標准。

定理: \(C\subset \mathbb{R}^n\)是一個由\(a_i^Tx\geq 0,\) \(i=1,\cdots,m\)定義的多面體錐。那么下面的敘述等價:

  1. 零向量是\(C\)的極點。
  2. \(C\)不存在線。
  3. \(a_1,\cdots,a_m\)中存在n個向量線性無關。

證:這個定理的證明可回看線性規划中的集合(四)中的第一個定理,因為這個定理是它的一個特例。證畢。

射線和回收錐

考慮一個非空多面體

\[P=\{x\in\mathbb{R}^n\mid Ax\geq b\}, \]

然后固定一個點\(y\in P\)。我們定義\(y\)點的回收錐 (recession cone) 為能夠使得無限遠移動且不離開可行域的所有方向的集合。用數學的方式表示為:

\[\{d\in\mathbb{R}^n \mid A(y+\lambda d)\geq b,\,\forall \lambda\geq 0\}. \]

顯然,這個集合等價於

\[\{d\in\mathbb{R}^n\mid Ad\geq 0\}. \]

這是因為\(Ay\geq b\)之后有\(\lambda Ad\geq 0\)。注意,這個回收錐是一個多面體錐。這說明回收錐獨立於起點\(y\)(如下圖)。回收錐中的非零元素稱為多面體\(P\)射線 (ray)

注:對於標准形式的多面體

\[P=\{x\in\mathbb{R}^n\mid Ax= b,\,x\geq 0\}, \]

它的回收錐為\( \{d\in\mathbb{R}^n \mid Ad= 0,\,d\geq 0\}.\)

極射線

直觀來看,極射線描述的是能夠延申到無窮的多面體的"邊"。

定義:

  1. 稱多面體錐\(C\subset\mathbb{R}^n\)中的一個非零元素\(x\)極射線 (extreme ray) 是指存在n-1個約束在\(x\)有效。
  2. 非空多面體\(P\)的回收錐中的極射線也稱為\(P\)極射線

下面給出一個例子,如下圖。圖\((a)\),向量\(y\)是一個極射線,因為此時n=2,約束\(a^T_1x=0\)\(y\)有效。圖\((b)\),多面體由\(a_i^Tx\geq 0\)定義,向量\(z\)是一個極射線,因為此時n=3,約束\(a_1^Tx\geq 0\)以及\(a_2^Tx\geq 0\)\(z\)有效。

注意,一個極射線的正數倍仍然是一個極射線。稱兩個極射線是等價的是指其中一個是另一個的正數倍。顯然,這兩個極射線由相同的n-1個線性無關的約束確定(任意n-1個線性無關的約束只能確定兩個極射線,其中一個是另一個的負方向)。因為選擇n-1個約束有效的情形是有限個,如果我們不區分等價極射線的話,那么多面體的極射線的個數也是有限的。 一個有限個極射線的集合稱為極射線的完全集 (complete set of extreme rays) 是指它只包含了等價極射線中的一個。

無界線性規划問題的特征

下面的兩個定理將敘述線性規划問題最優值為\(-\infty\)的條件,分別為可行域是一個錐以及一般情形。

定理: 考慮目標函數為\(c^Tx\),約束為一個尖的多面體錐

\[C=\{x\in\mathbb{R}^n\mid a^T_ix\geq 0,\,i=1,\cdots,m\} \]

的線性規划問題,最優值為\(-\infty\)當且僅當存在\(C\)中的極射線\(d\)滿足\(c^Td < 0\)

證:
如果存在滿足\(c^Td < 0\)\(d\),那么總可以沿着這個方向到無窮遠,使得目標函數值為\(-\infty\)

下面證另一部分,假設最優值為\(-\infty\),那么存在\(x\in C\)使得它的目標函數值為負,不妨假設\(c^Tx=-1\)(總可以通過縮小調整使其成立)。因此,多面體

\[P=\{x\in\mathbb{R}^n\mid a^T_1\geq 0,\cdots,a^T_mx\geq 0,c^Tx=-1\} \]

是非空的。由於\(C\)是一個尖錐,且向量\(a_1,\cdots,a_m\)的擴張是\(\mathbb{R}^n\),這說明\(P\)至少存在一個極點(從幾何的角度看,一個尖錐中插入一個超平面)。記\(d\)為這些極點中的一個,在\(d\)點,有n個線性無關的約束有效。這說明有n-1個形如\(a_i^Tx\geq 0\)的約束有效,因此\(d\)\(C\)的一個極射線。證畢。

下面,利用對偶理論得到關於一般形式的線性規划問題的。

定理: 考慮目標函數為\(c^Tx\),約束為\(Ax\geq b\)的的線性規划問題,並且假設可行域至少存在一個極點。那么最優值為\(-\infty\)當且僅當可行域中存在極射線\(d\)滿足\(c^Td < 0\)

證:

與上一個證明相同,如果存在滿足\(c^Td < 0\)\(d\),那么總可以沿着這個方向到無窮遠,使得目標函數值為\(-\infty\)

下面證另一面。考慮如下的對偶問題

如果原問題是無界的,那么對偶問題是不可行的。因此與之相關的問題


也是不可行的。這說明這個問題的對偶問題


要么是不可行的要么就是無界的。由於\(x=0\)是一個可行解,這說明這個問題是無界的。由於定理中原問題的可行域至少存在一個可行解,那么\(A\)的行的擴張是\(\mathbb{R}^n\)。這說明回收錐\(\{x\mid Ax\geq 0\}\)是尖的。由上一個定理可知存在回收錐的極射線\(d\)滿足\(c^Td < 0\),由定義可知\(d\)也是原問題可行域的一個極射線。證畢。

單純形法中的無界問題

對於使用單純形法的標准型問題,如果最優值為\(-\infty\),會出現什么情況呢?

考慮在使用單純形法中出現最優值為\(-\infty\)的情況,此刻的基本矩陣為\(B\),非基本變量\(x_j\)的判斷值為負,並且列\(B^{-1}A_j\)中不存在正的元素。對於第\(j\)個基本方向\(d\),其中\(d_B=-B^{-1}A_j\)\(d_j=1\),而對於其他非基本變量的下標\(i\)\(d_i=0\)。那么向量\(d\)滿足\(Ad=0\)以及\(d\geq 0\),這說明它屬於回收錐,並且它也是一個使目標函數值下降的方向(因為\(x_j\)對應的判斷數是負值)。

另外,在回收錐的約束中,在\(d\)有n-1個線性無關的約束有效。這是因為m個約束\(Ad=0\)成立,以及n-m-1個約束\(d_i=0\)成立。因此,\(d\)是一個極射線。這說明若對標准型問題使用單純形法使得停止在目標函數值為\(-\infty\),那么單純形法與此同時得到了一條極射線。

多面體的表示

Resolution 定理

下面的定理說明,至少存在一個極點的多面體中的任意元素都可由多面體的極點和極射線線性表出。

定理:(resolution 定理)

\[P=\{x\in\mathbb{R}^n\mid Ax\geq b\} \]

為一個至少存在一個極點的非空多面體。令\(x^1,\cdots,x^k\)為極點,\(w^1,\cdots,w^r\)\(P\)的極射線的完備集。令

\[Q=\{\sum_{i=1}^k\lambda_ix^i+\sum_{j=1}^r\theta_jw^j\mid\lambda\geq 0,\theta_j\geq 0,\sum_{i=1}^k \lambda_i=1\}. \]

那么,\(Q=P\)

證:

先證明\(Q\subset P\)。令

\[x=\sum_{i=1}^k\lambda_ix^i+\sum_{j=1}^r\theta_jw^j \]

\(Q\)中任意元素,其中\(\lambda_i\)\(\theta_j\)非負且\(\sum_{i=1}^k\lambda_i=1\)。而向量\(y=\sum_{i=1}^k\lambda_ix^i\)\(P\)中原色的凸組合,顯然\(y\in P\)且滿足\(Ay\geq b\)(因為多面體是凸集)。另外,對於每一個\(j\)都有\(Aw^j\geq 0\)(由定義可得),這說明\(z=\sum_{j=1}^r\theta_jw^j\)滿足\(Az\geq 0\)。綜上,向量\(x=y+z\)滿足\(Ax\geq b\),進而\(x\in P\)

下面證\(P\subset Q\)。使用反證法,假設\(P\)不是\(Q\)的一個子集。令\(z\in P\)但是不屬於\(Q\)。考慮如下的線性規划問題:

這個問題是不可行的,因為\(z\notin Q\)。它的對偶問題是:

顯然這個問題有一個可行解\(p=0,\,q=0\),又由於它的對偶問題不可行,因此這個問題的最優值為\(-\infty\),並且存在一個可行解\((p,q)\)使得\(p^Tz+q\)是負值。另外,由於對任意\(i\)都有\(p^Tx^i+q\geq 0\)這表明對於任意\(i\)都有\(p^Tz < p^Tx^i\)。注意,約束\(p^Tw^j\geq 0\)對任意的\(j\)都成立。 固定這個\(p\),考慮下面的線性規划問題

如果它的最優值有界,那么說明存在極點\(x^i\)是最優解。由於\(z\)是這個問題的一個可行解,因此\(p^Tx^i\leq p^Tz\)。產生矛盾。如果它的最優值為\(-\infty\),上一節的定理說明存在一個極射線\(w^j\)使得\(p^Tw^j <0\),產生矛盾。證畢。

例:

考慮由如下無界多面體確定的約束。

約束確定范圍如圖:

這個多面體有3個極點\(x^1=(0,2),\) \(x^2=(0,1)\), \(x^3=(1,0)\)。回收錐\(C\)由不等式\(d_1-d_2\geq 0\)以及\(d_1+d_2\geq 0\)\(d_1,d_2\geq 0\)確定,也即\(C=\{(d_1,d_2)\mid d_1\geq d_2\geq 0\}\)。這個錐由兩個極射線\(w^1=(1,1)\)以及\(w^2=(1,0)\)。那么多面體中向量\(y=(2,2)\)可表示為

注意,線性表示並不唯一,比如

注意: 上面定理中的集合\(Q\)是多面體

\[H=\left\{ (\lambda_1,\cdots,\lambda_k,\theta_1\cdots,\theta_r)\mid \sum_{i=1}^k\lambda_i=1,\lambda_i,\theta_j\geq 0\right\} \]

在線性映射

\[(\lambda_1,\cdots,\lambda_k,\theta_1\cdots,\theta_r) \mapsto \sum_{i=1}^k\lambda_ix^i+\sum_{j=1}^r\theta_jw^j \]

下的像。

下面,我們考慮多面體是有界的情形,這個結論在多面體中的幾何中提出過,這里換個思路重新考慮。

推論: 一個非空有界多面體是它的極點的凸包。

證:
\(P=\{x\mid Ax\geq b\}\)為一個非空有界多面體。若\(d\)是錐\(C=\{x\mid Ax\geq 0\}\)中的一個非零元素以及\(x\in P\),那么\(x+\lambda d\in P\), \(\forall \lambda\geq 0\)。這與\(P\)的有界性矛盾。因此\(C\)中僅存在\(0\)向量並且不存在極射線。由上面的定理將得到上述的推論。證畢。

還有另一個關於錐的推論。

推論: 假設錐\(C=\{x\mid Ax\geq 0\}\)是尖的。那么\(C\)中任意元素可由\(C\)中的極射線非負線性表出。

Resolution 定理的反面

稱集合\(Q\)有限生成的 (finitely generated) 是指

\[Q=\{\sum_{i=1}^k\lambda_ix^i+\sum_{j=1}^r\theta_jw^j\mid\lambda\geq 0,\theta_j\geq 0,\sum_{i=1}^k \lambda_i=1\}. \]

其中\(x^1,\cdots,x^k\)\(w^1,\cdots,w^r\)\(\mathbb{R}^n\)中的元素。Resolution 定理說明一個至少存在一個極點的多面體是一個有限生成的集合。下面,我們將說明每個有限生成的集合是一個多面體。

注意,之前提到的,一個有限生成集合\(Q\)可以看作是多面體

\[H=\left\{ (\lambda_1,\cdots,\lambda_k,\theta_1\cdots,\theta_r)\mid \sum_{i=1}^k\lambda_i=1,\lambda_i,\theta_j\geq 0\right\} \]

在一個線性映射下的像。下面給出定理說明每個有限生成的集合是一個多面體。

定理: 有限生成集合是多面體。特殊的,有限多個向量的凸包是一個有界多面體。

證:

考慮在resolution 定理證明中使用的線性規划問題:

一個給定的向量\(z\)屬於\(Q\)當且僅當上面的問題有可行解。利用對偶理論可知它有可行解當且僅當它的對偶問題

存在最優值且最優值有限。為了將這個對偶問題轉化為標准形式引入非負變量\(p^+,p^-,q^+,q^-\),使得\(p=p^+-p^-\)以及\(q=q^+-q^-\),同時引入剩余變量。由於標准型問題對應的多面體中不存在線(更具前面的定理,\(0\)是一個極點),根據無界線性規划問題的特征中的定理可知,這個標准型問題的最優值為有限當且僅當對於任意極射線都有

\[(p^+)^Tz-(p^-)^Tz+q^+-q^-\geq 0. \]

因此,\(z\in Q\)當且僅當\(z\)滿足上述的有限個不等式。這說明\(Q\)是一個多面體。證畢。

參考文獻: Introduction to Linear Optimization by Dimitris Bertsimas & John N. Tsitsiklis.


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM