18. 对偶理论(五)锥和极射线以及多面体的表示


锥和极射线

我们已经知道如果线性规划问题的最优解是有限的,那么我们总可以通过有限次寻找找到最优解(是因为基本可行解个数有限,可参考线性规划中的几何(二))。而在这一部分,我们将说明最优值为\(-\infty\)的情况。具体的,最优值为\(-\infty\)当且仅当存在一个能够使目标函数值下降且无论如何不婚离开可行域的方向。

锥(cone)

定义: 集合\(C\subset\mathbb{R}^n\)称为是指对于所有\(\lambda \geq 0\)以及所有\(x\in C\)都有\(\lambda x\in C\)

注意,如果\(C\)是一个非空的锥,那么必然有\(0\in C\)(因为\(\lambda\)的值总可以取到0)。另外,一个形如\(P=\{x\in\mathbb{R}^n\mid Ax\geq 0\}\)的多面体显然是一个非空的锥(注意定义中右侧为0不是b),称为多面体锥 (polyhedral cone)。下图给出两个锥的例子:

考虑多面体锥中的一个非\(0\)元素\(x\)。由于\(3x/2\in C\)\(x/2 \in C\),以及\(x\)\(3x/2\)\(x/2\)的中点,可知\(x\)不是\(C\)的一个极点,因此此时唯一的极点可能就是零向量。如果零向量确实是多面体锥的极点,那么这个锥称为尖锥 (pointed cone)。那多面体锥是否是尖锥呢?下面的定理给出了评价标准。

定理: \(C\subset \mathbb{R}^n\)是一个由\(a_i^Tx\geq 0,\) \(i=1,\cdots,m\)定义的多面体锥。那么下面的叙述等价:

  1. 零向量是\(C\)的极点。
  2. \(C\)不存在线。
  3. \(a_1,\cdots,a_m\)中存在n个向量线性无关。

证:这个定理的证明可回看线性规划中的集合(四)中的第一个定理,因为这个定理是它的一个特例。证毕。

射线和回收锥

考虑一个非空多面体

\[P=\{x\in\mathbb{R}^n\mid Ax\geq b\}, \]

然后固定一个点\(y\in P\)。我们定义\(y\)点的回收锥 (recession cone) 为能够使得无限远移动且不离开可行域的所有方向的集合。用数学的方式表示为:

\[\{d\in\mathbb{R}^n \mid A(y+\lambda d)\geq b,\,\forall \lambda\geq 0\}. \]

显然,这个集合等价于

\[\{d\in\mathbb{R}^n\mid Ad\geq 0\}. \]

这是因为\(Ay\geq b\)之后有\(\lambda Ad\geq 0\)。注意,这个回收锥是一个多面体锥。这说明回收锥独立于起点\(y\)(如下图)。回收锥中的非零元素称为多面体\(P\)射线 (ray)

注:对于标准形式的多面体

\[P=\{x\in\mathbb{R}^n\mid Ax= b,\,x\geq 0\}, \]

它的回收锥为\( \{d\in\mathbb{R}^n \mid Ad= 0,\,d\geq 0\}.\)

极射线

直观来看,极射线描述的是能够延申到无穷的多面体的"边"。

定义:

  1. 称多面体锥\(C\subset\mathbb{R}^n\)中的一个非零元素\(x\)极射线 (extreme ray) 是指存在n-1个约束在\(x\)有效。
  2. 非空多面体\(P\)的回收锥中的极射线也称为\(P\)极射线

下面给出一个例子,如下图。图\((a)\),向量\(y\)是一个极射线,因为此时n=2,约束\(a^T_1x=0\)\(y\)有效。图\((b)\),多面体由\(a_i^Tx\geq 0\)定义,向量\(z\)是一个极射线,因为此时n=3,约束\(a_1^Tx\geq 0\)以及\(a_2^Tx\geq 0\)\(z\)有效。

注意,一个极射线的正数倍仍然是一个极射线。称两个极射线是等价的是指其中一个是另一个的正数倍。显然,这两个极射线由相同的n-1个线性无关的约束确定(任意n-1个线性无关的约束只能确定两个极射线,其中一个是另一个的负方向)。因为选择n-1个约束有效的情形是有限个,如果我们不区分等价极射线的话,那么多面体的极射线的个数也是有限的。 一个有限个极射线的集合称为极射线的完全集 (complete set of extreme rays) 是指它只包含了等价极射线中的一个。

无界线性规划问题的特征

下面的两个定理将叙述线性规划问题最优值为\(-\infty\)的条件,分别为可行域是一个锥以及一般情形。

定理: 考虑目标函数为\(c^Tx\),约束为一个尖的多面体锥

\[C=\{x\in\mathbb{R}^n\mid a^T_ix\geq 0,\,i=1,\cdots,m\} \]

的线性规划问题,最优值为\(-\infty\)当且仅当存在\(C\)中的极射线\(d\)满足\(c^Td < 0\)

证:
如果存在满足\(c^Td < 0\)\(d\),那么总可以沿着这个方向到无穷远,使得目标函数值为\(-\infty\)

下面证另一部分,假设最优值为\(-\infty\),那么存在\(x\in C\)使得它的目标函数值为负,不妨假设\(c^Tx=-1\)(总可以通过缩小调整使其成立)。因此,多面体

\[P=\{x\in\mathbb{R}^n\mid a^T_1\geq 0,\cdots,a^T_mx\geq 0,c^Tx=-1\} \]

是非空的。由于\(C\)是一个尖锥,且向量\(a_1,\cdots,a_m\)的扩张是\(\mathbb{R}^n\),这说明\(P\)至少存在一个极点(从几何的角度看,一个尖锥中插入一个超平面)。记\(d\)为这些极点中的一个,在\(d\)点,有n个线性无关的约束有效。这说明有n-1个形如\(a_i^Tx\geq 0\)的约束有效,因此\(d\)\(C\)的一个极射线。证毕。

下面,利用对偶理论得到关于一般形式的线性规划问题的。

定理: 考虑目标函数为\(c^Tx\),约束为\(Ax\geq b\)的的线性规划问题,并且假设可行域至少存在一个极点。那么最优值为\(-\infty\)当且仅当可行域中存在极射线\(d\)满足\(c^Td < 0\)

证:

与上一个证明相同,如果存在满足\(c^Td < 0\)\(d\),那么总可以沿着这个方向到无穷远,使得目标函数值为\(-\infty\)

下面证另一面。考虑如下的对偶问题

如果原问题是无界的,那么对偶问题是不可行的。因此与之相关的问题


也是不可行的。这说明这个问题的对偶问题


要么是不可行的要么就是无界的。由于\(x=0\)是一个可行解,这说明这个问题是无界的。由于定理中原问题的可行域至少存在一个可行解,那么\(A\)的行的扩张是\(\mathbb{R}^n\)。这说明回收锥\(\{x\mid Ax\geq 0\}\)是尖的。由上一个定理可知存在回收锥的极射线\(d\)满足\(c^Td < 0\),由定义可知\(d\)也是原问题可行域的一个极射线。证毕。

单纯形法中的无界问题

对于使用单纯形法的标准型问题,如果最优值为\(-\infty\),会出现什么情况呢?

考虑在使用单纯形法中出现最优值为\(-\infty\)的情况,此刻的基本矩阵为\(B\),非基本变量\(x_j\)的判断值为负,并且列\(B^{-1}A_j\)中不存在正的元素。对于第\(j\)个基本方向\(d\),其中\(d_B=-B^{-1}A_j\)\(d_j=1\),而对于其他非基本变量的下标\(i\)\(d_i=0\)。那么向量\(d\)满足\(Ad=0\)以及\(d\geq 0\),这说明它属于回收锥,并且它也是一个使目标函数值下降的方向(因为\(x_j\)对应的判断数是负值)。

另外,在回收锥的约束中,在\(d\)有n-1个线性无关的约束有效。这是因为m个约束\(Ad=0\)成立,以及n-m-1个约束\(d_i=0\)成立。因此,\(d\)是一个极射线。这说明若对标准型问题使用单纯形法使得停止在目标函数值为\(-\infty\),那么单纯形法与此同时得到了一条极射线。

多面体的表示

Resolution 定理

下面的定理说明,至少存在一个极点的多面体中的任意元素都可由多面体的极点和极射线线性表出。

定理:(resolution 定理)

\[P=\{x\in\mathbb{R}^n\mid Ax\geq b\} \]

为一个至少存在一个极点的非空多面体。令\(x^1,\cdots,x^k\)为极点,\(w^1,\cdots,w^r\)\(P\)的极射线的完备集。令

\[Q=\{\sum_{i=1}^k\lambda_ix^i+\sum_{j=1}^r\theta_jw^j\mid\lambda\geq 0,\theta_j\geq 0,\sum_{i=1}^k \lambda_i=1\}. \]

那么,\(Q=P\)

证:

先证明\(Q\subset P\)。令

\[x=\sum_{i=1}^k\lambda_ix^i+\sum_{j=1}^r\theta_jw^j \]

\(Q\)中任意元素,其中\(\lambda_i\)\(\theta_j\)非负且\(\sum_{i=1}^k\lambda_i=1\)。而向量\(y=\sum_{i=1}^k\lambda_ix^i\)\(P\)中原色的凸组合,显然\(y\in P\)且满足\(Ay\geq b\)(因为多面体是凸集)。另外,对于每一个\(j\)都有\(Aw^j\geq 0\)(由定义可得),这说明\(z=\sum_{j=1}^r\theta_jw^j\)满足\(Az\geq 0\)。综上,向量\(x=y+z\)满足\(Ax\geq b\),进而\(x\in P\)

下面证\(P\subset Q\)。使用反证法,假设\(P\)不是\(Q\)的一个子集。令\(z\in P\)但是不属于\(Q\)。考虑如下的线性规划问题:

这个问题是不可行的,因为\(z\notin Q\)。它的对偶问题是:

显然这个问题有一个可行解\(p=0,\,q=0\),又由于它的对偶问题不可行,因此这个问题的最优值为\(-\infty\),并且存在一个可行解\((p,q)\)使得\(p^Tz+q\)是负值。另外,由于对任意\(i\)都有\(p^Tx^i+q\geq 0\)这表明对于任意\(i\)都有\(p^Tz < p^Tx^i\)。注意,约束\(p^Tw^j\geq 0\)对任意的\(j\)都成立。 固定这个\(p\),考虑下面的线性规划问题

如果它的最优值有界,那么说明存在极点\(x^i\)是最优解。由于\(z\)是这个问题的一个可行解,因此\(p^Tx^i\leq p^Tz\)。产生矛盾。如果它的最优值为\(-\infty\),上一节的定理说明存在一个极射线\(w^j\)使得\(p^Tw^j <0\),产生矛盾。证毕。

例:

考虑由如下无界多面体确定的约束。

约束确定范围如图:

这个多面体有3个极点\(x^1=(0,2),\) \(x^2=(0,1)\), \(x^3=(1,0)\)。回收锥\(C\)由不等式\(d_1-d_2\geq 0\)以及\(d_1+d_2\geq 0\)\(d_1,d_2\geq 0\)确定,也即\(C=\{(d_1,d_2)\mid d_1\geq d_2\geq 0\}\)。这个锥由两个极射线\(w^1=(1,1)\)以及\(w^2=(1,0)\)。那么多面体中向量\(y=(2,2)\)可表示为

注意,线性表示并不唯一,比如

注意: 上面定理中的集合\(Q\)是多面体

\[H=\left\{ (\lambda_1,\cdots,\lambda_k,\theta_1\cdots,\theta_r)\mid \sum_{i=1}^k\lambda_i=1,\lambda_i,\theta_j\geq 0\right\} \]

在线性映射

\[(\lambda_1,\cdots,\lambda_k,\theta_1\cdots,\theta_r) \mapsto \sum_{i=1}^k\lambda_ix^i+\sum_{j=1}^r\theta_jw^j \]

下的像。

下面,我们考虑多面体是有界的情形,这个结论在多面体中的几何中提出过,这里换个思路重新考虑。

推论: 一个非空有界多面体是它的极点的凸包。

证:
\(P=\{x\mid Ax\geq b\}\)为一个非空有界多面体。若\(d\)是锥\(C=\{x\mid Ax\geq 0\}\)中的一个非零元素以及\(x\in P\),那么\(x+\lambda d\in P\), \(\forall \lambda\geq 0\)。这与\(P\)的有界性矛盾。因此\(C\)中仅存在\(0\)向量并且不存在极射线。由上面的定理将得到上述的推论。证毕。

还有另一个关于锥的推论。

推论: 假设锥\(C=\{x\mid Ax\geq 0\}\)是尖的。那么\(C\)中任意元素可由\(C\)中的极射线非负线性表出。

Resolution 定理的反面

称集合\(Q\)有限生成的 (finitely generated) 是指

\[Q=\{\sum_{i=1}^k\lambda_ix^i+\sum_{j=1}^r\theta_jw^j\mid\lambda\geq 0,\theta_j\geq 0,\sum_{i=1}^k \lambda_i=1\}. \]

其中\(x^1,\cdots,x^k\)\(w^1,\cdots,w^r\)\(\mathbb{R}^n\)中的元素。Resolution 定理说明一个至少存在一个极点的多面体是一个有限生成的集合。下面,我们将说明每个有限生成的集合是一个多面体。

注意,之前提到的,一个有限生成集合\(Q\)可以看作是多面体

\[H=\left\{ (\lambda_1,\cdots,\lambda_k,\theta_1\cdots,\theta_r)\mid \sum_{i=1}^k\lambda_i=1,\lambda_i,\theta_j\geq 0\right\} \]

在一个线性映射下的像。下面给出定理说明每个有限生成的集合是一个多面体。

定理: 有限生成集合是多面体。特殊的,有限多个向量的凸包是一个有界多面体。

证:

考虑在resolution 定理证明中使用的线性规划问题:

一个给定的向量\(z\)属于\(Q\)当且仅当上面的问题有可行解。利用对偶理论可知它有可行解当且仅当它的对偶问题

存在最优值且最优值有限。为了将这个对偶问题转化为标准形式引入非负变量\(p^+,p^-,q^+,q^-\),使得\(p=p^+-p^-\)以及\(q=q^+-q^-\),同时引入剩余变量。由于标准型问题对应的多面体中不存在线(更具前面的定理,\(0\)是一个极点),根据无界线性规划问题的特征中的定理可知,这个标准型问题的最优值为有限当且仅当对于任意极射线都有

\[(p^+)^Tz-(p^-)^Tz+q^+-q^-\geq 0. \]

因此,\(z\in Q\)当且仅当\(z\)满足上述的有限个不等式。这说明\(Q\)是一个多面体。证毕。

参考文献: Introduction to Linear Optimization by Dimitris Bertsimas & John N. Tsitsiklis.


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM