帶你了解兩種線性規划的方法：稀疏矩陣存儲和預處理

本文轉載自查看原文 2021-07-19 10:32 287 預處理/ 線性規划/ 矩陣/ 稀疏矩陣/ 存儲/ 程序員之家

摘要：本文為大家帶來線性規划的稀疏矩陣存儲和數據預處理。

本文分享自華為雲社區《線性規划--稀疏矩陣》，原文作者：Bale10 。

隨着AI時代的發展，線性規划問題的規模越來越大是一種必然。面對大規模的線性規划問題，如何存儲數據，使得存儲空間節省以避免資源的浪費，並且使得數據的查詢、修改和增刪方便快捷，是一個急需解決的問題。本文為大家帶來線性規划的稀疏矩陣存儲和數據預處理。

稀疏矩陣

LP的規模通常是由約束矩陣A的規模決定的，矩陣的元素通常用8個字節的double型儲存，假設矩陣有m行，n列，則直接儲存A需要8mn字節。如果A有10000行，20000列（不是特別大規模的），那么需要1.6G內存儲存A，一方面內存要求高，另一方面對矩陣A的操作困難。大規模LP通常含有大量的零元，非零元占比非常小，這個性質稱為稀疏性，即A為稀疏矩陣。

稀疏矩陣儲存

稀疏矩陣的數據結構設計應該考慮下面三個因素：

僅存非零元，一個好的稀疏矩陣數據結構應該僅存A的非零元，而不存大量的零元。這樣做的優點有三。首先，節省內存，使得大型稀疏矩陣能存在內存中。其次，若僅存非零元內存也放不下，則必須借助於外存，而從外存存取數據的速度一般比從內存存取數據慢得多，因此，在使用外存的情況我們也希望僅存非零元。第三，涉及零元的操作可以不執行，從而顯著節約計算時間。
非零元的產生--填入元，一個稀疏矩陣，在高斯消去(或LU分解）過程中，原來的零元可能要變成非零元。這種在消去過程中，由零元變成的非零元，叫做填入元；在整個消去過程中產生的填入元的個數，叫做填入量。如果一個十分稀疏的矩陣，經過上述消去運算后產生大量的填入元，則稀疏性就會消失，因此，保持矩陣的稀疏性是利用其稀疏性的前提。如何設法使消去過程中產生盡可能少的填入元是算法需要考慮的。稀疏矩陣是一個動態的數據結構，特別是經常需要插入非零元或刪去非零元。因此，一個好的稀疏矩陣數據結構必須便於插入或刪除。
稀疏矩陣的數據結構和消去算法緊密相關，在考慮稀疏矩陣的數據結構時，必須同時考慮到消去算法，數據結構必須盡可能便於其算法的實現。

線性表

最簡單的稀疏矩陣存儲方案是線性表。為了具體起見，我們以下列稀疏矩陣A_5為例：

將非零元按列存放到數組CE中：

CE中相應非零元的行號記錄在數組IROW中：

為了給出每個非零元在的列號，引入一個指針數組ICFR，ICFR(j)表示第j列第一個非零元在CE中的位置。

ICFR的長度為N+1，ICFR(N+1)表示最后一個元存放在第$N$列末元位置加1的位置上，這是為了便於計算最后一列非零元個數而引入的。這種存儲方案所需要存儲量為2NZ+N+1。它的優點是存儲量小，結構簡單，單缺點是不便於插入和刪除，若要插入一個非零元，位於它下面的非零元必須向下移動一個位置，這是非常浪費時間的。

在程序中為了允許插入非零元，通常要說明一個較大的數組。上述是將A按列存放，當然也可以按行存放。經常的做法是先將A進行LU分解，然后將下三角形矩陣L按列存放，上三角矩陣U按行存放。