1.功能概述
1.1 圖像分類功能概述
在遙感技術的應用中,對資源分布、自然災害、區域環境等的監測和分析依附於遙感圖像分類。而遙感圖像分類是進行圖像信息提取的有效手段。隨着遙感技術的的不斷改進,各領域對遙感圖像分類方法的要求越來越高,主要表現在以下幾個方面:
-
分類結果的精確性:各領域對分類結果的精度要求越來越高。
-
分類速度的時效性:隨着近年來遙感數據的快速增長,項目中往往需要進行海量遙感數據的快速處理。遙感圖像分類屬於大規模機器學習,數據量大導致運算量很大。另外,人們在追求高精度的同時,計算復雜度也隨之增加,這對遙感應用的時效性提出了很高的要求。
-
分類方法使用的便捷性:解譯人員對分類算法的分類行為難以理解,無法准確了解參數設置與分類結果之間的關聯性,需要將分類器的行為轉化為易於理解的符號規則,把遙感影像的內在特征和規律顯示出來。
1.2 監督分類功能特點
遙感圖像分類實現的主要方法包括監督分類和非監督分類。其中監督分類作為一種先學習后分類的機器學習策略,利用像元光譜特征的相似性進行分類,具有較高的分類精度,是對遙感圖像進行信息提取的主要手段。
監督分類功能特點包括:
-
充分利用分類地區的先驗知識,有目的的選擇分類類別;
-
通過對樣本的反復檢驗和訓練,提高分類成果的可靠性,出現嚴重錯誤的幾率較低;
-
分類速度相對較快,分類精度較高;
-
人為主觀性比較強,獲取合格的樣本比較費時費力。
分類方法 |
優點 |
缺點 |
適用范圍 |
監督分類 |
精確度高,准確性好,與實際類別吻合較好 |
工作量大 |
有先驗知識時使用該方法 |
非監督分類 |
工作量小易於實現 |
分類結果與實際類別相差較大,准確性差 |
在沒有類別先驗知識時使用該方法 |
在實際應用中監督分類精度要高於非監督分類,更適用於遙感圖像的精細化分類,非監督分類可應用於分類精細化程度不高的快速分類的場景中。
1.3 監督分類應用
在目前的遙感圖像分類的應用中,傳統模式識別的監督分類方法,諸如最小距離、最大似然法等,能夠滿足應用人員對大區域遙感影像的快速分類處理需求。可以為行業用戶提供一種信息提取的解決方案,已廣泛在農業、林業、水資源、地質環境調查、環境保護、土地利用、城市規划等領域。
但是監督分類由於單一地依靠地物的光譜特征進行分類,由於受到遙感影像本身的空間分辨率及"同物異譜""異物同譜"現象存在,導致分類精度不高,因此對某些地區,某些地物需要對分類器加以改進或者與其他分類方法結合使用來提高分類精度。
2.基本概念
2.1 訓練樣本
定義:
-
訓練樣本用來確定圖像中已知類別像素的特征。建立訓練樣本之前首先要根據工作要求,收集研究區域的相關資料,包括DEM、土地利用覆蓋圖、植被覆蓋圖、行政區划圖等。根據這些資料,確定分類對象和分類系統。
訓練樣本的選取:
-
根據系統分類要求,在遙感圖像上用人機交互的方式勾繪各種典型地物的分布范圍,即訓練樣本。
訓練區的選取注意事項:
-
訓練樣本必須具有典型性和代表性。同一類別的訓練樣本的光譜特征必須是均一的,不能包含其他類別或者混合像元。
-
應分散的選取訓練樣本,不要太集中。目的是使每一類別的訓練樣本都具有一定的代表性。
-
訓練樣本的數量。作為一個普遍的規則,如果圖像有N波段,則每一類別至少應該有10N個訓練樣本。
2.2 監督分類方法-最小距離法
定義:
-
利用訓練樣本中各類別在各波段上的均值,根據各像元與訓練樣本平均值距離的大小來決定其類別。哪類別集群中心離它"最近",該像素就屬於哪個類別。
2.3 監督分類方法-馬氏距離法
定義:
-
馬氏距離是一種加權的歐式距離,它以協方差的倒數作為權重,協方差越大表示距離越短,因此馬氏距離表示數據的協方差距離。
馬氏距離的優點:
-
它不受量綱的影響,兩點之間的馬氏距離與原始數據的測量單位無關,馬氏距離還可以排除變量之間的相關性的干擾。
歐式距離
馬氏距離
2.4 監督分類方法-最大似然法
示例:
-
現在我們有兩個盒子:甲和乙,每個里面都裝了100個球,其中甲中裝了95個紅球,5個藍球,乙中裝了20個紅球,80個藍球,現在有人從盒子里面取出了一個球,發現是紅球,然后讓你猜:"他是從哪個盒子里面取出來的?",想必你會猜"甲"吧。
定義:
-
首先定義一個從屬於某種類別的概率分布集群,然后把待分類像元落入各類別的條件概率作為判別函數, 將像元落入某類別的條件概率最大的類定義為該像元的類別。
最大似然法確定概率密度函數
最大似然法假設遙感圖像的每個波段數據都為標准正態分布,條件概率的計算轉化為求取正態分布的概率密度函數 f(x)的值。
μ:均值
δ:方差
2.5 混淆矩陣
混淆矩陣(confusion matrix):是一個用於表示分為某一類別的像元個數與地面檢驗為該類別數的比較陣列。
圖像類別 |
參考類 |
||||
X |
Y |
Z |
行和 |
用戶精度 |
|
X |
A |
E |
F |
G |
A/G |
Y |
B |
I |
Z |
M |
I/M |
Z |
C |
Y |
J |
O |
J/O |
列和 |
D |
P |
Q |
N |
|
生產者精度 |
A/D |
I/P |
J/Q |
用戶精度:是指正確分到X類的像元總數(對角線值)與分類器將整個影像的像元分為X類的像元總數(混淆矩陣中X類行的總和)比率。用戶精度 = A / G。用來表示分類結果中,各類別的可信度,整張分類成果的可靠性。
生產者精度:指分類器將整個影像的像元正確分為A類的像元數(對角線值)與A類真實參考總數(混淆矩陣中A類列的總和)的比率。生產者精度= A / D。用於比較分類方法的好壞。
總體分類精度:指被正確分類的類別像元數與總的類別個數的比值。總體分類精度= A + I + J / N。
2.6 Kappa系數
kappa系數是一種衡量分類精度的指標。它是通過把所有地表真實分類中的像元總數(N)乘以混淆矩陣對角線(Xii)的和,再減去某一類地表真實像元總數與該類中被分類像元總數之積對所有類別求和的結果,再除以總像元數的平方減去某一類地表真實像元總數與該類中被分類像元總數之積對所有類別求和的結果所得到的。
N:地表真實分類中的像元總數.
xii:正確分類的數量(對角線上的數值)
Xi+:i類分類像元總數(行)
X+i:i類真實像元總數(列)
圖像類別 |
參考類 |
|||
X |
Y |
Z |
行和 |
|
X |
A |
E |
F |
G |
Y |
B |
I |
Z |
M |
Z |
C |
Y |
J |
O |
列和 |
D |
P |
Q |
N |
Kappa系數= [ N*(A+I+J)-(D*G+P*M+Q*O) ] / [ N2 -(D*G+P*M+Q*O) ]
Kappa系數 |
分類質量 |
<0 |
很差 |
0-0.2 |
差 |
0.2-0.4 |
一般 |
0.4-0.6 |
好 |
0.6-0.8 |
很好 |
0.8-1.0 |
極好 |
Kappa系數與分類精度關系
3.操作演示
使用數據:
高分2號多光譜數據,監督分類.img
操作流程:
監督分類總體上可以分為4個過程:
定義訓練樣本→執行監督分類→評價分類結果→分類后處理
其中評價分類結果和分類后處理的順序可以根據實際情況進行調整。
3.1 距離分類
打開PIE-Basic軟件,在"圖像處理"標簽下的"圖像分類"組,單擊【監督分類】按鈕下的下拉箭頭,選擇【距離分類】,打開【距離分類】對話框:
-
參數設置:
-
【選擇文件】選擇需要分類的數據;
-
【導入文件】如果待分類影像不在文件列表中,可以通過單擊【導入文件】,添加待處理影像到文件列表中;
-
【選擇區域】中設置待分類處理的區域,這里默認對裁剪出來的數據進行全圖分類;
-
【選擇波段】中選擇需要分類的波段,默認是全部波段參與分類;
-
【選擇ROI】中選擇ROI文件,這里會自動讀取制作的ROI樣本文件;
-
【分類器】中設置監督分類規則(最小距離或馬氏距離)。
3.2 最大似然分類
打開PIE-Basic軟件,在"圖像處理"標簽下的"圖像分類"組,單擊【監督分類】按鈕下的下拉箭頭,選擇【最大似然分類】,打開【最大似然分類】對話框:
-
參數設置:
-
【選擇文件】選擇需要分類的數據;
-
【導入文件】如果待分類影像不在文件列表中,可以通過單擊【導入文件】,添加待處理影像到文件列表中;
-
【選擇區域】中設置待分類處理的區域,這里默認對裁剪出來的數據進行全圖分類;
-
【選擇波段】中選擇需要分類的波段,默認是全部波段參與分類;
-
【選擇ROI】中選擇ROI文件,這里會自動讀取制作的ROI樣本文件;
-
【分類器】中設置監督分類規則-最大似然分類算法;
-
【輸出文件】設置輸出影像的保存路徑和名稱。
3.3 ROI工具
打開PIE-Basic軟件,在"圖像處理"標簽下的"圖像分類"組,單擊【ROI工具】,打開【 ROI工具】對話框:
3.4分類后處理
監督分類和非監督分類等分類方法得到的一般是初步結果,難於達到最終的應用目的。因此,需要對初步的分類結果進行一些處理,才能得到滿足需求的分類結果,這些處理過程就通常稱為分類后處理。常用分類后處理通常內容包括:分類合並、分類統計、過濾、聚類、主/次要分析、精度評價。
打開PIE-Basic軟件,在"圖像處理"標簽下的"圖像分類"組,單擊【分類后處理】按鈕下的下拉箭頭,顯示分類后處理算法。
-
分類后統計:分類統計主要基於分類結果計算相關輸入文件的統計信息。統計內容包括各類別的分類點數(像元個數)、百分比以及面積。
-
分類合並:是將分類成果中多個同物異譜的類別進行合並。
-
過濾:用以解決分類圖像中出現的孤島問題,使用斑點分組方法來消除分類文件中被隔離的像元 。像元被過濾后,被歸類為Unclassified。
-
過濾閾值:若一類中被分組的像元少於設定的閾值,這些像元會被歸類到Unclassified 層中;
-
聚類領域:觀察周圍的4個或8個像元,判定一個像元是否與周圍的像元同組。
-
聚類:聚類處理是運用形態學算子(腐蝕和膨脹)將鄰近的類似分類區域聚類並合並。首先將被選的分類用一個膨脹操作合並到一起,然后用指定了大小的變換核對分類圖像進行侵蝕操作。
-
主/次要分析:圖像分類往往會產生一些面積很小的圖斑,主/次要分析采用類似於卷積濾波的方法將較大類別數中虛假像元歸到該類中。主要分析功能是采用類似卷積濾波的方法將較大類別中的虛假像元歸到該類中,首先定義一個變換核尺寸,然后用變換核中占主要地位(像元最多)類別數代替中心像元的類別數,次要分析相反,用變換核中占次要地位的像元的類別數代替中心像元的類別數。
-
精度分析:是對分類結果的總體分類精度和各類地物的精度進行評價。評價方法包括混淆矩陣、Kappa系數。 真實感興趣區參考源可以使用兩種方式:一是標准的分類圖(矢量);二是選擇的感興趣區(驗證樣本區柵格數據),真實感興趣區參考源的選擇通常是歷史的分類柵格文件。
3.5實操流程
第一步:類別定義/類別判別
根據分類目的、影像數據自身的特征和分類區收集的信息確定分類系統。對影像進行特征判斷,評價圖像質量,決定是否需要進行影像增強等預處理。從遙感影像上仔細觀察地物覆蓋情況,大體判斷主要地物的類別數量。經過判別本次演示數據的目標類別包括:建築物、水體、道路、耕地、林地、其他類別等。
第二步:樣本選擇
使用PIE-Basic軟件【ROI工具】進行樣本選擇。打開【ROI工具】對話框。點擊【增加】添加樣本類別,設置樣本的名稱和顏色雙擊需要修改的ROI名稱列,名稱進行高亮顯示,開 始進行名稱修改。雙擊ROI顏色列,打開選擇顏色面板,選擇樣本的色彩。
樣本類別創建完成后,開始在影像上選取樣本。選中樣本類別,使用矩形工具在影像上
選擇純凈像元區域進行勾繪。同樣方法,在圖像別的區域繪制其他樣本,樣本要滿足一定數量,並且盡量均勻分布在整個圖像上。最后,可以用【文件】下的保存ROI工具把ROI文件保存到本地。
第三步:分類器選擇
根據分類的復雜度、精度需求等指標確定選擇哪一種分類器。PIE-Basic軟件提供了兩種分類方法,距離分類和最大似然分類方法。
-
距離分類的分類法原理簡單,分類精度不高,但計算速度快,可以在快速瀏覽分類概況中使用。
-
最大似然法是監督分類常用的方法之一,分類精度較高,本次案例選用最大似然法進行監督分類。
第四步:影像分類
在"圖像處理"標簽下的"圖像分類"組,單擊【監督分類】按鈕下的下拉箭頭,打開【最大似然分類】對話框;【選擇文件】欄中會自動加載圖層列表中的柵格影像,選中待分類的遙感影像。【選擇ROI】中選擇本次要使用的ROI文件,如果圖層列表中只有一個ROI,則不要選擇。【分類器】中已自動加載最大似然算法,不需要設置。
第五步:分類后處理
內容包括:分類合並、主/次要分析、分類統計、精度評價。
(1)分類合並:將分類成果中同一類別的不同圖層合並到一起。選擇"圖像處理"標簽下的"圖像分類"組,單擊【分類后處理】按鈕下的下拉箭頭,選擇【分類合並】,打開【分類合並】對話框,進行圖層合並。
(2)主次/要分析:監督分類或者非監督分類,分類結果中不可避免地會產生一些面積很小的圖斑。無論從專題制圖的角度,還是從實際應用的角度,都有必要對這些小圖斑進行剔除或重新分類,目前常用的方法有主次/要分析、聚類處理和過濾處理。但效果最好的是主次/要分析。
(3)分類統計:將分類合並后的成果進行統計,合並后的圖層有統計信息,被合並的圖層屬性是0。最后,可以對統計結果進行保存。
(4)精度評價:使用歷史分類成果作為真實地理影像進行混淆矩陣和Kappa系數。
總體分類精度:84.78%
Kappa系數:81.46%