PIE-Basic 非監督分類


  1. 功能概述

1.1 遙感圖像分類的概念

遙感技術能夠實現宏觀、迅速的大范圍信息提取,被各個行業廣泛應用。遙感圖像分類是圖像信息提取的一種方法,是遙感數字圖像處理的重要環節之一。

遙感圖像分類:根據感興趣目標在遙感圖像上的特征差異,判斷並識別其類別屬性和空間分布特征等信息的過程。

重點關注:

  • 選擇哪些有效特征進行分類
  • 選擇什么方法進行分類
  • 分類方法的參數如何設置

 

示例 :區分幼兒園小朋友的性別

變量(遙感的不同光譜波段)

觀測樣本(遙感像元)

身高

體重

服裝樣式

鞋子顏色

頭發長短

其他特征(如行為)

波段1

波段2

波段3

波段4

波段5

其他特征(如空間紋理)

張三

           

李四

           

王五

           

……

           

分類的本質就是從觀測樣本的屬性中選取對判斷目標具有差異的特征,並利用這些特征建立判斷標准,從而將觀測樣本划分為不同的類別。

 

1.2 遙感圖像分類的原理

地物在遙感影像上的每個屬性均可被當作一個變量,參與分類的這些屬性(也稱特征向量)構成一個n維的特征空間。

理想情況下,同類地物應具有相同或者相似的特征描述,因此他們的像元在n維特征空間中聚集在一起;而不同地物應具有不同的特征描述,因此不同地物的像元在n維的特征空間中呈現分離的狀態。

  • 一個像元可以看成由n個特征組成的n維空間的一個點
  • 同類地物的像元形成n維空間的一個點群,差異明顯的不同地物會構成n維空間的若干個點群。
  • 計算機分類就是要分析特征空間這些點群的特點,如點群的位置、分類中心,從而確定點群的界限,最終完成分類任務。

    二維特征空間分類

    三維特征空間分類

 

1.3 遙感圖像分類的方法

基於光譜特征的遙感影像分類方法主要包括:

  • 非監督分類
  • 監督分類

 

遙感圖像分類過程:

(1)分類的目的及研究區背景了解

(2)數據獲取

(3)數據預處理

(4)分類類別確定和解譯標志確立

(5)訓練樣本選取和評價

(6)特征提取和選擇

(7)分類方法的選擇

(8)圖像分類

(9)分類后處理

(10)精度評價

 

1.4 分類方法比較

監督分類和非監督分類的根本區別點在於是否利用訓練樣本來獲取先驗的類別知識。

 

1.5 遙感圖像分類概念

示例 :區分女演員的民族

有一群你一個都不認識的女演員,她們各自穿着自己民族的服裝,請將她們民族識別出來。

思路1:先將女演員按照她們服裝特征的相似程度進行歸類(此時你不知道該服裝類別是哪個民族),然后再去查找各民族服飾的特征介紹,由此判斷各類別是什么民族。(這種先聚類再判斷類別的方法屬於非監督分類

思路2:先根據畫冊找出各民族對應的服裝的特征,然后根據女演員穿着的服裝特征將各個女演員歸類到各民族中。(這種先學習先驗知識再分類的方法屬於監督分類

總結:監督分類和非監督分類,都需要給出特征,監督分類需要給出樣本,讓系統根據樣本學習並總結規律,然后對未知領域進行預測歸類。非監督分類是沒有樣本,系統隨機選擇一些種子點,根據特征進行聚類和優化,最后來確定各類的語義。

 

1.5 非監督分類應用

  • 非監督分類方法不需要對被研究的地區有事先的了解,僅需一定的知識來解釋分出的類別,人為誤差的機會減少,操作也相對簡單。因非監督分類整體計算量相對較小,對計算機配置要求較低,在時間和成本上較為節省,且分類成果具有一定的精度,可應用於分類精細化程度不高的快速分類的場景中,如基於中低分辨率的遙感影像森林、農作物的大范圍提取等。
  • 非監督分類想要得到相對可靠的結果,需對結果進行大量分析和處理,但分類出的結果依然普遍會存在"同物異譜"或者"異物同譜"現象,地物類別的細分難度較大。在項目實際操作中進行精細化分類時,不會選擇非監督分類作為唯一分類手段,通常會結合監督分類等其他分類方法混合使用,來使分類成果達到預期的目的。

 

2.基本概念

非監督分類:

在沒有先驗類別(訓練場地)作為樣本的條件下,主要根據像元間相似度的大小進行歸類合並(相似度大的像元歸為一類)的方法。它是以聚類分析作為理論基礎,所以非監督分類又稱為聚類分析。

補充說明:非監督分類的前提是假定遙感影像上同類物體在同樣條件下具有相同的光譜特征。非監督分類不必對影像地物獲取先驗知識,緊依靠影像上不同地物光譜信息(或紋理信息)進行統計地物特征的差別來達到分類的目的,最后通過目視判讀或者實地調查對分類結果進行屬性確認。

 

聚類分析:

非監督分類采用的主要方法是聚類分析。

把一組像素按照相似性歸成若干類別,其目的是使得屬於同一類別的像素之間距離盡可能的小,而不同類別的像素之間距離盡可能的的大,在遙感圖像分類中主要實現算法包括:

  • K-Means分類算法
  • ISODATA分類算法
  • 神經網絡分類算法

 

K-Means分類:

K-Means算法的基本思想是以空間中k個點為中心進行聚類,對最靠近中心的對象進行歸類。通過迭代的方法,逐次更新各聚類中心的值,直至得到最好的聚類結果。

 

示例:K-Means分類演示

 

ISODATA分類:

  • ISODATA算法(迭代自組織數據分析算法)是在k-均值算法的基礎上,增加對聚類結果的"合並"和"分裂"兩個操作,並可設定算法運行控制參數的一種聚類算法。
  • 與k-均值算法相比,ISODATA算法不僅可以通過調整樣本所屬類別完成樣本的聚類分析,而且可以自動地對類別進行"合並"和"分裂",從而得到類數比較合理的聚類結果, 而k-均值算法的類別數是設置后不能變化的。

 

初始參數設置:

  • K : 期望得到的聚類數;   
  • Nc: 初始的設定的聚類數;   
  • θN: 每一個類別中最少的像元數,若少於此數則去掉該類別;   
  • θs: 一個類別中,樣本特征中最大標准差。若大於這個值,則可能分裂;
  • θc: 兩個類別中心間的最小中心距離,若小於此數,把兩個類別需進行合並;
  • L: 在一次合並操作中,可以合並的類別的最多對數;
  • I: 最大迭代運算的次數。

 

ISODATA分類主體部分描述:

ISODATA算法

第一步:從遙感影像上隨機選取Nc個初始聚類中心。

第二步:用最小距離法計算每個樣本到聚類中心 Sj 的最小距離,並將其分到距離最小的聚類中心所在的類別中。

第三步:判斷每個類別中像元數目是否小於θN,如果 Sj 中的像元數目 Sj < θN,則刪除該類別,此時Nc=Nc-1。被刪除類別中的像元重新分配到剩下距離最小的類別中。

第四步:針對每個類別,重新計算它的聚類中心。

第五步:若 Nc ≤ K/2,即聚類中心的數目小於或等於預期值的一半,說明當前類別數太少,前往進行分裂操作。

第六步:若迭代運算的次數是偶數次,或Nc≥2K,說明當前類別數太多,前往進行合並操作。

第七步:如果達到最大迭代次數(I)則終止,否則回到第二步繼續執行

 

BP神經網絡分類:

神經網絡是源於對生物大腦機理的仿生學研究。 BP算法通過樣本和標簽值對神經元網絡進行訓練, 采用反向傳播算法來逐層調整各神經元的權重及截距,使得最終的輸出和標簽值接近。

誤差反向傳播法原理示意圖

 

自組織特征映射網絡是由輸入層和輸出層組成。

自組織特征映射網絡

 

示例:把屬性相似的16種動物進行歸類

自組織特征映射網絡的輸出平面有10x10個神經元,用16個動物模式輪番輸入進行訓練,最后輸出平面成果如下圖所示,屬性相似的動物在輸出平面上的位置相鄰。

 

3.操作演示

使用數據:

高分六號數據,非監督分類.img

操作流程:

 

3.1 K-Means分類:

打開PIE-Basic軟件,在"圖像處理"標簽下的"圖像分類"組,單擊【非監督分類】按鈕下的下拉箭頭,選擇【K-Means分類】,打開【K-Means分類】對話框:

  • 波段選擇:可以選擇所有波段,也可以選擇部分波段,通常都是選擇所有波段進行處理;
  • 參數設置:
  • 預期數類:期望得到的類別數。分類前對遙感影像進行分析,檢查影像整體上需要分出的類別數,設置的類別數與最終分類結果一致,是該算法最重要的參數;
  • 最大迭代次數:最大的運行迭代次數(為達到較好的運行效果,一般設置6次以),理論上迭代次數越多,分類結果越精確;
  • 終止閾值:當迭代計算的新聚類中心與原聚類中心距離等於或小於閾值,則終止迭代計算,閾值范圍在0-1之間。當距離接近設置的閾值時,說明新聚類中心已經趨於穩定,聚類集合中樣本數量和位置不會發生較大的改變。

注:K-Means分類參數設置最重要的是預期數類數,該參數對分類結果的正確性起到決定性影響。

 

3.2 ISODATA分類:

打開PIE-Basic軟件在"圖像處理"標簽下的"圖像分類"組,單擊【非監督分類】按鈕下的下拉箭頭,選擇【ISODATA分類】,打開"ISODATA分類"參數設置對話框:

  • 【波段選擇】欄可以選擇所有波段,也可以選擇部分波段,通常都是選擇所有波段進行處理;
  • 參數設置:
  • 預期類數:分類前對遙感影像進行分析,檢查影像整體上需要分出的目標類別數,預期類數通常是目標類別數量的2-3倍,若后期分類效果不好,可再次調整此參數;
  • 初始類數:通常填寫比預期類數略大一些的數值;
  • 最小像元數:設置形成一類別所需的最少像元數,可設置的較大一些。此處參數可用來減少出現細碎斑點的分類成果;
  • 最大迭代次數:理論上迭代次數越多(通常設置均應在6次以上),分類結果越精確;
  • 最大標准差:該參數是設置分裂的閾值,如果某一類別的標准差比該閾值大,該類將被拆分成兩類。根據影像灰度值設置此參數,若同一類別中存在多種地物需分離,為放大類別之間的差異,該參數值應往小的方向設置;
  • 最小中心距離:兩類別中心點的距離小於輸入的最小值,則類別將被合並。為避免同一類別被分成多個圖層,該參數設置應往小的方向設置;
  • 最大合並對數:一次迭代運算中可以合並的聚類中心的最多對數。

注:因ISODATA算法參數較多,在算法運算時參數之間也存在一定關聯性,所以為得到較好的分類結果,需要反復多次調整參數,直到得到最優的效果。

 

3.3 BP神經網絡分類:

打開PIE-Basic軟件,在"圖像處理"標簽下的"圖像分類"組,單擊【非監督分類】按鈕下的下拉箭頭,選擇【神經網絡聚類】,打開"神經網絡聚類"參數設置對話框:

  • 波段選擇:選擇需要分類的波段,可以選擇所有波段,也可以選擇部分波段;
  • 參數設置:
  • 分類類別:選擇分類規則,有交互傳播網絡,自組織特征映射網絡;
  • 分類數:設置分類個數,至少2個;
  • 窗口大小:選擇分類窗口大小,即1*1、3*3、5*5;
  • 迭代次數:迭代運算的最大次數,理論上迭代次數越大,分類結果越准確;
  • 收斂速率:設置分類收斂的速率,即連續2次誤差的比值的極限。

所有參數設置完畢后,點擊【確定】按鈕即可進行神經網絡分類,並輸出分類結果。

 

3.4 實操流程:

第一步:影像分析

從遙感影像上大體判斷主要目標地物的類別數量,一般非監督分類設置預期類數比目標分類數量多2-3倍,這樣有助於提高分類精度。

本次演示數據目標類別為:植被,水體,其他地類。本案例預期類別數量設置為8。

 

第二步:分類器選擇

PIE-Basic軟件非監督分類的算法包括 K-Means分類、ISODATA分類、神經網絡聚類分類。 ISODATA算法是在 K-Means算法的基礎上改進,增加了分裂和合並的操作,對遙感影像的適應程度比K-Means算法要高。所以本次演示使用ISODATA分類算法進行操作。

 

第三步:影像分類

打開PIE-Basic軟件,在圖層列表中添加柵格數據YLDOM.img。選擇菜單欄中"圖像處理"標簽下的"圖像分類"組,單擊【非監督分類】按鈕下的下拉箭頭,選擇【ISODATA分類】,打開【ISODATA分類】對話框:

  • 在【輸入文件】欄中把影像數據手動添加進來;
  • 【波段選擇】欄中選中所有波段;
  • 參數設置:
  • 預期類數:對遙感影像分析后,目標類別為3種,預期類數通常是目標類別數量的2-3倍,所以預期類數先填寫8.若后期分類效果不好,可再次調整此參數;
  • 初始類數:通常填寫比預期類數略大一些的數值,此處填寫為10
  • 最小像元數:設置形成一類別所需的最少像元數,可按默認設置為5
  • 最大迭代次數:理論上迭代次數越多,分類結果越精確,通常設置為10
  • 最大標准差:該參數是設置分裂的閾值,如果某一類別的標准差比該閾值大,該類將被拆分成兩類。為區分相似灰度值之間的差異,該參數值設置不宜過大,設置為5
  • 最小中心距離:兩類別中心點的距離小於輸入的最小值,則類別將被合並。為避免類別之間過於混淆,該參數設置不宜過大。設置為3
  • 最大合並對數:一次迭代運算中可以合並的聚類中心的最多對數,設置為2
  • 【輸出文件】設置輸出文件保存路徑和文件名。

所有參數設置完畢后,點擊【確定】按鈕即可進行ISODATA分類,並輸出分類結果。當分類結果達不到預期目標時,可反復調整初始類數、最大標准差、最小中心距離等參數,這些參數之間的相互作用對分類結果精度起到決定性作用。

原始影像

初步分類成果

 

第四步:類別整理

通過人工目視解譯的方式,把每一個生成的類別填寫上名稱及顏色。

 

1)給每個類別重新賦予地類"顏色"

采取人機交互的方式,查看每個類別在遙感影像上對應的地類,同一類別賦予同一種色彩。

分類后的成果自動加載到圖層列表中,雙擊要賦予的類別圖層,彈出顏色設置對話框,在【基本顏色】中選擇類別對應的色彩,單擊【確定】,完成色彩設置。

初步分類成果

類別重新賦予顏色成果

 

2)賦予類別名稱

鼠標右鍵點擊分類成果,選擇【屬性】,彈出圖層屬性對話框,選擇【柵格渲染】欄下的【色彩映射表】進行類別名稱的修改。選擇要修改的圖層,在【標注】列內雙擊鼠標左鍵,圖層名稱高亮顯示,開始進行圖層名稱的修改。

 

第五步:分類后處理

分類后處理主要進行兩個操作,分別為分類合並主次要分析,分類后處理其他功能可參考監督分類中的介紹

1)分類合並:分類成果中一種類別的圖層進行合並。

選擇"圖像處理"標簽下的"圖像分類"組,單擊【分類后處理】按鈕下的下拉箭頭,選擇【分類合並】。在類別關系對應欄中設置輸入類別與輸出類別的對應關系,把輸入類別中的地類合並到輸出類別中。

分類合並后,數據已經合並在三個圖層中,其他圖層已沒有數據。

分類后合並成果

 

2)主次要分析:采用類似卷積濾波的方法將較大類別中的虛假像元歸到該類中,首先定義一個變換核大小,然后用變換核中占主要地位(像元最多)類別數代替中心像元的類別數。

在分類成果中每種類別都存在大量斑點,需要使用【主要】的分析方法將這些細碎斑點"就近" 合並。

  • 參數設置:
  • 核大小:設置卷積核的大小。設置的數值越大,分類圖像越平滑,去除的細碎柵格類別越多,但也存在損失的細節越多的情況。按默認5*5設置。
  • 中心像元比重:即中心像元類別被計算的次數。按默認進行設置即可。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM