賽道背景
地物要素分類是將地表相對固定的物體分類的系統體系,是地表地物要素觀測與測繪的重要手段之一。基於遙感影像開展地理國情監測、“耕地紅線”、“生態紅線”等實際應用,受“同物異譜”、“同譜異物”現象影響,分析與處理的難度極大,目前主要采用人工方式提取地物要素,效率低,耗資巨大,迫切需要自動化、高精度的地物要素提取方法。AI+遙感影像賽道,旨在充分利用大數據、人工智能等先進技術,突破面向大規模多源異構高分數據信息提取與分析的技術瓶頸,形成一批高效、可用、實用的先進算法,提升高分對地觀測信息服務能力。
賽道任務
對高分辨率光學遙感圖像中各類地物光譜信息和空間信息進行分析,將圖像中具有語義信息的各個像元分別賦予語義類別標簽;以包含典型土地利用分類的光學遙感圖像為處理對象,選手使用主辦方提供的遙感圖像進行土地利用類型語義分割處理,主辦方依據評分標准對結果進行綜合評價。
依據現有的遙感地物分類要求,結合現有的地物分類實際需求,參照地理國情監測、“三調”等既有地物分類標准,依據遙感地物“所見即所得”原則,設計地物要素分類體系,共涉及一級大類8種,二級子類17種,詳見表:
一級大類 | 二級分類 | 分類示例 | 參考說明 |
---|---|---|---|
一級大類 | 二級分類 | 分類示例 | 參考說明 |
水體 | 水體 | 河流、湖泊、水庫、坑塘、溝渠、海洋等 | 視覺效果為純水面,如藍色、淺藍色等,由於水體污染等情況,水體可能出現淺綠到深綠色,並且由於水深的不同,水體可能出現顏色變幻。甚至由於傳感器角度與太陽角度,出現鏡面反射的情況,水體也可能出現高亮的情況,另外在大風天,高分辨率影像的水體也可能出現魚鱗紋。 |
交通運輸 | 道路 | 快速路、主干路、次干路和支路等 | 深灰色或灰白色,帶狀,連續,有明顯機動車道或高架匝道,內有行駛車輛。從影像角度而言,只考慮明顯可以將地物分割為不同地塊的道路,例如小區內部細小道路不予考慮,只標注周邊的公路 |
交通運輸 | 機場 | 飛行區、航站樓等 | 位於城市中心區以外,與高速公路聯系,占地面積大,有明顯白色飛機跑道,大體量的候機大廳,並配有大規模倉儲庫房。勾畫時,僅勾畫像元級別精度的跑道與配屬的航站樓,以及其他的擁有飛機的配屬建築。 |
交通運輸 | 火車站 | 火車站站台及候車廳 | 火車站因其背景特殊(建於鐵道之上)且形制特殊,可以單獨作為一類地物進行提取。 |
建築 | 建築物 | 住宅、工廠等人工建築 | 村庄、城市各類建築,如住宅、廠房,排列較為整齊,住宅通常為紅頂黑頂,廠房多為藍頂、白頂或灰頂等。 |
耕地 | 普通耕地 | 普通耕地 | 耕地多為規則矩形組成,成片分布,紋理細致。此處的耕地僅為在該地塊上無任何附加建築與覆蓋的耕地,例如農業大棚另做一類。耕地在不同時相上、不同氣候背景下有不同的光譜特征,例如休耕期與作物生長期的光譜特征截然不同,在南北方的相同時期,因氣候背景不同,其光譜特征也會由於作物類型不同而不同。 |
耕地 | 農業大棚 | 耕地另一種形式,如溫室 | 農業大棚為具有一定規模、排列緊密整齊,條狀淺藍綠色或白色窄形。 |
耕地 | 自然草地 | 自然草地 | 指以生長草本植物為主,覆蓋度在5%以上的各類草地,包括以牧為主的灌叢草地和郁閉度在10%以下的疏林草地。自然草地顏色以淺綠色至深綠色為主,間雜矮小灌木,圖像紋理雜亂。 |
綠地綠化 | 包括公園綠地、生態景觀綠地、防護綠地等人工草地 | 城市公園,內部有大面積潔凈水面或觀賞塔、亭,綠地率不小於65%;大型郊野公園影像特征與城市公園相似,占地面積更大,多位於城市邊緣地區或綠隔地區;防護綠地一般位於高速路、高壓線、鐵路兩側,或燃氣、污水處理廠等危險源四周,帶狀分布、均勻寬度,起隔離、衛生和安全的作用。 | |
耕地 | 自然林 | 喬木林、灌木林 | 多位於丘陵地區,成片分布,深綠色,具有明顯的溝脊走向,山坡陽坡顏色以淺綠色至深綠色為主,背陰坡以深綠色至黑色陰影覆蓋為主。從影像判讀中,其植被郁閉度極高,有明顯的垂直分布結構。 |
人工林 | 果園林、苗圃等 | 邊界規則,行株距清晰,樹冠小,深色點狀紋理,內部道路系統清晰連貫。樹冠陰影表現為黑色的暈斑等明顯有人為修正痕跡的林地。 | |
裸土 | 自然裸土 | 自然裸土、戈壁、沙漠 | 主要以自然原因造成的土壤裸露為主,例如因土壤貧瘠、土層較薄造成的土壤裸露,顏色以褐色或者灰色為主,或者因氣候原因造成土壤沙化進而形成的戈壁灘、沙漠等,顏色以黃色為主。 |
裸土 | 人為裸土 | 指因建築需求等原因破壞地表覆蓋而造成裸土裸露的地表 | 因建設需要,在建設之前,需要將地表開挖,然后運走土方,以便填充構築物,例如打樁作為地基穩定建築物,所以該地物存在時間較短,且紋理復雜,顏色以亮黃色為主,但是有時候因環境需求,須鋪設防塵網等防止揚塵的設施,所以部分情況下,在遙感影像上呈淺綠色。 |
其它 | 光伏 | 太陽能光伏發電板 | 太陽能光伏板是光譜和紋理相對於背景很特殊的一種地物,其顏色以深藍色為主,紋理固定 |
其它 | 停車場 | 社會停車場用地/公共交通場站/ | 位於主干道、次干道兩側或車站前甚至房頂,或大型購物中心附近。有數量較多、排列整齊或者間雜排列的汽車。 |
其它 | 操場 | 籃球場、排球場、羽毛球場、網球場等 | 橢圓形紅色或者藍色跑道,內有綠色或者藍色等其他醒目色的絨狀足球場,亦或者有明顯線條的室外籃球場、羽毛球場燈體育設施 |
其它 | 其它無法確定歸屬地物 | / | / |
依據所述地物要素分類標准與星載遙感影像處理實際需求,以多種地物要素的高分光學遙感圖像的像素級分類為目標,設計賽題如下:
a. 初賽:算法在地物要素按一級大類(8類)分類的能力。進階考察算法地物要素分類的准確性;
b. 復賽:算法在地物要素按二級子類(17類)分類的能力。進階考察算法分類的准確性,測試數據尺寸變化的適應性,支持統一的接口調用;
c. 決賽:算法在地物要素按二級子類(17類)分類的能力。進階考察現場答辯評議,強調模型復雜度和效率考察,算法分類的准確性,測試數據尺寸變化的適應性,支持統一的接口調用;
數據簡介
(1)來源:數據為0.1米-4米分辨率的高分一、二、六號,高景二號,北京二號,以及部分航空等數據源的可見光、多光譜載荷圖像,由鵬城實驗室和協辦單位合作采集、標注、構建;
(2)規模:100萬+張遙感影像語義分割樣本數據;
(3)用途:土地利用動態監測,礦產資源開發狀況和地質災害的調查與監測;生態環境監管調查與評價,水環境監測與評估,空氣環境監測與評價;耕地數量與質量調查。
(4)方法
初賽:10萬高分光學影像和標注文件(一級分類),20萬測試圖片數據;
復賽:10萬高分光學影像和標注文件(二級分類),30萬測試圖片數據;
決賽:10萬高分光學影像和標注文件(二級分類),30萬測試圖片數據,強調模型復雜度和效率考察:
數據說明
(1)整體數據說明
a.原始影像
影像格式為tif,包含R、G、B三個波段,訓練集影像尺寸為256 * 256像素,初賽測試集影像尺寸為256 * 256像素,復賽、決賽初步確定測試集尺寸可變。
b.標簽數據
標簽格式為單通道的png,每個像素的標簽值由一個三位數表示,使用‘uint16’數據類型存儲,該三位數包含了一級和二級兩個類別信息,百位上的一個數字表示一級類別,十位和個位上的兩個數字一起表示二級類別。
一級類別共分為8類,一級類別及對應的百位上的數字如下表所示:
一級類別 | 對應標簽百位上的數字 |
---|---|
水體 | 1 |
交通運輸 | 2 |
建築 | 3 |
耕地 | 4 |
草地 | 5 |
林地 | 6 |
裸土 | 7 |
其它 | 8 |
二級類別共分為17類,二級類別及對應的十位、個位上的數字如下表所示:
二級類別 | 對應標簽十位及個位上的數字 |
---|---|
水體 | 01 |
道路 | 02 |
建築物 | 03 |
機場 | 04 |
火車站 | 05 |
光伏 | 06 |
停車場 | 07 |
操場 | 08 |
普通耕地 | 09 |
農業大棚 | 10 |
自然草地 | 11 |
綠地綠化 | 12 |
自然林 | 13 |
人工林 | 14 |
自然裸土 | 15 |
人為裸土 | 16 |
其它 | 17 |
(2)初賽標簽數據
初賽中,要求對一級類別分類,分類的結果為表3中的8個類別,提供的標簽數據中,三位數標簽的十位及個位數賦值為0,用百位上的一個數字來表示一級類別,例如:對於標簽值為100的像元,對照表3,表示該像元的一級類別為水體。
(4)復賽/決賽標簽數據
復賽和決賽中,要求對二級類別分類,分類的結果為表4中的17個類別,三位數標簽的十位和個位一起表示二級類別,例如,對於標簽值為204的像元,該像元的二級類別編碼為‘04’,對照表4,表示該像元的二級類別為機場。
提交要求
(1)初賽
預測結果壓縮包提交,參賽者將測試集的預測結果放入results文件夾並壓縮為zip格式,將壓縮包上傳到大數據競賽平台,平台進行在線評分,實時排名。
(2)復賽及決賽
復賽及決賽作品提交要求將於初賽結束前2周公布。
提交示例
(1)初賽
a.向大賽平台提交參與評測的results.zip內容為:
results:
1.png
2.png
注意事項: 預測結果中的單個文件名需和預測圖片命名方式一致,如預測圖片中包含1.jpg,則預測結果中必須有1.png,其中1.png的數據格式和提供的訓練集的標注文件保持一致。
b.主觀評測的提交材料:
- 應當包含必要的代碼級樣例展示;
- 應當包含詳細的解題思路說明、項目運行環境和運行辦法等信息,方便大賽專家評委進行成績有效性核實;
c.參賽項目模型和工程文件: - 建議保留從工程創建至截止日期所有的 commit,以便展現項目迭代過程;
- 如有版本迭代,建議保留所有 tag 與 release;
- 應當包含所有的模型和工程文件,保證模型和成績可復現;
- 最終代碼以 master 分支為准,請適當合並分支;
- 成績需要可以成功復現,選手有義務及時響應技術委員會的復現要求;
- 其他技術委員會視情況指定的審核要求;
(2)復賽
復賽提交示例細則將在初賽結束后提供。
7、評測標准
(1)初賽/復賽
初賽、復賽使用國際通用指標加權交並比FWIoU, 根據每個類出現的頻率為其設置權重,具體計算公式為:
(2)決賽
決賽在FWIoU的技術上引入模型效率及模型復雜度評價指標:
模型效率:模型效率以6小時為基礎歸一化為百分制,超過6小時得分為0。
模型復雜度:模型復雜度以模型大小50MB為基礎歸一化為百分制,超過50MB得分為0。
決賽客觀得分 = 0.5FWIoU100 + 0.3E + 0.2C。
注意:評審說明
- 初賽排行榜采用 A/B 榜機制,其中A 榜計算提交結果文件中一定比例數據的成績,B 榜計算剩余數據的成績,A、B榜階段前將發布相應測試集;
- 在初賽A榜階段,每個隊伍每天最多可提交3次結果文件參與評測,平台實時評測出分,在A榜階段內各團隊最高分參與排名,排行榜實時更新;
- 在初賽B榜階段,每個隊伍每天可多次提交結果文件,但平台僅對當日最后1次提交進行評測,於當晚12:00:00評測出分,在B榜階段內各團隊最高分參與排名,排行榜每晚12:00:00定時更新;
- 主觀評審規則將由組委會統一發布;
- 決賽加分項:基於昇騰的算法模型,決賽成績可加分(細則待復賽結束后公布)。