最近在做利用Sentinel-2影像提取湖北省棉花種植分布,前前后后快兩個月了,學到一些東西,記錄一下。
1、目標作物最好是研究區內的主要作物,種植面積大、分布廣泛,這樣方便獲取作物在影像上的光譜特征,訓練樣本、驗證樣本也好獲取,實地調研難度也小;
本次提取的是湖北省的棉花分布數據,但受農村勞力流失、棉花種植人力物力成本高等因素影響,棉花種植面積逐年減少,農民轉而種植大豆、玉米等田間管理少、人力成本低的作物。棉花在湖北省不再是大面積種植,除少數試驗田外,都是零零散散的分布,田間地頭、房前屋后,棉花田塊面積小,分布不集中,在10m哨兵數據上極易出現混合像元問題,很難識別出棉花的特征,同時制作訓練樣本和驗證樣本也極為困難(實地調研找不到);
2、承接前述1中的問題,因為目標作物分布不集中,都是小田塊,實地調研時手機拍照定位存在數米的誤差,在10米的哨兵影像上,實地調研點就很可能出現位置偏差,造成訓練樣本錯誤;
上述兩條主要說明目標作物應是研究區內的主要作物。
3、提取某年份作物分布時,最好時當年去實地調研,否則農戶極可能存在種植屬性記憶模糊,尤其是對於小地塊、非主要作物;
4、訓練樣本、驗證樣本比例應該是七三或八二;
5、驗證樣本中各個類別的樣本數量和大小應當基本持平,不應存在較大出入,否則利用混淆矩陣作精度評價時,易分地物的高精度會掩蓋難分地物的低精度,雖然總體精度較高,但某些作物分類精度可能很低;
本次提取棉花時,起初驗證樣本中水體、水稻等地物樣本數量較多,棉花樣本數量較少,水體、建設用地、水稻等地物分類精度高,就掩蓋了棉花的低精度;
上述兩條主要說明樣本選擇注意事項。
6、受雲霧影像,作物生長期內,很難獲取到逐月滿足要求的影像,造成某些敏感時期影像缺失,無法准確區分某些地物,此處對專家決策樹法影響較大;
本次提取棉花過程中,起初采用專家決策樹方法,7月上中旬,水稻田里還有積水,利用NDWI可以有效識別,9月中旬,大豆基本收割完成,棉花還處於吐絮期,可以有效區分兩者,但受雲霧影像,兩期影像都不能采用,給決策樹法提取棉花帶來很大困難。
7、不能單純使用植被指數建立決策樹提取作物,某些作物長勢不均衡,單用植被指數進行閾值分割,極容易出現空洞現象(地物中心被掏去一部分)或保留邊緣輪廓(田埂、庄稼小路被誤分)。
8、如何從光譜特征、植被指數、紋理特征等眾多特征中篩選最有利於分類的特征???
追更
9、利用A區樣本和影像訓練的模型,如果要將其應用於B區,要注意影像光譜特征的歸一化處理或統一拉伸,否則A區訓練的模型完全不適用與B區,就像深度學習中,首先要將研究區內影像拉伸至32767或歸一化,然后再訓練模型,最后將模型應用於其他區域;
10、不是所有植被指數都像NDVI一樣,上下相除可以自動抵消縮放系數,一旦植被指數計算式中存在加減常數,此時就應該先把DN值轉為反射率數據再計算;
比如:EVI=2.5*(NIR-Red)/(NIR+6*Red-7.5*Blue+1),分母中存在常數1,乘以縮放系數與不乘以縮放系數的結果是完全不一致的。