谷歌研究員提出使用機器學習方法預測未來短時間內的天氣。此方法雖然處於早期發展階段,但效果已經優於傳統模型。
前言
天氣總是會或輕或重地影響人們的日常生活,而天氣預報的准確性會極大影響人們應對天氣的方式。天氣預報可以告知人們是否應當選取一條不同的上班路線、是否應該重新安排周末野餐的計划、是否因為一場風暴的來襲而撤離住所。但對於局部風暴或是雷暴等以每小時為時間尺度演化的天氣事件,做出准確的預測是極具挑戰性的。
在論文《Machine Learning for Precipitation Nowcasting from Radar Images》中,研究人員在降水短時預測問題上提出了基於機器學習模型的新研究,該模型主要是對未來短時間內的天氣進行高度局部化的「非物理」預測。
機器學習一個很顯著的優勢在於如果提供已經訓練好的模型,那么推斷過程的計算成本會很小。這使得在輸入數據后的預測幾乎是實時的,並且結果具有原始高分辨率。這種聚焦於 0-6 小時短時降水預測方法可以在總延遲僅為 5-10 分鍾的情況下生成 1km 分辨率的預測結果,這其中還包括了數據采集的延遲。
該方法雖然還處於早期發展階段,但已經優於傳統模型。
超越傳統天氣預報方法
世界各地的氣象機構都有大量的監控設施,例如,多普勒雷達可以實時測量降水量;氣象衛星可以提供多光譜成像;地面氣象站可以直接測量風速、風向和降水量等。下圖比較了美國大陸表示降水的假彩色雷達成像以及地球同步衛星所提供的雲層成像,以闡釋多來源天氣信息的重要性。降水的存在和雲的存在相關,但又不完全相關,所以單純從衛星遙感圖像中推斷降水情況是很有挑戰性的。
上圖:圖像顯示了地球同步衛星觀測到的雲的位置。下圖:**圖像顯示了多普勒雷達觀測站觀測到的降水位置。
不幸的是,這些測量手段並非在全球范圍內都適用。例如,雷達數據大多來源於地面觀測站,而這在海洋上通常不可行。此外,測量的覆蓋范圍因地理位置而異,有些地方即使具有良好的衛星覆蓋率,雷達覆蓋率也可能很小。
即便如此,有如此海量的觀測數據,同時數據還有繁多的種類,以至於天氣預測系統很難將它們全部納入其中。在美國,由美國海洋與大氣管理局 (https://www.noaa.gov/)(NOAA)收集的遙感數據規模增長速度已經達到了每天 100TB。NOAA 將這些數據提供給運行在超級計算機上的天氣預測引擎,以提供未來 1-10 天的全球氣象預測。這些引擎在過去的半個世紀中不斷發展,它們基於數值方法,可以直接模擬物理過程,包括大氣動力學和大量效應,如熱輻射,植被、湖泊、海洋效應等等。
然而,計算資源的可用性在多個層面限制了基於數值的天氣預報方法的能力。例如,計算力的需求將空間分辨率限制在約 5km 的范圍內,這不足以用來分析市區和農田內的天氣模式。數值方法還需要數個小時來運行。如果 6 小時才能完成一次預測的計算,那么每天只能進行 3-4 次預測,導致每次預測基於的是 6 小時前的舊數據,這會限制對於當前正在發生情況的了解。相比之下,短時預測對於交通路線選擇和疏散計划等即時決策場景來說比較適用。
雷達到雷達的預測
作為系統可以生成預測類型的一個典型事例,研究者考慮一個雷達到雷達的預測問題:給定過去一小時的雷達圖序列,預測從現在開始 N 小時內的雷達圖,其中 N 一般為 0-6 小時之間。由於雷達數據已經被轉換成了圖像,可以將這種預測視為一個計算機視覺問題,從輸入圖像序列去推測氣象的演變。在這樣短的時間尺度下,演變主要由兩種物理過程控制:平流導致雲的運動,對流導致雲的形成,兩者都受局部地形和地理條件的影響。
上排(從左到右):前三張圖展示了當前時間之前 60 分鍾、30 分鍾以及 0 分鍾(即需要進行預測的時間點)的雷達圖。最右圖展示了當前時間之后 60 分鍾的雷達圖,也就是短時預測的真實值。下左圖:對上排前三張圖應用光流(OF)算法得到的矢量場(作為比較)。光流法是在 20 世紀 40 年代發展起來的一種計算機視覺方法,常用於預測短期天氣變化。下右圖:由光流方法進行預測的結果示例。可以注意到,它很好地追蹤了圖中左下角降水的運動,但沒能考慮風暴強度的衰減。
研究者使用的是一種數據驅動的無物理方法,這意味着神經網絡僅僅從訓練樣本中學習如何擬合大氣的物理變化,而沒有引入任何關於大氣如何工作的先驗知識。將天氣預測問題視為一個圖像到圖像的轉換問題,並且利用目前圖像分析中最先進的卷積神經網絡(CNNs)技術來解決。
CNNs 通常由線性的層序列構成,其中每層都是將某些輸入圖像轉換成新的輸出圖像的一組操作。通常,卷積神經網絡層除了會使用一組卷積核對圖像進行卷積操作外,還會改變圖像的通道數和整體分辨率。這些卷積核本身是小圖像(對於我們來說的小圖像,通常 3x3 或 5x5)。卷積核給 CNN 提供了大部分的威力,並且帶來了邊緣檢測、識別有意義的圖案等操作。
U-Net 是一種特別有效的 CNN。U-Net 首先是一組被排列成編碼階段的層序列,其中逐層降低輸入圖像的分辨率;接着是解碼階段,在該階段,編碼器生成的圖像的低維表示被擴展回更高的分辨率。下圖展示了特定的 U-Net 結構中的所有層。
(A)U-Net 的整體結構。藍色方框對應着基礎 CNN 層;粉色方框對應下采樣層;綠色方框對應上采樣層。實線表示層間輸入連接關系;虛線表示跨越了編碼和解碼階段的長跳躍連接;點線表示各個層中的短跳躍連接。(B)基礎層中的操作。(C)上采樣層中的操作。
U-Net 的輸入是一張圖像,過去一小時的觀測序列中每張多光譜衛星圖像都占據其中一個通道。例如,如果過去一小時采集了 10 張衛星圖像,每張多光譜圖像都成像於 10 個不同的波長,那么模型的輸入將是一張由 100 個通道組成的圖像。對於雷達圖到雷達圖的預測,輸入是由過去一小時內 30 張雷達觀測組成的序列,相隔 2 分鍾一張;輸出包含從現在開始 N 小時后的預測結果。對於美國的初步工作中,研究者使用美國大陸 2017-2019 年的歷史觀測數據進行網絡的訓練。數據以四周為周期進行分割,每個周期的前三周作為訓練數據,第四周用於效果評估。
結果
研究者將結果與三個廣泛使用的模型進行了比較。首先,是 NOAA 的高分辨率快速刷新 (HRRR)數值預測方法。HRRR 包含了對於許多不同氣候量的預測,這里研究者將結果與 1 小時地面累積總降水量預測進行比較,因為這是質量最高的 1 小時降水量預測指標。第二個是基於光流(OF)的算法,該方法試圖通過一系列圖像追蹤移動的物體。這是一個常被用於天氣預測的方法,即使它作出了一個顯然不成立的假設——一個較大區域內的總降水量在預測時間段內是恆定不變的。第三個,所謂的持續性模型,這是一個平凡的模型,它假設某個地點未來也會像當前時刻一樣在以同樣的程度降水,即降水的模式並不會改變。這可能看上去是一種過度簡化的模型,但鑒於天氣預測的困難程度,這也是一種常見的做法。
對大約一天時間內所做預測的可視化。左圖:1 小時 HRRR 在每小時開始時所作的預測,該方法局限在於 HRRR 提供預測的間隔。中圖:真實情況,即想要預測的情況。右圖:研究者模型所做出的預測。可以每兩分鍾進行一次預測(這里展示了每 15 分鍾的結果),預測區域的分辨率約為 HRRR 方法的 10 倍。可以注意到此方法捕捉到了風暴整體的運動和形態。
研究者使用准確率-召回率(PR)圖像來進行模型的比較。由於可以直接獲取到模型分類器的結果,因此提供了完整的 PR 曲線(下圖中的藍線)。然而,研究者不能直接獲取 HRRR 的模型,並且持續性模型和基於光流的模型都沒有在准確率和召回率間進行折中權衡的能力,因此這些模型只能由單點來表示。可以看到,研究者神經網絡預測方法的質量高於其他三個模型(因為藍線在其他模型表示的點之上)。值得注意的是,當預測范圍達到 5-6 小時的時候,HRRR 模型的結果開始超過當下的結果。
准確率-召回率(PR)曲線 (https://en.wikipedia.org/wiki/Precision_and_recall) 將方法的結果(藍線)和以下三個方法進行比較:基於光流(OF)的方法、持續性模型、HRRR 的 1 小時預測。因為無法直接獲取到它們的分類器,因此無法提供完整的 PR 曲線。左圖:對於小雨的預測結果。右圖:對於中雨的預測結果。
基於機器學習方法的一大優勢在於預測結果是實時有效的,這意味着預測可以基於實時的新數據,而 HRRR 會受到 1-3 小時計算延遲的影響。這使得基於計算機視覺的方法可以為超短時預測提供更好的結果。相比之下 HRRR 使用的數值模型可以提供更長期的預測,這一部分是因為它使用了完整的 3D 物理模型——雲的形成很難從 2D 圖像中觀察到,所以基於機器學習的方法更難學習到對流的過程。將兩個系統相結合——使用機器學習模型用於快速的預測,使用 HRRR 進行長期預測——可以在整體上產生更好的結果,這是一個未來工作可以關注的重點。研究者也在考慮將機器學習直接用於 3D 觀測數據。無論如何,即時預測都是實時規划、輔助決策和改善生活的關鍵工具。
原文鏈接:**https://ai.googleblog.com/2020/01/using-machine-learning-to-nowcast.html