1.SPI原理概述
SPI計算原理是將某時間尺度(如1、3、6、12個月等)降水量的連續時間序列(最好是長期記錄,一般最少30年)看作服從某種概率密度函數分布(如gamma分布),然后推導出相應的累積概率函數,再通過累積概率函數轉換為標准正態分布。轉換之后,某時間尺度樣本的SPI為:該樣本降水量的累積概率所對應的標准正態分布的x軸的值。
例如:以3個月為時間尺度,使用1981-2010年30年的降水數據。計算2010年1月的SPI值。因為時間尺度是3個月,所以2010年1月的累積降水量被定義為2009年11月-2010年1月期間的總降水量,記作P;使用的時間序列為往年同期的降水量數據,即各年11月-1月的降水。首先按照原理,將時間序列數據假設為滿足gamma分布g(x),然后推導其累積概率函數H(x),再轉換為標准正態分布。然后,查找P對應的累積概率H(P),然后查找與H(P)相同累積概率的標准正態分布所對應的x軸的值,即為SPI。示意圖如下,左圖為累積概率H(x),右圖為轉換之后的標准正態分布。
2.SPI原理詳解
2.1一些基本概念
1)概率密度函數(probability density function, PDF)
通俗來說,是描述變量落在某點(x=x0)上的概率,變量落在某區間(x1<x<x2)的概率是該區間的概率密度函數的積分。
2)累積概率(cumulative probability, CDF)
又稱CDF,是概率密度函數的積分,如H(x0)表示變量x在(0,x0)區間內發生的概率,H(x0)=∫0x0g(x)
3)標准正態分布函數
期望μ=0,即曲線圖象對稱軸為Y軸,標准差σ=1條件下的正態分布,記為N(0,1)。
4)概率密度分布變換
SPI是通過gamma分布轉換為標准正態分布得到的,其轉換過程就是通過累積概率函數(CDF)的等概率變換;在已知gamma分布(fX(x))和標准正態分布(fY(y))的條件下,求取二者之間的轉換關系dx/dy,從而得到y=h(x)的關系,其中y值即為SPI,x值為樣本的降水量。
現在已知一個隨機變量 的概率密度為
, 現在我們令
, 現在我們要嘗試求出
的概率密度函數
. 為了計算方便, 我們只考慮函數
是嚴格單調遞增的情況, 平時我們需要求解的函數大部分都是滿足嚴格單調遞增的.
由概率分布函數定義可知:
對兩邊一起求導得:
這樣, 我們成功計算出了 的概率密度函數。
2.2構建降水頻率gamma分布函數g(x)
1)gamma分布推導
Γ函數是階乘在實數上的推廣,定義為:
根據定義,等式兩邊同除以Γ:
取積分中的函數作為概率密度,就得到了一個形式最簡單的Gamma分布,其概率密度函數為:
若將公式 (∗)中的 x 替換為βt,則有下式成立:
於是得到Gamma分布的一般形式,概率密度函數為:
2)gamma分布函數構建
Thom(1966)發現gamma分布(一種概率密度函數)很適合氣候降水的頻率時序特征,如下圖所示。(首先解釋為什么使用gamma分布)
SPI中gamma分布定義:
3)gamma分布α、β參數求解
在定義完gamma分布函數之后,需要求解其中的α形狀參數和β尺寸參數,使用Thom(1966)提出的最大似然法來估算最佳的α與β值。
式中,x為降水時間序列的樣本值,x¯為降水序列的平均值,n為時間序列的長度。
2.3構建降水累積概率函數H(x)
將上一步求得的α、β參數代入,則降水量x>0的累積概率函數G(x)為g(x)的積分:
令t=x/β,則該等式變為:
因為gamma函數沒有定義x>0,但實際降水可能為0(x=0),所以實際降水累積概率函數為:
其中,q為降水量為0的概率,設m為降水時間序列中降水量為0的個數,則q=m/n。
至此,得到了降水的累積概率函數H(x)。其意義為:任選時間序列中的某樣本數據,其降水量在(0,x)之間的概率為H(x)。
2.4H(x)等概率變換為標准正態分布函數
這一步是通過累積概率函數的等概率變換,建立了gamma分布與標准正態分布之間的轉換關系,從而確定降水量與SPI之間的關系。
等概率變換即變量從一種分布(如gamma)轉變為另一種分布(如標准正態分布),變換前后對應變量在兩種分布中小於某個值的累積概率是不變的。
如Fig3.2所示,通過累積概率H(x)與轉換后的標准正態分布的x軸上獲取對應的SPI值。為更加方便的獲取SPI(通過轉化之后的圖像獲取太過繁瑣),使用Abramowitz and Stegun (1965)提出的近似方法,求解概率密度H(x)與標准正態分布SPI的關系(實質是建立降水量x與SPI的關系,即概率密度分布變換中的y=h(x)關系):
其中,c0 = 2.515517, c1 = 0.802853, c2 = 0.010328, d1 = 1.432788, d2 = 0.189269, d3 = 0.001308
2.5SPI與Z-score
SPI被認為是一種z分數(z-score),因為對於轉化后的標准正態分布,其μ=0,σ=1,帶入z-score=(x-μ)/σ=SPI。z-score的實際意義為測量樣本數據與樣本總體均值相差多少個標准差;所以,SPI可被解釋觀測降水量為與長期降水均值偏離的標准差個數。
3.SPI應用
標准化降水指數(SPI)是一個廣泛使用的指數,用於描述一系列時間尺度上的氣象干旱的特征。在短的時間尺度上,SPI與土壤水分密切相關,而在長的時間尺度上,SPI可以與地下水和水庫儲存有關。SPI可以在氣候明顯不同的地區進行比較。
參考
SPI原理:
Edwards D C . Characteristics of 20th Century Drought in the United States at Multiple Time Scales. , 1997.
https://www.doc88.com/p-9798233006864.html?r=1
https://max.book118.com/html/2017/0309/94893982.shtm
z-score:
https://blog.csdn.net/qq_39482438/article/details/110873346
概率密度分布變換:
https://blog.csdn.net/bingfeiqiji/article/details/81908948
https://zhuanlan.zhihu.com/p/191487550
程序:
https://climate-indices.readthedocs.io/en/latest/