正態 QQ 圖和普通 QQ 圖
分位數-分位數 (QQ) 圖是兩種分布的分位數相對彼此進行繪制的圖。
評估數據集是否正態分布,並分別研究兩個數據集是否具有相似的分布。
如何構建正態 QQ 圖
首先,數據值經過排序,且累積分布值按照公式 (i– 0.5)/n 進行計算,其中字母表示總數為 n 的值中的第 i 個值(累積分布值給出了某個特定值以下的值所占的數據比例)。累積分布圖通過以比較方式繪制有序數據和累積分布值得到(如下圖中左上角的圖表所示)。標准正態分布(平均值為 0 標准方差為 1 的高斯分布,如下圖的中右上角的圖表所示)的繪制過程與此相同。生成這兩個累積分布圖后,對與指定分位數相對應的數據值進行配對並繪制在 QQ 圖中(見下圖的底圖所示)。
![]() |
如何構建普通 QQ 圖
普通 QQ 圖用於評估兩個數據集的分布的相似程度。這些圖的創建和所述的正態 QQ 圖的過程類似,不同之處在於第二個數據集不一定要服從正態分布,使用任何數據集均可。如果兩個數據集具有相同的分布,普通 QQ 圖中的點將落在 45 度直線上。
![]() |
使用 QQ 圖檢查數據分布
正態 QQ 圖上的點可指示數據集的單變量分布的正態性。如果數據是正態分布的,點將落在 45 度參考線上。如果數據不是正態分布的,點將會偏離參考線。
在下圖中,標准正態分布的分位數值繪制在正態 QQ 圖中的 x 軸上,數據集的相應分位數值繪制在 y 軸上。可以看到點落在 45 度參考線附近。與此線的主要偏離發生在高臭氧濃度值處。
正態 QQ 圖工具可用於選擇未落在參考線附近的點。所選的點的位置將高亮顯示在 ArcMap 數據視圖中。如下所示,這些點集中在聖弗朗西斯科灣區域附近(以下地圖中粉紅色陰影點)。
使用數據變換的示例
示例數據集的正態 QQ 圖如下所示:

請注意點如何偏離直線。
但是,當將對數變換應用於數據集時,點更接近 45 度參考線,如下圖所示。

還可對正態 QQ 圖工具中的數據應用 Box-Cox 和反正弦變換,以評估它們對分布的正態性的影響。


