白話空間統計之四:P值和Z值(上):零如果


    本來今天想要講講軟件操作的,后來發現好像還有好幾個重要的指標沒有說,干脆等所有說完在講操作吧。否則操作出來的結果會發現大量的“不明覺厲”。


    首先是空間統計里面非常神奇的兩個值:P值和Z值。


    要說這兩個值之前。還是要復習一下統計學的概念。畢竟空間統計的理論基礎還是建立在經典統計學上面的。

首先,統計學里面。有一個叫做“零如果”的概念很厲害,一定要說說。


    零如果(null hypothesis),有時候又稱原如果,官方的解釋是:指進行統計檢驗時預先建立的如果。也就是說,你在檢驗你的結果之前。先對這些結果如果一個數值區間,這個區間通常是符合某種概率分布的情況。如果你的真實結果偏離了你設定的區間。就表示發生了小概率事件。這樣你原來的如果就不成立了。

    例如以下圖所看到的:



    如果你的計算結果落在-22之間,就表示你的如果是能夠接受得。可是不在這個范圍內,就說明消息小概率事件了。既然有小概率事件,就說明兩種可能:1,你的如果有錯誤。2,出現了異常值。

   

    這個奇妙的零如果有啥用呢?看以下這個樣例:


    我們來拋一枚硬幣,(我發現統計學,特別是經典統計學最喜歡拋硬幣了)。在丟之前,我們就已經設定了不管正反兩面的概率都在50%左右。(實際上更接近48%——52%這個區間)那么假設我們丟出來的結果,出現了正面概率高達80%,而反面才出現了20%。那就是說。超出了我預設的范圍,發生了小概率現象,那么這樣的小概率現象就非常值得研究了,蝦神個人覺得,假設出現了這樣的情況,最大可能是這個硬幣被做了手腳。


    當然,還有可能是出現硬幣豎立了起來這樣的極小概率的事情……這樣的就得歸類到異常值里面去了。

    (關於拋硬幣的第二種思維方式,還能夠看這篇文章:拋硬幣的兩種思維方式

     http://mp.weixin.qq.com/s?__biz=MzA4ODk4NzgyNA==&mid=200720156&idx=1&sn=564f0b6fe95276180c625373a7cea70f#rd



    在經典統計里面,零如果覺得你統計計算的數據是符合某種概率的,那么在空間統計里面。零如果表示什么呢?

看以下這個樣例:


    假設說,A市在7月份發生了200起案件,理論上,不設定條件的話,這200起案件應該是平均的分布在A市的每一個區域的,可是實際上這是不可能的,我們會發現某些地區,案發率遠遠高於其它地區。


    那么上面那個命題,最開始我們說明的,200起案件。平均分布在全市各個地方。就是所謂的“零如果”,在空間統計中,零如果指的就是空間位置在一定區域里面呈現全然隨機(均勻)分布(在自然現象里面,均勻分布是極小概率才會出現的,基本上都能夠忽略了。所以一般談的就是全然隨機)。


    依照這種如果,我們就能夠對整個城市的案件案發地點進行統計分析了,如果計算出來的結果,符合我們如果,那么就僅僅能說,這200起案件。發生的地點是隨機的,沒有聚集規律或者離散的規律。


    在空間數據的分析中。有一個非常重要內容,就是知道數據分布是否有規律。


    拿到一份數據的時候。第一時間,要了解的,就是這份數據是不是有規律。由於有規律的數據才干進行更好的分析。而假設你拿到的這份數據是一份隨機分布的數據,那么一般來說,就沒有啥分析研究的可能了。由於純隨機(全然隨機)是無法預測也無法找到模式的,就像素數(素數在數軸上出現的位置就是全然隨機的,無法找到不論什么規律和模式)。


    所謂的純隨機。也有三種可能。一種是你的如果是純隨機的。二是你要計算的數據本身是純隨機的。第三就是你要計算的數據與其周邊數據的關系是純隨機。


    那么怎樣對隨機如果進行推斷呢?也就是說。你的結果是接受零如果還是拒絕零如果。這樣的就能夠通過PZ兩種值的結果來幫助我們進行推斷。

(未完待續)


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM