在隨機事件的大量重復出現中,往往呈現幾乎必然的規律,這個規律就是大數定律。
當我們擲一枚硬幣時,說正面朝上的概率是1/2,是這樣嗎?當你擲十次硬幣時,正面朝上的概率可未必是1/2,這個結果帶有很強的隨機性,並沒有什么規律可言。但是當投擲的次數足夠多時,規律就呈現出來了。概率研究的是隨機現象背后的客觀規律,當試驗次數趨近於無窮時,正面朝上的頻率收斂於1/2概率。
大數定律是概率論中討論隨機變量序列的算術平均值向隨機變量各數學期望的算術平均值收斂的定律。我覺得還是不要計較概念,關注實際例子就好。
以斗地主為例,玩家的水平有高有低,但每個人都有一個真實水平,衡量真實水平的數字特征就是獲勝的數學期望。然而高手也不見得每次都會獲勝,因為除了實力外,運氣也占有很大比重,頂尖高手面對一手爛牌也會束手無策。我們並不能以一局的輸贏判斷某個人打牌的水平高低,此時運氣帶來的影響會放大,也就是隨機性太大,但是隨着打牌的次數增多,高手的成績會漸漸趨於穩定,他贏的次數會漸漸符合他的真實水平,此時隨機性背后的客觀規律會逐漸顯現出來。
我們用一段程序模擬大數定律。這段程序在1~10中隨便抽取n個數,然后計算平均值:
1 import numpy as np 2 import pandas as pd 3 from matplotlib import pyplot as plt 4 5 results = [] 6 for n in range(1, 10000): 7 nums = np.random.randint(low=1, high=10, size=n) 8 results.append(nums.mean()) 9 10 df = pd.DataFrame({'均值': results}) 11 df.plot() 12 plt.rcParams['font.sans-serif'] = ['SimHei'] 13 plt.xlabel('樣本數量') 14 plt.ylabel('樣本均值') 15 plt.show()
可以看到,隨着樣本的增多,均值逐漸趨近於平穩,隨機性對均值的影響也越來越小。
以下內容是從 保險不是碰運氣(大數法則) (https://www.jianshu.com/p/f384357a554d)上抄來的:
根據以往的經驗,某類汽車每年的損失概率約為2‰,相應的,在收保費時也會按這個損失比例收取。這時,我們可以把一投保的該類汽車看作一次拋硬幣或一次擲骰子,如果投保的汽車數量很少,則相當於拋硬幣和擲骰子實驗中拋擲的次數很少,那么投保的汽車實際發生事故幾率與預先估計的2‰,這個比例可能相差較遠,對於保險公司而言則容易發生賠付危機;相反,如果有許許多多的車輛投保該保險,就相當於上面實驗中拋擲次數相當多,那么實際的事故發生狀況當然就會更接近保險公司估計的2‰,這一損失比例,保險公司就不會擔心發生賠付危機了。
大數定律的實質就在於,通過集合眾多性質相同或相近的風險,把單個風險的不確定性變成集體風險的可測性,從而達到分散風險的目的。其實,一家保險公司承保的業務再少,也可以通過再保險制度將全世界的同類業務聯系起來,也符合大數定律的要求。
有了大數定律這一科學原理,保險公司在保證大量標的存在的前提下,可以預先估計來年將會發生多少事故,並提前做好准備。所以,不用擔心,保險公司是真的很“保險”,並不是在碰運氣。
作者:我是8位的
出處:http://www.cnblogs.com/bigmonke
本文以學習、研究和分享為主,如需轉載,請聯系本人,標明作者和出處,非商業用途!
掃描二維碼關注公作者眾號“我是8位的”