面對滿足正態分布的事情,我們如何增加成功概率


一、正態分布視角下的「優異問題」

這篇文章咱們把“正態分布”這個知識給發揮一下,我們知道世界上很多事物都符合正態分布,包括人的身高和智商、產品的質量等等。下面這張圖描寫了一個均值是 1,標准差是 0.1,總數量也是 1 的正態分布曲線,

咱們以智商為例。圖中橫坐標代表智商的高低,越往曲線的右側智商就越高;縱坐標代表人數,越往上代表人數越多。曲線下方的陰影區域面積就是總人數。

請注意這三個變量的大小都是可變的,針對具體的問題可以按比例放大或者縮小。比如智商的均值是 100 分,標准差是 15 分,那么圖中橫坐標的 1.0 對應的就是智商 100;1.2 對應的就是兩個標准差之外,也就是智商 130;如果你要研究的總人數是 100 萬人,那么陰影區的總面積就是 100 萬。

現在我們最感興趣的,是我用紅色的框標記出來的那個區域,稱為“優異區”。它出現在分布曲線右側的大約兩到三個標准差之外的尾巴上,代表統計中最出類拔萃的樣本。

  • 如果你研究的是人群的智商,這個區域就代表智商最高的人群,他們的智商都在 140 以上。
  • 如果你研究的是一個詩人的作品,這個區域就代表他最高水平的產出。
  • 如果你研究的是一個國家的足球運動員,這個區域就代表最頂級的足球運動員

我們的問題是,如何增加那個區域的面積?

也就是說,

  • 如果你是個老師,怎樣讓你的學生中多出幾個聰明人呢?
  • 如果你是個詩人,怎樣才能多寫幾首好詩呢?
  • 如果你是個企業家或者投資者,怎樣才能多抓住幾個出類拔萃的好項目呢?

怎樣增加優異數,這是有進取心的人最關心的問題,而光憑直覺說我要“努力!奮斗!”、或者只是憑直覺說”我要多多嘗試“那種思維太落后了。正態分布這個數學模型,可以幫你理清思路。

根據正態分布,你可以影響的其實就是三個變量:

  • 總量
  • 標准差
  • 均值

 

二、提高總量

增加總量是個直觀的辦法:如果我們把總數增加一倍,優異區的數量自然也會增加一倍。

  • 比如作為一個作家,我寫的文章之中可能有的你感興趣有的你不感興趣,但是我什么都寫。只要我寫的東西足夠多,總會有你感興趣的內容。
  • 學生多的老師自然更容易遇到好學生
  • 讀書多的人更容易有真知灼見。
  • 你投資的項目足夠多,總有遇到好的項目
  • 你投入創造的資源越多,總有可能產生顛覆式創新

多年以前,中國制造的水平不像現在這么高,經常有質量問題。當時我記得有人提出一個很有意思的問題,說中國航天的水平非常過硬,發射衛星很少失敗,可是中國制造的汽車質量卻不行,而對比之下,日本制造的汽車質量很好,可是日本航天的水平卻不如中國航天,經常因為技術問題導致發射任務失敗,這是為啥呢?

答案就在這個優異區之中。中國搞航天是舉全國之力干這一件事兒,可以把每一種零件都讓不同的廠家生產很多個,然后從中挑選最好的一個。這就是以總量取勝。總量多了,總能挑出幾個好的來。

用提升總量來獲得優異數,這是一個用戰略的勤奮彌補能力的不足的方法……但是生產汽車可不能這么干,得個保個質量都過硬才行。

提高總量,是個低效率的笨辦法。

 

三、提升均值

提升均值才是解決問題的根本辦法。想要理解這一點,請你思考這么一個問題:為啥中國有十四億人,都找不出十一個足球天才來呢?為啥冰島只有三十多萬人,足球水平卻比中國隊強那么多呢?

有個寫數學博客的外國友人,替中國足球操心,說答案就在正態分布曲線的這個形狀之中。進入優異區之后,曲線下降的速度非常、非常之快。比如請看咱們開頭說的這個分布曲線在尾部的情況,

從4個標准差到4.5 個標准差,再到 5 個標准差,曲線縱坐標的落差是以數量級的方式下降的。這也就是說,越是天才就越罕見,而且罕見的程度急劇下降。哪怕你有十四億人口,真到了代表天才的尾部區域,也沒幾個人。如果天才總共就沒幾個人,你就算把人口再增加一倍,也多不了幾個人。

真正有效增加天才的辦法,是提高均值!

我們看看,如果把全中國人民踢足球的平均水平提高 5%,標准差和人口總量都不變,是個什么情形,

這相當於你把鍾形曲線往右側挪動了一點。而這一點,體現在優異區上,就是巨大的差異!咱們把優異區放大了再看,

4.5個標准差之外,面積會有幾十倍的差距。

均值對優異區的效果比總量的效果要厲害得多!

冰島人口是比我們少得多,可是冰島人踢足球的平均水平可比我們高了遠遠不止 5%。所以冰島的球星數量比我們多,這難道不是應該的嗎?

這個數學博主還舉了個特別有意思的例子。單論成年男子的總數,印度有 6.5 億,而挪威只有250 萬;而印度成年男子的平均身高是165 厘米,挪威則是 180 厘米。那請問,身高 1 米 95 以上的成年男子,是印度人多還是挪威人多呢?

下面這張正態分布曲線尾部的圖告訴你答案,

1米 95 以上的挪威人數是印度人數的一百倍。總人口多沒啥用。

優異區曲線下降速度實在太快了,你必須用提升均值的方法把曲線往右邊挪動,才能得到更大的優異區。

如果你水平就是不行,產量高是沒用的。據說乾隆皇帝弘歷一生寫了四萬首詩,可是現在流傳開來的一首都沒有。中國有句話叫“勤能補拙”,我理解如果你的勤奮是用於提高均值,那可以;但如果你的勤奮都用在了低水平的高產出上,那勤補不了拙,據說是愛因斯坦的一句名言是這么說的:

“所謂精神病,就是翻來覆去做同一件事兒,卻期待能有不同的結果。”

 

四、大標准差

抬高尾部曲線的第三個辦法是加大你這個分布的標准差。我們把標准差提高 10%,從 0.1 變成 0.11,就成了下面這個情形,

中間普通區的人數變少了一點,而優異區的人數明顯增加了,

對個人來說,擴大標准差意味着你要去嘗試一些更極端的事情。比如一個人的工作能力一般,在一個旱澇保收的公司干着,賺錢不多但是很穩定。如果他水平不變又想獲得更高的收入,那么冒險加入一家創業公司,是一個辦法。當然這么做的缺點是一旦創業不成就會落入曲線左邊的尾巴,進入失敗區。

對一群人來說,標准差大意味着這群人的水平參差不齊,有的特別高有的特別低。這里有個著名的學術典故。2005年,哈佛大學校長勞倫斯·薩默斯(Lawrence Summers),就為什么女科學家的人數比男性科學家少這個問題,發表了一個私人的看法。薩默斯說這並不是因為女性的平均智商比男性低,而是因為女性智商分布的標准差比男性小。

他說的恰恰就是我們這里講的這個道理。男性的標准差大,所以在優異區有更多男性。而這並不是說男性作為一個整體優於女性,因為在曲線另一側的尾巴,也是男性多。男性中特別笨的人,也比女性多。

這純粹是一個數學性質,但是很多人認為薩默斯這番言論是性別歧視,結果薩默斯就因為這段話而被迫從哈佛校長的位置上辭職了!

 

五、總結

如果一個系統符合正態分布,要優化這個系統,你要做的不是增加系統的總量,而是應該專注在改進這個系統的內部結構上。

但是要注意的是,我們這篇文章假設人的能力都是正態分布的,這個假設不一定在任何情況都成立。我們的模型能解釋為什么中國人多可是中國男足的水平不行,但是解釋不了為什么中國沒有那么多舉世聞名的數學家,要知道中國人的平均數學水平可是很高的。

我猜測到了特別高的水平,人的能力其實是冪律分布的:那些能力強的人會有更大的機會和意願去進一步提升自己的能力,這里面有個馬太效應。要這么說的話,什么“高考加一門足球”這樣的辦法其實根本提升不了國家隊的水平。

但是那只是技術細節。我們今天的結論其實對長尾的冪律分布大體上也是成立的。總結來說,要想增加優異區中的數量,

  • 上策,是提升均值。這個方法對優異區的提升非常快,而且沒有風險。
  • 中策,是擴大標准差。這意味着你要冒險去做一些極端的事情。
  • 下策,是增加總量。這是一個笨辦法,效果很差。

只要想想有多少人還在問“為什么十四億中國人都找不到十一個會踢球的”,就知道並非所有人都理解今天說的道理。

以數量取勝非常符合人的直覺。有些年輕人以上大學之前就通讀了二十四史為榮,有些家長對孩子的期待是上小學之前認識幾千個漢字,有些人四處積累“人脈”。他們犯了和愛新覺羅·弘歷一樣的錯誤,以為一只猴子只要不停地打字,就終有一日能打出莎士比亞名句來,他們大大低估了正態分布曲線尾部下降的速度。

高手貴精而不貴多。如果你的輸出很多可是你的水平還是以前那樣,你從未探索新領域,你缺的不是運氣。

……但是,當你的均值已經高到無法再高,當你把能冒的險都冒了以后,數量,就是你唯一可以掌控的東西。巴拉巴西在《成功公式》這本書中提出的最后一個定律,恰恰就是要放量。一個人的科研水平二十多歲的時候就已經到頂了,成功科學家和一般科學家的最大區別是成功科學家一輩子都特別勤奮。

水平夠了才配得上比誰敢冒險。水平夠了又敢冒險,那就只能比誰勤奮、誰家人多了。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM