歐凱慣例:引子
其實每個人時時刻刻都在產生數據,特別是在當今的移動互聯年代,但確並不是每個人都知道這個事實。
首發地址
數字信息總量的瘋狂擴張簡史
想要了解當前全球的好數字信息總量,不妨先看一看截至2007
年的全球數字信息總量的擴展史,如下圖所示:
如上圖所示,1986
年,全球只有0.02EB
也就是約21000TB
的數據量,而到了2007年,全球就是280EB
也就是約300000000TB
的數據量,翻了14000
倍。
而最近,由於移動互聯網及物聯網的出現,各種終端設備的接入,各種業務形式的普及,平均每40
個月,全球的數據量就會翻倍!如果這樣說還沒有什么印象,可以再舉個簡單的例子,在2012
年,每天會產生2.5EB
的數據量。基於IDC的報告預測,從2013年到2020年,全球數據量會從4.4ZB
猛增到44ZB
!而到了2025年,全球會有163ZB
的數據量!
由此可見,截至目前,全球的數據量已經大到爆了!而傳統的關系型數據庫根本處理不了如此海量的數據!
量變能帶來質變嗎
接下來,咱們通過一幅圖看看海量的數據是如何從另外一個角度呈現給我們價值的。
通過上面看似雜亂的圖,你能想到什么呢?其實它以最簡單的方式形式的給我們意會了大數據的核心:90%
的圖標都落在了左上到右下的區間塊中(趨勢)。
- 用一句中文描述大數據的核心價值就是:
世上本沒有路,走的人多了也便成了路
- 用一個英文單詞描述大數據的核心價值就是:
expirence
如何理解上面的兩句話呢?這里不妨說一個簡單的例子,也是大數據初始階段應用的典型案例:
話說谷歌有一天發現非洲某個區域的人在某個月份對某一病毒的查詢頻次非常之高,這讓谷歌的工程師們十分費解,為什么會出現這種現象呢?他們猜測莫非非洲的這個區域在這段時間內感染這種病毒的人很多?后來他們的調查印證了他們的猜測,這給了他們極大的鼓舞!他們意識到當數據量大到一定程度之后,或可先覺或可后知某種現象,即如果某件事發生的頻次很高,那么很可能這件事還正在發生着,很可能在未來當條件相似時還會發生這種事件(這也是
機器學習
的原理),這就是預測,使用大數據進行的預測!
數據【大】了,谷歌瘋了
谷歌真是一家牛逼的公司,雄厚的基礎實力,逆天的創新能力,大數據的起航讓它瘋狂,AlphaGo擊敗人類又讓大數據一戰封神!
到底什么是數據呢?
可以用一句屌炸天的話來概括:宇宙中的一切痕跡都是數據!宇宙中唯一不變的就是變化,時時刻刻的變化會時時刻刻留下痕跡,這都是數據!
歐凱慣例:小結
好,關於數據與大數據咱就先說到這里,我會從系列之二開始,以科學的角度,嚴謹的討論數據與大數據,歡迎大家隨時關注哦~