一.大數據的定義:
大數據是指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
二.數據的特點:
大量:采集、存儲和計算的數據量都非常大。
高速:在大數據時代,數據的創建、存儲、分析都要求被高速處理,比如電商網站的個性化推薦盡可能要求實時完成推薦,這也是大數據區別於傳統數據挖掘的顯著特征。
多樣:數據形式和來源多樣化。包括結構化、半結構化和非結構化數據,具體表現為網絡日志、音頻、視頻、圖片、地理位置信息等等,多類型的數據對數據的處理能力提出了更高的要求。
真實:確保數據的真實性,才能保證數據分析的正確性。
低價值:數據價值密度相對較低,或者說是浪里淘沙卻又彌足珍貴。互聯網發展催生了大量數據,信息海量,但價值密度較低,如何結合業務邏輯並通過強大的機器算法來挖掘數據價值,是大數據時代最需要解決的問題,也是一個有難度的課題。
三.應用場景
1.倉儲物流:
大數據技術驅動了倉儲物流領域的智能化發展,以蘇寧為例,蘇寧物流可在全國的各級倉庫間實現智能分倉、就近備貨和預測式調撥,實現”客戶需要的商品就在離客戶最近的配送中心“。
2.電商零售:
零售業 ” 啤酒+紙尿褲 “ 案例,個性推薦。
3.汽車:
利用了大數據和物聯網技術的無人駕駛汽車
4.電信:
移動聯通根據用戶年齡、職業、消費情況,分析統計哪種套餐適合哪類人群,對市場人群精准定制。
5.生物醫學:
大數據可以幫助我們實現流行病預測、智慧醫療、健康管理,同時還可以幫助我們解讀DNA,了解更多的生命奧秘。比如影像大數據支撐下的早期肺癌支撐平台,基於大量病例數據樣本,制定早期肺癌高危人群預警指標。
6.人工智能
7.智慧城市