大數據,很明顯從字面上理解就是大量的數據,海量的數據。大,意思就是數據的量級很大,不上TB都不好意思說是大數據。數據,狹義上理解就是12345那么些數據,畢竟計算機底層是二進制來存的,那么在大數據領域,數據就不僅僅包括數字這些,它可以是所有格式的東西,比如日志,音頻視頻,文件等等。
所以,大數據從字面上理解就是海量的數據,技術上它包括這些海量數據的采集,過濾,清洗,存儲,處理,查看等等部分,每一個部分包括一些大數據的相關技術框架來支持。
當然了,關於這些只是大數據的邊角料,數據資料是一直在更新完善的,大數據資料庫是收集資料、傳輸資料、存儲資料之后再挖掘資料、分析資料、展示資料,這一系列的步驟都是非常關鍵的,也是密不可分的。
都是需要有着龐大的數據來源,不僅如此,大數據和雲計算也是有着非常密切的關系的,比如,大數據的分布式存儲以及分布式計算都是雲計算的重要技術。
大數據具有4大特征,也就是快速化、多樣化、大量化以及價值高和密度低,快速化是指的互聯網連接設備數量的增長為我們帶來更高速數據的處理。
而多樣化則是指的數據的來源多,格式也多,來源具體到生活中包括搜索引擎的信息來源、社交網絡信息來源、通話記錄等都是大數據信息的來源。
當然了,關於這些只是大數據的邊角料,數據資料是一直在更新完善的,大數據資料庫是收集資料、傳輸資料、存儲資料之后再挖掘資料、分析資料、展示資料,這一系列的步驟都是非常關鍵的,也是密不可分的。
都是需要有着龐大的數據來源,不僅如此,大數據和雲計算也是有着非常密切的關系的,比如,大數據的分布式存儲以及分布式計算都是雲計算的重要技術。
大數據具有4大特征,也就是快速化、多樣化、大量化以及價值高和密度低,快速化是指的互聯網連接設備數量的增長為我們帶來更高速數據的處理。
而多樣化則是指的數據的來源多,格式也多,來源具體到生活中包括搜索引擎的信息來源、社交網絡信息來源、通話記錄等都是大數據信息的來源。
