大數據的特征(4V+1O)


 

數據量大(Volume):第一個特征是數據量大,包括采集、存儲和計算的量都非常大。大數據的起始計量單位至少是P(1000個T)、E(100萬個T)或Z(10億個T)。

類型繁多(Variety):第二個特征是種類和來源多樣化。包括結構化、半結構化和非結構化數據,具體表現為網絡日志、音頻、視頻、圖片、地理位置信息等等,多類型的數據對數據的處理能力提出了更高的要求。

價值密度低(Value):第三個特征是數據價值密度相對較低,或者說是浪里淘沙卻又彌足珍貴。隨着互聯網以及物聯網的廣泛應用,信息感知無處不在,信息海量,但價值密度較低,如何結合業務邏輯並通過強大的機器算法來挖掘數據價值,是大數據時代最需要解決的問題。

速度快時效高(Velocity):第四個特征數據增長速度快,處理速度也快,時效性要求高。比如搜索引擎要求幾分鍾前的新聞能夠被用戶查詢到,個性化推薦算法盡可能要求實時完成推薦。這是大數據區別於傳統數據挖掘的顯著特征。

數據是在線的(Online):數據是永遠在線的,是隨時能調用和計算的,這是大數據區別於傳統數據最大的特征。現在我們所談到的大數據不僅僅是大,更重要的是數據變的在線了,這是互聯網高速發展背景下的特點。比如,對於打車工具,客戶的數據和出租司機數據都是實時在線的,這樣的數據才有意義。如果是放在磁盤中而且是離線的,這些數據遠遠不如在線的商業價值大。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM