amazon redshift 分析型數據庫特點——本質還是列存儲


Amazon Redshift 是一種快速且完全托管的 PB 級數據倉庫,使您可以使用現有的商業智能工具經濟高效地輕松分析您的所有數據。從最低 0.25 USD 每小時 (不承擔任何義務) 直到每年每 TB 1,000 USD (PB 級),成本不到傳統解決方案的十分之一。客戶通常進行 3 倍壓縮,也就是將其成本降低到每年每 TB (未壓縮) 333 USD。

 

問:與最傳統的數據倉庫存儲及分析用數據庫相比,Amazon Redshift 的性能如何?

Amazon Redshift 使用各種創新技術,與傳統的數據倉庫倉儲及分析用數據庫相比,其性能提高將近十倍:

    • 列式數據存儲:Amazon Redshift 以列組織數據,並非以一系列的行來存儲數據。與適用於事務處理的基於行的系統不同,基於列的系統適用於數據倉庫存儲及分析,在此系統下,查詢經常涉及到對大型數據集進行聚合。由於僅對涉及查詢的列進行處理,且列式數據順序存儲在存儲介質上,故基於列的系統所需的 I/O 要少得多,從而顯著提高了查詢性能。
    • 高級壓縮:與基於行的數據存儲相比,列式數據存儲可進行更大程度的壓縮,因為類似的數據是按順序存儲在硬盤上。Amazon Redshift 擁有多種壓縮技術,與傳統的關系數據存儲相比,經常可進行很大程度的壓縮。此外,與傳統的關系數據庫系統相比,Amazon Redshift 不需要索引或具體化視圖,因此使用的空間較少。將數據加載到空表中時,Amazon Redshift 自動對您的數據進行采樣並選擇最合適的壓縮方案。
    • 大規模並行處理 (MPP):Amazon Redshift 在所有節點之間自動分配數據及查詢負載。Amazon Redshift 可輕松將節點添加至您的數據倉庫,而且隨着您的數據倉庫規模的擴大,仍能維持快速的查詢性能。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM