一、什么是Alluxio
Alluxio(之前名為Tachyon)是世界上第一個以內存為中心的虛擬的分布式存儲系統。它統一了數據訪問的方式,為上層計算框架和底層存儲系統構建了橋梁。應用只需要連接Alluxio即可訪問存儲在底層任意存儲系統中的數據。此外,Alluxio的以內存為中心的架構使得數據的訪問速度能比現有常規方案快幾個數量級。
在大數據生態系統中,Alluxio介於計算框架(如Apache Spark,Apache MapReduce,Apache HBase,Apache Hive,Apache Flink)和現有的存儲系統(如Amazon S3,OpenStack Swift,GlusterFS,HDFS,MaprFS,Ceph,NFS,OSS)之間。Alluxio為大數據軟件棧帶來了顯著的性能提升。Alluxio與Hadoop是兼容的。現有的數據分析應用,如Spark和MapReduce程序,可以不修改代碼直接在Alluxio上運行。
二、Alluxio應用
比如:分布式內存文件系統Alluxio, Alluxio是一個分布式內存文件系統,可以在集群里以訪問內存的速度來訪問存在Alluxio里的文件。把Alluxio是架構在最底層的分布式文件存儲和上層的各種計算框架之間的一種中間件,其前身為Tachyon。