1. fastDSF介紹
FastDFS是用c語言編寫的一款開源的分布式文件系統,它是由淘寶資深架構師余慶編寫並開源。FastDFS專為互聯網量身定制,充分考慮了冗余備份、負載均衡、線性擴容等機制,並注重高可用、高性能等指標,使用FastDFS很容易搭建一套高性能的文件服務器集群提供文件上傳、下載等服務。
為什么要使用fastDFS呢?
上邊介紹的NFS、GFS都是通用的分布式文件系統,通用的分布式文件系統的優點的是開發體驗好,但是系統復雜性高、性能一般,而專用的分布式文件系統雖然開發體驗性差,但是系統復雜性低並且性能高。fastDFS非常適合存儲圖片等那些小文件,fastDFS不對文件進行分塊,所以它就沒有分塊合並的開銷,fastDFS網絡通信采用socket,通信速度很快。
2. fastDSF工作原理
2.1 fastDSF架構
FastDFS架構包括 Tracker server和Storageserver。客戶端請求Tracker server進行文件上傳、下載,通過Tracker server調度最終由Storage server完成文件上傳和下載。
如下圖:
1)Tracker
Tracker Server作用是負載均衡和調度,通過Tracker server在文件上傳時可以根據一些策略找到Storage server提供文件上傳服務。可以將tracker稱為追蹤服務器或調度服務器。
FastDFS集群中的Tracker server可以有多台,Tracker server之間是相互平等關系同時提供服務,Tracker server不存在單點故障。客戶端請求Tracker server采用輪詢方式,如果請求的tracker無法提供服務則換另一個tracker。
2)Storage
Storage Server作用是文件存儲,客戶端上傳的文件最終存儲在Storage服務器上,Storage server沒有實現自己的文件系統而是使用操作系統的文件系統來管理文件。可以將storage稱為存儲服務器。
Storage集群采用了分組存儲方式。storage集群由一個或多個組構成,集群存儲總容量為集群中所有組的存儲容量之和。一個組由一台或多台存儲服務器組成,組內的Storage server之間是平等關系,不同組的Storage server之間不會相互通信,同組內的Storage server之間會相互連接進行文件同步,從而保證同組內每個storage上的文件完全一致的。一個組的存儲容量為該組內的存儲服務器容量最小的那個,由此可見組內存儲服務器的軟硬件配置最好是一致的。
采用分組存儲方式的好處是靈活、可控性較強。比如上傳文件時,可以由客戶端直接指定上傳到的組也可以由tracker進行調度選擇。一個分組的存儲服務器訪問壓力較大時,可以在該組增加存儲服務器來擴充服務能力(縱向擴容)。當系統容量不足時,可以增加組來擴充存儲容量(橫向擴容)。
3)Storage狀態收集
Storage server會連接集群中所有的Tracker server,定時向他們報告自己的狀態,包括磁盤剩余空間、文件同步狀況、文件上傳下載次數等統計信息。
2.2 文件上傳流程
客戶端上傳文件后存儲服務器將文件ID返回給客戶端,此文件ID用於以后訪問該文件的索引信息。文件索引信息包括:組名,虛擬磁盤路徑,數據兩級目錄,文件名。
- 組名:文件上傳后所在的storage組名稱,在文件上傳成功后有storage服務器返回,需要客戶端自行保存。
- 虛擬磁盤路徑:storage配置的虛擬路徑,與磁盤選項store_path*對應。如果配置了store_path0則是M00,如果配置了store_path1則是M01,以此類推。
- 數據兩級目錄:storage服務器在每個虛擬磁盤路徑下創建的兩級目錄,用於存儲數據文件。
- 文件名:與文件上傳時不同。是由存儲服務器根據特定信息生成,文件名包含:源存儲服務器IP地址、文件創建時間戳、文件大小、隨機數和文件拓展名等信息。
2.3 文件下載流程
tracker根據請求的文件路徑即文件ID 來快速定義文件。
比如請求下邊的文件:
1.通過組名tracker能夠很快的定位到客戶端需要訪問的存儲服務器組是group1,並選擇合適的存儲服務器提供客戶端訪問。
2.存儲服務器根據“文件存儲虛擬磁盤路徑”和“數據文件兩級目錄”可以很快定位到文件所在目錄,並根據文件名找到客戶端需要訪問的文件。
3.fastDFS安裝
如果想自己嘗試安裝fastDSF也可以按照文檔一步一步安裝。
tracker和storage使用相同的安裝包,fastDFS的下載地址在:https://github.com/happyfish100/FastDFS
本教程下載安裝包:FastDFS_v5.05.tar.gz
FastDFS是C語言開發,建議在linux上運行,本教程使用CentOS7作為安裝環境。
安裝細節請參考 “fastDFS安裝教程.doc”。
3.1 Tracker配置
本小節介紹Tracker的配置文件內容。
fastDFS的配置文件目錄 :/etc/fdfs
主要的配置文件:/etc/fdfs/tracker.conf (tracker配置文件 );storage.conf(storage配置文件)
tracker.conf配置內容如下:
端口:port=22122
存儲策略:store_lookup=
取值范圍:0(輪詢向storage存儲文件)、1(指定具體的group)、2負載均衡,選擇空閑的storage存儲
指定具體的group:store_group= 如果store_lookup設置為1則這里必須指定一個具體的group。
tracker 基礎目錄:base_path=/home/fastdfs,tracker在運行時會向此目錄存儲storage的管理數據。
3.2 storage配置
本小節介紹storage的配置文件內容。
storage.conf配置 內容如下:
組名:group_name=group1
端口:port=23000
向tracker心跳間隔(秒):heart_beat_interval=30
storage基礎目錄:base_path=/home/fastdfs
磁盤存儲目錄,可定義多個store_path:
store_path0=/home/fastdfs/fdfs_storage 此目錄下存儲上傳的文件,在/home/fastdfs/fdfs_storage/data下
store_path1=...
...
上報tracker的地址:tracker_server=192.168.101.64:22122
如果有多個tracker則配置多個tracker,比如:
tracker_server=192.168.101.64:22122
tracker_server=192.168.101.65:22122
....
3.3 啟動停止
fastDFS啟動/停止腳本目錄:
fdfs_trackerd:tracker腳本,通過此腳本對 tracker進行啟動和停止
/usr/bin/fdfs_trackerd /etc/fdfs/tracker.conf restart
fdfs_storaged:storage腳本,通過此腳本對 storage進行啟動和停止
/usr/bin/fdfs_storaged /etc/fdfs/storage.conf restart