FastDFS
FastDFS是由國人余慶所開發:項目GitHub FastDFS是一個輕量級的開源分布式文件系統,主要解決了大容量的文件存儲和高並發訪問的問題,文件存取時實現了負載均衡。 FastDFS是一款類Google FS的開源分布式文件系統,它用純C語言實現,支持Linux、FreeBSD、AIX等UNIX系統。 FastDFS只能通過專有API對文件進行存取訪問,不支持POSIX接口方式,不能mount使用。 准確地講,Google FS以及FastDFS、mogileFS、 HDFS、TFS等類Google FS都不是系統級的分布式文件系統,而是應用級的分布式文件存儲服務。
FastDFS的特性
1》分組存儲,靈活簡潔、對等結構,不存在單點
2》文件ID由FastDFS生成,作為文件訪問憑證,FastDFS不需要傳統的name server
3》和流行的web server無縫銜接,FastDFS已提供apache和nginx擴展模塊
4》大、中、小文件均可以很好支持,支持海量小文件存儲
5》 支持多塊磁盤,支持單盤數據恢復
6》 支持相同文件內容只保存一份,節省存儲空間
7》 存儲服務器上可以保存文件附加屬性
8》 下載文件支持多線程方式,支持斷點續傳
FastDFS架構圖

FastDFS架構解讀
只有兩個角色,tracker server和storage server,不需要存儲文件索引信息
所有服務器都是對等的,不存在Master-Slave關系
存儲服務器采用分組方式,同組內存儲服務器上的文件完全相同(RAID 1)
不同組的storage server之間不會相互通信
由storage server主動向tracker server報告狀態信息,tracker server之間通常不會相互通信
系統架構-上傳文件流程圖

1》client詢問tracker上傳到的storage;
2》tracker返回一台可用的storage;
3》client直接和storage通信完成文件上傳,storage返回文件ID。
系統架構-下載文件流程圖

1》client詢問tracker下載文件的storage,參數為文件ID(組名和文件名);
2》tracker返回一台可用的storage;
3》client直接和storage通信完成文件下載。
Fast同步機制
采用binlog文件記錄更新操作,根據binlog進行文件同步
同一組內的storage server之間是對等的,文件上傳、刪除等操作可以在任意一台storage server上進行;
文件同步只在同組內的storage server之間進行,采用push方式,即源服務器同步給目標服務器;
源頭數據才需要同步,備份數據不需要再次同步,否則就構成環路了;
上述第二條規則有個例外,就是新增加一台storage server時,由已有的一台storage server將已有的所有數據(包括源頭數據和備份數據)同步給該新增服務器。
FastDFS用戶請求過程

FastDFS核心組件
Tracker:
調度器,負責維持集群的信息,例如各group及其內部的storage node,這些信息也是storage node報告所生成,每個storagenode會周期性向tracker發心跳信息;
storage server:
以group為單位進行組織,任何一個storage server都應該屬於某個group,一個group應該包含多個storage server,在同一個group內部,各storage server的數據互相冗余;
FastDFS運行機制
如何在組中挑選storage server:
1》rr;
2》以ip為次序,找第一個,即IP地址較小者;
3》以優先級為序,找第一個;
如何選擇磁盤(存儲路徑):
1》rr;
2》剩余可用空間大者優先;
生成FID:
由源頭storage server ip、創建時的時間戳、大小、文件的校驗碼和一個隨機數進行hash計算后生成;
最后基於base64進行文本編碼,轉換為可打印字符;
groupID/MID/H1ID/H2ID/file_name
groupID:組編號
MID:存儲路徑(存儲設備)編號
H1ID/H2ID:目錄分層
file_name:文件名,不同於用戶上傳時使用文件名,而是由服務器生成hash文件名;
服務器IP、文件創建時的時間戳、文件大小、文件名和擴展名;
文件同步:
每個storage server在文件存儲完成后,會將其信息存於binlog, binlog不包含數據,僅包含文件名等元數據信息,binlog可用於同步;
FastDFS配置修改
Tracker:
編輯tracker server配置文件tracker.conf,需要修改內容如下:
disabled=false(默認為false,表示是否無效)
port=22122(默認為22122)
base_path=/data/fastdfs/tracker
storage server:
disabled=false(默認為false,表示是否無效)
port=23000(默認為23000)
base_path=/data/fastdfs/storage
tracker_server=172.18.10.232:22122
store_path0=/data/fastdfs/storage
http.server_port=8888(默認為8888,nginx中配置的監聽端口那之一致)
FastDFS常用命令
1》查看存儲節點狀態
# fdfs_monitor /etc/fdfs/client.conf
2》上傳測試
fdfs_test <config_file> upload <local_filename> [FILE | BUFF | CALLBACK]
3》文件上傳
fdfs_upload_file /etc/fdfs/client.conf /root/solo-2.2.0.war
4》文件查看
fdfs_file_info /etc/fdfs/client.conf group1/M00/00/00/rBH7vFoax3KANb_FAUlr7-L-yRM9.0.war
5》文件下載
fdfs_download_file /etc/fdfs/client.conf group1/M00/00/00/rBH7vFoax3KANb_FAUlr7-L-yRM9.0.war
FastDFS實現nginx代理
1》安裝nginx以及對應模塊
2》修改nginx的location配置,映射路徑和啟動模塊
location /group1/M00 {
root /data/fdfs/store/data;
ngx_fastdfs_module;
}
3》修改對應fastdfs模塊
url_have_group_name = true
tracker_server=172.17.252.234:22122
轉自:https://www.cnblogs.com/shenxm/p/8459292.html
