fastDFS原理及環境搭建


1. fastDSF介紹

FastDFS是用c語言編寫的一款開源的分布式文件系統,它是由淘寶資深架構師余慶編寫並開源。FastDFS專為互聯網量身定制,充分考慮了冗余備份、負載均衡、線性擴容等機制,並注重高可用、高性能等指標,使用FastDFS很容易搭建一套高性能的文件服務器集群提供文件上傳、下載等服務。

​ 為什么要使用fastDFS呢?

​ 上邊介紹的NFS、GFS都是通用的分布式文件系統,通用的分布式文件系統的優點的是開發體驗好,但是系統復雜性高、性能一般,而專用的分布式文件系統雖然開發體驗性差,但是系統復雜性低並且性能高。fastDFS非常適合存儲圖片等那些小文件,fastDFS不對文件進行分塊,所以它就沒有分塊合並的開銷,fastDFS網絡通信采用socket,通信速度很快。

2. fastDSF工作原理

2.1 fastDSF架構

FastDFS架構包括 Tracker server和Storageserver。客戶端請求Tracker server進行文件上傳、下載,通過Tracker server調度最終由Storage server完成文件上傳和下載。

如下圖:

1523153786785

1)Tracker

​ Tracker Server作用是負載均衡和調度,通過Tracker server在文件上傳時可以根據一些策略找到Storage server提供文件上傳服務。可以將tracker稱為追蹤服務器或調度服務器。

​ FastDFS集群中的Tracker server可以有多台,Tracker server之間是相互平等關系同時提供服務,Tracker server不存在單點故障。客戶端請求Tracker server采用輪詢方式,如果請求的tracker無法提供服務則換另一個tracker。

2)Storage

​ Storage Server作用是文件存儲,客戶端上傳的文件最終存儲在Storage服務器上,Storage server沒有實現自己的文件系統而是使用操作系統的文件系統來管理文件。可以將storage稱為存儲服務器。

​ Storage集群采用了分組存儲方式。storage集群由一個或多個組構成,集群存儲總容量為集群中所有組的存儲容量之和。一個組由一台或多台存儲服務器組成,組內的Storage server之間是平等關系,不同組的Storage server之間不會相互通信,同組內的Storage server之間會相互連接進行文件同步,從而保證同組內每個storage上的文件完全一致的。一個組的存儲容量為該組內的存儲服務器容量最小的那個,由此可見組內存儲服務器的軟硬件配置最好是一致的。

​ 采用分組存儲方式的好處是靈活、可控性較強。比如上傳文件時,可以由客戶端直接指定上傳到的組也可以由tracker進行調度選擇。一個分組的存儲服務器訪問壓力較大時,可以在該組增加存儲服務器來擴充服務能力(縱向擴容)。當系統容量不足時,可以增加組來擴充存儲容量(橫向擴容)。

3)Storage狀態收集

​ Storage server會連接集群中所有的Tracker server,定時向他們報告自己的狀態,包括磁盤剩余空間、文件同步狀況、文件上傳下載次數等統計信息。

2.2 文件上傳流程

1523155433891

​ 客戶端上傳文件后存儲服務器文件ID返回給客戶端,此文件ID用於以后訪問該文件的索引信息。文件索引信息包括:組名,虛擬磁盤路徑,數據兩級目錄,文件名。

1523155556871

  • 組名:文件上傳后所在的storage組名稱,在文件上傳成功后有storage服務器返回,需要客戶端自行保存。
  • 虛擬磁盤路徑:storage配置的虛擬路徑,與磁盤選項store_path*對應。如果配置了store_path0則是M00,如果配置了store_path1則是M01,以此類推。
  • 數據兩級目錄:storage服務器在每個虛擬磁盤路徑下創建的兩級目錄,用於存儲數據文件。
  • 文件名:與文件上傳時不同。是由存儲服務器根據特定信息生成,文件名包含:源存儲服務器IP地址、文件創建時間戳、文件大小、隨機數和文件拓展名等信息。

2.3 文件下載流程

1523155448191

tracker根據請求的文件路徑即文件ID 來快速定義文件。

比如請求下邊的文件:

1523155556871[1]

1.通過組名tracker能夠很快的定位到客戶端需要訪問的存儲服務器組是group1,並選擇合適的存儲服務器提供客戶端訪問。

2.存儲服務器根據“文件存儲虛擬磁盤路徑”和“數據文件兩級目錄”可以很快定位到文件所在目錄,並根據文件名找到客戶端需要訪問的文件。

 

3.fastDFS安裝

​ 如果想自己嘗試安裝fastDSF也可以按照文檔一步一步安裝。

​ tracker和storage使用相同的安裝包,fastDFS的下載地址在:https://github.com/happyfish100/FastDFS

本教程下載安裝包:FastDFS_v5.05.tar.gz

FastDFS是C語言開發,建議在linux上運行,本教程使用CentOS7作為安裝環境。

安裝細節請參考 “fastDFS安裝教程.doc”。

3.1 Tracker配置

本小節介紹Tracker的配置文件內容。

fastDFS的配置文件目錄 :/etc/fdfs

主要的配置文件:/etc/fdfs/tracker.conf (tracker配置文件 );storage.conf(storage配置文件)

1523157210467

tracker.conf配置內容如下:

端口:port=22122

存儲策略:store_lookup=

​ 取值范圍:0(輪詢向storage存儲文件)、1(指定具體的group)、2負載均衡,選擇空閑的storage存儲

指定具體的group:store_group= 如果store_lookup設置為1則這里必須指定一個具體的group。

tracker 基礎目錄:base_path=/home/fastdfs,tracker在運行時會向此目錄存儲storage的管理數據。

3.2 storage配置

本小節介紹storage的配置文件內容。

storage.conf配置 內容如下:

組名:group_name=group1

端口:port=23000

向tracker心跳間隔(秒):heart_beat_interval=30

storage基礎目錄:base_path=/home/fastdfs

磁盤存儲目錄,可定義多個store_path:

store_path0=/home/fastdfs/fdfs_storage 此目錄下存儲上傳的文件,在/home/fastdfs/fdfs_storage/data下

store_path1=...

...

上報tracker的地址:tracker_server=192.168.101.64:22122

如果有多個tracker則配置多個tracker,比如:

tracker_server=192.168.101.64:22122

tracker_server=192.168.101.65:22122

....

3.3 啟動停止

fastDFS啟動/停止腳本目錄:

1523157172590

fdfs_trackerd:tracker腳本,通過此腳本對 tracker進行啟動和停止

/usr/bin/fdfs_trackerd /etc/fdfs/tracker.conf restart

fdfs_storaged:storage腳本,通過此腳本對 storage進行啟動和停止

/usr/bin/fdfs_storaged /etc/fdfs/storage.conf restart


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM