關於網絡存儲技術和存儲的協議
網絡存儲技術
網絡存儲技術(Network Storage Technologies)是基於數據存儲的一種通用網絡術語。網絡存儲結構大致分為三種:直連式存儲(DAS:Direct Attached Storage)、網絡存儲設備(NAS:Network Attached Storage)和存儲網絡(SAN:Storage Area Network)。
直連式存儲(DAS)
這是一種直接與主機系統相連接的存儲設備,如作為服務器的計算機內部硬件驅動。到目前為止,DAS 仍是計算機系統中最常用的數據存儲方法。
DAS即直連方式存儲,英文全稱是Direct Attached Storage。中文翻譯成“直接附加存儲”。顧名思義,在這種方式中,存儲設備是通過電纜(通常是SCSI接口電纜)直接到服務器的。I/O(輸入/輸出)請求直接發送到存儲設備。DAS,也可稱為SAS(Server-Attached Storage,服務器附加存儲)。它依賴於服務器,其本身是硬件的堆疊,不帶有任何存儲操作系統。
網絡存儲設備(NAS)
NAS 是一種采用直接與網絡介質相連的特殊設備實現數據存儲的機制。由於這些設備都分配有 IP 地址,所以客戶機通過充當數據網關的服務器可以對其進行存取訪問,甚至在某些情況下,不需要任何中間介質客戶機也可以直接訪問這些設備。
- 最大存儲容量
最大存儲容量是指NAS存儲設備所能存儲數據容量的極限,通俗的講,就是NAS設備能夠支持的最大硬盤數量乘以單個硬盤容量就是最大存儲容量。這個數值取決於NAS設備的硬件規格。不同的硬件級別,適用的范圍不同,存儲容量也就有所差別。通常,一般小型的NAS存儲設備會支持幾百GB的存儲容量,適合中小型公司作為存儲設備共享數據使用,而中高檔的NAS設備應該支持T級別的容量(1TB=1024GB)。
- NAS
NAS是英文“Network Attached Storage”的縮寫, 中文意思是“網絡附加存儲”。按字面簡單說就是連接在網絡上, 具備資料存儲功能的裝置,因此也稱為“網絡存儲器”或者“網絡磁盤陣列”。
- 從結構上講,NAS是功能單一的精簡型電腦,因此在架構上不像個人電腦那么復雜,在外觀上就像家電產品,只需電源與簡單的控制鈕。
- NAS是一種專業的網絡文件存儲及文件備份設備,它是基於LAN(局域網)的,按照TCP/IP協議進行通信,以文件的I/O(輸入/輸出)方式進行數據傳輸。在LAN環境下,NAS已經完全可以實現異構平台之間的數據級共享,比如NT、UNIX等平台的共享。
- 一個NAS系統包括處理器,文件服務管理模塊和多個硬盤驅動器(用於數據的存儲)。 NAS 可以應用在任何的網絡環境當中。主服務器和客戶端可以非常方便地在NAS上存取任意格式的文件,包括SMB格式(Windows)NFS格式(Unix, Linux)和CIFS(Common Internet File System)格式等等。
存儲網絡(SAN)
SAN 是指存儲設備相互連接且與一台服務器或一個服務器群相連的網絡。其中的服務器用作 SAN 的接入點。在有些配置中,SAN 也與網絡相連。SAN 中將特殊交換機當作連接設備。它們看起來很像常規的以太網絡交換機,是 SAN 中的連通點。SAN 使得在各自網絡上實現相互通信成為可能,同時並帶來了很多有利條件。
SAN英文全稱:Storage Area Network,即存儲區域網絡。它是一種通過光纖集線器、光纖路由器、光纖交換機等連接設備將磁盤陣列、磁帶等存儲設備與相關服務器連接起來的高速專用子網。
SAN由三個基本的組件構成:接口(如SCSI、光纖通道、ESCON等)、連接設備(交換設備、網關、路由器、集線器等)和通信控制協議(如IP和SCSI等)。這三個組件再加上附加的存儲設備和獨立的SAN服務器,就構成一個SAN系統。SAN提供一個專用的、高可靠性的基於光通道的存儲網絡,SAN允許獨立地增加它們的存儲容量,也使得管理及集中控制(特別是對於全部存儲設備都集群在一起的時候)更加簡化。而且,光纖接口提供了10 km的連接長度,這使得物理上分離的遠距離存儲變得更容易。
存儲結構/性能對比
存儲結構/性能對比 |
DAS |
NAS |
FC-SAN |
IP-SAN |
成本 |
低 |
較低 |
高 |
較高 |
數據傳輸速度 |
快 |
慢 |
極快 |
較快 |
擴展性 |
無擴展性 |
較低 |
易於擴展 |
最易擴展 |
服務器訪問存儲方式 |
直接訪問存儲數據塊 |
以文件方式訪問 |
直接訪問存儲數據塊 |
直接訪問存儲數據塊 |
服務器系統性能開銷 |
低 |
較低 |
低 |
較高 |
安全性 |
高 |
低 |
高 |
低 |
是否集中管理存儲 |
否 |
是 |
是 |
是 |
備份效率 |
低 |
較低 |
高 |
較高 |
網絡傳輸協議 |
無 |
TCP/IP |
Fibre Channel |
TCP/IP |
存儲接口協議
不同的硬盤接口決定着硬盤與控制器之間的連接速度,在整個系統中,硬盤接口的性能高低對磁盤陣列整體性能有直接的影響,因此了解一款磁盤陣列的硬盤接口往往是衡量這款產品的關鍵指標之一。
硬盤接口是硬盤與主機系統間的連接部件,作用是在硬盤緩存和主機內存之間傳輸數據。不同的硬盤接口決定着硬盤與控制器之間的連接速度,在整個系統中,硬盤接口的性能高低對磁盤陣列整體性能有直接的影響,因此了解一款磁盤陣列的硬盤接口往往是衡量這款產品的關鍵指標之一。存儲系統中目前普遍應用的硬盤接口主要包括SATA、 SCSI、SAS和FC等,此外ATA硬盤在SATA硬盤出現前也在一些低端存儲系統里被廣泛使用。
每種接口協議擁有不同的技術規范,具備不同的傳輸速度,其存取效能的差異較大,所面對的實際應用和目標市場也各不相同。同時,各接口協議所處於的技術生命階段也各不相同,有些已經沒落並面臨淘汰,有些則前景光明,但發展尚未成熟。那么經常困擾客戶的則是如何選擇合適類型陣列,既可以滿足應用的性能要求,又可以降低整體投資成本。
ATA,在並行中沒落
ATA (AT Attachment)接口標准是IDE(Integrated DriveElectronics)硬盤的特定接口標准。自問世以來,一直以其價廉、穩定性好、標准化程度高等特點,深得廣大中低端用戶的青睞,甚至在某些高端應用領域,如服務器應用中也有一定的市場。ATA規格包括了 ATA/ATAPI-6 其中Ultra ATA 100兼容以前的ATA版本,在40-pin的連接器中使用標准的16位並行數據總線和16個控制信號。
最早的接口協議都是並行ATA(Paralle ATA)接口協議。PATA接口一般使用16-bit數據總線,每次總線處理時傳送2個字節。PATA接口一般是100Mbytes/sec帶寬,數據總線必須鎖定在50MHz,為了減小濾波設計的復雜性,PATA使用Ultra總線,通過“雙倍數據比率”或者2個邊緣(上升沿和下降沿)時鍾機制用來進行DMA傳輸。這樣在數據濾波的上升沿和下降沿都采集數據,就降低一半所需要的濾波頻率。這樣帶寬就是:25MHz 時鍾頻率x 2 雙倍時鍾頻率x16 位/每一個邊緣/ 8 位/每個字節= 100 Mbytes/sec。
在過去的20年中,PATA成為ATA硬盤接口的主流技術。但隨着CPU時鍾頻率和內存帶寬的不斷提升,PATA逐漸顯現出不足來。一方面,硬盤制造技術的成熟使ATA硬盤的單位價格逐漸降低,另一方面,由於采用並行總線接口,傳輸數據和信號的總線是復用的,因此傳輸速率會受到一定的限制。如果要提高傳輸的速率,那么傳輸的數據和信號往往會產生干擾,從而導致錯誤。
PATA的技術潛力似乎已經走到盡頭,在當今的許多大型企業中,PATA現有的傳輸速率已經逐漸不能滿足用戶的需求。人們迫切期待一種更可靠、更高效的接口協議來替代PATA,在這種需求的驅使下,串行(Serial)ATA總線接口技術應運而生,直接導致了傳統PATA技術的沒落。
SATA,在低端徘徊
PATA曾經在低端的存儲應用中有過光輝的歲月,但由於自身的技術局限性,逐步被串行總線接口協議(Serial ATA,SATA)所替代。SATA以它串行的數據發送方式得名。在數據傳輸的過程中,數據線和信號線獨立使用,並且傳輸的時鍾頻率保持獨立,因此同以往的PATA相比,SATA的傳輸速率可以達到並行的30倍。可以說:SATA技術並不是簡單意義上的PATA技術的改進,而是一種全新的總線架構。
從總線結構上,SATA 使用單個路徑來傳輸數據序列或者按照bit來傳輸,第二條路徑返回響應。控制信息用預先定義的位來傳輸,並且分散在數據中間,以打包的格式用開/關信號脈沖發送,這樣就不需要另外的傳輸線。SATA帶寬為16-bit。並行Ultra ATA總線每個時鍾頻率傳輸16bit數據,而SATA僅傳輸1bit,但是串行總線可以更高傳輸速度來彌補串行傳輸的損失。SATA將會引入 1500Mbits/sec帶寬或者1.5Gbits/sec帶寬。由於數據用8b/10b編碼,有效的***傳輸峰值是150Mbytes/sec。
目前能夠見到的有SATA-1和SATA-2兩種標准,對應的傳輸速度分別是150MB/s和300MB/s。從速度這一點上,SATA已經遠遠把 PATA硬盤甩到了后面。其次,從數據傳輸角度上,SATA比PATA抗干擾能力更強。從SATA委員會公布的資料來看,到2007年,在第三代SATA技術中,個人電腦存儲系統將具有達600MB/s的數據帶寬。此外,串口的數據線由於只采用了四針結構,因此相比較起並口安裝起來更加便捷,更有利於縮減機箱內的線纜,有利散熱。
雖然廠商普遍宣稱SATA支持熱插拔,但實際上,SATA在硬盤損壞的時候,不能像SCSI/SAS和FC硬盤一樣,顯示具體損壞的硬盤,這樣熱插拔功能實際上形同虛設。同時,盡管SATA在諸多性能上遠遠優越於PATA,甚至在某些單線程任務的測試中,表現出了不輸於SCSI的性能,然而它的機械底盤仍然為低端應用設計的,在面對大數據吞吐量或者多線程的傳輸任務時,相比SCSI硬盤,仍然顯得力不從心。除了速度之外,在多線程數據讀取時,硬盤磁頭頻繁地來回擺動,使硬盤過熱是SATA需要克服的缺陷。正是因為這些技術上致命的缺陷,導致目前為止,SATA還只能在低端的存儲應用中徘徊。
SCSI,中端存儲的主流之選
SCSI(Small Computer System Interface)是一種專門為小型計算機系統設計的存儲單元接口模式,通常用於服務器承擔關鍵業務的較大的存儲負載,價格也較貴。SCSI計算機可以發送命令到一個SCSI設備,磁盤可以移動驅動臂定位磁頭,在磁盤介質和緩存中傳遞數據,整個過程在后台執行。這樣可以同時發送多個命令同時操作,適合大負載的I/O應用。在磁盤陣列上的整體性能也大大高於基於ATA硬盤的陣列。
SCSI規范發展到今天,已經是第六代技術了,從剛創建時候的SCSI(8bit)到今天的Ultra 320 SCSI,速度從1.2MB/s到現在的320MB/s有了質的飛躍。目前的主流SCSI硬盤都采用了Ultra 320 SCSI接口,能提供320MB/s的接口傳輸速度。SCSI硬盤也有專門支持熱拔插技術的SCA2接口(80-pin),與SCSI背板配合使用,就可以輕松實現硬盤的熱拔插。目前在工作組和部門級服務器中,熱插拔功能幾乎是必備的。
相比ATA硬盤,SCSI體現出了更適合中、高端存儲應用的技術優勢:
首先SCSI相對於ATA硬盤的接口支持數量更多。一般而言,ATA硬盤采用IDE插槽與系統連接,而每IDE插槽即占用一個IRQ(中斷號),而每兩個 IDE設備就要占用一個IDE能道,雖然附加IDE控制卡等方式可以增加所支持的IDE設備數量,但總共可連接的IDE設備數最多不能超過15個。而 SCSI的所有設備只占用一個中斷號(IRQ),因此它支持的磁盤擴容量要比ATA更為巨大。這個優點對於普通用戶而言並不具備太大的吸引力,但對於企業存儲應用則顯得意義非凡,某些企業需要近乎無節制地擴充磁盤系統容量,以滿足網絡存儲用戶的需求。
其次:SCSI的帶寬很寬,Ultra 320 SCSI能支持的總線速度為320MB/s,雖然這只是理論值而已,但在實際數據傳輸率方面,最快 ATA/SATA的硬盤相比SCSI硬盤無論在穩定性和傳輸速率上,都有一定的差距。不過如果單純從速度的角度來看,用戶未必需要選擇SCSI硬盤,RAID技術可以更加有效地提高磁盤的傳輸速度。
SCSI硬盤CPU占用率低、並行處理能力強。在ATA和SATA硬盤雖然也能實現多用戶同時存取,但當並行處理人數超過一定數量后,ATA/SATA硬盤就會暴露出很大的I/O缺陷,傳輸速率大幅下降。同時,硬盤磁頭的來回擺動,也造成硬盤發熱不穩定的現象。
對於SCSI而言,它有獨立的芯片負責數據處理,當CPU將指令傳輸給SCSI后,隨即去處理后續指令,其它的相關工作就交給SCSI控制芯片來處理;當 SCSI“處理器”處理完畢后,再次發送控制信息給CPU,CPU再接着進行后續工作,因此不難想像SCSI系統對CPU的占用率很低,而且SCSI硬盤允許一個用戶對其進行數據傳輸的同時,另一位用戶同時對其進行數據查找,這就是SCSI硬盤並行處理能力的體現。
SCSI硬盤較貴,但是品質性能更高,其獨特的技術優勢保障SCSI一直在中端存儲市場占據中流砥柱的地位。普通的ATA硬盤轉速是5400或者7200RPM;SCSI 硬盤是10000或者15000 RPM,SCSI硬盤的質保期可以達到5年,平均無故障時間達到1,200,000小時。然而對於企業來說,盡管SCSI在傳輸速率和容錯性上有極好的表現,但是它昂貴的價格使得用戶望而卻步。而下一代SCSI技術SAS的誕生,則更好的兼容了性能和價格雙重優勢。
SAS,接口協議的明日帝國
SAS 是Serial Attached SCSI的縮寫,即串行連接SCSI。和現在流行的Serial ATA(SATA)硬盤相同,都是采用串行技術以獲得更高的傳輸速度,並通過縮短連結線改善內部空間等。
SAS是新一代的SCSI技術,同SATA之於PATA的革命意義一樣,SAS 也是對SCSI技術的一項變革性發展。它既利用了已經在實踐中驗證的 SCSI 功能與特性,又以此為基礎引入了SAS擴展器。SAS可以連接更多的設備,同時由於它的連接器較小,SAS 可以在3.5 英寸或更小的 2.5 英寸硬盤驅動器上實現全雙端口,這種功能以前只在較大的 3.5 英寸光纖通道硬盤驅動器上能夠實現。該功能對於高密度服務器如刀片服務器等需要冗余驅動器的應用非常重要。
為保護用戶投資,SAS的接口技術可以向下兼容SATA。SAS系統的背板(Backplane)既可以連接具有雙端口、高性能的SAS驅動器,也可以連接高容量、低成本的SATA驅動器。過去由於SCSI、ATA分別占領不同的市場段,且設備間共享帶寬,在接口、驅動、線纜等方面都互不兼容,造成用戶資源的分散和孤立,增加了總體擁有成本。而現在,用戶即使使用不同類型的硬盤,也不需要再重新投資,對於企業用戶投資保護來說,實在意義非常。但需要注意的是,SATA系統並不兼容SAS,所以SAS驅動器不能連接到SATA背板上。
SAS 使用的擴展器可以讓一個或多個SAS主控制器連接較多的驅動器。每個擴展器可以最多連接 128 個物理連接,其中包括其它主控連接,其它 SAS 擴展器或硬盤驅動器。這種高度可擴展的連接機制實現了企業級的海量存儲空間需求,同時可以方便地支持多點集群,用於自動故障恢復功能或負載平衡。前期,SAS接口速率為3Gbps(SAS1.0),其SAS擴展器多為12端口。目前6Gbps(SAS2.0)、12Gbps(SAS3.0)的高速接口均已商用,並且會有28或36端口的SAS擴展器出現以適應不同的應用需求。
在SAS接口享有種種得天獨厚的優勢的同時,SAS產品的成本從芯片級開始,都遠遠低於FC,而正是因為SAS突出的性價比優勢,使SAS在磁盤接口領域,給光纖存儲帶來極大的威脅。目前眾多廠商均已推出SAS磁盤接口協議的產品,SAS也成為存儲的主流接口標准。