存儲快照實現原理

本文轉載自查看原文 2018-02-12 13:02 1028

存儲快照有兩種實現方式：COW(寫時復制 Copy-On-Write)、ROW(寫重定向 Redirect-On-Write)，兩種實現方法有區別，造成讀寫性能、應用場景有比較大的區別。
COW：

原理見下圖(從網上找的，沒自己畫)。
1)原卷數據是A~G。此卷Metedata像指針一樣指向這些數據。
2)當做快照時，重新復制一份Metedata，並且也指向這些A~G數據。
3)當有數據要寫入到源卷時(下圖寫入D')，寫入到D的原位置之前，需要把D拷貝出放到一個新位置。然后修改快照的Metedata的其中一個指針指向拷貝出的位置[D](圖中是Snapshot data的存儲位置)。同時，把D’寫入到D原來的位置。
存儲快照實現原理

此方式可以看出，源卷的Metedata的是沒有變化的。對原卷是連續的數據，多次快照，多次寫之后還是 連續的數據，因此讀性能或者對單個位置的多次寫性能都不會有很大的影響。
但是， 快照的數據是非連續的，如數據ABCEFG還是在源卷的位置，是連續數據。而數據D在存儲的其他位置，非連續。如果多次快照，不同位置的多次讀寫后，快照的數據可能就比較混亂。造成對快照的讀寫延時較大。

應用場景：

這種實現方式在第一次寫入某個存儲位置時需要完成一個讀操作（讀原位置的數據），兩個寫操作（寫原位置與寫快照空間），如果寫入頻繁，那么這種方式將非常消耗IO時間。因此可推斷，如果預計某個卷上的I/O多數以讀操作為主，寫操作較少的場景，這種方式的快照實現技術是一個較理想的選擇，因為快照的完成需要較少的時間。除此之外，如果一個應用易出現寫入熱點，即只針對某個有限范圍內的數據進行寫操作，那么COW的快照實現方式也是較較理想的選擇。因為其數據更改都局限在一個范圍內，對同一份數據的多次寫操作只會出現一次寫時復制操作。

但是這種方式的缺點也是非常明顯的。如果寫操作過於分散且頻繁，那么 COW造成的開銷則是不可忽略的，有時甚至是無法接受的。因此在應用時，則需要綜合評估應用系統的使用場景，以判斷這種方式的快照是否適用。

ROW：

原理見下圖：

Vd是源卷的Metedata，分別指向4塊數據。做快照時，snap的metadata也指向此4塊數據。當有數據寫入時，把數據寫入另外一個位置，然后修改vd的其中一個metedata到新位置。snap的metedata數據不變化。

此方式源卷經過長時間寫后，所有數據塊的位置可能都會重定向到其他位置，導致源卷的數據不連續。在集中式存儲情況下，會導致對源卷的讀寫性能降低。

兩種方式的優缺點，及應用場景：

COW最大的問題是對寫性能有影響。第一次修改原卷，需要復制數據，因此需要多一次讀寫的數據塊遷移過程。這個就比較要命，應用需要等待時間比較長。但原卷數據的布局沒有任何改變，因此對讀性能沒有任何影響。

ROW在傳統存儲情況下最大的問題是對讀性能影響比較大。ROW寫的時候性能基本沒有損耗，只是修改指針，實現效率很高。但多次讀寫后，原卷的數據就分散到各個地方，對於連續讀寫的性能不如COW。這種方式比較適合Write-Intensive（寫密集）類型的存儲系統

但是，在分布式存儲的情況下，ROW的連續讀寫的性能會比COW差嗎？就不一定了。正常情況下，讀寫性能的瓶頸一般是在磁盤上。分布式存儲情況下，業務層看到連續存儲，實際上是分布在不同的服務器的不同硬盤中，數據越是分散，系統性能越高。而ROW把原數據打散之后，對性能反而有好處。

因此，整體情況下ROW基本上是對讀寫性能影響較小，因此是業界發展方向。

下圖是幾個廠家的快照實現方式：

存儲快照實現原理

目前分布式存儲比較流行，華為有個FusionStorage數據，說是無限次快照，而且0性能下降，vSAN快照10%~30%的性能下降。從上面的分析來看，就知道兩個場景的實現方法了。

快照另外一個非常重要的特性是快照一致性組（Consistency Group），這個功能就是支持多個LUN或者叫卷volume同時做快照，保證數據的一致性。

如果采用陣列的快照來做數據庫的備份，必須所有的LUN都是一個時間點的才行，這樣數據庫恢復的時候才能起來，否則數據庫必須回滾到某一個一致的時間點，意味數據的丟失。比較完美的做法就是在主機安裝一個快照的agent，最好是多路徑軟件具備這個功能，在高端存儲要做快照的時候，對主機的快照agent說，別動，要照相了。主機agent接受到攝影師的命令后，把ORACEL主機緩存的內容flush一下到陳列來，然后hold住，陣列也盡快把cache的內容 flush到硬盤里，ORACLE用到的所有硬盤一塊喊”茄子“，攝像師一按快門，一幅完美的快照就產生了。

一致性組除了保證照相的時候一致性外，還有恢復的時候要一致性恢復。這塊的實現的重要性就不如照相的時候重要，可以人工選擇同一時間的LUN快照恢復就可以了。最重要的是照相的時候必須要一致，而且這個人工干不了。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 其他：什么是快照？及存儲快照的實現？快照是什么？揭秘存儲快照的實現 Redis快照原理詳解快照技術原理 VMware快照的工作原理快照和備份的區別、快照原理（一）——COW技術 uniapp 調用手機相機拍照實現圖片上傳深度剖析HashMap的數據存儲實現原理（看完必懂篇） HBase底層存儲原理 HashMap的存儲結構及原理