MongoDB 常用的數據備份梳理匯總


1.基於數據文件的備份

直接將原始的數據文件Copy至備份的地方,這個方法的優點是比較快,因為備份和恢復都不需要轉換數據格式。缺點就是需要鎖住數據庫服務器,但是此方案通常備份是在從節點上進行,備份過程不影響應用的正常運行。

如果不鎖住數據,經常會導致復制文件中斷,另外就是保證數據文件的一致性狀態。

主要命令:

加鎖的命令--db.fsyncLock()

注意:鎖之后的任何嘗試寫入都會被阻止,而且讀操作也會被阻止。新的連接嘗試也會被阻止。

解鎖的命令--db.fsyncUnlock()

注意:這僅僅是個解鎖請求,數據庫可能無法正確解鎖。運行db.currentOp方法可以驗證數據庫是否還處於鎖狀態。

2.mongodump

mongodump導出的是bson格式,是二進制形式。此工具對於恢復整個實例、單個數據庫、指定集合都十分有用。他們可以用於備份實時運行的數據庫(無需鎖住或者關閉數據庫)。

mongorestore用於讀取恢復這些文件。

部分主要命令參數 如下:

 -h [ --host ]   --數據庫所在主機IP地址;

–port           --mongodb使用的端口號;

-u [ --username ]--登陸用戶名;

-p [ --password ] --用戶的登陸密碼;

-d [ --db ]  --准備備份的數據庫;

-c [ --collection ] --准備備份的集合;

-o [ --out ] --導出數據將要保存在的目錄;

-q [ --query ] --指定備份的查詢條件;

–oplog --快照式備份,保證數據的時間一致性和完整性;

--authenticationDatabase --用戶的登錄驗證數據庫

--gzip --備份文件壓縮

例子:

將端口為37017的MongoDB數據備份到 /opt/backup/mongodump-2011-10-24 路徑下,登入驗證需輸入密碼。

mongodump --host mongodb1.example.net --port 37017 --username user --password "pass" --out /opt/backup/mongodump-2011-10-24

 

3.mongoexport 

mongoexport命令行用於數據的導出,默認導出的文件格式為JSON格式,還支持csv格式。

部分主要命令參數 如下:

-h,--host :代表遠程連接的數據庫地址,默認連接本地Mongo數據庫;

--port:代表遠程連接的數據庫的端口,默認連接的遠程端口27017;

-u,--username:代表連接遠程數據庫的賬號,如果設置數據庫的認證,需要指定用戶賬號;

-p,--password:代表連接數據庫的賬號對應的密碼;

-d,--db:代表連接的數據庫;

-c,--collection:代表連接數據庫中的集合;

-f, --fields:代表集合中的字段,可以根據設置選擇導出的字段;

--type:代表導出輸出的文件類型,包括csv和json文件;

-o, --out:代表導出的文件名;

-q, --query:代表查詢條件;

 

與mongodump相比,從功能上來講,mongoexport可以細化到集合中的字段,可以根據需要只導出指定的字段。從文件格式上來看,不再是Bson格式的文件,而是直接可讀的Json或CSV文件,容易被第三方程序讀取利用。缺點就是備份性能減低了。

 

在開發的數據變更需求中,有時候 考慮到 數據的重要性和可溯性,部分需求會要求我們將數據臨時備份到一個集合中,便於回滾和查詢比較。這時候登錄到服務器上,根據條件執行mongoexport 導出和 mongoimport 再次導入, 雖然可以實現備份的需求,但這有一個前提要求,就是有服務器登入和執行的權限,且過程還相對繁瑣。如果MongodB部署在雲上,上面mongoexport的備份方案就歇菜了,我們不能登入雲庫的物理機。此外,雲上數據庫雖然還可以還原實例,但代價相對較大。 

相信這時候,我們會不由自主的懷念 SQL Server / MySQL 的   insert into XXXX_bak  select * from XXXX。如果 MongoDB也有這種輕量級的備份該多好啊。

其實,在MongoDB的命令中,也有類似功能代碼。在這里我們,我們講解下Cursor游標和聚合框架的$out。

 

4.cursor.forEach()

Cursor,又稱游標。

游標不是查詢結果,可以理解為數據在遍歷過程中的內部指針,其返回的是一個資源,或者說數據讀取接口.客戶端通過對游標進行一些設置就能對查詢結果進行有效地控制,如可以限制查詢得到的結果數量、跳過部分結果、或對結果集按任意鍵進行排序等。

db.collection.find()可以實現根據條件查詢和指定使用投影運算符返回的字段(省略此參數返回匹配文檔中的所有字段)。並返回到匹配文檔的游標,可以隨意修改查詢限制、跳躍、和排序順序的功能。

游標有一個重要的迭代函數---cursor.forEach(回調函數),允許我們自定義回調函數來逐個處理每個單元.

基本語法格式:

db.collection.find().forEach(<function>)

 

例如,我們需要修改集合QQOrder中創建時間為指定時間,狀態為10的訂單,因為訂單數據不能輕易修改,除流程控制外,要求DBA在修改前備份一下。

以下代碼是將符合條件的數據備份至QQOrder_bak集合中。

db.QQOrder.find(
{"Status" : "10",
"Rec_CreateTime" : {$gt:ISODate("2018-11-18T15:37:20.740+08:00"),$lt:ISODate("2018-11-20T15:37:20.740+08:00")}
}
).forEach(
    function(x){
      db.QQOrder_bak.insert(x)
   }
   )

 

5.聚合框架--$out

 我們知道在聚合框架中有一個步驟--$out,可以把管道的結果寫入某個集合中(2.6版新增)。

使用$out操作符,可以自動把聚合管道的輸出結果保存到集合里。如果集合不存在的話,則$out操作符將會創建一個集合,或者如果存在就會完全取代現有的集合。此外,如果創建新的集合失敗的話,MongoDB不會修改之前的集合。

所以,針對上面的需求,使用下面的代碼也可以實現。

(測試過程中,將上一個案例備份集合由QQOrder_bak替換成了QQOrder_bak_2)

db.QQOrder.aggregate([
{$match: {"Status" : "10","Rec_CreateTime" : {$gt:ISODate("2018-11-18T15:37:20.740+08:00"),$lt:ISODate("2018-11-20T15:37:20.740+08:00")}}},
{$out:'QQOrder_bak_2'}
])

需要特別注意的話,QQOrder_bak_2只可以臨時存放數據,如果再次執行新的導出,會將集合中原來的數據覆蓋掉。

 

以上五種備份,可以涵蓋我們日常所有的備份需求了。包含 實例、庫的日常災備,也有業務需求的臨時備份。

 

本文版權歸作者所有,未經作者同意不得轉載,謝謝配合!!!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM