mongoDB 刪除集合后,空間不釋放


 mongoDB 刪除集合后,空間不釋放,添加新集合,沒有重新利用之前刪除集合所空出來的空間,也就是數據庫大小只增不減。

方法有:

1、導出導入 dump & restore

2、修復數據庫 repair database

3、復制數據庫 db.copyDatabase(“from”,”to”,”127.0.0.1:27017”);

4、重新同步復制集

 

方法一:導出導入 dump & restore

所需時間根據數據庫實際大小而定,如果數據量不大,dump不需要太長時間的情況下,或者經常備份有dump文件的情況下,這種方法很簡單。

備份

#Mongodump –h IPAddress --port 27017 –d DatabaseName –u UserName –p Password –authenticationDatabase admin –o backup_dir

恢復

#Mongorestore –h IPAddress --port 27017 –d DatabaseName –u UserName –p Password –authenticationDatabase admin backup_dir

 

方法二:修復數據庫 repair database

  需要停機,即便你不停機的話 mongodb 自己也會鎖住直到 repair 完成。注意要有足夠的磁盤空間,需要額外一倍的空間,如果mongodb 占用了100G,那么 repair 時還需要額外的100G+2G 空間。可以追加磁盤,然后將目標目錄指向新加的磁盤。

我理解到官網的意思是,在確認修復過程不中斷並且有足夠的空閑空間的前提下,那么這個repair database方法是回收磁盤空間唯一合適的方法(注意前提啊)。

 # mongod --dbpath /data/db --repair --repairpath /data/db0

    如果當前磁盤足夠的話可直接在 mongo 命令行中運行:

    >  db.repairDatabase()

     或者

     > db.runCommand({ repairDatabase: 1 })

第二種方法可以帶其他幾個參數

{ repairDatabase: 1,

preserveClonedFilesOnFailure: <boolean>,

backupOriginalFiles: <boolean> }

只要磁盤空間夠基本上沒什么問題。

       這種方法有兩個不好的地方。1.在生產上操作如果意外停止可能會造成數據無法恢復的危險。2.如果磁盤空間不足,小於現在這個db時間占有的空間,這種情況是用不了    db.repairDatabase()的。

 

方法三:復制數據庫 db.copydatabase

1.db.copyDatabase("from","to","127.0.0.1:27017");復制出一個新的to數據庫。這個已經是最小數據占用的數據。會在數據目錄下產生to的相關數據文件。127.0.0.1:27017是from的數據庫所在的地址和端口號。

2.將所有程序的配置從from庫改為to庫。

3刪除from庫。

>use from

> db.dropDatabase()

這個方法的好處是可以時間將磁盤上的數據刪除掉。節省出很大的空間。

方法四:重新同步復制集

  還沒整理好,后續再補充。

 

 

MongoDB不會自動進行垃圾文件清理,不過我們可以借助自帶的repairDatabase等功能來實現,下面我們就來詳解清除MongoDB所占用的多余的磁盤空間的方法,附帶一個如何格式化mongo shell的輸出的小技巧:

首先一點就是mongodb 不會釋放已經占用的硬盤空間,即使drop collection也不行,除非drop database。如果一個db曾經有大量的數據一段時間后又刪除的話,硬盤空間就是一個問題,如何收回被mongdodb占用的多余空間?方法有兩種
1. dump & restore

?

1

2

3

mongodump -d databasename -o /path/to/dump_dir

echo 'db.dropDatabase()' | mongo <databasename>

mongorestore -d <databasename> /path/to/dump_dir

如果數據量不大,dump不需要太長時間的情況下,或者經常備份有dump文件的情況下,這種方法很簡單。

2. repair database
即在mongo shell中運行

?

1

db.repairDatabase()

, 或者

?

1

db.runCommand({ repairDatabase: 1 })

, 第二種方法可以帶其他幾個參數

?

1

2

3

{ repairDatabase: 1,

 preserveClonedFilesOnFailure: <boolean>,

 backupOriginalFiles: <boolean> }

repairDatabase是官方文檔中認為唯一可以回收硬盤空間的方法。
repairDatabase is the appropriate and the only way to reclaim disk space.
當你有多個shard的且數據量巨大時,dump & restore方法會花費巨大的時間,這時第二種方法的優勢就很明顯,就是分別在每個shard上運行repairDatabase,結果會快很多。

PS:格式化mongo shell的輸出
如果數據量大的情況下,mongo shell 默認的輸出很亂,幾乎沒法閱讀。我們可以用.pretty() 來解決這樣的問題:

?

1

db.collection.find().pretty()

這樣的輸出會漂亮很多,每個field一行,

?

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

{

 "_id" : ObjectId("5396cd3823e97923ba689ef3"),

 "batch" : 66,

 "category" : 4,

 "cover_imgs" : [

 "/post_imgs/5396cd3823e97923ba689ef3/c_2.jpg",

 "/post_imgs/5396cd3823e97923ba689ef3/c_3.jpg",

 "/post_imgs/5396cd3823e97923ba689ef3/c_4.jpg"

 ],

 "created_at" : ISODate("2014-06-10T09:18:06.383Z"),

 "fav_count" : 0,

 "host_reply_count" : 338,

 "last_reply_date" : "2014-06-17 21:22:00",

 "post_date" : "2014-06-06 19:57:00",

 "referer" : "http://tieba.baidu.com/f?kw=%B9%C5%D7%B0%B5%E7%CA%D3%BE%E7",

 "reply_count" : 716,

 "reuse_type" : 2,

 "section" : "古裝電視劇",

 "seq" : 27180,

 "serial" : false,

 "sort_index" : 0.997,

 "source_site" : "貼吧",

 "updated_at" : ISODate("2014-06-18T09:04:55.228Z"),

 "visible" : true

}

{

 "_id" : ObjectId("5396c7ca23e97921fb7de8e4"),

 "batch" : 74,

 "category" : 4,

}

配置使其成為Default:
添加如下配置到$HOME/.mongorc.js, 如果不存在則創建。

?

1

DBQuery.prototype._prettyShell = true

這樣就不需要每次使用pretty()方法了,直接db.collection.find()即可。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM