快速掌握mongoDB(三)——mongoDB的索引詳解


1 mongoDB索引的管理

  本節介紹mongoDB中的索引,熟悉mysql/sqlserver等關系型數據庫的小伙伴應該都知道索引對優化數據查詢的重要性。我們先簡單了解一下索引:索引的本質就是一個排序的列表,在這個列表中存儲着索引的值和包含這個值的數據(數據row或者document)的物理地址,索引可以大大加快查詢的速度,這是因為使用索引后可以不再掃描全表來定位某行的數據,而是先通過索引表找到該行數據對應的物理地址(多數為B-tree查找),然后通過地址來訪問相應的數據。
  索引可以加快數據檢索、排序、分組的速度,減少磁盤I/O,但是索引也不是越多越好,因為索引本身也是數據表,需要占用存儲空間,同時索引需要數據庫進行維護,當我們對索引列的值進行增改刪操作時,數據庫需要更新索引表,這會增加數據庫的壓力。
我們要根據實際情況來判斷哪些列適合添加索引,哪些列不適合添加索引,一般遵循的規律如下:
  主/外鍵列,主鍵用於強制該列的唯一性和組織表中數據的排列結構;外鍵可以加快連接的速度;
  經常用於比較的類(大於小於等於等),因為索引已經排序,值就是大於/小於的分界點;
  經常進行范圍搜索,因為索引已經排序,其指定的范圍是連續的;
  經常進行排序的列,因為索引已經排序,這樣查詢可以利用索引的排序,加快排序查詢時間;
  經常進行分組的列,因為索引已經排序,同一個值的所有數據地址會聚集在一塊,很方便分組。
我們看一下mongoDB的索引使用,首先准備數據:
db.userinfos.insertMany([
   {_id:1, name: "張三", age: 23,level:10, ename: { firstname: "san", lastname: "zhang"}, roles: ["vip","gen" ]},
   {_id:2, name: "李四", age: 24,level:20, ename: { firstname: "si", lastname: "li"}, roles:[ "vip" ]},
   {_id:3, name: "王五", age: 25,level:30, ename: { firstname: "wu", lastname: "wang"}, roles: ["gen","vip" ]},
   {_id:4, name: "趙六", age: 26,level:40, ename: { firstname: "liu", lastname: "zhao"}, roles: ["gen"] },
   {_id:5, name: "田七", age: 27, ename: { firstname: "qi", lastname: "tian"}, address:'北京' },
   {_id:6, name: "周八", age: 28,roles:["gen"], address:'上海' }
]);  

  索引的增刪改查還是十分簡單的,我們看一下索引管理的幾個方法:

//創建索引,值1表示正序排序,-1表示倒序排序
  db.userinfos.createIndex({age:-1})

//查看userinfos中的所有索引
  db.userinfos.getIndexes()

//刪除特定一個索引
  db.userinfos.dropIndex({name:1,age:-1})
//刪除所有的索引(主鍵索引_id不會被刪除)
  db.userinfos.dropIndexes()

//如果我們要修改一個索引的話,可以先刪除索引然后在重新添加。 

2 mongoDB中常用的索引類型

1 單鍵索引

  單鍵索引(Single Field Indexes)顧名思義就是單個字段作為索引列,mongoDB的所有collection默認都有一個單鍵索引_id,我們也可以對一些經常作為過濾條件的字段設置索引,如給age字段添加一個索引,語法十分簡單:

//給age字段添加升序索引
  db.userinfos.createIndex({age:1})

  其中{age:1}中的1表示升序,如果想設置倒序索引的話使用 db.userinfos.createIndex({age:-1}) 即可。我們通過explain()方法查看查詢計划,如下圖,看到查詢age=23的document時使用了索引,如果沒有使用索引的話stage=COLLSCAN。

  因為document的存儲是bson格式的,我們也可以給內置對象的字段添加索引,或者將整個內置對象作為一個索引,語法如下:

//1.內嵌對象的某一字段作為索引 //在ename.firstname字段上添加索引
  db.userinfos.createIndex({"ename.firstname":1})
//使用ename.firstname字段的索引查詢
  db.userinfos.find({"ename.firstname":"san"})

//2.整個內嵌對象作為索引 //給整個ename字段添加索引
  db.userinfos.dropIndexes()
//使用ename字段的索引查詢
  db.userinfos.createIndex({"ename":1})

2 復合索引

  復合索引(Compound Indexes)指一個索引包含多個字段,用法和單鍵索引基本一致。使用復合索引時要注意字段的順序,如下添加一個name和age的復合索引,name正序,age倒序,document首先按照name正序排序,然后name相同的document按age進行倒序排序。mongoDB中一個復合索引最多可以包含32個字段。

//添加復合索引,name正序,age倒序
    db.userinfos.createIndex({"name":1,"age":-1}) 
//過濾條件為name,或包含name的查詢會使用索引(索引的第一個字段)
    db.userinfos.find({name:'張三'}).explain()
    db.userinfos.find({name:"張三",level:10}).explain()
    db.userinfos.find({name:"張三",age:23}).explain()

//查詢條件為age時,不會使用上邊創建的索引,而是使用的全表掃描
db.userinfos.find({age:23}).explain()

  執行查詢時查詢計划如下:

3 多鍵索引

  多鍵索引(mutiKey Indexes)是建在數組上的索引,在mongoDB的document中,有些字段的值為數組,多鍵索引就是為了提高查詢這些數組的效率。看一個栗子:准備測試數據,classes集合中添加兩個班級,每個班級都有一個students數組,如下:

  db.classes.insertMany([
     {
         "classname":"class1",
         "students":[{name:'jack',age:20},
                    {name:'tom',age:22},
                    {name:'lilei',age:25}]
      },
      {
         "classname":"class2",
         "students":[{name:'lucy',age:20},
                    {name:'jim',age:23},
                    {name:'jarry',age:26}]
      }]
  )

  為了提高查詢students的效率,我們使用  db.classes.createIndex({'students.age':1}) 給students的age字段添加索引,然后使用索引,如下圖:

 4 哈希索引

  哈希索引(hashed Indexes)就是將field的值進行hash計算后作為索引,其強大之處在於實現O(1)查找,當然用哈希索引最主要的功能也就是實現定值查找,對於經常需要排序或查詢范圍查詢的集合不要使用哈希索引。

3 mongoDB中常用的索引屬性

1  唯一索引

  唯一索引(unique indexes)用於為collection添加唯一約束,即強制要求collection中的索引字段沒有重復值。添加唯一索引的語法:

//在userinfos的name字段添加唯一索引
db.userinfos.createIndex({name:1},{unique:true})

  看一個使用唯一索引的栗子:

2  局部索引

  局部索引(Partial Indexes)顧名思義,只對collection的一部分添加索引。創建索引的時候,根據過濾條件判斷是否對document添加索引,對於沒有添加索引的文檔查找時采用的全表掃描,對添加了索引的文檔查找時使用索引。使用方法也比較簡單:

//userinfos集合中age>25的部分添加age字段索引
    db.userinfos.createIndex(
        {age:1},
        { partialFilterExpression: {age:{$gt: 25 }}}
    )
//查詢age<25的document時,因為age<25的部分沒有索引,會全表掃描查找(stage:COLLSCAN)
    db.userinfos.find({age:23})
//查詢age>25的document時,因為age>25的部分創建了索引,會使用索引進行查找(stage:IXSCAN)
    db.userinfos.find({age:26})

  當查詢age=23的記錄時,stage=COLLSCAN,當查詢age=26的記錄時,使用了索引,如下:

2 稀疏索引

  稀疏索引(sparse indexes)在有索引字段的document上添加索引,如在address字段上添加稀疏索引時,只有document有address字段時才會添加索引。而普通索引則是為所有的document添加索引,使用普通索引時如果document沒有索引字段的話,設置索引字段的值為null。

  稀疏索引的創建方式如下,當document包含address字段時才會創建索引:

//創建在address上創建稀疏索引
  db.userinfos.createIndex({address:1},{sparse:true})

  看一個使用稀疏索引的栗子:

4 TTL索引

  TTL索引(TTL indexes)是一種特殊的單鍵索引,用於設置document的過期時間,mongoDB會在document過期后將其刪除,TTL非常容易實現類似緩存過期策略的功能。我們看一個使用TTL索引的栗子:

 //添加測試數據
db.logs.insertMany([
       {_id:1,createtime:new Date(),msg:"log1"},
       {_id:2,createtime:new Date(),msg:"log2"},
       {_id:3,createtime:new Date(),msg:"log3"},
       {_id:4,createtime:new Date(),msg:"log4"}
       ])
       //在createtime字段添加TTL索引,過期時間是120s
       db.logs.createIndex({createtime:1}, { expireAfterSeconds: 120 })


//logs中的document在創建后的120s后過期,會被mongoDB自動刪除

  注意:TTL索引只能設置在date類型字段(或者包含date類型的數組)上,過期時間為字段值+exprireAfterSeconds;document過期時不一定就會被立即刪除,因為mongoDB執行刪除任務的時間間隔是60s;capped Collection不能設置TTL索引,因為mongoDB不能主動刪除capped Collection中的document。

小結

  本節介紹了mongoDB中常用的索引和索引屬性,索引對提升數據檢索的速度十分重要,在數據量比較大的時候一般都要在collection上建立索引。mongoDB提供的索引種類很豐富,總會有幾種適用於我們的業務,除了上邊介紹的索引外,mongoDB還支持text index和一些地理位置相關的索引,這里不再介紹,有興趣的小伙伴可以到官網 研究下。如果文中有錯誤的話,希望大家可以指出,我會及時修改,謝謝。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM