大數據中間件MongoDB

本文轉載自查看原文 2022-05-25 22:16 685 分布式中間件/ .NET

1.前言

相信說起MongoDB很多人都知道是NoSql，非關系型之類的，但是需要注意

1.和傳統關系型數據庫Sqlserver、Mysql、Oracle相比，MongoDB身為非關系型數據庫，在數據存儲結構和數據查詢以及數據海量存儲上,擁有絕對的優勢，並且可以說它與關系型數據庫是互為優缺點，互補的關系，所以不要主觀的去給它們定義`誰更好一些"，在實際中可以將模式固定的結構化數據存儲在RDS，靈活的業務存儲在MongoDB中

2.雖然Redis也是非關系型數據庫，但它和MongoDB沒有可比性，因為Redis是操作內存，關注的是性能，多用於緩存和系統緩沖場景，而MongoDB則是文檔型數據庫，基於存儲結構的靈活，適用於存儲一些非標准且數據結構不固定的數據，所以不要去問MongoDB可不可以用來做緩存，選擇正確的方式做正確的事，才是最佳實踐，因為業務場景決定技術點。

2.MongoDB基本操作及安裝

1.MongoDB的安裝參考這里，有專門記錄Linux安裝步驟，至於windows下的太簡單，就不做記錄了

2.一些常用基本的命令，更多的就不介紹了，這些可以在官方手冊中查詢學習

1.`數據庫操作`

//查看已有數據庫
show dbs

//1.使用數據庫
//2.查看集合
use UserDB
show collecitons

//1.刪除數據庫
//2.修復數據庫
//3.從127.0.0.1克隆一份數據庫
db.dropDatabase();
db.repairDatabase();
db.cloneDatabase("127.0.0.1");

//1.獲取數據庫狀態，可以查看集合等信息
//2.獲取當前數據庫名字
//3.客戶端連接服務端的信息
//4.查看當前服務版本
db.stats();
db.getName();
db.getMongo();
db.version();

集合操作

//1.創建一個用戶集合,最大存放1000個文檔，達到容量自動刪除舊數據
//2.查看用戶表狀態
db.createCollection("User",{"size":1024,capped:true,max:1000});
db.User.stats();

//1.查詢所有用戶數據
//2.查詢指令列
db.User.find();
db.User.find({}, {name: 1, Code: 1});

//1.查詢用戶集合id大於5的數據
//2.查詢用戶集合id小於5的數據
//3.查詢用戶集合id大於3並且小9的數據
db.User.find({id: {$gt: 5}});
db.User.find({id: {$lt: 5}});
db.User.find({id: {$gte: 3, $lte: 9}});

//1.新增一條用戶數據
//2.修改一條用戶數據
//3.刪除一條用戶數據
db.User.save({name: '特朗普', id: 1, sex: unknow,age:8});
db.User.update({age: 9}, {$set: {name: '特朗普'}}, false, true);
db.User.remove({id: 1});

MongoDBHelper

1.首先需要通過Nuget或者手動下載Mongodb在C#中的驅動MongoDB.Bson、MongoDB.Driver、MongoDB.Driver.Builders

2.實現簡單的增刪改查,在此僅供參考，沒有很完善所以再拷貝去用的時候需要注意

 internal class MongoHelper
 {
     private readonly MongoDatabase _db = null;

     public MongoHelper()
     {
         var clientServer = new MongoClient("mongodb://127.0.0.1:27017").GetServer();
         this._db = clientServer.GetDatabase("UserDB");
     }

     public bool Insert<T>(T entity)
     {
         BsonDocument doc = entity.ToBsonDocument();
         WriteConcernResult result = this._db.GetCollection(typeof(T).Name).Insert(entity);
         return result.Ok;
     }

     public bool DelEntity<T>(string whereField, string whereValue)
     {
         var query = Query.EQ(whereField, whereValue);
         WriteConcernResult result = this._db.GetCollection(typeof(T).Name).Remove(query);
         return result.Ok;
     }

     public bool UpdateEntity<T>(string whereField, string whereValue, string updateField, string updateValue)
     {
         var query = Query.EQ(whereField, whereValue);
         var update = Update.Set(updateField, updateValue);
         WriteConcernResult result = this._db.GetCollection(typeof(T).Name).Update(query, update);
         return result.Ok;
     }

     public T FindOne<T>(string Field, string Value)
     {
         T oneEntity = default(T);
         FindOneArgs args = new FindOneArgs { Query = Query.EQ(Field, Value) };
         oneEntity = this._db.GetCollection(typeof(T).Name).FindOneAs<T>(args);
         return oneEntity;
     }
 }

2.MongoDB適用場景

其實對於已經了解過基本概念的來說，我們更想知道什么時候使用它，怎么發揮他的特點，既然前面說到，他和關系傳統數據庫是互補的，並且擁有存儲不規則數據的絕對優勢，那么我們可以擴展出對業務數據的解耦，例如存儲需要查詢不同系統的高並發數據，將他們組合起來存儲在MongoDB，避免使用時跨庫跨服務查詢以節約性能，具體如下

1.在我們的員工管理系統中，我們有3個不同的微服務，考勤、申請、以及用戶服務，員工的考勤信息與申請服務掛鈎，實際情況下一個微服務對應的數據表很多個，每天需要統計考勤信息，那么就需要調用3個不同的服務以及多個庫表之間的連接，用於組合出需要的數據，此時我們可以利用，數據異構工具，例如DataX、Canal、Kettle等，在后台將數據組合存儲到MondoDB，方便查詢，以緩解防止集中訪問時對服務器的壓力

2.用戶系統中線上運行的服務會產生大量的運行及訪問日志，日志里會包含一些錯誤、警告、及用戶行為等信息，通常服務會以文本的形式記錄日志信息，這樣可讀性強，方便於日常定位問題，但當產生大量的日志之后，要想從大量日志里挖掘出有價值的內容，則需要對數據進行進一步的存儲和分析。

3.項目初期數據庫結構不穩定的情況下，這時不確定哪些表會有改變，可以使用Mongodb，例如一個表存儲系統不同類型的數據，某一天需求變更需要為某一個類型增加字段，對於動態存儲，這時使用Mongodb就體現了優勢所在

3.MongoDB架構設計

MongoDB分為3個大的核心模塊，分別為MongoDB query Language、MongoDB Data Model、查詢引擎，首先將客戶端請求通過MongoDB query Language轉換為MongoDB可識別的語句命令，再通過MongoDB Data Model轉換為Bson文檔，最終交給存儲引擎將數據存儲或讀取。

1.Wiredtiger引擎寫入原理

當數據給到MongoDB 引擎后，首先寫入內部緩存，然后將緩存數據同步磁盤，為防止在緩存寫入磁盤數據丟失，MongoDB 采用雙寫的策略，在寫入緩存的同時，利用journaling buffer來存儲數據的日志信息到journal文件中

1.journaling buffer是用於存放 mongodb 增刪改指令的緩沖區

2.journal文件類似於關系數據庫中的事務日志

2.索引與查詢

1.單個索引每個索引對應文檔中的單個值，默認索引在id上

2.復合索引可以在查詢中使用多個索引，查詢數據，如果經常查詢多個字段，我們可以使用建立復合索引來提升性能，但是需要注意復合索引的順序非常重要，大范圍在前小范圍在后

3.如果索引太多，插入更新數據會導致索引的重排，所以可以根據自身系統監控查詢的字段，將查詢較多的設為索引鍵

4.索引在內存中大概占據4kb的大小，並且是非聚集的

4.MongoDB復制集

在上面介紹中，我們使用的是一台服務器，一個mongod服務進程.如果單純的做學習和開發是完全可以承載的，但是在生產環境中，風險會增高，如果服務器宕機或者故障導致數據庫有一段時間不可訪問，而使用mongodb的復制功能來將數據副本保存在多台服務器上，即使一台服務器出錯，也可以保證程序正常運行和數據安全，在實際落地中實現MongoDB高可用方案主從復制建議最少3個節點，一個主節點用於讀寫，2個從節點用於同步主節點數據在主節點故障時保證可以提供服務。

1.集群搭建

1.在MongoDB中創建多個配置文件,數據和日志需要創建實例自己獨立的文件夾，端口需要設置為不同，或者拷貝3個mongodb文件作為獨立文件，然后獨立啟動

#復制三份配置文件
# Where and how to store data.
storage:
  dbPath: /usr/local/mongodb/mongoserver/data/27017data #數據文件存放目錄
  journal:
    enabled: true

systemLog:
  destination: file
  logAppend: true
  path:  /usr/local/mongodb/mongoserver/log/mongodb27017.log

# network interfaces
net:
  port: 27017 #27018  #27019
  bindIp: 127.0.0.1

replication: 
   replSetName: rs0  #復制集名稱，多個配置寫一樣的

2.根據配置啟動不同端口的3個不同實例

./mongod -f mongo27017.conf
./mongod -f mongo27018.conf
./mongod -f mongo27019.conf

3.使用客戶端連接,然后使用rs.initiate()集群初始化

//局域網連接需要將ip設置為0.0.0.0
mongodb.exe --host 192.168.0.106 --port 27018

rs.initiate()

4.查看集群狀態rs.status(),然后使用rs.add("192.168.0.106:27019")向集群中添加另外2個節點

5.然后客戶端連接集群

 //連接字符串
 mongodb://192.168.0.106:27018,192.168.0.106:27019,192.168.0.106:27020/?readPreference=primary&ssl=false

 var clientServer = new MongoClient("mongodb://192.168.0.106:27018,192.168.0.106:27019,192.168.0.106:27020").GetServer();

2.選舉機制

1.現在有27018、27019、27020 一主2從，那么當27018主節點宕機后，在各個節點有心跳檢測機制,如果在一定時間內，沒有回復，那么從節點就會觸發選舉機制選出新的主節點

1.從節點首先會各自投票vote自己為主節點
2.然后向其他節點拉票，如果節點給自己投了，就不能給別人投，選舉規則過半數則為主節點，集群節點為奇數節點，偶數節點會產生腦裂，形成多個主節點
3.當主節點連接后，自動變為從節點

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 最全Java架構師130面試題：微服務、高並發、大數據、緩存等中間件簡單介紹下Redis消息隊列，實際生產環境中，大數據高並發時，不建議使用Redis做消息隊列中間件數據庫中間件增量數據同步中間件 Alibaba Canal 數據同步中間件數據庫中間件什么是中間件？常見中間件有哪些？中間件專題(RabbitMQ+Kafka+MongoDB) python淺學【網絡服務中間件】之MongoDB 消息中間件