MySql輕松入門系列——第一站從源碼角度輕松認識mysql整體框架圖

本文轉載自查看原文 2020-06-02 08:22 3795 mysql

一：背景

1. 講故事

最近看各大技術社區，不管是知乎，掘金，博客園，csdn基本上看不到有小伙伴分享sqlserver類的文章，看來在國內大環境下是不怎么流行了，看樣子我再寫sqlserver是不可能再寫了，這輩子都不會寫了，只能靠技術輸出mysql維持生活這樣子。

二：了解架構圖

mysql最大的好處就是開源，手握百萬源碼，有什么問題搞不定呢？這一點要比sqlserver爽多了，不用再dbcc搗來搗去。

1. 從架構圖入手

大家都知道做/裝修房子都要有一張圖紙，其實軟件也是一樣，只要有了這么一張圖紙，大方向就定下來了，再深入到細節也不會亂了方向，然后給大家看一下我自己畫的架構圖，畫的不對請輕拍。

其實SqlServer，Oracle，MySql架構都大同小異，MySql的鮮明特點就是存儲引擎做成了插拔式，這就牛逼了，現行最常用的是InnoDB，這就讓我有了一個想法，有一套業務准備用 InMemory 模式跑一下，厲害了~~~

2. 功能點介紹

MySql其實就兩大塊，一塊是MySql Server層，一塊就是Storage Engines層。

<1> Client

不同語言的sdk遵守mysql協議就可以與mysqld進行互通。

<2> Connection/Thread Pool

MySql使用C++編寫，Connection是非常寶貴的，在初始化的時候維護一個池。

<3> SqlInterface,Parse,Optimizer,Cache

對sql處理，解析，優化，緩存等處理和過濾模塊，了解了解即可。

<4> Storage Engines

負責存儲的模塊，官方，第三方，甚至是你自己都可以自定義實現這個數據存儲，這就把生態做起來了，🐮👃。

三：源碼分析

關於怎么去下載mysql源碼，這里就不說了，大家自己去官網搗鼓搗鼓哈，本系列使用經典的 mysql 5.7.14版本。

1. 了解mysql是如何啟動監聽的

手握百萬行源碼，怎么找入口函數呢？？？ 😁😁😁，其實很簡單，在mysqld進程上生成一個dump文件，然后看它的托管堆不就好啦。。。

從圖中可以看到，入口函數就是 mysqld!mysqld_main+0x227 中的 mysqld_main, 接下來就可以在源碼中全文檢索下。

<1> mysqld_main 入口函數 => sql/main.cc


extern int mysqld_main(int argc, char **argv);

int main(int argc, char **argv)
{
  return mysqld_main(argc, argv);
}

這里大家可以用visualstudio打開C++源碼，使用查看定義功能，非常好用。

<2> 創建監聽


int mysqld_main(int argc, char **argv)
{
    //創建服務監聽線程
    handle_connections_sockets();
}

void handle_connections_sockets()
{
     //監聽連接
     new_sock= mysql_socket_accept(key_socket_client_connection, sock,
                                    (struct sockaddr *)(&cAddr), &length);

    if (mysql_socket_getfd(sock) == mysql_socket_getfd(unix_sock))
      thd->security_ctx->set_host((char*) my_localhost);

    //創建連接
    create_new_thread(thd);
}

//創建新線程處理處理用戶連接
static void create_new_thread(THD *thd){
   
   thd->thread_id= thd->variables.pseudo_thread_id= thread_id++;
   
   //線程進了線程調度器
   MYSQL_CALLBACK(thread_scheduler, add_connection, (thd));   
}

至此mysql就開啟了一個線程對 3306 端口進行監控，等待客戶端請求觸發 add_connection 回調。

2. 理解mysql是如何處理sql請求

這里我以Insert操作為例稍微解剖下處理流程：

當用戶有請求sql過來之后，就會觸發 thread_scheduler的回調函數add_connection。


static scheduler_functions one_thread_per_connection_scheduler_functions=
{
  0,                                     // max_threads
  NULL,                                  // init
  init_new_connection_handler_thread,    // init_new_connection_thread
  create_thread_to_handle_connection,    // add_connection
  NULL,                                  // thd_wait_begin
  NULL,                                  // thd_wait_end
  NULL,                                  // post_kill_notification
  one_thread_per_connection_end,         // end_thread
  NULL,                                  // end
};

從 scheduler_functions 中可以看到，add_connection 對應了 create_thread_to_handle_connection，也就是請求來了會觸發這個函數，從名字也可以看出，用一個線程處理一個用戶連接。

<1> 客戶端請求被 create_thread_to_handle_connection 接管及調用棧追蹤


void create_thread_to_handle_connection(THD *thd)
{
     if ((error= mysql_thread_create(key_thread_one_connection, &thd->real_id, &connection_attrib,
                                     handle_one_connection,(void*) thd))){}
}
//觸發回調函數  handle_one_connection
pthread_handler_t handle_one_connection(void *arg)
{
     do_handle_one_connection(thd);
}
//繼續處理
void do_handle_one_connection(THD *thd_arg){
    while (thd_is_connection_alive(thd))
    {
      mysql_audit_release(thd);
      if (do_command(thd))  break;  //這里的 do_command 繼續處理
    }
}
//繼續分發
bool do_command(THD *thd)
{
    return_value= dispatch_command(command, thd, packet+1, (uint) (packet_length-1));
}
bool dispatch_command(enum enum_server_command command, THD *thd, char* packet, uint packet_length)
{
      switch (command) {
         case COM_INIT_DB: ....  break;
         ...
         case COM_QUERY:   //查詢語句：  insert xxxx
             mysql_parse(thd, thd->query(), thd->query_length(), &parser_state);  //sql解析
           break;
      }
}
//sql解析模塊
void mysql_parse(THD *thd, char *rawbuf, uint length, Parser_state *parser_state)
{
      error= mysql_execute_command(thd);
}

<2> 到這里它的Parse，Optimizer，Cache都追完了，接下來看sql的CURD類型，繼續追。。。


//繼續執行
int mysql_execute_command(THD *thd)
{
  switch (lex->sql_command) 
  {
      case SQLCOM_SELECT:  res= execute_sqlcom_select(thd, all_tables);  break;

      //這個 insert 就是我要追的
      case SQLCOM_INSERT:   res= mysql_insert(thd, all_tables, lex->field_list, lex->many_values,
		                                      lex->update_list, lex->value_list,
                                              lex->duplicates, lex->ignore);
  }
}
//insert插入操作處理
bool mysql_insert(THD *thd,TABLE_LIST *table_list,List<Item> &fields, List<List_item> &values_list,
                  List<Item> &update_fields, List<Item> &update_values, 
                  enum_duplicates duplic, bool ignore)
{
      while ((values= its++))
      {
           error= write_record(thd, table, &info, &update);
      }
}
//寫入記錄
int write_record(THD *thd, TABLE *table, COPY_INFO *info, COPY_INFO *update)
{
    if (duplicate_handling == DUP_REPLACE || duplicate_handling == DUP_UPDATE)
    {
         // ha_write_row  重點是這個函數
         while ((error=table->file->ha_write_row(table->record[0])))
         {
             ....
         }
    }
}

可以看到，調用鏈還是挺深的，追到 ha_write_row 方法基本上算是追到頭了，再往下的話就是 MySql Server 給 Storage Engine提供的接口實現了，不信的話繼續看唄。。。

<3> 繼續挖 ha_write_row


int handler::ha_write_row(uchar *buf)
{
    MYSQL_TABLE_IO_WAIT(m_psi, PSI_TABLE_WRITE_ROW, MAX_KEY, 0,{ error= write_row(buf); })
}

//這是一個虛方法
virtual int write_row(uchar *buf __attribute__((unused)))
{
    return HA_ERR_WRONG_COMMAND;
}

看到沒有，write_row是個虛方法，也就是給底層方法實現的，在這里就是給各大Storage Engines的哈。😁😁😁

3. 調用鏈圖

這么多方法，看起來有點懵懵的吧，我來畫一張圖，幫助大家理解下這個調用堆棧。

三：總結

大家一定要熟讀架構圖，有了架構圖從源碼中找信息就方便多了，總之學習mysql成就感還是滿滿的😁。

如您有更多問題與我互動，掃描下方進來吧~

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 MySql輕松入門系列——第二站使用visual studio 對mysql進行源碼級調試 Javascript之旅——第一站：從變量說起 2015生命之旅---第一站重慶第一站：CLion安裝教程與環境配置 CSS之旅——第一站為什么要用CSS asp.net mvc 之旅—— 第一站從簡單的razor入手 Sql Server之旅——第一站那些給我們帶來福利的系統視圖 MySQL 8.0系列——輕松改配置，雲上友好 Linux下的.NET之旅：第一站，CentOS+Mono+Xsp構建最簡單的ASP.NET服務器 Matplotlib——第一章輕松畫個圖