MySql 學習之 一條查詢sql的執行過程


  相信大家都接觸過Mysql數據庫,而且也肯定都會寫sql。我不知道大家有沒有這樣的感受,反正我是有過這樣的想法。就是當我把一條sql語句寫完了,並且執行完得到想要的結果。這時我就在想為什么我寫這樣的一條sql語句,就能給我查詢出我想要的結果,為什么我寫了update就能更新一條語句?它們的執行過程是什么樣的?它們的原理是什么?那么接下來我就來談談這個。

select * from user where id=6

上面這條查詢語句非常簡單,就是查詢一個id為6的用戶信息。那么它的執行流程是怎么樣的?別急,咱們先看一張圖,

根據上面的圖,咱們一步一步來分析。從圖中可以看出整個執行過程大致可以分為兩部分,分別是server層和引擎層。

server層中又分為連接器、分析器、查詢緩存、優化器以及執行器幾部分。

引擎層則是主要負責存儲數據,提供讀寫接口。

那么接下來從頭開始分析。

1、連接器

首先要操作數據庫,那么必須得連接上數據庫,所以這時候就用到了連接器。當你輸入 “mysql -h$ip -P$端口 -u$登錄名 -p ” 時就表示要進行連接數據庫了,然后輸入密碼進行連接。如果密碼或者用戶名錯了,則會報如下錯誤:

ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES)

如果輸入用戶名和密碼正確,那么連接器接下來就去權限表中查詢你登錄用戶所擁有的權限,之后此用戶操作數據的權限判斷邏輯都將依賴查詢到的權限。哪怕你修改了此用戶的權限也還是沒用,必須重新新建連接,修改的權限才會生效。

另外說到這里就順便提一下,客戶端連接mysql服務器時,如果連接一直處於空閑狀態,那么到了一定的時候就會斷開連接,多長時間是由 wait_timeout 控制的,其默認是8個小時。如果超過8個小時,你執行操作數據庫時就回提示 “Lost connection to MySQL server during query”,這時只有重新連接數據庫方能進行操作。

說到連接器,咱們得說一下長連接和短鏈接。長連接就是如果客戶端一直都有請求操作數據庫,那么就會一直使用這個連接進行操作。短鏈接就是每次執行完很少的數據庫操作就斷開連接了,如果再有請求就必須重新連接。

所以這里建議減少數據庫的連接操作,盡量使用長連接。但是長時間使用長連接會導致一個問題,那就是mysql的占用的內存會越來越大,甚至到最后可能會出現OOM情況,導致mysql異常重啟,那么這就尷尬了。

針對上面的情況有兩種解決辦法:

(1)、定期斷開長連接,或者斷開一些查詢占用內存比較大的操作的連接,釋放資源。

(2)、如果是5.7及以上版本,可以使用 mysql_reset_connection 來重置連接,但是需要注意以下幾點

  • 活躍事務會被回滾,自動提交模式也會被重置;
  • 釋放所有表鎖;
  • 關閉&刪除所有臨時表;
  • 會話變量(選項)被重置成和全局變量一致;
  • 用戶級變量丟失;
  • PREPARE語句會被釋放(其相應的HANDLER也會被關閉);
  • LAST_INSERT_ID值重置為0;
  • 利用GET_LOCK獲取的鎖會被釋放。

以上是mysql官微給出的解釋,所以重置連接的時候以上因素,以免對數據庫中的數據產生影響。

 

2、查詢緩存

客戶端連接成功mysql服務器后,執行上面的一條sql時,首先會去緩存中查詢是否有數據,如果有數據,那么直接把數據返回給客戶端,后面的步驟都省略了。它的原理怎樣的呢?請接着往下看,一條查詢sql的首次執行完成后,會把sql語句作為key,把查詢出來的數據作為value放入到緩存中,如果后面再有相同的查詢,那么直接從緩存中取值便可。

看到這里也許你們會想緩存這么好用,那以后要多用緩存。別急,請接着往下看。查詢緩存用起來確實好用,但是它有一個弊端,那就是當這個表做了更新操作時,那么此表的緩存將會全部清空。也許當你辛辛苦苦緩存起來的數據,還沒來得及用時就可能被一條update語句給全部干掉。

所以如果更新比較頻繁的表是不適合使用緩存的,如果是某些配置表倒是比較適合緩存的使用。

在mysql中的查詢語句使不使用緩存時看query_cache_type的值,當為0時關閉緩存,當為1時表示開啟緩存,當為2(DEMAND)時表示只有在sql語句中帶有 SQL_CACHE  關鍵字才會使用緩存,如下sql

select SQL_CACHE * from user where id=6

不過需要注意的一點是 mysql 8.0 版本已經把緩存功能完全移除,所以這一塊需要注意一下。

3、分析器

當執行一條查詢sql時,會優先取查詢緩存,如果緩存中沒有數據,那么便會開始sql的真正的執行流程。首先是分析器,其主要就是對sql語句進行 “詞法分析” 和 “語法分析”。

詞法分析 就是對sql中的單詞進行逐個的分析,比如 從 select 可以識別出要執行查詢操作,user則是識別成表user,id則識別成user表中字段id。

語法分析就是分析整條sql是否符合mysql的語句,比如 你故意把sql中的 where 后面不跟條件,那么語法就肯定會問題,那么此時就會給你提示 “You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near '' at line 1” 。如果給出類似的提示,那么基本就是語法錯了,那就得仔細檢查一下寫的sql語句了。

4、優化器

經過了分析器這一層,那么接下來就要進入優化器了。從分析器中我們已經知道這條sql是要執行更新還是查詢操作。那么優化器便是要對這條sq執行之前l進行優化處理,有哪些優化處理呢?例如 某表有多個索引的時候 決定用哪一個索引;或者多關聯(join)查詢的時候,決定關聯的順序。比如下面一條sql

select * from user u join  score s using(ID)  where u.id=10 and s.scores=60;

上面一條 sql 可以分為兩種情況

  • 既可以先從表user里面取出id=10的記錄的ID值,再根據ID值關聯到表socre,再判斷score表里scores的值是否等於20。
  • 也可以先從表score里面取出scores=20的記錄的ID值,再根據ID值關聯到user,再判斷user表里面id的值是否等於10。

這兩種方案得出的結果是一樣的,但是執行的效率是不一樣的,而優化器作用便是從中選擇一個方案。

5、執行器

當優化器選擇好了方案,那么便進入執行器階段,這時候就要開始執行sql了。執行sql前要查詢一下你對需要操作的表是否有對應的操作權限,如果沒有操作權限,則會給出提示 “ERROR 1142 (42000): SELECT command denied to user 'b'@'localhost' for table 'XXX‘ “ 。

如果有對應表的操作權限,那么便打開表繼續執行,執行器會根據定義的表的引擎,來執行引擎提供的對應讀寫的接口,mysql 5.5版本之后 默認的引擎為 InnoDB。

其大致流程如下:(假如 id 是沒有索引的)

  1. 調用InnoDB引擎接口取這個表的第一行,判斷ID值是不是6,如果不是則跳過,如果是則將這行存在結果集中;

  2. 調用引擎接口取“下一行”,重復相同的判斷邏輯,直到取到這個表的最后一行。

  3. 執行器將上述遍歷過程中所有滿足條件的行組成的記錄集作為結果集返回給客戶端。

如果是 id 是有索引的,第一次調用的是“取滿足條件的第一行”這個接口,之后循環取“滿足條件的下一行”這個接口,基本和上面差不多。這些接口都是引擎中已經定義好的。

至此 一條 sql 便執行完成。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM