單表查詢和多表連接查詢哪個效率更快

本文轉載自查看原文 2019-10-29 17:08 4561

一.第一個解答來源於《高性能Mysql》中的回答

很多高性能的應用都會對關聯查詢進行分解。簡單地，可以對每個表進行一次單表查詢，然后將結果在應用程序中進行關聯。例如，下面這個查詢：

select * from tag

join tag_post on tag_post.tag_id=tag.id

join post on tag_post.post_id=post.id

where tag.tag=’mysql’;

可以分解成下面這些查詢來代替：

Select * from tag where tag=’mysql’;

Select * from tag_post where tag_id=1234;

Select * from post where id in(123,456,567,9989,8909);

到底為什么要這樣做？

咋一看，這樣做並沒有什么好處，原本一條查詢，這里卻變成了多條查詢，返回結果又是一模一樣。

事實上，用分解關聯查詢的方式重構查詢具有如下優勢：（高並發、高性能的應用中，一般建議使用單表查詢）

1. 讓緩存的效率更高。

許多應用程序可以方便地緩存單表查詢對應的結果對象。另外對於MySQL的查詢緩存來說，如果關聯中的某個表發生了變化，那么就無法使用查詢緩存了，而拆分后，如果某個表很少改變，那么基於該表的查詢就可以重復利用查詢緩存結果了。

2. 將查詢分解后，執行單個查詢可以減少鎖的競爭。

3. 在應用層做關聯，可以更容易對數據庫進行拆分，更容易做到高性能和可擴展。

4. 查詢本身效率也可能會有所提升。

5. 可以減少冗余記錄的查詢。

6. 更進一步，這樣做相當於在應用中實現了哈希關聯，而不是使用MySQL的嵌套環關聯，某些場景哈希關聯的效率更高很多。

7. 單表查詢有利於后期數據量大了分庫分表，如果聯合查詢的話，一旦分庫，原來的sql都需要改動。

8. 上次看到某個CTO技術分享，公司規定底層禁止用join聯合查詢。數據大的時候確實慢。

9. 聯合查詢或許確實快，但是mysql的資源通常比程序代碼的資源緊張的多。

二.其他回答

情景假設：假設網站有一個公司庫版塊，我想搜索某城市的所有公司。

數據表：tbl_company （t1）、 tbl_city (t2)。

例1： t1表中存cityid 根據id做表連接查詢 select * from t1 inner join t2 on t1.cityid=t2.cityid;

例2： t1表中存cityName 用戶前台點擊上海市，則把上海市的id傳到后台（不考慮傳cityName），根據id查出cityName select cityName from t2 where cityid= #{cityid};，然后 select * from t1 where cityName = #{cityName};

兩者區別：例1中只做了一次表關聯查詢，例2中分別做了兩次單表查詢。

考慮到數據量大，多表連接查詢會影響查詢效率所以都優化為單表查詢。 TP：以上是在不使用索引的情況下

請問哪種效率會更高些?

答：sql優化與業務也有關系，這條語句的查詢會不會頻繁，要不要考慮2次連接帶來的開銷，如果這些都不用考慮的話，都沒有索引的情況下，感覺相差不大，2應該略優於1。

數據沒有特別大的情況還是級聯查詢快。

對於傳統的數據庫涉及來說, 盡可能減少數據庫查詢次數.

BUT, 1. mysql都對處理連接/斷開連接, 回復小而簡單的查詢是非常快的; 2.現在的網絡已經非常快了. 所以多個小的查詢對mysql來說可能更快一些.

最后, 大神也沒有結論哪個更好. 呵呵, 其實整本書都明確表達一個意思, 測試測試! 做benchmark! 對於自己的數據環境, 把兩種方式都測試一下. 用數據說話.

總結：建議還是用單表查詢！

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 oracle的多表查詢與表的連接 MySQL多表查詢三表查詢連接查詢的套路 hive 多表連接查詢並將結果存入新表 orm多表，連表查詢 SQL多表連接查詢多表連接查詢 Django多表連接查詢多表查詢（內連接與外連接）多表聯合查詢效率分析及優化 Mysql 多表聯合查詢效率分析及優化