一.第一個解答來源於《高性能Mysql》中的回答
很多高性能的應用都會對關聯查詢進行分解。簡單地,可以對每個表進行一次單表查詢,然后將結果在應用程序中進行關聯。例如,下面這個查詢:
select * from tag
join tag_post on tag_post.tag_id=tag.id
join post on tag_post.post_id=post.id
where tag.tag=’mysql’;
可以分解成下面這些查詢來代替:
Select * from tag where tag=’mysql’;
Select * from tag_post where tag_id=1234;
Select * from post where id in(123,456,567,9989,8909);
到底為什么要這樣做?
咋一看,這樣做並沒有什么好處,原本一條查詢,這里卻變成了多條查詢,返回結果又是一模一樣。
事實上,用分解關聯查詢的方式重構查詢具有如下優勢:(高並發、高性能的應用中,一般建議使用單表查詢)
1. 讓緩存的效率更高。
許多應用程序可以方便地緩存單表查詢對應的結果對象。另外對於MySQL的查詢緩存來說,如果關聯中的某個表發生了變化,那么就無法使用查詢緩存了,而拆分后,如果某個表很少改變,那么基於該表的查詢就可以重復利用查詢緩存結果了。
2. 將查詢分解后,執行單個查詢可以減少鎖的競爭。
3. 在應用層做關聯,可以更容易對數據庫進行拆分,更容易做到高性能和可擴展。
4. 查詢本身效率也可能會有所提升。
5. 可以減少冗余記錄的查詢。
6. 更進一步,這樣做相當於在應用中實現了哈希關聯,而不是使用MySQL的嵌套環關聯,某些場景哈希關聯的效率更高很多。
7. 單表查詢有利於后期數據量大了分庫分表,如果聯合查詢的話,一旦分庫,原來的sql都需要改動。
8. 上次看到某個CTO技術分享,公司規定底層禁止用join聯合查詢。數據大的時候確實慢。
9. 聯合查詢或許確實快,但是mysql的資源通常比程序代碼的資源緊張的多。
二.其他回答
情景假設:假設網站有一個公司庫版塊,我想搜索某城市的所有公司。
數據表:tbl_company (t1)、 tbl_city (t2)。
例1: t1表中存cityid 根據id做表連接查詢 select * from t1 inner join t2 on t1.cityid=t2.cityid;
例2: t1表中存cityName 用戶前台點擊上海市,則把上海市的id傳到后台(不考慮傳cityName),根據id查出cityName select cityName from t2 where cityid= #{cityid};, 然后 select * from t1 where cityName = #{cityName};
兩者區別:例1中只做了一次表關聯查詢,例2中分別做了兩次單表查詢。
考慮到數據量大,多表連接查詢會影響查詢效率所以都優化為單表查詢。 TP:以上是在不使用索引的情況下
請問哪種效率會更高些?
答:sql優化與業務也有關系,這條語句的查詢會不會頻繁,要不要考慮2次連接帶來的開銷,如果這些都不用考慮的話,都沒有索引的情況下,感覺相差不大,2應該略優於1。
數據沒有特別大的情況還是級聯查詢快。
對於傳統的數據庫涉及來說, 盡可能減少數據庫查詢次數.
BUT, 1. mysql都對處理連接/斷開連接, 回復小而簡單的 查詢是非常快的; 2.現在的網絡已經非常快了. 所以多個小的查詢對mysql來說可能更快一些.
最后, 大神也沒有結論哪個更好. 呵呵, 其實整本書都明確表達一個意思, 測試測試! 做benchmark! 對於自己的數據環境, 把兩種方式都測試一下. 用數據說話.
總結:建議還是用單表查詢!