面試技巧,如何通過索引說數據庫優化能力,內容來自Java web輕量級開發面試教程


      上星期寫了一個篇文章,數據庫方面的面試技巧,如何從建表方面展示自己能力,承蒙管理員抬舉,放入首頁,也承蒙各位厚愛,兩天內收獲了將近770個點擊,也一度進入48小時熱榜。

      為了感謝管理員和大家的支持,再根據我的面試經驗原創一篇關於索引方面如何推銷自己的文章。這內容也來自我寫的書

java web輕量級開發面試教程

 

       如果我們需要招個Java方面的高級程序員,一方面看年限(本科3年),具體到數據庫方面的技能要求,包括如下三個方面:

       第一,是否會基本的增刪改查,存儲過程等技能,是否會用些group by, having,distinct, exist, in, with等高級點的語句。這點一般都沒問題,甚至一個剛畢業的大學生或工作經驗2年之內的初級程序員也沒問題,也就是說,這個是高級程序員必備的,你會了是應該,不會甚至不及畢業生。

       第二,有沒有設計表的經驗,這方面的面試技能也已經在數據庫方面的面試技巧,如何從建表方面展示自己能力里說了,關鍵一點,你得結合實際需求來說。

       第三也是關鍵一點,在數據庫優化方面,你是否有相關經驗。

       這是個開放性的問題,大神們知道,可以從分區,根據執行計划優化等很多方面來考慮,對高級程序員,我的期望是你至少能說點索引相關的。但根據我的面試經驗,很少有候選人(特別是高級程序員候選人)能比較深入地敘述。

 

      開場白說了不少,下面進入正文。

      索引是數據庫優化所必需的工具,在面試的時候一般不會問概念性的問題,因為大家都能從教科書上找到答案,所以一般會問以下兩方面的問題:

①索引有什么代價?哪些場景下你需要建索引?或者有時候反過來問,哪些場景下不推薦建索引。

②建好索引之后,怎么才能最高效地利用索引?或者反過來問,請說出一個無法有效利用已建索引的案例。

      從結構上來看,索引好比是一棵B樹(也叫B*或者B+),假設學生表里只有學生ID和姓名兩列,該學生表里有1000個學生,學號分別從1到1000,如果針對ID建立索引,大致的結構如下圖所示。

       

       當然,在實際的數據庫系統中,索引要比這個復雜得多,但從這個圖里,我們能大致看出索引的工作原理。

       索引建好后,如果我們要查找ID為111的學生,則數據庫系統就會走索引,從圖2.1中我們可以看到,根據根節點的指引,會 找到第二層從左往右第二個數據塊,以此類推,會在第四層里得到ID為111的物理地址,然后直接從硬盤里找數據。

       反過來,如果沒有建索引,數據庫系統可能就要從一個大的范圍里逐一定位查找,效率就沒這么高了。

       索引的好處大家已經看到了,那么為了得到這個“查詢效率高”的好處,我們要付出了什么樣的代價呢?

       1  索引需要占硬盤空間,這是空間方面的代價。

       2  一旦插入新的數據,就需要重新建索引,這是時間上的代價。

       關於索引性能問題,我會細問,你建索引的表規模多少?不少人直接告訴我表就幾千條,我或者問,索引有什么代價?不少回答是索引是只有好處沒壞處的, 也就是說,可以隨便建。

      對此我們來詳細分析下(也就是大家在面試時需要說的):

      場景一,數據表規模不大,就幾千行,即使不建索引,查詢語句的返回時間也不長,這時建索引的意義就不大。當然,若就幾千行,索引所占的空間也不多,所以這種情況下,頂多屬於“性價比”不高。

     場景二,某個商品表里有幾百萬條商品信息,同時每天會在一個時間點,往其中更新大概十萬條左右的商品信息,現在用where語句查詢特定商品時(比如where name = ‘XXX’)速度很慢。為了提升查詢效率可以建索引,但當每天更新數據時,又會重建索引,這是要耗費時間的。這時就需要綜合考慮,甚至可以在更新前刪除索引,更新后再重建。

      場景三,從上圖中可以看到,因為在數據表里ID值都不相同,所以索引能發揮出比較大的作用。相反,如果某個字段重復率很高,如性別字段,或者某個字段大多數值是空(null),那么不建議對該字段建索引。

       請大家記住,一定是有業務需求了才會建索引。比如在一個商品表里,我們經常要根據name做查詢,如果沒有索引,查詢速度會很慢,這時就需要建索引。但在項目開發中,如果不經常根據商品編號查詢,那么就沒必要對編號建索引。

      最后再強調一次,建索引是要付出代價的,沒事別亂建着玩,同時在一個表上也不能建太多的索引。

      下面說下索引建好了該怎么用?畢竟大家花了不少時間和空間代價建了索引,至少得回本吧?

      如果出現一些不好的SQL語句,那么索引就白建了。下面通過一些具體的例子來看索引的正確用法。

      ①語句一:select name from 商品表。不會用到索引,因為沒有where語句。

      ②語句二:select * from 商品表 where name = ‘Java書’,會用到索引,如果項目里經常用到name來查詢,且商品表的數據量很大,而name值的重復率又不高,那么建議建索引。

      ③語句三:select * from 商品表 where name like ‘Java%’  這是個模糊查詢,會用到索引,請大家記住,用like進行模糊查詢時,如果第一個就是模糊的匹配符,比如where name like ‘%java’,那么在查詢時不會走索引。在其他情況下,不論用了多少個%,也不論%的位置,只要不出現在第一個位置,那么都能用到索引。

        學生成績表里有兩個字段:姓名和成績。現在對成績這個整數類型的字段建索引。

        ①第一種情況,當數字型字段遇到非等值操作符時,無法用到索引。比如:

        select name from 學生成績表 where 成績>95 , 一旦出現大於符號,就不能用到索引,為了用到索引,我們應該改一下SQL語句里的where從句:where 成績 in (96,97,98,99,100)

        ② 第二種情況,如果對索引字段進行了某種左值操作,那么無法用到索引。

         能用到索引的寫法:select name from 學生成績表 where 成績 = 60

         不能用到索引的寫法:select name from 學生成績表 where 成績+40 = 100

        ③ 第三種情況,如果對索引字段進行了函數操作,那么無法用到索引。

        比如SQL語句:select * from 商品表 where substr(name) = ‘J’,我們希望查詢商品名首字母是J的記錄,可一旦針對name使用函數,即使name字段上有索引,也無法用到。

      關於索引,當然還有位圖索引和復合索引等,如果大家要應聘更高級的崗位(比如有5年經驗了),那么就不能止步於此了,但根據我的面試經驗,上述關於索引的說辭對工作經驗3年以下的候選人是有幫助的。

 

       其實我知道,不少程序員平時用過索引,但不知道怎么說,這很吃虧。對於高級程序員而言,如果你這都說不好,那么你的能力比初級的要高多少?對於初級程序員而言,如果你掌握了,而且能在面試中很好地說,那么你和同等能力的人相比,就很占優勢。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM