數據庫設計規范(轉)


1. 基礎規范

    1). 必須使用InnoDB存儲引擎

         解讀:支持事務、行級鎖、並發性能更好、CPU及內存緩存頁優化使得資源利用率更高

    2). 必須使用utf8mb4字符集

          解讀:標准,萬國碼,無需轉碼,無亂碼風險

                     utf8mb4是utf8的超集,emoji表情以及部分不常見漢字在utf8下會表現為亂碼,故需要升級至utf8mb4。

    3). 數據表、數據字段必須加入中文注釋

         解讀:N年后誰tm知道這個r1,r2,r3字段是干嘛的

    4). 禁止使用存儲過程、視圖、觸發器、Event

         解讀:高並發大數據的互聯網業務,架構設計思路是“解放數據庫CPU,將計算轉移到服務層”,並發量大的情況下,這些功能很可能將數據庫拖死,業務邏輯放到服務層具備更好的擴展性,

                    能夠輕易實現“增機器就加性能”。數據庫擅長存儲與索引,CPU計算還是上移吧

    5). 禁止存儲大文件或者大照片

         解讀:為何要讓數據庫做它不擅長的事情?大文件和照片存儲在文件系統,數據庫里存URI多好

    6). 不在數據庫做計算,cpu計算務必移至業務層

 

 2. 命名規范

     1). 只允許使用內網域名,而不是ip連接數據庫

     2). 線上環境、開發環境、測試環境數據庫內網域名遵循命名規范

          業務名稱:xxx

          線上環境:dj.xxx.db

          開發環境:dj.xxx.rdb

          測試環境:dj.xxx.tdb

          從庫在名稱后加-s標識,備庫在名稱后加-ss標識

          線上從庫:dj.xxx-s.db

          線上備庫:dj.xxx-sss.db

     3). 庫名、表名、字段名:小寫,下划線風格,不超過32個字符,必須見名知意,禁止拼音英文混用

     4). 表名t_xxx,非唯一索引名idx_xxx,唯一索引名uniq_xxx 

 

3. 表設計規范

    1). 單實例表數目必須小於500

    2). 單表列數目必須小於30

    3). 表必須有主鍵,例如自增主鍵 

         解讀:

         a)主鍵遞增,數據行寫入可以提高插入性能,可以避免page分裂,減少表碎片提升空間和內存的使用

         b)主鍵要選擇較短的數據類型, Innodb引擎普通索引都會保存主鍵的值,較短的數據類型可以有效的減少索引的磁盤空間,提高索引的緩存效率

         c) 無主鍵的表刪除,在row模式的主從架構,會導致備庫夯住

    4). 禁止使用外鍵,如果有外鍵完整性約束,需要應用程序控制

         解讀:外鍵會導致表與表之間耦合,update與delete操作都會涉及相關聯的表,十分影響sql 的性能,甚至會造成死鎖。高並發情況下容易造成數據庫性能,大數據高並發業務場景數據庫使用以性能優先

 

4. 字段設計規范

    1). 必須把字段定義為NOT NULL並且提供默認值

          解讀:

          a)null的列使索引/索引統計/值比較都更加復雜,對MySQL來說更難優化

          b)null 這種類型MySQL內部需要進行特殊處理,增加數據庫處理記錄的復雜性;同等條件下,表中有較多空字段的時候,數據庫的處理性能會降低很多

          c)null值需要更多的存儲空,無論是表還是索引中每行中的null的列都需要額外的空間來標識

          d)對null 的處理時候,只能采用is null或is not null,而不能采用=、in、<、<>、!=、not in這些操作符號。如:where name!=’shenjian’,如果存在name為null值的記錄,查詢結果就不會包含name為null值的記錄

     2). 禁止使用TEXT、BLOB類型

          解讀:會浪費更多的磁盤和內存空間,非必要的大量的大字段查詢會淘汰掉熱數據,導致內存命中率急劇降低,影響數據庫性能

     3). 禁止使用小數存儲貨幣

          解讀:使用整數吧,小數容易導致錢對不上

                     因為需要額外的空間和計算開銷,所以應該盡量只在對小數進行精確計算時才使用DECIMAL。在數據量比較大的時候,可以考慮使用BIGINT代替DECIMAL,將對應的值擴大N倍。

     4). 必須使用varchar(20)存儲手機號

          解讀:

          a)涉及到區號或者國家代號,可能出現+-()

          b)手機號會去做數學運算么?

          c)varchar可以支持模糊查詢,例如:like“138%”

     5). 禁止使用ENUM,可使用TINYINT代替

          解讀: 

          a)增加新的ENUM值要做DDL操作

          b)ENUM的內部實際存儲就是整數,你以為自己定義的是字符串? 

     6). 更小的通常更好

          更小的數據類型通常更快,因為他們占用更少的磁盤、內存和CPU緩存,並且處理需要的CPU周期也更少。

     7). 簡單就好:簡單的數據類型的操作通常需要更少的CPU周期。

           例如:整型比字符串操作的代價更低,因為字符集和校對規則(排序規則)是字符串比較比整型比較更復雜。這里有兩個例子:一個是應該使用MySQL內建的類型而不是字符串來存儲日期和時間,另外一個是應該使用整型存儲IP地址。

     8). 避免隱藏的類型轉換:

           一旦選擇了一種類型,要確保在所有關聯表中都使用同樣的類型。會用不同數據類型可能導致性能問題,即使沒有性能影響,在比較操作時隱式類型轉換也可能導致很難發現錯誤。

     9). 緩存表和匯總表

     10). 從 PROCEDURE ANALYSE() 取得建議:PROCEDURE ANALYSE() 會讓 MySQL 幫你去分析你的字段和其實際的數據,並會給你一些有用的建議。只有表中有實際的數據,這些建議才會變得有用,

             因為要做一些大的決定是需要有數據作為基礎的。

             語法:select id from d_city PROCEDURE ANALYSE()

     11). 固定長度的表會更快:

              a. 固定長度的表會提高性能,因為MySQL搜尋得會更快一些,因為這些固定的長度是很容易計算下一個數據的偏移量的,所以讀取的自然也會很快。而如果字段不是定長的,那么,每一次要找下一條的話,需要程序找到主鍵。

              b. 固定長度的表也更容易被緩存和重建。不過,唯一的副作用是,固定長度的字段會浪費一些空間,因為定長的字段無論你用不用,他都是要分配那么多的空間。

      12). 使用int/bigInt作為主鍵類型時,推薦使用UNSIGNED

 

5. 索引設計規范

    1). 單表索引建議控制在5個以內

    2). 單索引字段數不允許超過5個

         解讀:字段超過5個時,實際已經起不到有效過濾數據的作用了

    3). 禁止在更新十分頻繁、區分度不高的屬性上建立索引

         解讀:

         a)更新會變更B+樹,更新頻繁的字段建立索引會大大降低數據庫性能 

         b)“性別”這種區分度不大的屬性,建立索引是沒有什么意義的,不能有效過濾數據,性能與全表掃描類似

    4). 建立組合索引,必須把區分度高的字段放在前面

         解讀:能夠更加有效的過濾數據

 

6. 數據庫注意事項:

    1). 禁止使用應用程序配置文件內的帳號手工訪問線上數據庫

    2). 禁止非DBA對線上數據庫進行寫操作,修改線上數據需要提交工單,由DBA執行,提交的SQL語句必須經過測試

    3). 分配非DBA以只讀帳號,必須通過VPN+跳板機訪問授權的從庫

    4). 開發、測試、線上環境隔離

 

內容轉自微信公眾號:架構師之路

書:高性能Mysql                     

            

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM