數據庫設計之冗余字段設計

本文轉載自查看原文 2022-03-23 17:39 650 數據庫

在設計數據庫時，某一字段屬於一個表，但它又同時出現在另一個或多個表，且完全等同於它在其本來所屬表的意義表示，那么這個字段就是一個冗余字段。

——以上是我自己給出的定義

冗余字段的存在到底是好還是壞呢（

冗余是為了效率，減少join。單表查詢比關聯查詢速度要快。
某個訪問頻繁的字段可以冗余存放在兩張表里，不用關聯了。

）？這是一個不好說的問題。可能在有人看來，這是一個很蹩腳的數據庫設計。因為在數據庫設計領域，有一個被大家奉為圭臬的數據庫設計范式，這個范式理論上要求數據庫設計邏輯清晰、關系明確，比如，”用戶昵稱”字段”nickname”本來屬於表”user”，那么，表示”用戶昵稱”的字段就唯一的只應該屬於”user”表的”nickname”字段，這樣，當用戶要修改昵稱的時候，程序就只需要修改 user.nickname這個字段就行了，瞧，很方便。不過問題也隨之而來，我在其他數據表(如訂單orders表)里只存儲了用戶的ID，我要通過這個ID值得到用戶昵稱該怎么辦呢？一個普遍的解決方法是通過聯接(join)，在查詢時，通過id這個唯一條件聯接兩個表，從而取到用戶的昵稱。

這樣確實是沒問題，我也一直覺得這樣是最好的方案，擴展方便，當要更新用戶信息時，程序中要修改的地方很少，但是隨着數據庫里數據不斷增加，百萬，千萬，同時，用戶表的數據肯定也在不斷的增加的，它可能是十萬，百萬。這個時候，你會發現兩個表通過聯接來取數據就顯得相當費力了，可能你只需要取一個nickname這個用戶昵稱屬性，你就不得不去聯一下那個已經幾十萬的用戶表進行檢索，其速度可想而知了。

這個時候，你可以嘗試把nickname這個字段加到orders這個訂單表中，這樣做的好事是，當你要通過訂單表呈現一個訂單列表時，涉及用戶的部分可能就不需要再進行聯接查詢了(變成了單表查詢)。當然，有利就有弊，這樣做的弊端就是，當你嘗試更新用戶信息時，你必須記得用戶信息表里當前被更新的字段中，有哪些是冗余字段，分別屬於哪些表，找到他們，然后加入到你的更新程序段中來。這個是程序中的開銷，開銷在開發人員的時間上了。至於這樣做是否值得，就得看具體情況而定了。

所以，目前要創建一個關系型數據庫設計，我們有兩種選擇：

盡量遵循范式理論的規約，盡可能少的冗余字段，讓數據庫設計看起來精致、優雅、讓人心醉。
合理的加入冗余字段這個潤滑劑，減少join，讓數據庫執行性能更高更快。

選擇哪一種呢？如果你是一個美學狂人，並且財大氣粗，非要使用第一種方案，也沒關系，這種方案的短板並非不可救葯的。比如，你可以增加服務器，從數據庫集群入手，進行讀寫分離，讀的時候可以將壓力分散到不同的數據庫服務器上，這樣也可以獲得很好的性能，只是多付出了硬件成本和維護成本。或者，你可以在數據庫前端架設Memcached之類的緩存服務，減少讀寫數據庫的次數，也可以達到同樣的效果。問題在於你確定你需要緩存之類的東西。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 數據庫設計之冗余字段設計數據庫的冗余字段數據庫的字段設計心得 mysql數據庫設計文檔-導出字段設計設計數據庫時字段類型和長度建議關於數據庫設計中的狀態字段關於數據庫‘狀態’字段設計的思考與實踐數據庫設計數據庫設計數據庫間的一致性：數據庫冗余表數據一致性