數據庫與數據倉庫的本質區別是什么？

本文轉載自查看原文 2021-10-14 08:14 99

作者：陳誠
鏈接：https://www.zhihu.com/question/20623931/answer/139842331
來源：知乎
著作權歸作者所有。商業轉載請聯系作者獲得授權，非商業轉載請注明出處。

數據庫：傳統的關系型數據庫的主要應用，主要是基本的、日常的事務處理，例如銀行交易。

數據倉庫：數據倉庫系統的主要應用主要是OLAP（On-Line Analytical Processing），支持復雜的分析操作，側重決策支持，並且提供直觀易懂的查詢結果。

我嘗試着再補充些具體的事例來說明，這樣更可以幫助大家更好理解一些。

舉個最常見的例子，拿電商行業來說好了。

基本每家電商公司都會經歷，從只需要業務數據庫到要數據倉庫的階段。

第二階段，流量來了，客戶和訂單都多起來了，普通查詢已經有壓力了，這個時候就需要升級架構變成多台服務器和多個業務數據庫（量大+分庫分表），這個階段的業務數字和指標還可以勉強從業務數據庫里查詢。初步進入工業化。

第三個階段，一般需要 3-5 年左右的時間，隨着業務指數級的增長，數據量的會陡增，公司角色也開始多了起來，開始有了 CEO、CMO、CIO，大家需要面臨的問題越來越復雜，越來越深入。高管們關心的問題，從最初非常粗放的：“昨天的收入是多少”、“上個月的 PV、UV 是多少”，逐漸演化到非常精細化和具體的用戶的集群分析，特定用戶在某種使用場景中，例如“20~30歲女性用戶在過去五年的第一季度化妝品類商品的購買行為與公司進行的促銷活動方案之間的關系”。

這類非常具體，且能夠對公司決策起到關鍵性作用的問題，基本很難從業務數據庫從調取出來。原因在於：

而怎么解決這個問題，此時我們就需要建立一個數據倉庫了，公司也算開始進入信息化階段了。數據倉庫的作用在於：

那么在這里前一種業務數據庫（讀寫都優化）的是業務性數據庫，后一種是分析性數據庫，即數據倉庫。

最后總結一下：

數據庫比較流行的有：MySQL, Oracle, SqlServer等
數據倉庫比較流行的有：AWS Redshift, Greenplum, Hive等

這樣把數據從業務性的數據庫中提取、加工、導入分析性的數據庫就是傳統的 ETL 工作。現在也有一些新的方法，這展開說又是另一件事情了，有機會再詳細說說。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 數據庫 DROP命令和DELETE命令的本質區別是什么 oCPC和oCPM的本質區別是什么？數據庫與數據倉庫的區別數據倉庫與數據庫的區別 GET 和 POST請求的本質區別是什么數據倉庫的介紹(數據倉庫和數據庫的區別) 數據庫和數據倉庫的區別數據庫與數據倉庫區別數據倉庫和傳統數據庫的區別數據庫和數據倉庫的區別