一、BI 商業智能(Business Intelligence,簡稱:BI),又稱商業智慧或商務智能,指用現代數據倉庫技術、線上分析處理技術、數據挖掘和數據展現技術進行數據分析以實現商業價值。 商業智能的概念在1996年最早由加特納集團(Gartner Group)提出,加特納集團 ...
基於Presto和superset搭建數據分析平台。 Presto可以作為數據倉庫,能夠連接多種數據庫和NoSql,同時查詢性能很高 Superset提供了Presto連接,方便數據可視化和dashboard生成。 基本概念 datawarehouse 數據倉庫 整合各類數據庫數據,面向主題,方便分析。存儲元數據,模型信息,存儲數據 建索引 緩存 分區 pre aggregation 等。 gre ...
2018-08-17 15:11 1 3562 推薦指數:
一、BI 商業智能(Business Intelligence,簡稱:BI),又稱商業智慧或商務智能,指用現代數據倉庫技術、線上分析處理技術、數據挖掘和數據展現技術進行數據分析以實現商業價值。 商業智能的概念在1996年最早由加特納集團(Gartner Group)提出,加特納集團 ...
殺手級特性 今年Power BI的幾大殺手級特性的GA,可以讓其構建完整的數據倉庫/數據湖和BI分析一站式方案。 Power BI Premium Per User-超低的價格 Large datasets in Power BI Premium-內置完整的SSAS引擎 ...
Preface:本文將會講述 BI/DW/DA 領域的一些常見概念,如:事實表、維度表、建模、多維分析、cube 等,但不涉及具體實例分析。 1、維(Dimension) 維是用於從不同角度描述事物特征的,一般維都會有多層(Level:級別),每個Level都會包含一些共有的或特有的屬性 ...
1. 什么是數據倉庫? 在wiki中對數據倉庫的解釋是: 在計算中,數據倉庫(DW或DWH),也稱為企業數據倉庫(EDW),是用於報告和數據分析的系統,被認為是商業智能的核心組成部分 DW是來自一個或多個不同來源的集成數據的中央存儲庫。 他們將當前和歷史數據存儲在一個地方,用於為整個企業 ...
聲明: 1. 本欄是個人總結,如有錯漏,請指正 2. 數據倉庫的構建目前業界只有指導方案,並沒有統一的標准,每個公司都可以按照實際情況進行設計 3. 本總結參考《阿里巴巴大數據之路》、《數據倉庫工具箱》 產生背景 ...
第一章 數倉搭建-ODS層 1)保持數據原貌不做任何修改,起到備份數據的作用。 2)數據采用LZO壓縮,減少磁盤存儲空間。100G數據可以壓縮到10G以內。 3)創建分區表,防止后續的全表掃描,在企業開發中大量使用分區表。 4)創建外部表。在企業開發中,除了自己用的臨時表,創建內部表外 ...
維度表(dimension)存放着一些維度屬性,例如時間維度:年月日時;地域維度:省份,城市;年齡維度:老年,中年,青年;職稱維度:高,中,低。它定義了可以從哪些角度分析事實表。 事實表(fact)存放着一些業務產生的數據,例如:商品訂購產生的訂單信息,銀行的流水信息,erp系統的辦公信息。但它 ...
一. Greenplum簡介 大數據是個炙手可熱的詞,各行各業都在談。一談到大數據,好多人認為就是Hadoop。實際上Hadoop只是大數據若干處理方案中的一個。現在的SQL、NoSQL、NewSQL、Hadoop等等,都能在不同層面或不同應用上處理大數據的某些問題。而Greenplum數據 ...