PowerBI系列組件關系詳解


隨着數據分析工具的不斷更新,我們所熟知的Excel可能已經不是你想象中的樣子了。
Excel和Power BI又有何千絲萬縷的聯系?
M語言和DAX語言又是什么樣的存在?
操作他們又需要掌握什么樣的技能?
通過我的講解,從此你將發現一扇通往新世界的大門,開啟你新的人生,讓我們啟航吧!

為方便書寫,以下內容使用簡寫
Power Query : PQ
Power Pivot : PP
Power BI Desktop : PBI

一、先讓我們大致了解下他們的聯系

 
為了更加直觀的表述他們的關系,我特意制作了一張圖片用以說明.png

關系說明
在Office2010時代,BI組建均以插件形式存在;2013時代,除了PQ,其他插件已全部內置;2016時代已全部內置相關插件;而Power BI就是將這些插件打包起來做了一個獨立的軟件,更加方便我們的使用,同時提供了在線版、移動版、桌面版,而我們通常所說的PBI指的就是Power BI的桌面版(Power BI Desktop)。其中BI組件包含Power Query、Power Pivot、Power View、Power Map四個。操作Power Query需要學習M語言、操作Power Pivot需要學習DAX語言,兩則均屬於函數式編程。而Power View和Power Map主要是做可視化,在Excel里面不是重點,已經逐漸被更為強大的PBI的儀表板取代。

Power BI系列組件:

Power BI 是一套商業分析工具,用於在組織中提供見解,全稱:Power-BI決策分析系統。可連接數百個數據源、簡化數據准備並提供即時分析。集數據獲取、整理、呈現與一體。早期作為插件和Excel搭配使用,后續逐漸內置到Excel當中,現在已經開發出來獨立的軟件可以使用。


 
圖片截圖來至於BI佐羅的作品.png

二、對各部分做個簡單的介紹

Office Excel

關於Office辦公軟件就不做過多的介紹了,只需要知道從Excel 2010開始才涉及到我們今天開始講的內容,這之前的版本比如2003版和2007版均不支持相關功能。

Excel 中可用的三大數據分析工具:

Power Query

Power Query 是一種數據連接技術,可用於發現、連接、合並和優化數據源以滿足分析需要。Power Query 的功能在 Excel 和 Power BI Desktop 中可用。通常需執行一些常見步驟才可使用 Power Query。——微軟的解釋

Power Query使用場景:
  • 1、PQ可以加載N多種數據源,包括常見的Excel文件、文件夾、TXT文件、CSV文件、SQL Server、MySQL、Web等。可對數據進行合並、追加等之前需要VBA才能完成的工作。
  • 2、PQ操作完的步驟可以重復執行,下次再操作同樣的步驟只需要刷新即可得到最新的數據。
  • 3、PQ寫好的操作步驟可以再次編輯和更改,還可調整操作步驟。你可以想象成你錄制了一個宏,並且這個宏是可以根據你的需要隨時可以編輯的。如果我們直接修改宏的代碼實現則需要學習VBA編程,但是在PQ里面操作基礎功能只需要像在Excel中的工具欄按鈕進行操作一樣簡單。
  • 4、PQ加載的數據可以突破Excel中100萬行的限制,而加載數據的大小取決於你的內存上限。我曾經測試過9千萬條的數據進行加載,而有人測試過100億條數據。 在你原有的認識中你認為Excel可以加載100億條數據嗎?
  • 5、PQ和PP結合,我們出日報則只需要更新數據源后刷新一下就可以完成。對於重復性的工作,可以稱為是【神器】,效果堪比VBA,但學習門檻缺非常低。
  • 6、Office2010、Office2013沒有內置PQ,使用必須去微軟官網下載插件才能使用。下載Power Query,下載安裝后會在Excel菜單欄新增一個Power Query的菜單。Office2016內置了PQ,在數據菜單下-新建查詢。
M語言:

M語言是操作PQ的語言,目前由700多個函數組成。但你不用怕,我們學習PQ只是為了完成我們基本的工作,沒有必要對這些函數全部都熟悉,就像我們學習Excel不需要對VBA和全部的函數熟悉一樣,只需要掌握幾個基本的函數即可讓你游刃有余,即便是你不會任何M函數,則依然可以通過工具欄上的按鈕來實現,而且很多功能與Excel中是類似的,學習門檻很低。后續我會提供這些按鈕的功能講解和PQ的相關操作教程。


 
圖片.png

 
PQ菜單及工具預覽.png
Power Query總結:

你可以簡單的理解為是一個數據加載數據清洗工具。在實際操作中由於受限於Power Query計算效率,通常作為數據加載使用的較多,但其數據清洗功能也是非常強大的,甚至可以做網絡爬蟲。

Power Pivot

PowerPivot 是一種數據建模技術,用於創建數據模型,建立關系,以及創建計算。 可使用 PowerPivot 處理大型數據集,構建廣泛的關系,以及創建復雜(或簡單)的計算,這些操作全部在高性能環境中和所你熟悉的 Excel 內執行。——微軟的解釋

Power Pivot使用場景:
  • 1、PP是PQ的好搭檔,一般配合使用的場景非常多,如果你要做一份日報,可以通過PQ加載數據直接生成想要的數據。如果有更加復雜的需求可以再鏈接到PP里面使用度量值+多維數據集函數將你需要的結果返回。下次在做日報只需要在更新數據源后全部刷新即可完成。下載Power Pivot
  • 2、可以突破數據透視表的限制,制作更加自由的數據呈現結構。
  • 3、可對整個數據庫進行復雜查詢,具有快速內存處理能力,和PQ一樣不受Excel100萬行的限制,結合使用DAX Studio可以實現類似SQL的查詢效果。
  • 4、和PQ一樣,也無需受限於數據來源形式,PP也支持非常多的數據源格式,不需要受限於Excel文件。我們可以選擇直接使用PP加載源數據,也可也通過PQ加載然后再鏈接到PP中進行使用。
  • 5、使用PP中的DAX語言可以有兩個方向,數據分析方向數據查詢方向。數據分析方向主要使用度量值,數據分析師使用的較多。查詢方向是使用DAX處理各種復雜的表格關系,其查詢效果類似SQL。
DAX語言:

與PQ一樣,操作PP也需要一門變成語言,叫做DAX語言。DAX語言由200多個函數組成,和PP的M語言均被成為函數式編程。看到編程二字,你不必害怕,因為DAX的函數實際上部分函數跟我使用的Excel函數一樣或者類似,如果作為入門你會很快上手。涉及到DAX更加復雜的操作需要你需要理解兩個概念:篩選上下文行上下文,后續我會做簡單的介紹。

 
PP數據加載支持的類型.png

 
表格關系視圖.png

 

Power Pivot總結:

PP主要適用於數據模型的搭建方向,作為數據的查詢也是優秀的工具。PQ和PP是一對在數據處理方面具有划時代意義的工具。但不要聽到搭建數據模型就感覺很復雜,其實並沒有我們想象的那么高大上,只要開始學習都會很容易的入門。

Power View

Power View 是一種數據可視化技術,用於創建交互式圖表、圖形、地圖和其他視覺效果,以便直觀呈現數據。 Power View 在 Excel、BI SharePoint、SQL Server 和 Power BI 中均可用。——微軟的解釋

Power View、Power Map使用場景:

Power View在Excel中已經被微軟放棄,如果你對Excel不熟悉,你甚至找不到它,所以實際工作中,使用的並不是很多,而這部分內容在PBI中對應的就是儀表板。而Power Map在Excel中做展示使用的相對多一些,而同樣可以在PBI中通過地圖來實現。


 
圖片來源於Power 工坊微信公眾號.png

 
Power Map示例.png

三、學習BI組件的入門途徑

  • 從Excel入門-該方法適合Excel用戶

如果你之前只是使用Excel,那么可以通過Excel開始學習這些BI組件,你會發現這將顛覆你以前對Excel的認識。

  • 從Power BI入門-該方法適合數據分析人員

如果你是一名數據分析相關人員,那么使用Power BI Desktop將是一個不錯的選擇,其和Excel中的組件基本雷同,可以非常方便的使用儀表板展示你所需要表達的內容,是數據分析師的不二之選。

  • 從SSAS入門-該方法適合開發人員

SSAS是SQL Server的一個組件,具體我也未曾使用過,是屬於企業級BI的工具。
從任何途徑開始學習都可以對其他部分觸類旁通,其關鍵部分均是一樣的。

四、缺點

凡是都有兩面,雖然PQ和PP萬般好,但是也有其限制。

  • 1、不適合數據量特別大的數據,一般數據超過2G就不建議使用了,其效率會明顯降低。而我們平時處理個幾十萬上百萬的數據還是非常流暢的。如果要優化其性能並結合SQL使用能發揮更大的效果。
    -2、PQ的計算效率低,在之前的探討中,如果大量在PQ中做復雜的計算會導致計算效率明顯降低,尤其是分組操作、合並查詢等。我們目前的處理方式是僅使用PQ加載數據並做簡單的數據清洗,大量的分析和計算則交給PP來做,因為PP的效率比PQ高了很多。但PQ的效率依然比在Excel里面高了很多。
    -3、定位有點尷尬,一般辦公人員學習可能稍嫌難一些,同時作為IT人員一般又不屑於使用。但目前的現狀正在改善,Power BI也在不斷迭代,桌面版平均每月都有更新,有時候甚至是周,已經成為微軟戰略及產品,學習BI的人員也在不斷的增多。
  • 4、參考資料少,不像Excel那么成熟,教程特別多,網上隨處可見。BI組件的有質量的教程網上還是不太容易找,這些限制了部分想要學習的同學的積極性。如果是Excel入門可以看看劉凱老師翻譯的《用PowerPivot建立數據模型》,如果是從PBI入門可以看看馬世權老師的《從Excel到Power BI》,或者也可也看下Power 工坊的網絡課程。后續我也會寫或者錄制一些相關的教程,方便大家學習。

五、總結

其實今天已經介紹了非常多的內容,最后也做一個總結。我得聲明一下,今天我介紹的功能,WPS都是不支持的,必須是微軟Office辦公軟件才可以。如果你是首次使用PP,這需要設置一下,才能使用,文件-選項-自定義功能區-將開發工具打勾,設置完畢后點擊開發工具菜單下的COM加載項,對Power Pivot勾選后才能使用,會多一個Power Pivot的菜單。


 
圖片
 
圖片.png


本文轉載於:

Excel、Power BI、Power Query、Power Pivot、M語言、DAX語言之間的關系 - 簡書
https://www.jianshu.com/p/b3d6fdf480e6

 

數據科學交流群,群號:189158789 ,歡迎各位對數據科學感興趣的小伙伴的加入!

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM