歲月不居,時節如流。
時光荏苒,歲月如梭。
前面兩段充分體現了博主深厚的文學素養,別和博主爭,博主說啥就是啥。
其實,對於大量數據的處理,這幾年微軟Office做的不單單是2007的時候把Excel的行數從65536提高到了1048576。存得多了不是目的,目的是處理得了,處理得快,處理過程簡單,2010的時候微軟便引入了Power Query插件用以提升Excel的數據獲取、處理能力,2016的時候PowerQuery便成了Excel的標配功能。沒錯,扯了這么多就是為了說出本系列案例要用PowerQuery,雖然標題上已經明白得不要不要的了,但還是想多扯幾句,沒辦法,將就着看吧,誰讓我是作者。
從今天開始,博主有可能會斷斷續續斷斷地更一些關於Power Query的知識,希望博主能堅持下來!
但凡對Excel數據處理比較熟悉的用戶,說到條件計數、條件求和一定會想到Countif、Sumif,沒錯,在Excel里這是兩個使用頻率很高的函數。但是,當“大數據”來臨時,它們統統都成了“雞肋”,屏幕上卡死不動的Excel與內存爆紅的“加速計”說明了一切。
1 條件計數,秒殺“Countif”
操作目的
案例大概是這樣的,有數以十萬計的記錄條數在Excel里面,目的是輕松點點點就“秒完”計數。
先來算下每戶人數,再來算下每戶男女各多少。
操作步驟
1、數據要先加載到PQ,至於不知道如何加載的請翻看其他案例,這里要特別點一下的是加載后一定要“點一下‘更改的類型’”前的x。刪掉這一步,因為這一步PQ“自作主張”將長數字串轉成了數值,而且還給科學計了數,而我們需要的就是原來的長數字串。
2、【開始】選項卡—【分組依據】,按“戶號”分組,分組操作是對“戶號”列計數,這樣每戶多少人就出來了。
3、“秒完”計數,上載至Excel就行了。
4、為了把案例整復雜點以顯示本博主的教程不太水,這里還要算下每戶男女成員各幾人。具體的操作其實和上邊一樣的簡單,如果硬要說說多講述這一步的必要性,下圖已經明了,嗯,就是“依據”多了一個。
2 條件求和,完敗“Sumif”
操作目的
博主愣是沒有找到案例,於是拿上邊的例子“硬造”了一個每個人的收入信息,至於是什么收入,天曉得,隨機來的…
目的是求每戶的總收入。
操作步驟
1、數據加載到PQ,依然是【開始】—【分組依據】,依據依然是“戶號”,不過這波操作換成了“求和”,對,就是對“收入”求和。依然需要提醒的是注意叉掉PQ對長數字串的“自作主張”。
2、就這么簡單,還想多扯幾千字呢,可是,這波操作確確實實已經輕輕松松的完了。
想體驗一下十萬級數據的處理速度,你得先有十萬級的數據,造起來怪辛苦的,博主這里貼心提供實驗材料:
鏈接:https://pan.baidu.com/s/1nsbUvqFi8cGsqISLON0EiQ 密碼:de78