最近跟公司的數據分析師打交道比較多,其中一個分析師認為:行業對數據分析師這個崗位的理解有嚴重偏差。
由此產生了一個好奇,行業理解數據分析師是什么?偏差是什么?嚴重偏差的嚴重在哪里?
講真啊,這么大的問題,我一個都答不上來。我就根據自己在工作中,親身遇到數據分析師接的任務來說一下我理解的這個崗位吧。
領導會要求運營人員要多看數,多分析數據,理解數據背后的意義。
然后每天都會接到運營提出的類似這種樣子的任務:XX,最近PC的數據下降的厲害,幫忙分析下是什么原因吧。XX,昨天App的數據降的多,看看是怎么回事。XX,上周移動端上發生什么了?導致我們的新用戶大幅減少。
好吧。這些就是我日常中的一小部分(日常的東西太多了^-^)。其實我部門的數據分析師干的就是這些活:為數據異動找到一個合理的解釋。必須強調:這是我部門的數據分析師。行業的數據分析師是干嘛的,據我所知,每個公司還真不一樣。
要給出一個合理的解釋,其實是挺難的。最難的是提需求方是否能接受分析師給的結論。我部門的好處是:哪怕結論是非常悲觀的,只要合情合理,也能接受。這一點難能可貴。
一些人是不太能接受悲觀解釋的,比如某公司CEO就不太能接受數據分析師給出這種結論:行業用戶規模已經見頂,我們發掘新用戶的成本將大幅上升,且增長將減慢。於是CEO甚至會不看分析過程,直接把結論懟回去:你分析的不對,重新來過。因為他不能接受這種結論。
如果需求方大老板是這種個性,那么數據分析師的任務就變成了:不要分析我提出的觀點對不對,請你負責證明我是對的。哪怕是錯的,也要變着方證明我是對的。
所以數據分析師這個崗位分兩種:
1、分析事情的原因,並給出解釋。
2、證明領導的話是對的。
不管是1還是2,其實做事的方法是一樣的,就是以下步驟循環使用,直到問題被解釋/證明出來。
1、抓重點。
2、往下拆。
我工作中,重點是這么理解的:用最少的動因組合解釋80%以上的異動情況。
往下拆是這么理解的:如果解釋還不能滿足需求,就需要把動因再找個維度,往下拆解一層。然后對拆解的內容繼續抓重點,往下拆。
所以面試中我都會問一個問題:針對XXX情況,請你至少找2個維度來分析這件事。
至於需要掌握的技能嘛,身為互聯網大數據行業,SQL必須要會。大部分傳統行業來面試的,因為SQL不過關被我斃掉了。因為沒耐心教怎么寫SQL,還是要找個來了就直接能寫的才行。工具方面excel肯定要會,matlab、spss等,會1、2個就行,沒有什么特殊要求。計算機語言也得會一個,最好是Python,如果不會Java、C/C++也可以。相比起來,Python更簡單,更好學。計算機語言是作為膠水使用的。把數據庫導出的數據預處理一下,輸入到分析軟件中。數據庫和分析軟件之間的膠水。所以不需要掌握的很好,畢竟不是做工程,只是在分析師的工作電腦上做一個數據格式轉換和基礎的清洗而已。代碼寫的有內存泄露、復用性差,這些都不是問題。
這次成功的把一個前端開發培養成了一個數據分析師,也是很欣慰的。堪稱0基礎手把手教會的經典案例。