有些面試候選人雖然有相關的工作經歷或者實習經驗,但是因為在工作中沒有自己的思考,在面試中並沒有給自己加分。只有用心思考如何利用數據為公司創造價值並付諸實踐,才是一個好的數據分析師應該做的。
一、數據人員如何創造價值
隨着大數據的發展,公司的數據庫中存儲着大量的數據,這些數據大多是公司內部技術人員通過埋點獲取的,也有些是通過第三方機構獲取的。如何充分利用這些數據,創造價值,推動公司的發展,是數據分析師所應該思考的。
作為數據分析師,經常被問到的問題是“XXX 數據最近上升/下降了,是什么原因造成的?” “新上線的功能給業務帶來的是正面影響還是負面影響”“對於 XXX,我們需要制定什么樣的策略,完成 KPI/OKR? ”……解決業務方的問題,並提出建設性意見,就體現出了數據分析師的價值。
面對數據庫中的海量數據,數據分析師首先要做的就是構建合理的指標體系或者模型,合理地“整理”這些數據。指標體系可以分成兩個部分——通用的規則和針對具體業務的特定規則;模型則包含了比較多的類型,如業務模型、數據挖掘模型等。在構建好合理的指標體系或者模型后,接下來就可以通過報表或者數據看板的方式,對數據進行監控,並且制定相應的監控規則,根據監控結果實時調整策略。有了合理的監控規則和監控結果,下一步要做的就是將獲取到的內容進行整合,輸出完整的分析報告,或者調整相應的策略,繼續追蹤調整后的效果,真正指導業務的發展。
總結起來,就是:
- 基於歷史數據和業務背景構建指標體系或者模型。
- 基於指標體系,監控線上業務數據並制定相應的監控規則。
- 輸出數據分析報告或者提供可執行策略,推動業務的發展。
二、完整的指標體系構建
在數據分析師的工作中,針對“xxxApp 或 xxx 功能模塊最近的用戶量或者其他相關指標下降了,你會如何進行分析”等問題,最直接的解決方法就是建立完整的指標體系。通過指標體系,能夠很直觀地發現問題所在,並且可以針對問題采取相應的措施。
Q :要構建一套指標體系,整體思路是什么?
構建指標體系應該“縱向”和“橫向”相結合,縱向指的是梳理出分析問題的整個流程,比如對於電商產品,需要分析出用戶從進入網站到最終下單的整個流程;對於工具類產品,則需要關注用戶使用過程中的體驗以及用戶流失情況。有了縱向分析的過程,還需要橫向拓展不同的維度,如基於用戶畫像的人群分類、根據不同業務背景的時間拓展以及業務線的划分。最后將縱向和橫向的結果相結合,就得到了一套完整的指標體系。
Q:用戶行為的核心節點有哪些?如何有針對性地設計指標?
了解用戶行為的核心節點,實際上就是縱向分析的過程。互聯網公司大多針對 C 端用戶進行分析,這里就以 C 端用戶為例進行介紹。對於 C 端用戶,核心的三個節點是新增、活躍、留存/流失,大多數分析都是圍繞這三個節點逬行的,整個流程如圖 5-1 所示。
可以看到,針對新增、活躍、留存/流失這些節點,可以縱向設計出很多指標,但主要是絕對數量和百分比。
- 對於新增用戶,指標有新增用戶數量、新增用戶留存率、新增用戶活躍率等。
- 對於活躍用戶,指標有活躍用戶數量、活躍用戶中的新增用戶數量、活躍用戶中 的老用戶數量等。
- 對於老用戶,指標有老用戶螭、老用戶老用戶喚醒率等。
- 對於流失用戶,指標有流失用戶數量、流失用戶與新增用戶比率等。
這樣就可以針對用戶的整體行為節點進行比較完整的指標設計,其中活躍用戶部分是需要重點關注的,通過對從新增到流失整個流程指標的構建,可以清晰地看出在哪個環節最終活躍用戶數增加了或者減少了。
Q:對於活躍用戶,應該如何進行相應的指標設計及路徑分析?
對於活躍用戶,要研究其活躍行為,從而提高用戶的體驗。針對不同類型的產品,需要進行相應的細分設計。比如對於電商產品,需要關注的是從來訪用戶到用戶最終成功支付的整個流程,如圖 5-2 所示。

可以看到,針對這個流程的每一步都可以統計出相應的用戶數量以及上一步的轉化率,比如來訪用戶數量、點擊用戶數量、加入購物車用戶數量、下單用戶數量、支付用戶數量、最終成功支付用戶數量,以及各種轉化率,如點擊/曝光轉化率、下單/點擊轉化率、下單/加購轉化率、支付/下單轉化率、成功支付/支付轉化率。這些指標就構成了一個完整的縱向指標體系,通過這些指標可以清晰地看出哪個環節存在問題。
對於電商產品,除了要關心用戶數量,金額也是要關心的指標。從加購開始,每個環節在用戶數量的基礎上都需要增加金額指標以及相應的客單價指標。
以上是對電商產品活躍用戶的縱向分析。下面再舉一個短視頻的例子。對於短視頻, 需要分為視頻的觀看者和視頻的發布者兩個獨立的用戶群體進行分析。對於視頻的觀看者,需要考慮的是各種行為數據,相對路徑比較短,如圖 5-3 所示。
針對用戶的這些行為設計相關的指標,比如觀看視頻的數量、整體時長、點贊視頻占比、評論視頻占比等,這些指標刻畫了用戶觀看視頻的體驗情況。
對於視頻的發布者,則需要關注整個流程,看在某個環節的轉化上是否存在問題,造成發布的視頻數量減少,如圖 5-4 所示。

以上就是構建指標體系的縱向部分,其中包括了用戶從新增到流失/留存的整個流程,這是比較通用的指標體系建立方法。同時針對一些產品的活躍用戶逬行了分析。大 家在面試前需要對所要應聘部門的業務有所了解,梳理出產品中用戶的生命周期以及活 躍用戶的行為情況。
Q:有了明確的用戶行為路徑及相關指標后,如何進一步分析?
除了縱向分析,還需要橫向分析,橫向分析是指對於同一個指標,基於不同的維度進行相應的拓展,常用的維度包括時間維度和用戶維度。
Q:針對時間維度的分析,需要注意的點有哪些?
對於時間維度,常用的分析方法是關注最近一段時間的數據,時間的長短要根據業務的具體特性來確定。對於一些高頻的 App 或者功能,通常關注最近 1~ 7 天的整體數據情況即可,也可以是自然周。對於一些相對低頻的 App 或者功能,則需要將時間拉長,關注最近 15 天、30 天、90 天甚至更長時間的整體數據,也可以是自然月、季度甚至自然年。
另外,與時間維度相關的有同比和環比的概念。因為單純地關注一段時間的數據並 不能很好地看出趨勢情況,需要與之前的數據逬行對比。對於同比和環比的概念,在實際應用中不需要逬行很明確的划分。常用的對比方法是對比當日與上日、本周與上周、本月與上月的數據。對於一些周期性比較強的產品,則需要先確定產品的周期,比如有些產品會受到周末的影響,此時比較合理的對比方法是用本日的數據與上周同一日的數 據進行對比;有些產品會受到大型節假日的影響,此時針對節假日數據,就需要與上一個大型節假日的數據進行對比。
對於一些對實時性要求高的產品,需要將數據指標細化到小時級別。處理后的時間維度分析方法如圖 5-5 所示。

除了時間維度,還有一種常用的拓展方法,就是基於用戶畫像的用戶維度進行拓展。用戶畫像是互聯網公司中常用到的分析工具,通過用戶畫像可以有效了解各個群體的行為情況,也可以基於用戶畫像拓展出相應的指標。
Q:列舉常用的用戶維度拓展方法。
有很多通用的用戶維度拓展方法,比如對於用戶所在地,可以分為城市、省份,甚 至華東、華南等大區;對於用戶的基本屬性,可以分為年齡、性別、職業等;對於用戶使用的設備情況,可以分為終端類型、客戶端版本、廠商、機型等;對於新老用戶,也可以拓展出一些指標。對於新用戶,需要關注的是用戶來源渠道,通常分為自然新增用 戶、活動新增用戶、廣告新增用戶等渠道,通過對渠道的划分,可以在一定程度上避免 一些大型活動對新增用戶分析帶來的影響;對於老用戶,根據用戶的生命周期逬行划分, 通常分為有效用戶、活躍用戶、忠誠用戶、沉睡用戶和流失用戶,可以對產品整體趨勢 有一個清晰的了解。
梳理后的用戶維度拓展方法如圖 5-6 所示。

以上縱向和橫向兩個方向講解了如何構建一套完整的指標體系。在數據分析師崗位面試前,候選人需要對所要面試公司的產品有一定的了解,這樣一方面可以進行有針對性的准備;另一方面也可提前構建起一套指標體系。下面通過問題對前面的內容進行總結
Q: XXX 最近有所下降,如何進行分析?
針對這個問題,需要充分利用前面所講的指標體系,按照如下步驟逬行分析。
(1) 梳理與該問題相關的流程,確定縱向指標體系。比如是支付金額有所下降,就需要梳理:曝光-點擊-下單-支付這樣完整的用戶路徑,以各個環節的轉化率和用戶量為核心指標。
(2) 針對核心指標,確定所要對比的時間維度,比如基於所要分析的產品確定與前一天或者前一周的數據進行對比,發現問題所在。
(3) 確定問題所在的環節后,針對該環節以用戶維度進行拓展,如基本屬性、所在地、設備情況、新老用戶等,確定引起該問題的用戶群體,並針對這部分用戶逬行相應的策略調整。
除了上述問題,對於“新版產品或者某個運營活動上線后,如何評估效果”等問題, 也可以采用相同的方法進行分析,只做微調即可。總結起來,整個思路就是:梳理路徑一 確定對比的指標一選取對比的時間維度-針對問題環節拓展用戶維度。
本節內容總結如圖 5—7 所示。