1.概述
為什么要寫這系列文章?
商業數據分析的根本目的就是要洞察數據背后的規律,基於此,企業可以制訂決策、並采取相應措施和行動,進而達成想要的結果。這是商業數據分析的最大價值所在。
那么如何才能洞察數據背后的規律,以給企業的決策提供支撐呢?
著名的咨詢公司Gartner於2013年總結、歸納、提煉出一套數據分析的框架,個人認為可以很好地回答上述問題,特此分享給大家。

如上圖所示,Gartner把數據分析分為四個層次,分別是:
- 描述性分析(Descriptive Analysis)
- 診斷性分析(Diagnostic Analysis)
- 預測性分析(Predictive Analysis)
- 處方性分析(Prescriptive Analysis)
1.2 數據分析的四個層次介紹
下面對這四個層次的分析方法分別進行介紹
(1)描述性分析-發生了什么?
故名思義,該層次主要是對已經發生的事實用數據做出准確的描述。比如某企業本月訂單簽約額比上月增加100萬,至1100萬,但是訂單履約率從上月的98%下降到了95%,庫存周轉率從上月的0.8下降到了0.7。
(2)診斷性分析-為什么會發生?
知道到底發生了什么,對我們的幫助不大,更重要的是,我們要明白為什么發生。比如經過分析,發現上文提到的訂單履約率下降的原因是成品生產不出來,無法完成交付。而成品生成不出來的原因則是部分原材料的供應商未能按時送貨,導致原材料不齊套,無法開始生產。
(3)預測性分析-什么可能會發生?
基於上述兩個層次的分析,我們發現了其中的規律,即原材料供應商的送貨及時率會影響成品訂單的履約率。假如上月某原材料供應商A送貨及時率只有70%,通過建模,我們可以預測本月該供應商會使我們的訂單履約率下降2%。
(4)處方性分析-該做些什么?
有了預測性分析的結果后,我們無需再做事后諸葛亮,而可以運籌帷幄,在事前就采取措施。上例中,供應商A會導致本月我們的訂單履約率下降,我們可能采取的措施就是把A換掉,但是現在有B和C兩個供應商供我們選擇,該選擇哪個呢?通過分析和計算得出:選用供應商B會比選C的訂單履約率高1%,因此建議選擇供應商B。這就是處方性分析。
1.3 總結
從上文可以看出,該數據分析的框架邏輯非常清晰,四個層次層層遞進,經過這四個層次的分析以后,可以對企業的決策和行動提供有力支撐。
本篇文章是這個系列的開篇,主要說明該數據分析框架每一個層次具體是什么,他們之間的關系如何。后面的文章將會對每一個層次的工具和方法進行詳細介紹,解決如何做的問題,下一篇文章將聚焦於描述性分析。
2. 描述性分析(Descriptive Analysis)
2.1方法
2.1.1 了解業務場景
如果想通過數據發現和回答『發生了什么』的問題,第一步並不是急急忙忙的直接去分析數據,而是首先要了解和還原數據產生的業務場景,包括:數據涉及到的部門和崗位有哪些,這些部門和崗位之間的業務流程是怎么樣的,在不同業務流程中有哪些輸入,對數據做了什么處理,又是如何輸出和傳遞給下游部門的。如果不了解業務場景就去做數據分析,就如同盲人摸象,因此這一步至關重要。
2.1.2 探索性分析
探索性分析又細分為以下三個步驟:
(1)提問,理順初步分析思路和目標
在了解清楚數據產生的業務場景后,可試着問自己一些what happened的問題。比如,本月銷售額是多少?環比和同比變化分別是多少?本財年銷售的變化趨勢是怎么樣的?通過相應問題,可以理順初步的分析思路和分析目標。另外,在上一步了解業務背景的時候,也要注意和相關業務的關鍵干系人溝通,獲取他們想知道的what happened的問題有哪些。
需要注意的是,這里說的是初步的分析思路和目標,因為在隨后做分析的時候,新的靈感可能會被不斷激發,分析的思路和目標也在不斷調整,這是一個循環往復的過程。
(2)收集數據
有了初步的分析思路和目標以后,就可以確定需要收集哪些數據了。比如上文提到的銷售額分析可能用到的數據為銷售訂單數據、銷售開票數據。
(3)選擇相應分析方法
根據分析的思路和目標,就可以對收集到的數據選擇相應的分析方法了。具體的方法包括:
對數據位置的探索,包括:最大值、最小值、均值、中位數、分位數等
對數據分布的探索,包括:偏差、方差、標准差、莖葉圖、直方圖、箱形圖(也叫盒須圖)、密度圖等
對數據趨勢的探索,包括:同比、環比、趨勢圖、條形圖等
對數據聚合的探索,包括:排序、篩選、計數、重復項、分組、求和、比例、條形圖、餅圖等
2.1.3 提煉指標
對數據做探索性分析后,可對數據反映的事實有一個直觀的感受,比如,通過分析一個倉庫的月度收發存數據,可以大概知道這個倉庫的貨物周轉情況。但是要想更准確、簡潔地描述發生了什么,還應該提出更高的要求:即總結和提煉出相應指標。比如描述庫存周轉的整體情況,庫存周轉率、庫存周轉天數等指標更有效。這些指標可以做為企業日常經營管理的KPI,讓相關人員快速、准確地了解到企業當前的經營情況。
2.2 工具
2.2.1 個人使用
描述性分析中最常用的工具就是Excel,但是隨着商業環境中產生數據的增多,Excel的運行效率變得相對低下,並且Excel主要側重於表格中的數字分析,但是因為人類對圖形的敏感度和理解力天生就比數字高,正所謂一圖勝千言,因此近年來可視化分析工具逐漸流行起來,此類工具主要是通過圖形去對數據產生洞見,發現其中的規律,而不僅僅是用做結果的展示。Tableau就是其中的佼佼者。其上手比較容易,很多功能設計的也比較便捷和人性化,運行效率較高(10萬行以上的數據Tableau較Excel有明顯優勢),輸出的可視化圖表也很美觀,可直接用在數據分析報告里(Excel默認輸出的圖表都很丑,后期還需要做不少調整和美化,才能放到數據分析報告里)
Tableau是商業軟件,不過提供免費版本Tableau Public使用,但是此版本存在諸多限制。大家可用郵箱免費注冊旁聽Coursera上的這門課程:《使用 Tableau 展示可視化數據》,注冊以后會收到有效期半年的Tableau Desktop的序列號。
2.2.2 企業使用
對企業來說,描述性分析的工具主要是報表和BI。
報表一般是嵌入至各專業系統中,如CRM、SRM、ERP、WMS、MES等。
BI一般是單獨的系統,其從各專業系統中抽取數據,經過處理后,通過表格或圖形展示出來。Gartner 2017年企業級BI系統的魔力象限如下圖所示,大家可以看到Tableau也是這一市場的領導者(產品為Tableau Server、Tableau Online、Tableau Mobile),Tableau之所以能超越一眾傳統強大的BI產品(如Oracle的BIEE,IBM的Cognos,SAP的BO)成為市場的領導者,主要原因是,商業智能分析平台市場的主流已經從IT部門主導的靜態展示分析轉向業務部門主導的動態探索分析,這樣才能激發員工的主動性和創造力。
在報表和BI的基礎之上,可增加預警系統,如對異常的指標進行郵件或微信預警,讓領導僅對這些指標進行關注,而無需把所有的指標都看一遍,以節省時間,提高效率,有必要時再查看相應報表或BI展示,這也是企業描述性分析的應用方式之一。
本篇向大家簡要介紹了描述性分析的方法和工具,涉及到的知識主要是統計學的內容,這部分知識需要大家自行找相關書籍進行補充閱讀,下一篇將向大家介紹診斷性分析和預測性分析。
3.診斷性分析(Diagnostic Analysis)& 預測性分析 (Predictive Analysis)
上一篇文章向大家介紹了描述性分析的方法和工具,基於此,可以明確到底發生了什么,但是更重要的是明確為什么發生以及未來會發生什么,這就是診斷性分析(Diagnostic Analysis)和預測性分析(Predictive Analysis)的作用。
在診斷性分析中,首先需要知道和結果可能相關的因素(在數據分析里,這些因素被稱為特征)有哪些,這個過程一方面依賴於我們對業務的了解程度,另外也要多和業務人員進行頭腦風暴,只要是可能相關的,都納入考慮,也可以基於現有特征構造新特征,至於是否相關可在后面的分析中進行驗證。
比如和汽車油耗可能相關的特征包括:車重、排量、軸距、變速箱類型(手動、自動)、驅動方式(兩驅、四驅)等。
3.2.相關性分析(Correlation Analysis)
列出和結果可能相關的特征后,下一步就是要驗證這些特征和結果到底是否相關。具體方法包括:
3.2.1 定性分析
(1)二維散點圖
若分析的僅是一個特征與結果的相關性,則可以通過畫二者的二維散點圖進行分析,通過圖形描述,可以初步且直觀判斷二者的存在何種相關關系:正相關、負相關、無關;如果相關的話,是線性相關還是非線性相關(拋物線、指數等)。下圖為不同性別年齡與身高關系的散點圖,可以看出在青少年時期,這二者是呈線性正相關的。

(2)矩陣散點圖
在現實中,僅有一個特征與結果相關的情況是少之又少的,大部分情況都是存在多個與結果相關的特征,此時需要矩陣散點圖進行分析。矩陣散點圖樣式如下:

其實質就是針對每一個特征與結果分別做二維散點圖,以分析其相關性。當然,在矩陣散點圖上也可分析特征與特征之間是否有相關性,專業上稱呼為多重共線性,多元線性回歸要求模型中的特征數據不能存在有多重共線性,否則模型的可信度將大打折扣,此時需要排除部分特征消除共線性才能建模。
3.2.2 定量分析
上述的散點圖分析僅能通過圖形看出特征與結果的大致關系,即定性分析;但是無法對它們的關系做精確性描述,即定量分析;定量分析主要分為如下兩個步驟:
3.2.2.1 特征選擇
當我們列出可能和結果有關的多個特征,並通過散點圖獲得大致的直觀認知后,還需要更精確的判斷到底哪個特征與結果的相關性更高,為了降低計算的復雜度,我們應該只把那些最相關或者最重要的特征放到模型中,主要的方法有兩種:
單變量特征選擇方法:常用的手段有計算皮爾遜系數(即相關系數)和互信息系數,相關系數只能衡量線性相關性而互信息系數能夠很好地度量各種相關性,但是計算相對復雜一些,不過很多toolkit里邊都包含了這個工具(如sklearn的MINE),得到相關性之后就可以排序選擇特征了;
基於模型的特征選擇方法:部分模型本身在訓練過程中就會對特征進行排序,如邏輯回歸、決策樹、隨機森林等;
特征選擇不僅有助於簡化計算,還可以幫助我們對特征與結果的關系有更好的理解。
3.2.2.2 模型建立
(1)回歸(Regression)
若結果為連續值,則應用的模型為回歸模型,包括:
a. 一元線性回歸(Linear Regression)
若僅有一個特征與結果相關,並且其是呈線性關系的,則可以進行一元線性回歸,即建立回歸模型y=a+bx計算出截距a和斜率b,x為特征(自變量),y為結果(因變量);
b. 多元線性回歸
上文中已經提到,在現實生活中,僅單個特征與結果相關的情況是不多見的,大多數都是多特征共同作用導致的結果。若通過矩陣散點圖判斷,各特征無多重共線性,且與結果呈線性關系,則可以進行多元線性回歸分析,建立回歸模型y=a+b1x1+b2x2+...+bnxn;
c. 非線性回歸(Non-Linear Regression)
如果回歸模型的因變量是自變量的一次以上函數形式,回歸規律在圖形上表現為形態各異的各種曲線,稱為非線性回歸。常見的非線性回歸模型包括:雙曲線模型、冪函數模型、指數函數模型、對數函數模型、多項式模型等;
那么如何獲得上述的回歸模型呢?常用的回歸算法包括:最小二乘法、支持向量機(SVM)、GBRT、神經網絡等。
(2)分類(Classification)
若結果為離散值,則應用的模型為分類模型。比如人的年收入、日平均運動時間、日平均睡眠時間與人的壽命的相關關系是回歸模型;而人的年收入、日平均運動時間、日平均睡眠時間與人健康與否(健康或者不健康)的相關關系則是分類模型。
常用的分類算法包括:決策樹、邏輯回歸、隨機森林、朴素貝葉斯等。
3.2.2.3 監督式學習(Supervised Learning)
上述回歸模型和分類模型均是機器學習的監督式學習模型,它主要指通過學習歷史的真實數據,找到其中的規律(即模型),並假設「歷史總是驚人的相似」「太陽底下沒有新鮮事」,通過找到的模型對未來進行預測。這一種學習方式相當於既包括了診斷性分析,也包括了預測性分析。但是,通過歷史數據找到真正的規律是比較難的。在現實生活中大家應該都有這種感覺,回顧過去好像清清楚楚,但是展望未來時又是一片迷茫。這是因為實踐和未來才是檢驗規律的唯一標准,但是在未來還沒有發生的情況下,檢驗只能依靠歷史的數據,這樣非常容易出現機器學習中常說的過擬合和欠擬合的問題。如何評估機器學習模型的效果,避免過擬合和欠擬合的問題,找到那個真正的規律,業界提出了很多的方法,限於篇幅的原因,只能在其他文章中下回分解了。
3.3 因果性分析
診斷性分析的隱含意思就是,要找到事物的因果關系,即因果性分析。所謂因果性,假設X是因,Y是果,則只要X出現,必然會導致Y的發生,其是百分之百的概率。
雖然我們在上文中介紹了相關性分析,但是需要特別注意的是,相關性分析並不等同於因果性分析,相關性分析可達不到百分之百的概率。比如,雖然收入與個人的健康有很大的關系,因為收入高的人可以享受更好的物質和醫療,但是並不意味着有錢人就一定健康,現在有錢人英年早逝的新聞經常見諸報端,因此我們只能說收入與健康是呈相關性,而非因果性。關於看似相關但是其實一點關系也沒有的例子大家可以參見這個網頁:http://www.tylervigen.com/spurious-correlations
但是,在現實世界中,很多事務的因果性是很難被證實的,因為其追求的是百分之百的概率,一點差錯、一個反例都不能出。「吸煙有害健康」這句話聽了很多年,現在聽起來貌似這兩者之間存在因果性,但是其實它們也是相關性,只不過是強相關性。因為要證明所有吸煙的人健康都受到了影響,這件事是很難的。
所以,回過頭來,做診斷性分析時,我們依然要從相關性分析出發,並結合相關領域的知識,通過邏輯推理,對分析的結果進行合理解釋。因此,在使用機器學習的模型時,也要注意其可解釋性。
另外,在大數據時代,我們看問題和分析問題時,也要轉換自己的思路,從以往的尋找確定的因果性改為尋找強相關性。
最后,這里要特別推薦著名計算機科學家吳軍博士所著的《智能時代》,對本節內容解釋的更精彩,推薦大家閱讀。
4.處方式分析(Prescriptive Analysis)
4.1 什么是處方式分析?
本系列前面三篇文章分別向大家介紹了描述性分析、診斷性分析和預測性分析,這三種分析方式有點像就醫時的檢查和診斷階段,在此階段確定病因之后,可以預估出病情可能的發展方向,而處方式分析,就是要根據前面的分析結果開具相應處方,到底是該吃葯,還是該輸液,甚至是做手術。商業領域中的處方式分析與此類似,只是其給出的是相應商業問題的解決方案和行動建議(這也是處方式分析區別於其他三種分析方式最主要的特征)。處方式分析回答的問題是:為了解決這個問題,我們該做些什么?或者說,為了達到某個目標,我們該朝哪個方向努力?
4.2 如何進行處方式分析?
那么如何通過處方式分析給出相應問題的解決方案和行動建議呢?
首先,還是要進行描述性分析。通過描述性分析明確現狀和問題,及業務人員和管理人員的需求,這樣才能做到有的放矢。
其次,進行診斷性分析,尋找和當前問題相關的特征,並對其進行建模。
上述兩個步驟在前面的文章中已經做了詳細介紹。
最后,根據不同的業務場景和需求,給出具體的解決方案和行動建議。具體方法又分為以下三種:
(1)預測性分析
有一些情況,僅僅使用診斷性分析和預測性分析的模型,即可以給出建議,比如銀行可根據申請人的基本信息,包括學歷、收入、是否有車、是否有住房、存款金額、是否有違約記錄等,去建立模型預測其信用違約的風險有多大,進而給出建議是否要給這個申請人發放信用卡,如果要發放,信用卡的額度又該是多少。
(2)仿真(Simulation)
仿真就是通過建模模擬真實世界的系統或流程,並通過不同的輸入參數或條件查看其對結果的影響,據此制訂相應決策。仿真在各行各業已經有廣泛的應用,比如軍事上初級的沙盤推演、中級的電腦模擬對抗、高級的實戰演習,都是仿真。再比如飛機設計時初級的軟件CFD(計算流體力學)仿真、中級的風洞實驗、高級的試飛,也是仿真。當然,越高級的仿真付出的成本就越高,所以在商業環境中,主要是通過在電腦上做數學建模仿真,進而根據仿真結果給出相應的解決方案和行動建議。比如企業的成本支出和客戶服務水平是一個兩難問題,往往成本的削減意味着客戶服務水平的下降,那如果說企業要制訂年度成本削減目標,通過仿真發現成本降低5%,但是客戶服務水平僅下降1%,屬於可接受范圍,但是當成本降低10%時,客戶服務水平下降達6%,可能對公司的經營、商譽等產生重大影響,則此時成本降低5%是相對合適的,而10%就不是那么合適了。
(3)最優化( Optimization)
最優化是應用數學的一個分支,主要指在一定限制條件下,選取某種研究方案使目標達到最優的一種方法。最優化問題在當今的軍事、工程、管理、商業等領域有着極其廣泛的應用。比如,企業都希望利潤盡量高,那如何在現實的約束條件下,達到上述目標就是一個普遍的最優化問題。最優化常用的方法為線性規划、非線性規划、凸優化、整數規划、網絡流優化(物流、電網、通訊網絡應用)等。
4.3 處方式分析的其他特點
醫生開出相應處方后,都會告訴病人按期進行診后復查,目的就是檢驗處方的效果,如果處方收效甚微,則需要盡快調整方向,確定新的處方。因此處方式分析除了會給出行動建議外,另一大特點就是需要有一個反饋系統可以收集采取相應行動后的結果數據,以驗證行動建議的有效性,若效果不佳,則需要調整,給出新的可行性建議,這個過程會不斷循環迭代,直至達到預期目標。一個優秀的處方式數據分析系統,迭代過程應該是無須人工干預、智能自動完成的,這也是目前機器學習和人工智能方法的最大優勢。
處方式分析是數據分析方法的最高階形態,也是在商業環境中對企業最有用、產生價值最大的方法,因此希望大家未來不管是在做數據分析時,還是在設計數據產品時,都能以此為目標,我們一起共勉。
下一篇文章將以一個完整的例子,向大家介紹這四種分析方法的綜合運用。
前面已經通過四篇文章詳細介紹了商業數據分析的四個層次,本篇將通過一個示例將這四個層次串聯起來。
5.1 背景
PAS是一家銷售企業管理軟件的公司,雖然整個行業欣欣向榮,但是這家公司的業務卻陷入泥沼,銷售額連續八個季度出現下滑。為了扭轉此局面,PAS花重金招聘了過往銷售業績極為出色的老李擔任CSO(Chief Sales Officer),直接向CEO匯報。
上任伊始,老李為了摸清情況,召集銷售、產品、售前、人事、市場部門一起開了一個溝通會議,沒想到這個會議變成了吐槽大會。
銷售部門報怨人事部門給的候選人素質不高,經驗太少。人事反擊說是你們管理不善,有經驗的老員工頻繁離職,新入職的員工培訓不夠,不能快速成長。銷售又抱怨公司產品功能不完善,在市場上的競爭力不足。而產品則回懟,已上線項目的客戶反應良好,是你們銷售能力不行。還有銷售抱怨售前顧問不給力或者支持力度不夠,還說市場部門組織的活動效果太差,獲得的銷售線索太少等等,不一而足。

在思路不暢、需要靈感時,老李喜歡到星巴克坐坐。在公司附近的星巴克,老李看到一個年青人正在寫商業計划書,於是找這個年青人攀談起來。原來這個青年叫小白,畢業於斯坦福。小白學成歸來打算回國創立自己的商業數據分析公司,並且向老李介紹了數據分析在商業決策中的作用和案例,尤其是描述性分析、診斷性分析、預測性分析和處方式分析這四個層次和所用的具體方法。聽完之后,老李覺得或許在PAS的事情上小白可以提供幫助,於是向小白介紹了自己面臨的困境,並希望接下來在改造銷售團隊和提升銷售業績的過程中小白能通過數據分析的方法提供有力支撐,當然他也想考校下小白,看他說的數據分析方法是不是有那么神奇。公司還沒創立就接到了第一單生意,遇到這種好事小白欣然答應。
5.2 描述性分析
在進入PAS公司后,小白先對公司的業務現狀和數據情況做了初步調研。PAS公司上線了CRM、ERP、HR等系統,針對商機、合同、付款、客戶、價格、銷售員的入職時間、接受過的培訓等信息都是有詳細記錄的,這就為后續的數據分析工作打下了堅實的基礎。
在做描述性分析時,最重要的是結構化思維,即要把分析的問題或指標進行逐層結構化分解,直到無法分解為止。
比如,總體銷售收入=銷售漏斗中所有銷售機會的數量 * 每個銷售機會的交易金額 * 勝率
而每個銷售機會的交易金額=每個銷售機會包含的產品 * 每個產品包含的模塊數量 * 每個模塊的平均單價;
根據上述思路,小白首先對去年銷售員整體的業績情況做了分析:總體銷售指標為 1億2000萬,已簽單 1個億,指標達成了83%,目前有100個銷售員,平均每個銷售員的簽單金額為100萬,這樣看起來貌似還不錯。但是再看下一項數據就會發現比較大的問題,僅有20%的銷售員完成了銷售指標。

通過查看去年銷售員簽單金額分布,這個問題體現的更明顯。銷售業績主要是靠幾個明星銷售員來達成的。

再看去年整體銷售漏斗的表現,整體銷售漏斗金額高達5億,而每個銷售員平均的漏斗金額有500萬,但是平均簽單金額僅有100萬,也就是說勝率僅為20%;另外,去年已完結的交易數量為1000,而銷售員平均完成交易數量僅為10個,數量偏少;同樣,平均的交易金額僅為10萬,平均客戶價值僅為20萬,在企業管理軟件行業,這兩個數字都是偏小的。

接着分析新老客戶平均交易金額及勝率,可以看出新客戶雖然單子大,但是贏單的概率較低;反之,老客戶雖然單子小,但是勝率很高。




經過初步的描述性分析,小白對現有CRM、ERP、HR、售后、市場等5大系統或數據源中的數據做了梳理,共137個變量或KPI。如此之多的變量想通過傳統的數據分析方法分析是很困難的(如通過散點圖分析這些變量與銷售業績的相關性),只能使用機器學習的技術;通過此項技術,可計算出不同變量(機器學習稱為特征)對結果值(即銷售業績)的影響到底有多大;具體結果如下:


根據上圖把銷售業績分為三類:平庸,中等和優秀;
其中平庸為業績完成不到50%的;中等為業績完成50%-99%的;優秀為業績完成100%的;
下圖可以看到優秀組和平庸組在這12個關鍵KPI的差異:

可以看到,對業績影響最大的變量為銷售員銷售的產品種類:業績優秀的銷售員,是所有產品都銷售的;而業績平庸的銷售員,則只銷售自己熟悉的產品;
其次,業績優秀的銷售員,和合作伙伴的關系很緊密,銷售線索可能來自於合作伙伴,甚至合同都是與合作伙伴聯合與客戶簽訂;而業績平庸的銷售員,只依賴於公司內部市場部提供的銷售線索;
第三重要的是平均合同金額。業績優秀的銷售員合同金額是平庸的銷售員的2倍多;而較大的合同金額通常是因為每個合同銷售的產品更多;
第四重要的是銷售漏斗金額與銷售指標的比率。業績優秀的銷售員會在全年保持穩定的銷售機會創造率,其每月創造的銷售漏斗金額是平庸銷售員的3倍;
5.4 預測性分析
再細致分析不同銷售人員這12個變量表現:

通過上圖可以看出,尺有所短,寸有所長。比如,85號銷售員看起來大部分變量都處於平均水平或之下,但是其也有閃光點,這些人里只有他每季度創造的銷售機會超過平均水平,那其他人就可以向他學習如何提升這一點。
上圖雖然可看出不同銷售員在單個變量的表現,但是很難據此直接判斷出其未來是否能完成業績指標。如果可以做到這點,就可以把可能不達標的人提前找出來,進而給予其必要的幫助。這里就需要用到預測性分析,通過建立預測性模型,根據其關鍵KPI的表現情況,即可以預測其業績達標情況。小白根據歷史數據訓練出的預測模型,預測的准確率已經達到了95%。
5.5 處方式分析
預測模型完成后,即開始發揮作用。根據模型預測,剛入職一年的銷售員小王很難完成今年的業績指標。雖然其很努力,每月創造的銷售機會比均值高不少,銷售漏斗金額與銷售指標的比率也OK,但是在部分關鍵指標表現不佳:

另外,看起來他不怎么和合作伙伴一起合作,公司平均60%的合同是和合作伙伴一起打單打下來的,而他的比率是0;而有合作伙伴參與的訂單金額是沒有合作伙伴參與的訂單金額的6倍,勝率也更高。
因此,小王的直屬主管找他溝通后,建議他着重提升合同的金額,並給出了以下改進措施:
首先,主管給到小王負責區域的合作伙伴名單,以及以往公司與每個伙伴簽署的平均金額,小王需要更積極地聯系合作伙伴。
其次,建議小王要提升捆綁銷售軟件的數量,公司平均有40%的軟件都是捆綁銷售出去的。主管給了小王捆綁銷售占比較高的產品清單,以及在與合作伙伴和捆綁銷售做的好的同事名單,要求小王找他們多溝通,看他們是如何做到的。
5.6 尾聲
經過一年的時間,PAS公司的業績得到了明顯的提升:


至此,本系列文章就完結了,希望能幫助大家通過該系列了解數據分析在商業決策中的作用,並能在實際的商業決策中有意識的使用數據分析方法提升決策的效率和質量
參考文檔:
商業數據分析的四個層次(二) 描述性分析(Descriptive Analysis)
商業數據分析的四個層次(三) 診斷性分析(Diagnostic Analysis)& 預測性分析 (Predictive Analysis)
商業數據分析的四個層次(四) 處方式分析(Prescriptive Analysis)