數據分析的七個步驟


大數據時代,做數據分析報告,如何對數據進行分析顯得尤為重要,那么數據分析該如何進行呢?這里列出了我個人工作中的一些經驗總結,可能針對不同的報告場景有所不同。

 

了解需求背景

在進行真正的數據分析操作之前,要首先了解該需求的背景,為什么要做數據分析,數據分析的目的是什么,只有弄清楚了這兩個問題,才能接着往下一步走,正所謂“師出有名”也正是這個道理。

 

確定需求數據的來源

分析需求涉及到的維度和指標,以及這些維度和指標數據來源的庫表,並且分析以公司當前庫表的數據,能否支持該需求進行(上鑽/下鑽)數據分析。

 

需求數據采集

所謂的數據采集,其實就是收集被確定為數據需求的維度和指標信息的過程。如何獲取數據,即獲取數據的關聯方式(內關聯/外關聯),要遵循一些原則:准確性,代表性,可靠性等,原則的遵循重點是為了保證后續相關決策的可靠性。

 

需求數據的處理

數據的處理,也可以說成是數據清洗,即數據類型轉換和數據精度的處理,是數據的一種規范化,把收集到的數據進行組織,按需求要求重新構建數據的過程。

 

數據分析

也稱之為數據建模,完成以上步驟之后,結合業務現實做定性分析,對數據進行描述性分析,盡可能建立科學准確的數據模型,使數據可置信。

 

數據可視化

按照要求,將數據分析的結果進行報告輸出,所謂的可視化簡單來說就是以圖表的方式展示出來,讓用戶更直觀的接受理解你的分析結果

 

數據分析結論

通過數據分析,你得到了什么樣的結論,今后的措施,或者說是改進方案是什么。

 

備注:數據分析時,數據采集的方案,sql優化和資源利用,決定着該需求分析的時間成本的投入。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM