大數據時代,做數據分析報告,如何對數據進行分析顯得尤為重要,那么數據分析該如何進行呢?這里列出了我個人工作中的一些經驗總結,可能針對不同的報告場景有所不同。
了解需求背景
在進行真正的數據分析操作之前,要首先了解該需求的背景,為什么要做數據分析,數據分析的目的是什么,只有弄清楚了這兩個問題,才能接着往下一步走,正所謂“師出有名”也正是這個道理。
確定需求數據的來源
分析需求涉及到的維度和指標,以及這些維度和指標數據來源的庫表,並且分析以公司當前庫表的數據,能否支持該需求進行(上鑽/下鑽)數據分析。
需求數據采集
所謂的數據采集,其實就是收集被確定為數據需求的維度和指標信息的過程。如何獲取數據,即獲取數據的關聯方式(內關聯/外關聯),要遵循一些原則:准確性,代表性,可靠性等,原則的遵循重點是為了保證后續相關決策的可靠性。
需求數據的處理
數據的處理,也可以說成是數據清洗,即數據類型轉換和數據精度的處理,是數據的一種規范化,把收集到的數據進行組織,按需求要求重新構建數據的過程。
數據分析
也稱之為數據建模,完成以上步驟之后,結合業務現實做定性分析,對數據進行描述性分析,盡可能建立科學准確的數據模型,使數據可置信。
數據可視化
按照要求,將數據分析的結果進行報告輸出,所謂的可視化簡單來說就是以圖表的方式展示出來,讓用戶更直觀的接受理解你的分析結果
數據分析結論
通過數據分析,你得到了什么樣的結論,今后的措施,或者說是改進方案是什么。
備注:數據分析時,數據采集的方案,sql優化和資源利用,決定着該需求分析的時間成本的投入。