這是簡易數據分析系列的第 1 篇文章。
為什么叫簡易數據分析?
第 1 個原因是本教程面向純小白用戶,不寫代碼不寫公式,邁出數據分析的第一步。
第 2 個原因是生活中很多的數據分析場合,都是很輕量的,不需要上 Python 爬蟲、高並發架構,機器學習等重武器,一個瀏覽器再加一個 Excel 就足夠了:
比如說某門課程論文交稿只有幾天了,急需快速爬取數據進行數據分析,這時候臨陣磨槍學習 Python 爬蟲知識時間完全不夠;
做一些市場調研和運營工作需要對數據進行采集,讓技術部門支持的話,走流程的周期過長,不如擼起袖子自己做;
工作跳槽,想知道市場上的技能要求和薪資分布,需要采集數據並分析市場需求;
…...
這些都是生活中會遇到的問題,面對這些數據量不大(100~10000)的分析需求,非互聯網技術人士去學習一些編程知識其實性價比並不高。我們不如利用手頭最常見的工具——Excel 和 瀏覽器,去分析去梳理數據,輔助進行思考和更好的決策。
這也算本門教程的目的——用 20% 的精力解決 80% 的數據分析需求,解放個人的生產力。
本教程主要會從三個方向上進行延伸:數據采集,數據清洗和數據可視化。
數據采集,就是利用爬蟲軟件從互聯網上爬取想要數據,然后存儲到本地;
數據清洗,就是對收集到的數據做一些格式化的處理,利於后續分析;
數據可視化,就是采用各種各樣分析手法,對數據進行不同維度的解讀,並以圖表這種直觀的形式表現出來,更好的輔助我們決策;
從下一篇文章開始,我們學習如何從互聯網上采集數據。
聯系我
因為文章發在各大平台上,賬號較多不能及時回復評論和私信,有問題可關注公眾號 ——「鹵蛋實驗室」,(或 wx 搜索 egglabs)關注上車防失聯。