數據分析中圖表的選擇


1、折線圖

  作用:適合於隨時間變化的遞增或遞減變量,有規律可循,需要了解某變量在一段時間的趨勢變化,就用折線圖。

  注意:折線圖條數過多不宜放在一張圖內

  具體例子:公司的A商品的年銷售趨勢。

2、柱狀圖

  作用:各類別之間的對比。

  注意:垂直柱狀圖最多12個分類,橫向柱狀圖最多30個分類。分類名過長,選用橫向柱狀圖。

  具體例子:每月降雨量

3、直方圖

  作用:查看各組數據數量分布的情況,用於觀察異常或孤立數據。

  具體例子:

  注意:樣本不少於50個。區別於柱狀圖(柱狀圖是查看每個類別的大小,而直方圖則是查看各組數據數量分布的情況)。

4、散點圖

  作用:查看變量之間的相關性以及相關程度。

  根據樣本數據特征計算出回歸方程。

  具體例子:身高和體重的關系

5、餅狀圖

  作用:顯示分類之間的占比情況,分類個數不宜超過9個。

  注意:占比接近的,不宜使用,可以使用柱狀圖。

  具體例子:A城市少年、青年、壯年、中年、老年人的每月讀書情況占比

6、箱線圖

  核心指標:四分位數。

  將一組數據按從小到大順序排列,等分為4份。

  • 下四分位數:Q1=25%的數據處
  • 上四分位數:Q3=75%的數據處
  • 中位數:Q2
  • IQR=Q3-Q1
  • 下限值=Q1-1.5*IQR
  • 上限值=Q3+1.5*IQR

  注意:上限值不是最大值,下限值也不是最小值。

  作用:

    直觀明了識別數據中的異常值;

    判斷數據的偏態:偏上說明整體水平在中上,區域跨度較大說明數據分布差異較大;

    比較多組數據的分布情況。若只比較一組數據的分布情況,使用直方圖。

  具體例子:各城市的薪資分布情況


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM