#-*- coding: utf-8 -*- import pandas as pd catering_sale = '../data/catering_sale.xls' #餐飲數據 data = pd.read_excel(catering_sale, index_col = u'日期') #讀取數據,指定“日期”列為索引列 import matplotlib.pyplot as plt #導入圖像庫 plt.rcParams['font.sans-serif'] = ['SimHei'] #用來正常顯示中文標簽 plt.rcParams['axes.unicode_minus'] = False #用來正常顯示負號 plt.figure() #建立圖像 p = data.boxplot(return_type='dict') #畫箱型圖,直接使用DataFrame的方法,檢測異常值 x = p['fliers'][0].get_xdata() # 'flies'即為異常值的標簽 y = p['fliers'][0].get_ydata() y.sort() #從小到大排序,該方法直接改變原對象 #用annotate添加注釋 #其中有些相近的點,注解會出現重疊,難以看清,需要一些技巧來控制。 #以下參數都是經過調試的,需要具體問題具體調試。 for i in range(len(x)): if i>0: plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.05 -0.8/(y[i]-y[i-1]),y[i])) else: plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.08,y[i])) plt.show() #展示箱線圖