bar_chart_race:輕松繪制動態條形圖


楔子

最近在 B 站上看到了一個寶藏 up 主,名叫 "Jannchie見齊",專門做動態條形圖相關的數據可視化。

可以看到做出的效果還是很不錯的,但工具使用的是 JS,不是 Python,於是嘗試搜索了一下,看看 Python 有沒有相關的庫能夠做出動態條形圖相關的效果。幸運的是還真有相關的庫,叫 bar_chart_race,那么下面就來看看相關的用法。

老規矩,使用之前先安裝,直接 pip install bar-chart-race 即可。

使用方法

下面來看看使用方法。

import pandas as pd
import bar_chart_race as bcr

# 如果出現SSL錯誤,則全局取消證書驗證
# import ssl
# ssl._create_default_https_context = ssl._create_unverified_context

# 獲取數據
df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# 生成 GIF 圖像
bcr.bar_chart_race(df, "covid19_horiz.gif")

我們看到代碼非常簡單,就是將數據轉成 pandas 的 DataFrame,然后調用 bar_chart_race 即可生成 GIF 圖像。

整體還是不錯的,然后我們重點來看一下數據:

其中表頭就是 GIF 圖表中 Y 軸的部分,但需要注意的是,我們的圖表是隨時間不斷變化的,所以我們在生成 DataFrame 的時候必須將 date 字段設置為索引。然后數據隨着時間不斷變化,並且條形圖之間會根據數據的大小進行排序。

當然了,以上只是默認生成的,bar_chart_race 里面還有很多的參數,我們來看一下。

動態條形圖變動態柱狀圖

import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
bcr.bar_chart_race(df, "covid19_horiz.gif", orientation='v')

我們看到為了避免文字發生重疊,自動傾斜了,所以還是比較人性化的。

 

排序方式,默認為降序

import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# 設置排序方式
bcr.bar_chart_race(df, "covid19_horiz.gif", sort='asc')

 

條目數限制

import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# 設置最多能顯示的條目數,這里最多顯示 6 條
bcr.bar_chart_race(df, 'covid19_horiz.gif', n_bars=6)

 

設置固定類目

import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# 選取如下 5 個國家的數據
bcr.bar_chart_race(df, 'covid19_horiz.gif', fixed_order=['Iran', 'USA', 'Italy', 'Spain', 'Belgium'])

 

固定數值軸,使其不發生動態變化

import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# 設置數值的最大值,固定數值軸
bcr.bar_chart_race(df, 'covid19_horiz.gif', fixed_max=True)

 

設置圖像幀數,默認 10 幀

import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# 圖像幀數:數值越小,越不流暢;越大,越流暢
bcr.bar_chart_race(df, 'covid19_horiz.gif', steps_per_period=3)

可以看到,動圖變得不流暢了。

 

設置幀率,單位時間默認為 500ms

import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# 設置幀率為 200ms,總共 20 幀
bcr.bar_chart_race(df, 'covid19_horiz.gif', steps_per_period=20, period_length=200)

 

設置每幀增加的標簽時間,默認為 False

import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
bcr.bar_chart_race(df, 'covid19_horiz.gif', interpolate_period=True)

 

繪圖屬性設置

import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# figsize:設置畫布大小,默認 (6, 3.5)
# dpi:圖像分辨率,默認 144
# label_bars:顯示柱狀圖的數值信息,默認為 True;指定為 False 則不顯示;指定為字典,則自定義顯示屬性
# period_label:顯示時間標簽信息,默認為 True;指定為 False 則不顯示;指定為字典,則自定義顯示屬性
# period_fmt:設置日期格式
# title:圖表標題
# title_size:標題字體大小
# shared_fontdict:全局字體屬性,例如 {'family': 'Helvetica', 'weight': 'bold', 'color': 'rebeccapurple'}
bcr.bar_chart_race(df, 'covid19_horiz.gif', figsize=(5, 3), dpi=100, label_bars=False,
                   period_label={'x': .99, 'y': .1, 'ha': 'right', 'color': 'red'},
                   title='COVID-19 Deaths by Country')

 

條形圖屬性,可以設置透明度,邊框等

import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# bar_kwargs:條形圖屬性
bcr.bar_chart_race(df, 'covid19_horiz.gif', bar_kwargs={'alpha': .2, 'ec': 'black', 'lw': 3})

 

添加動態文本

import pandas as pd
import bar_chart_race as bcr
import matplotlib.pyplot as plt

# 設置字體,否則無法顯示中文
plt.rcParams['font.sans-serif'] = ['SimHei']  # Windows
# plt.rcParams['font.sans-serif'] = ['Hiragino Sans GB'] # Mac
plt.rcParams['axes.unicode_minus'] = False

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])

def summary(values, ranks):
    # 動態文本的內容
    """
    values 為 df 的每一行(Series),例如
        Belgium            1143.0
        China              3326.0
        France             6520.0
        Germany            1275.0
        Iran               3294.0
        Italy             14681.0
        Netherlands        1490.0
        Spain             11198.0
        USA                7418.0
        United Kingdom     3611.0
        Name: 2020-04-03, dtype: float64

    ranks 則是針對 values 的值進行了排名,例如
        Belgium            1.0
        China              5.0
        France             7.0
        Germany            2.0
        Iran               4.0
        Italy             10.0
        Netherlands        3.0
        Spain              9.0
        USA                8.0
        United Kingdom     6.0
        Name: 2020-04-03, dtype: float64
    """
    all_people = int(values.sum())
    ranks_country = ranks.sort_values().index
    s = f'總死亡人數:{all_people},死亡人數最多的國家:{ranks_country[-1]},死亡人數最少的國家:{ranks_country[0]}'
    # 設置文本位置、數值、大小、顏色等
    return {'x': .99, 'y': .05, 's': s, 'ha': 'right', 'size': 8}
# 添加文本
bcr.bar_chart_race(df, 'covid19_horiz.gif', period_summary_func=summary)

 

添加垂直條

import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# 設置垂直條數值,分位數
def func(values, ranks):
    return values.quantile(.9)
# 添加垂直條
bcr.bar_chart_race(df, 'covid19_horiz.gif', perpendicular_bar_func=func)

 

設置柱狀圖顏色

import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
bcr.bar_chart_race(df, 'covid19_horiz.gif', cmap="plotly3")

那么顏色都有哪些呢?

from pprint import pprint
from bar_chart_race._colormaps import colormaps
pprint(list(colormaps.keys()))
"""
['dark12',
 'dark12_r',
 'plotly3',
 'viridis',
 'cividis',
 'inferno',
 'magma',
 'plasma',
 'blackbody',
 'bluered',
 'electric',
 ....
 ....
"""

 

柱狀圖顏色不重復

import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
bcr.bar_chart_race(df, 'covid19_horiz.gif', cmap="plotly3", filter_column_colors=True)

以上就是絕大部分配置,當然源碼中注釋寫的也比較詳細,可以點進去看一下。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM