Pandas 排序，時間處理

本文轉載自查看原文 2022-04-06 15:26 633

Pandas 排序

sort_values 排序

import pandas as pd
excel_name = '花夢影.xlsx'
df = pd.read_excel(excel_name)
# result = df.sort_values(by='粉絲數')  # 默認升序，降序 ascending=False
result = df.sort_values(by=['筆記類型', '粉絲數'], ascending=False)  # 按照類型和粉絲數排序

數據透視

透視語法

DataFrame.pivot_table(data, values=None, index=None, columns=None,
			aggfunc='mean', fill_value=None, margins=False,
			dropna=True, margins_name='All')

values: 對目標數據進行篩選，默認是全部數據，我們可通過values參數設置我們想要展示的數據列

index : 透視表的行索引，必要參數，如果我們想要設置多層次索引，使用列表[ ]

columns :透視表的列索引，非必要參數，同index使用方式一樣

aggfunc ：對數據聚合時進行的函數操作，默認是求平均值，也可以sum、count等

margins ：額外列，在最邊上，默認是對行列求和

fill_value : 對於空值進行填充

dropna : 默認開啟去重

res = df.pivot_table(
    values='粉絲數', index='筆記類型', columns='發布時間', aggfunc='mean'
)

時間處理

轉換為 datetime 對象

df['發布時間'] = pd.to_datetime(df['發布時間'])

將列表的時間列作為 timestamp 讀取，從而將數據轉換為日期

df = pd.read_excel(excel_name, parse_dates=['發布時間'])
df['發布時間'].max()
df['發布時間'].min()

時間對比

df['發布時間'].max() - df['發布時間'].min()

獲取年

df['結束時間'] = df['結束時間'].dt.year

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Pandas 時間序列處理 Pandas時間處理的一些小方法 Python——Pandas 時間序列數據處理 pandas 對時間與日期處理 pandas根據時間（日期）跨度處理數據 Pandas中時間序列缺失如何處理？使用pandas處理時間日期格式 pandas時間序列分析和處理Timeseries Pandas高級教程之:時間處理 pandas處理時間序列（4）: 移動窗口函數