(3) 根據習慣日期定位方式定位
首先看看有哪些定位?之前運用的都可以,加上數字即可
| - SemiMonthEnd | - MonthEnd | - WeekOfMonth | - QuarterEnd | - BQuarterEnd | - YearEnd | - BYearEnd |
| - SemiMonthBegin| - MonthBegin| - LastWeekOfMonth| - QuarterBegin| - BQuarterBegin | - YearBegin| - BYearBegin |
| - Hour | - Minute | - Second | -
now+MonthEnd(2) #往后挪兩個月,這彌補了之前無法定位到當前月的下個月問題 Timestamp('2020-01-31 16:34:35.850953')
注意:錯誤示范
offset=MonthEnd(2)
offset.rollforward(now) #結果仍然為 Timestamp('2019-12-31 16:34:35.850953'),想要達到2020年1月只能用加的方式
注意:通常情況下我們一般不單獨做時間序列單列,都會跟一些數據,也就是series和dataframe,可以使用shift進行日期變更
四、在兩個時間點內按要求添加數據
這個功能就相當於range(a,b),所以公式也很像date_range(start='開頭日期’,end='結尾日期‘,periods=遞增幾次,freq='頻率')
1. date_range(‘開頭日期‘,n)
從開頭日期開始一天一天的列出n天
2. date_range(‘開頭日期‘,遞增幾次,頻率)
頻率有以下幾種表示方式:
a. 天以內
| - 2(按2天遞增) |-‘3B’(按3天工作日遞增)| - ‘4h’(按四個小時遞增) | - '50min'(按五十分鍾遞增)
| - '6S'(按六秒遞增)| - ‘7ms’(按七毫秒遞增)|-‘8U’(按八微秒遞增)| - ‘2D4h50min6S7ms8U’ (可以連着寫)
pd.date_range('2019-12-16',periods=5,freq='2D4h50min6S7ms8U')
DatetimeIndex(['2019-12-16 00:00:00', '2019-12-18 04:50:06.007008',
'2019-12-20 09:40:12.014016', '2019-12-22 14:30:18.021024',
'2019-12-24 19:20:24.028032'],
dtype='datetime64[ns]', freq='190206007008U')
b. 周以內
| - ‘W-TUE’(從開頭日期的當天開始,往后第一個星期二開始,按7天遞增)
pd.date_range('2019-12-16',periods=5,freq='W-TUE')
DatetimeIndex(['2019-12-17', '2019-12-24', '2019-12-31', '2020-01-07',
'2020-01-14'],
dtype='datetime64[ns]', freq='W-TUE')
c. 月以內
|-'WOM-3FRI'(從開頭日期開始月的第3個星期五,按月遞增)
pd.date_range('2019-12-21',periods=5,freq='WOM-3FRI') #注意:如果給出的日期超過本月第三個星期五將跳過本月
DatetimeIndex(['2020-01-17', '2020-02-21', '2020-03-20',
'2020-04-17'],dtype='datetime64[ns]', freq='WOM-3FRI')
| -‘6M’(從開頭日期的當月月底開始,按六個月遞增)| - ‘6BM’(從開頭日期的當月最后一個工作日開始,按六個月遞增)
pd.date_range('2019-12-21',periods=5,freq='6M') # 注意:與MS的區別
DatetimeIndex(['2019-12-31', '2020-06-30', '2020-12-31', '2021-06-30',
'2021-12-31'],
dtype='datetime64[ns]', freq='6M')
pd.date_range('2018-12-21',periods=5,freq='6BM')
DatetimeIndex(['2018-12-31', '2019-06-28', '2019-12-31', '2020-06-30',
'2020-12-31'],
dtype='datetime64[ns]', freq='6BM')
| -‘7MS ’(從開頭日期的當月月初開始,按七個月遞增)| -‘7BMS’(從開頭日期的當月第一個工作日開始,按七個月遞增)
pd.date_range('2018-12-21',periods=5,freq='7MS') # 注意:如果給定的日期不是月頭開始,那么結果會從下個月月初開始,按七個月遞增
DatetimeIndex(['2019-01-01', '2019-08-01', '2020-03-01', '2020-10-01',
'2021-05-01'],
dtype='datetime64[ns]', freq='7MS')
pd.date_range('2018-12-21',periods=5,freq='7BMS')
DatetimeIndex(['2019-01-01', '2019-08-01', '2020-03-02', '2020-10-01',
'2021-05-03'],
dtype='datetime64[ns]', freq='7BMS')
d. 季度以內
| - ‘Q-FEB’(從二月月底開始,按三個月遞增)|-‘QS-FEB’(從二月月頭開始,按三個月遞增)
| - 'BQ-FEB'(從二月最后一個工作日開始,按三個月遞增)|- 'BQS-FEB'(從二月第一個工作日開始,按三個月遞增)
pd.date_range('2018-12-01',periods=5,freq='BQ-FEB')
# Q和QS沒什么注意點,但BQ和BQS需要注意,如果給定的日期已經過了當年二月,則系統會從下月的二月開始顯示
DatetimeIndex(['2019-02-28', '2019-05-31', '2019-08-30', '2019-11-29',
'2020-02-28'],
dtype='datetime64[ns]', freq='BQ-FEB')
e. 年以內
| - 'A-FEB'(從開頭年份的二月底開始,按年遞增)| - ‘BA-FEB’(從開頭年份的二月最后一個工作日開始,按年遞增)
| - ‘AS-FEB’(從開頭年份的二月初開始,按年遞增)| - ‘BAS-FEB’(從開頭年的二月第一個工作日開始,按年遞增)
pd.date_range('2018-12-01',periods=5,freq='AS-FEB') #同上
DatetimeIndex(['2019-02-01', '2020-02-01', '2021-02-01', '2022-02-01',
'2023-02-01'],
dtype='datetime64[ns]', freq='AS-FEB')
-----------------
前文中我們看到有些日期已經超過導致遞延問題,那么我們如何解決這類問題?
我們可以提取年、月來避免
- 比如前文中pd.date_range('2018-12-01',periods=5,freq='BQ-FEB') 中的問題從年初開始
import pandas as pd
startDate="2018-12-01"
startDateYear=str(pd.to_datetime(startDate).year)
pd.date_range(startDateYear,periods=5,freq='AS-FEB')
DatetimeIndex(['2018-02-01', '2019-02-01', '2020-02-01', '2021-02-01',
'2022-02-01'],
dtype='datetime64[ns]', freq='AS-FEB')
- 比如前文中pd.date_range('2019-12-21',periods=5,freq='WOM-3FRI') 中的問題從月初開始
import pandas as pd
startDate="2019-12-01"
startDateYear=str(pd.to_datetime(startDate).year)
startDateMonth=str(pd.to_datetime(startDate).month)
year_month=startDateYear+'-'+startDateMonth
pd.date_range(year_month,periods=5,freq='WOM-3FRI')
DatetimeIndex(['2019-12-20', '2020-01-17', '2020-02-21', '2020-03-20',
'2020-04-17'],
dtype='datetime64[ns]', freq='WOM-3FRI')
3. date_range(‘開頭日期‘,‘結束日期’,頻率)
4. date_range('開頭日期‘,‘結束日期’,遞增幾次)
按天數等分