numpy之數據平滑處理


'''
    1.數據平滑:通常包含降噪、擬合等操作。降噪的功能在於去除額外的影響因素,擬合的目的在於數學模型化,可以通過更多的數學方法識別曲線的特征。
    2.繪制兩支股票的收益率
                ---收益率 =(后一天的收盤價 - 前一天的收盤價)/前一天的收盤價
'''
import matplotlib.pyplot as mp
import numpy as np
import datetime as dt
import matplotlib.dates as md


# 日期轉化函數
def dmy2ymd(dmy):
    # 把dmy格式的字符串轉化成ymd格式的字符串
    dmy = str(dmy, encoding='utf-8')
    d = dt.datetime.strptime(dmy, '%d-%m-%Y')
    d = d.date()
    ymd = d.strftime('%Y-%m-%d')
    return ymd


dates, bhp_closing_prices = \
    np.loadtxt('./da_data/bhp.csv', delimiter=',', usecols=(1, 6), unpack=True,
               dtype='M8[D], f8', converters={1: dmy2ymd})  # converters為轉換器,運行時先執行,其中1表示時間所在的列索引號

vale_closing_prices = \
    np.loadtxt('./da_data/vale.csv', delimiter=',', usecols=(6,), unpack=True,
               dtype='f8')

# 繪制收盤價折線圖
mp.figure('Profits', facecolor='lightgray')
mp.title('Profits', fontsize=18)
mp.xlabel('date', fontsize=12)
mp.ylabel('profits', fontsize=12)
mp.tick_params(labelsize=10)
mp.grid(linestyle=':')
# 設置x軸的刻度定位器,使之更適合顯示日期數據
ax = mp.gca()
# 以周一作為主刻度
ma_loc = md.WeekdayLocator(byweekday=md.MO)
# 次刻度,除周一外的日期
mi_loc = md.DayLocator()
ax.xaxis.set_major_locator(ma_loc)
ax.xaxis.set_major_formatter(md.DateFormatter('%Y-%m-%d'))
ax.xaxis.set_minor_locator(mi_loc)
# 日期數據類型轉換,更適合繪圖
dates = dates.astype(md.datetime.datetime)
# 計算兩支股票的收益率
bhp_returns = np.diff(bhp_closing_prices) / bhp_closing_prices[:-1]
vale_returns = np.diff(vale_closing_prices) / vale_closing_prices[:-1]

# 繪制兩支股票的收益率曲線
mp.plot(dates[:-1], bhp_returns, color='orangered', label='BHP_return', alpha=0.3)
mp.plot(dates[:-1], vale_returns, color='dodgerblue', label='VALE_return', alpha=0.3)
# mp.hlines(0, md.date2num(dates[0]), md.date2num(dates[-1]), colors='red')
# 使用卷積對兩組數據降噪
kernel = np.hanning(8)  # 隨機生成一個卷積核(對稱的)
kernel /= kernel.sum()
bhp_returns_convolved = np.convolve(bhp_returns, kernel, 'valid')
vale_returns_convolved = np.convolve(vale_returns, kernel, 'valid')
# mp.plot(dates[7:-1], bhp_returns_convolved, color='orangered', label='bhp_returns_convolved')
# mp.plot(dates[7:-1], vale_returns_convolved, color='dodgerblue', label='vale_returns_convolved')

# 對兩條曲線執行多項式擬合
days = dates[7:-1].astype('M8[D]').astype('i4')
bhp_P = np.polyfit(days, bhp_returns_convolved, 3)
vale_P = np.polyfit(days, vale_returns_convolved, 3)
# 繪制多項式曲線
bhp_y = np.polyval(bhp_P, days)
vale_y = np.polyval(vale_P, days)
mp.plot(dates[7:-1], bhp_y, color='greenyellow', label='bhp_y')
mp.plot(dates[7:-1], vale_y, color='pink', label='vale_y')

# 求曲線的交點坐標
P = np.polysub(bhp_P, vale_P)  # 求兩個多項式函數的差函數的P值
xs = np.roots(P)
y = np.polyval(bhp_P, xs)
result = xs.astype('i4').astype('M8[D]')
mp.scatter(result, y, s=80, color='red', zorder=3)

mp.tight_layout()
mp.legend()
# 自動格式化x軸日期的顯示格式(以最合適的方式顯示)
mp.gcf().autofmt_xdate()
mp.show()

  


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM