pandas空值處理與插值


# coding:utf-8

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from scipy.interpolate import interp1d

data = pd.read_excel('指數.xlsx',header=None,index_col=None)

# 數據信息
# print(data.info())

# 查看空值
isnull = data[1].isnull()
# print(isnull)
# print(data[1])

# 替換空值
data[1] = data[1].fillna('666')

# 找出索引
index_ = data[isnull].index.tolist()
# print(index_)

# 去除空列所在行
data = data.drop(index_)
# print(data)

x = data[1]
y = data[0]

# 插值

f1=interp1d(x,y,kind='linear')#線性插值
f2=interp1d(x,y,kind='cubic')#三次樣條插值
x_pred=np.arange(1,170,1)
y1=f1(x_pred)

datas = pd.DataFrame([y1,x_pred])
datas.to_excel('new指數.xlsx')


y2=f2(x_pred)
plt.figure(figsize=[12,7])
plt.scatter(x,y,s=30,c='red',label='原始指數')
plt.plot(x_pred,y1,'b--',label='linear interpolation')
# plt.plot(x_pred,y2,'b--',label='cubic')
plt.legend(loc='upper left')
font_size = {'size':13}
plt.ylabel('淘寶指數',font_size)
plt.rcParams['font.sans-serif'] = ['SimHei']  # 設置字體為SimHei顯示中文
plt.rcParams['axes.unicode_minus'] = False  # 設置正常顯示符號
plt.show()

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM