在用python繪圖的時候,經常由於數據的原因導致畫出來的圖折線分界過於明顯,因此需要對原數據繪制的折線進行平滑處理,本文介紹利用插值法進行平滑曲線處理:
實現所需的庫
numpy、scipy、matplotlib
插值法實現
nearest:最鄰近插值法 zero:階梯插值 slinear:線性插值 quadratic、cubic:2、3階B樣條曲線插值
擬合和插值的區別
插值:簡單來說,插值就是根據原有數據進行填充,最后生成的曲線一定過原有點。
擬合:擬合是通過原有數據,調整曲線系數,使得曲線與已知點集的差別(最小二乘)最小,最后生成的曲線不一定經過原有點。
代碼實現
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
|
import
matplotlib.pyplot as plt
import
numpy as np
from scipy
import
interpolate
#設置距離
x =np.array([
0
,
1
,
1.5
,
2
,
2.5
,
3
,
3.5
,
4
,
4.5
,
5
,
5.5
,
6
,
6.5
,
70
,
8
,
9
,
10
])
#設置相似度
y =np.array([
0.8579087793827057
,
0.8079087793827057
,
0.7679087793827057
,
0.679087793827057
,
0.5579087793827057
,
0.4579087793827057
,
0.3079087793827057
,
0.3009087793827057
,
0.2579087793827057
,
0.2009087793827057
,
0.1999087793827057
,
0.1579087793827057
,
0.0099087793827057
,
0.0079087793827057
,
0.0069087793827057
,
0.0019087793827057
,
0.0000087793827057
])
#插值法之后的x軸值,表示從
0
到
10
間距為
0.5
的
200
個數
xnew =np.arange(
0
,
10
,
0.1
)
#實現函數
func = interpolate.interp1d(x,y,kind=
'cubic'
)
#利用xnew和func函數生成ynew,xnew數量等於ynew數量
ynew = func(xnew)
# 原始折線
plt.plot(x, y,
"r"
, linewidth=
1
)
#平滑處理后曲線
plt.plot(xnew,ynew)
#設置x,y軸代表意思
plt.xlabel(
"The distance between POI and user(km)"
)
plt.ylabel(
"probability"
)
#設置標題
plt.title(
"The content similarity of different distance"
)
#設置x,y軸的坐標范圍
plt.xlim(
0
,
10
,
8
)
plt.ylim(
0
,
1
)
plt.show()
|
繪制后的曲線,紅色是未進行平滑處理的折線,藍色是進行平滑處理之后的曲線 cpc30
注意事項
x, y為原來的數據(少量) xnew為一個數組,條件:x??xnew
如:x的最小值為-2.931,最大值為10.312;則xnew的左邊界要小於-2.931,右邊界要大於10.312。當然也最好注意一下間距,最好小於x中的精度 func為函數,里面的參數x、y、kind,x,y就是原數據的x,y,kind為需要指定的方法 ynew需要通過xnew數組和func函數來生成,理論上xnew數組內的值越多,生成的曲線越平滑