標題閔可夫斯基距離(LP距離)、曼哈頓距離、歐式距離、切比雪夫距離、馬哈拉諾比斯距離、相關系數、夾角余弦
在聚類中,可以將樣本集合看作是向量空間中的點的集合,以該空間的距離表示樣本之間相似度。常用的距離有閔可夫斯基距離,閔可夫斯基距離距離越大相似度越小,距離越小相似度越大。
定義:
1.閔可夫斯基距離
p>=1,p>=1,當p=1時是曼哈頓距離,p=2時是歐式距離,p=∞時是切比雪夫距離
2.曼哈頓距離
3.歐式距離
4.切比雪夫距離
切比雪夫距離是兩個點之間距離最大的坐標系之間的距離。
5.馬哈拉諾比斯距離
馬哈拉諾比斯距離,簡稱馬氏距離,也是另一種常用距離,考慮各個分量之間的相關性與各個分量的尺度無關。馬哈拉諾比斯距離越大相似度越小,距離越小相似度越大。
6. 相關系數
樣本之間的相似度也可以用相關系數來表示。相關系數的絕對值接近於1樣本岳相似;越接近於0,樣本越不相似。
7. 夾角余弦
夾角余弦越接近於1樣本越相似,越接近於0,樣本越不相似。