余弦相似度,又稱為余弦相似性,是通過測量兩個向量的夾角的余弦值來度量它們之間的相似性。
兩個方向完全相同的向量的余弦相似度為1,而兩個彼此相對的向量的相似度為-1。 注意,它們的大小並不重要,因為這是方向的度量。
如何計算
余弦定理
余弦定理是三角形中三邊長度與一個角的余弦值(cos)的數學式。
余弦定理指的是:
勾股定理則是余弦定理的特殊情況,當角為直角時,即:時,公式簡化為
余弦的計算公式
所以余弦的計算公式如下:
a,b,c 是三個邊的長度。
假定a向量是[x1, y1],b向量是[x2, y2],那么可以將余弦定理改寫成下面的形式:
根據下面帶入可以得上面公式
數學家已經證明,余弦的這種計算方法對n維向量也成立。假定A和B是兩個n維向量,A是 [A1, A2, ..., An] ,B是 [B1, B2, ..., Bn] ,則A與B的夾角θ的余弦等於: