余弦相似度計算:
\cos(\bf{v_1}, \bf{v_2}) = \frac{\left(
v_1 \times v_2 \right)}{||v_1|| * ||v_2|| }
\cos(\bf{M_1}, \bf{M_2}) = \frac{\left(M_1 \times M_2^T \right)}{||M_1|| \times ||M_1||^T }
### 矩陣矢量化操作
### 按行計算余弦相似度
### 兩矩陣計算相似度向量應為同維度
### 返回值RES為A矩陣每行對B矩陣每行向量余弦值
### RES[i,j] 表示A矩陣第i行向量與B矩陣第j行向量余弦相似度
def cosine_Matrix(_matrixA, _matrixB):
import numpy
_matrixA_matrixB = _matrixA * _matrixB.transpose()
### 按行求和,生成一個列向量
### 即各行向量的模
_matrixA_norm = numpy.sqrt(numpy.multiply(_matrixA,_matrixA).sum(axis=1))
_matrixB_norm = numpy.sqrt(numpy.multiply(_matrixB,_matrixB).sum(axis=1))
return numpy.divide(_matrixA_matrixB, _matrixA_norm * _matrixB_norm.transpose())
### 向量計算余弦相似度
### 計算兩向量余弦相似度
### 返回_vec1和_vec2余弦相似度
### 此處用於計算向量余弦相似度,驗證矩陣相似度計算結果
def cosine(_vec1, _vec2):
import numpy
return float(numpy.sum(_vec1*_vec2))/(numpy.linalg.norm(_vec1)*numpy.linalg.norm(_vec2))
