2016-05-31 77 views

回答

0

如果您有興趣計算餘弦相似度,可以使用sklearn中存在的cosine-similarity度量函數來完成,如果輸入爲矩陣形式,則返回距離矩陣。

插圖:

import numpy as np 
from sklearn.metrics.pairwise import pairwise_distances 

mat_1 = np.matrix([[1,2,3],[3,4,5]]) 
vec_1 = (2, 3, 5) 
# Make sure the dimensions of the vector and matrix are equal 
>>>print pairwise_distances(mat_1, vec_1, metric = 'cosine') 
[[ 0.00282354] 
[ 0.01351234]] 

注:如果您打算改變距離指標,則可以通過將合適的名稱來度量參數這麼做。但是,如果您的輸入包含稀疏矩陣,則只能使用指標 - ['cityblock', 'cosine', 'euclidean', 'l1', 'l2', 'manhattan'],因爲其他人不支持處理稀疏度量輸入。


文檔,你可以進一步參考:Pairwise metrics, Affinities and Kernels