2017-08-29 758 views
0

Gensim實現了一個名爲「doesnt_match」的函數,該函數從列表中返回一個異常詞。Gensim doesnt_match函數是如何工作的?

該函數在wordvector對象上調用。

model.wv.doesnt_match( 「穀物早餐晚餐午餐」 .split()) '谷'

的文檔不指定如何此功能真正發揮作用(什麼是計算的背景)

有誰知道 ?

回答

0

您可以查看doesnt_match() method's source code - 只有11行 - 瞭解詳細信息。

但它的要點是......

  • 採取一切字向量的均值 - 一種「中心」的所有候選人
  • 從中心計算餘弦距離每個單詞 - 這是每個相關矢量的單位標準化版本之間的點積
  • 返回具有最高餘弦距離的單個單詞