2016-12-28 115 views
1

我對word2vec輸出向量的解釋有些困惑! 如果我想預測在特定單詞(w1)之後出現的最可能的單詞,我可以使用最靠近w1的單詞嗎? 我的意思是,與w1距離最短的單詞可以解釋爲最高概率的下一個單詞?如何使用word2vec輸出向量來計算相似度?

+0

你能告訴我們你試過了嗎? – nakashu

回答

1

如果我要預測一個特定的詞(W1)之後將出現的最有可能的話,

這就是所謂的語言模型

我可以用最最近的字到w1? 我的意思是,與w1距離最短的單詞可以解釋爲最高概率的下一個單詞?

否:最接近w1的單詞是w1中語義最接近的單詞。

+0

謝謝。 PMI如何?它能反映出預期的接近度嗎? –

+0

它不是一個概率輸出(聯合等),所以沒有鏈接到PMI。 – user3639557

+0

感謝您的回答。我找到了一篇論文,描述了移動PMI和SGNS之間的等價關係。 「Neural Word Embedding as Implicit Matrix Factorization」,O.Levy,Y.Golberg,NIPS'14 –