2017-08-31 159 views
0

我已經獲得了一個將單詞映射到它們在python中的向量的字典,並且我正在試圖散佈繪製n個最相似的單詞,因爲TSNE上的大量單詞正在永久存在。最好的選擇是將字典轉換爲w2v對象來處理它。將Python字典轉換爲Word2Vec對象

+0

那麼你到目前爲止嘗試過什麼? – patrick

+0

單詞向量從哪裏來? (通常,任何提供它們的文件或者計算它們的庫都已經將它們置於有用的形式中。)「Word2Vec對象」的具體含義是什麼? – gojomo

+0

我用我自己的神經網絡計算了詞向量。 我試圖想像他們像那個鏈接中的那個例子: https://www.kaggle.com/jeffd23/visualizing-word-vectors-with-t-sne –

回答

0

如果您已經使用自己的代碼計算出了單詞向量,那麼您可能希望以與Google原始word2vec.c或gensim兼容的格式將它們寫入文件。您可以查看KeyedVectors.save_word2vec_format()中的gensim代碼,以確切瞭解它的向量是如何寫入的 - 它少於20行代碼 - 並執行類似於向量的操作。請參閱:

https://github.com/RaRe-Technologies/gensim/blob/3d2227d58b10d0493006a3d7e63b98d64e991e60/gensim/models/keyedvectors.py#L130

然後,你可以重新加載源自你的代碼的載體,幾乎直接與像one from Jeff Delaney you mention例子中使用它們。