2016-12-13 105 views
0

我有一個訓練有素的300尺寸的geinsim模型的word2vec模型,並希望將尺寸切割爲100(簡單地刪除最後200個尺寸)。什麼是使用python最簡單和最有效的方法?Gensim Word2Vec模型:切割尺寸

回答

1

您可以將輸出模型保存在word2vec format中。確保將其保存爲文本文件(.txt)。 word2vec格式如下

第一行是<vocabulary_size> <embedding_size>。在你的情況下,<embedding_size>將是300。 其餘的行將是<word><TAB><300 floating point numbers space separated>。現在你可以很容易地用python解析這個文件,並丟棄每一行的最後200個浮點數。確保在第一行中更新<embedding_size>。將其另存爲新文件(可選)。現在您可以使用load_word2vec_format()將這個新文件加載爲新的word2vec模型。

如果能解決您的問題,請立即聯繫我們。