2017-04-03 78 views
0

我正在使用短語類,並希望在2D空間中可視化向量。爲了用Word2Vec做到這一點,我使用了T-SNE,它的工作非常完美。當我試圖用短語做同樣的事情時,它沒有任何意義(單詞出現在不相關的單詞旁邊)。在2D中可視化Gensim的短語的向量

關於如何可視化短語輸出的任何建議?

回答

0

正如gensim mailing list所建議/報告的那樣,關鍵問題是僅僅包裝一個語料庫到Phrases會導致只提供一次數據傳遞的迭代器。 Word2Vec模型需要一個語料庫,通過這個語料庫可以進行多次傳遞以進行詞彙發現,然後進行多次訓練。 (如果密切關注INFO級別的日誌記錄,應該有跡象表明「訓練」在這種情況下幾乎立即結束。)