我正在學習使用TensorFlow教程的Word2Vec。我爲Word2Vec運行的代碼也來自TensorFlow教程:https://github.com/tensorflow/models/blob/master/tutorials/embedding/word2vec_optimized.py。當我運行15個紀元的代碼時,測試精度爲30%左右。當我跑100個紀元時,測試精度達到了39%左右。我正在使用Text8數據集進行培訓,並使用questions-words.txt進行評估。Word2Vec應該培養多少個時代?什麼是推薦的訓練數據集?
我是否需要跑更多的時代?我應該使用不同的數據集嗎?我怎樣才能提高測試的準確性?
謝謝!我會嘗試一個更大的數據集。 –
較大的數據集的確提高了測試的準確性。還要感謝關於將數據集和測試與主題材料進行匹配的建議。 –