我打算使用Scikit Learn的Multi Layer Perceptron Classifier來達到此目的。
輸出是該單詞的性別,該單詞將以單熱編碼表示,如男性爲[1,0,0],女性爲[0,1,0],女性爲[0,0,1]。 現在其中一個輸入是單詞的單詞向量。這些向量中的每一個都有20個維度。 其他功能是它的語音標籤和奇點(0)/多(1)狀態的一部分。 我的問題是如何使用MLPClassifier中的一個數組作爲一個數組的單詞向量?如何使用word2vec返回的單詞向量作爲功能?
0
A
回答
1
您的w2v矢量捕捉到與該單詞相關的一些語義相似性。這個矢量必須被認爲是一個整體 - 它本身就是一個特徵。
神經網絡的一個很好的屬性是它們自己提取和學習模式的能力。作爲輸入,你可以考慮用POS標籤的矢量化/數值相當於沿着串聯詞彙向量,最後的奇點狀態:
------------------- ---- -
\_________________/ \__/ | } ------ 25d vector input to the MLP (assuming your POS takes 4 spaces)
w2v vector POS state
只要你遵循的培訓,測試一致的方案,並看不見的數據,您的MLP將使用整個輸入在學習時自動從輸入中提取特徵。
+0
再次感謝!順便說一下,GloVe軟件包不支持印地語! – Djokester
+0
@Djokester哦!我很遺憾聽到這個消息。 :(希望w2v對你有好處,祝你好運! –
相關問題
- 1. 如何使用預先訓練的單詞向量創建gensim word2vec模型?
- 2. 爲什麼mllib word2vec單詞向量只有100個元素?
- 3. 使用向量作爲功能輸出
- 4. 如何加載word2vec向量?
- 5. 如何從gensim word2vec獲取詞彙單詞數量?
- 6. 爲什麼word2vec詞彙長度不同於單詞向量長度
- 7. 如何手動改變一個詞的向量尺寸Gensim Word2Vec
- 8. rnn使用word2vec進行單詞預測
- 9. 取得PHP的Pspell返回正確的單詞作爲變量
- 10. word2vec如何從嵌入向量中提供一個熱門詞向量?
- 11. word2vec給出了文本中很少單詞的向量。爲什麼?
- 12. 爲什麼word2vec爲每個單詞使用2個表示?
- 13. 返回功能作爲django的模型
- 14. 使用平均方法從word2vec單詞向量計算句子向量的具體步驟是什麼?
- 15. 使用功能 - 如何傳遞和返回變量部件
- 16. 如何返回CGpoint功能?
- 17. Word2Vec相似性功能不工作
- 18. 如何使用word2vec輸出向量來計算相似度?
- 19. 如何使用word2vec?
- 20. 如何在Javascript中使用反向詞功能
- 21. 包含數值的Word2Vec單詞
- 22. 關於單詞嵌入的問題(word2vec)
- 23. 如何使用掃描功能將單詞列表作爲矢量輸入到r中
- 24. 返回變量的主要功能
- 25. 如何使用向量作爲基類
- 26. 配置單元返回沒有值,如果使用功能
- 27. Python:如何製作一個功能,要求準確的單詞數量?
- 28. ResolutionFailedException作爲成功返回
- 29. 如何返回單詞「by」+ link_to?
- 30. 功能的返回值使用AlertDialog
你有兩個女性班? –