2017-10-12 87 views
0

我正在使用gensim library for word2vec。我想用與文本無關的例子來訓練模型,例如:「貓是棕色的,現在幾點?」不同背景下的gensim

我所創建的輸入模型如下:

[["The", "cat", "is", "brown"], ["What", "time", "is", "it"]],但我不知道該模型是否假設「棕色」,並在相同的情況下「是什麼」。

試圖在api中找到答案,但找不到它。

回答

0

在相同的上下文中,gensim API不會考慮「brown」和「What」。在句子邊界附近使用了不均勻的窗口。因此,對於您例如,如果窗口大小假設爲1,則(背景下,目標)對看起來像如下:

([cat],The), ([The,is],cat), ([cat,brown],is), ([is],brown) ([time],What), ([What,is],time), ([time,it],is), ([is],it)

我希望這將清除您的疑問。