gensim

0熱度

1回答

當我執行下面的代碼 sim_model = gensim.similarities.MatrixSimilarity(corp) sim_model.save("sim_model.pkl") 非但沒有「sim_model.pkl」我得到兩個文件「sim_model.pkl.index.npy」和「sim_model。 pkl「爲什麼是這種行爲。

5熱度

3回答

os.execute沒有繼承父母的FDS

我有類似於這裏所描述的一個問題： Prevent fork() from copying sockets 基本上，我的Lua腳本中，我產卵另一個腳本：不需要與我的腳本通信兩種方式繼續我的劇本已經完成後運行是一個第三方程序，代碼我沒有控制權的問題是，我的Lua腳本打開一個TCP套接字來偵聽特定端口上，它的退出後儘管明確server:close()孩子（或者更具體地說其子女）持有到插座和保持端

0熱度

1回答

Gensim doc2vec句子標記

我試圖理解doc2vec，我可以用它來解決我的情況。我想使用TaggedSentences（[words]，[tags]）爲一個或多個標籤標註句子，但不確定如果我的理解是正確的。所以基本上，我需要這樣的事情發生（或我完全沒譜）我創建2個TaggedDocuments TaggedDocument(words=["the", "bird", "flew", "over", "the", "coo

2熱度

2回答

gensim.corpora.Dictionary是否有保存頻率的頻率？

gensim.corpora.Dictionary是否保存了術語頻率？從gensim.corpora.Dictionary，它可能得到的話文檔頻率（即怎麼一個特定的詞出現在許多文件）： from nltk.corpus import brown from gensim.corpora import Dictionary documents = brown.sents() brown_di

1熱度

2回答

是否可以使用文字嵌入搜索文本的一部分？

我發現成功的權重主題爲增加這似乎是一句比較在我的情況下工作的詞矢量： query1 = vectorize_query("human cat interaction") query2 = vectorize_query("people and cats talk") query3 = vectorize_query("monks predicted frost") query4 = vect

0熱度

1回答

如何使用預先訓練的單詞向量創建gensim word2vec模型？

我使用分佈式word2vec算法創建了詞向量。現在我有單詞和相應的向量。如何使用這些單詞和向量來構建gensim word2vec模型？

2熱度

3回答

如何使用gsub搜索並使用正則表達式進行替換？

我想過濾一個描述字符串中的標籤，並希望將它們製作成錨標籤。我無法返回標籤的值。我輸入的是： a = "this is a sample #tag and the string is having a #second tag too" 我的輸出應該是： a = "this is a sample <a href="/tags/tag">#tag</a> and the string is ha

2熱度

2回答

Python3.6 - 無法在Windows中導入gensim

我使用Python 3.6.3rc1。執行我的python腳本後，我收到以下消息： Traceback (most recent call last): File "main.py", line 6, in <module> from train import train File "C:\path\train.py", line 2, in <module>

-1熱度

1回答

gensim KeyedVectors對象字數

我加載一個KeyedVectors模型，字頻似乎像字索引我想念什麼？

3熱度

2回答

確定在MySQL

可出現在列最大長度表的結構是這樣的： registrant_id varchar(16) registrant_name varchar(128) 我想運行，顯示所有符合所允許的最大長度，也就是我現在做的項目查詢對於上面做： SELECT * FROM `tm_registrant` WHERE length(`registrant_name`) = 128 不過，我不想硬編碼1