gensim

    0熱度

    1回答

    當我執行下面的代碼 sim_model = gensim.similarities.MatrixSimilarity(corp) sim_model.save("sim_model.pkl") 非但沒有「sim_model.pkl」我得到兩個文件「sim_model.pkl.index.npy」和「sim_model。 pkl「爲什麼是這種行爲。

    5熱度

    3回答

    我有類似於這裏所描述的一個問題: Prevent fork() from copying sockets 基本上,我的Lua腳本中,我產卵另一個腳本: 不需要與我的腳本通信兩種方式 繼續我的劇本已經完成 後運行是一個第三方程序,代碼我沒有控制權 的問題是,我的Lua腳本打開一個TCP套接字來偵聽特定端口上,它的退出後儘管明確server:close()孩子(或者更具體地說其子女)持有到插座和保持端

    0熱度

    1回答

    我試圖理解doc2vec,我可以用它來解決我的情況。我想使用TaggedSentences([words],[tags])爲一個或多個標籤標註句子,但不確定如果我的理解是正確的。 所以基本上,我需要這樣的事情發生(或我完全沒譜) 我創建2個TaggedDocuments TaggedDocument(words=["the", "bird", "flew", "over", "the", "coo

    2熱度

    2回答

    gensim.corpora.Dictionary是否保存了術語頻率? 從gensim.corpora.Dictionary,它可能得到的話文檔頻率(即怎麼一個特定的詞出現在許多文件): from nltk.corpus import brown from gensim.corpora import Dictionary documents = brown.sents() brown_di

    1熱度

    2回答

    我發現成功的權重主題爲增加這似乎是一句比較在我的情況下工作的詞矢量: query1 = vectorize_query("human cat interaction") query2 = vectorize_query("people and cats talk") query3 = vectorize_query("monks predicted frost") query4 = vect

    0熱度

    1回答

    我使用分佈式word2vec算法創建了詞向量。現在我有單詞和相應的向量。如何使用這些單詞和向量來構建gen​​sim word2vec模型?

    2熱度

    3回答

    我想過濾一個描述字符串中的標籤,並希望將它們製作成錨標籤。我無法返回標籤的值。 我輸入的是: a = "this is a sample #tag and the string is having a #second tag too" 我的輸出應該是: a = "this is a sample <a href="/tags/tag">#tag</a> and the string is ha

    2熱度

    2回答

    我使用Python 3.6.3rc1。執行我的python腳本後,我收到以下消息: Traceback (most recent call last): File "main.py", line 6, in <module> from train import train File "C:\path\train.py", line 2, in <module>

    -1熱度

    1回答

    我加載一個KeyedVectors模型,字頻似乎像字索引 我想念什麼?

    3熱度

    2回答

    可出現在列最大長度 表的結構是這樣的: registrant_id varchar(16) registrant_name varchar(128) 我想運行,顯示所有符合所允許的最大長度,也就是我現在做的項目查詢對於上面做: SELECT * FROM `tm_registrant` WHERE length(`registrant_name`) = 128 不過,我不想硬編碼1