gensim

    0熱度

    1回答

    這是一個我負責工作的項目。我要製作一個數字標牌網頁,這個想法是讓一個樹莓派進入一個網頁,然後轉到另一個不同的內容。我不確定的部分是如何讓網頁在30秒後發送給你新的頁面。 (網頁全部在內部網絡服務器上託管) 示例:第一頁 - 公司啓動頁面 第二頁 - 員工在另一週年即將到來,也許您即將到來的生日。 我只需要一種方法來自動指示電腦自動將網頁從一個切換到另一個。 我正在使用覆盆子pi軟件樹莓數字標牌,它

    0熱度

    1回答

    我執行以下行: id2word = gensim.corpora.Dictionary.load_from_text('wiki_en_wordids.txt') 該代碼可在「https://radimrehurek.com/gensim/wiki.html」。我下載了wikipedia語料庫並生成了所需的文件,wiki_en_wordids.txt就是其中的一個文件。此文件可在以下位置: ~

    3熱度

    2回答

    10.12.1 10.12.10 10.12.11 10.12.12 10.12.13 10.12.14 10.12.15 10.12.16 10.12.17 10.12.18 10.12.19 10.12.2 10.12.3 10.12.4 10.12.5 10.12.6 10.12.7 10.12.8 10.12.9 這是一個varchar列。但'10

    1熱度

    1回答

    我使用的是運行於https://rare-technologies.com/word2vec-tutorial/#bonus_app的word2vec HTTP服務器中的w2v_server_googlenews代碼。我將加載的文件更改爲使用word2vec的原始C版本訓練的矢量文件。我加載文件與 gensim.models.KeyedVectors.load_word2vec_format(fn

    0熱度

    1回答

    我的問題涉及對Word2Vec模型獨特且具體使用的模型進行適當的培訓。 See Word2Vec details here 我正致力於識別單詞嵌入中的名詞 - 形容詞(或)關係。 (例如,我們在數據集的句子中有'好車')給定單詞的語料嵌入以及所有標記的名詞和形容詞,我試圖設計一種技術來找到連接的正確矢量'nice'with'car'。) 當然,我並不是試圖只連接那兩個單詞,而是技術應該適用於所有的

    0熱度

    1回答

    我已經使用LDA模型(使用Gensim)基於特定文檔實現了查找類似文檔。接下來我想要做的是如果我有多個文檔,那麼如何根據提供的多個文檔獲取類似的文檔作爲輸入。 我實現了LDA使用此link 示例代碼單查詢 - dictionary = corpora.Dictionary.load('dictionary.dict') corpus = corpora.MmCorpus("corpus.mm")

    0熱度

    1回答

    我使用列車(..)訓練了一個doc2vec模型,默認設置。這工作,但現在我想知道如何infer_vector結合跨輸入單詞,它只是個別單詞向量的平均值? model.random.seed(0) model.infer_vector(['cat', 'hat']) model.random.seed(0) model.infer_vector(['cat']) model.infer_ve

    0熱度

    1回答

    我想使用gensim的摘要和關鍵字來提取重要的關鍵字和總結內容。不過,我收到以下錯誤: from gensim.summarization import summarize 回溯: ImportError Traceback (most recent call last) <ipython-input-12-70743b938b65> in <module>() ---->

    0熱度

    1回答

    我試圖使用gensim(ver 1.0.1)doc2vec來獲得文檔的餘弦相似度。這應該是相對簡單的,但我有問題檢索文檔的矢量,所以我可以做餘弦相似度。當我嘗試通過培訓中的標籤檢索文檔時,出現重大錯誤。 例如, print(model.docvecs['4_99.txt']) 會告訴我,有作爲4_99.txt沒有這樣的關鍵。 但是,如果我打印print(model.docvecs.doctags)

    1熱度

    1回答

    我想通過使用LDA在我的數據集中找到離羣值。爲了規定異常值,對於這種情況,我打算在訓練好的模型上使用新的未見文檔的束縛或困惑值? 之後,我會按升序對值進行排序以檢查它是否是異常值? 我的問題是,我無法獲得個別文檔的綁定/困惑值,該模型引發我「TypeError:'int'object is not subcriptabletable」錯誤。 如果你能幫我解決我的問題,我將不勝感激。 以防萬一,我附