word-frequency

    0熱度

    2回答

    我寫一個python級使用一個簡單的功能,其計算從文本單字組用頻率: for listIndex in range(len(words)): uniGramDict[words[listIndex]] = float(float(words.count(words[listIndex]))/float(len(words))) 我測試腳本中窗口命令行用於語料庫6個令牌並取得所

    0熱度

    1回答

    我想弄清楚如何在文本文件中找到最頻繁的單詞並更改單個單詞以便它包裹某些東西否則,例如:freewordchoice(自由+頻繁詞+選擇)和文本中的任何地方,該詞是該詞可以改變的文本。我一直在尋找像這樣瘋狂的東西,但我找不到它。我很新的JavaScript,這是我想用這個。要上傳和顯示文本正常工作,我不明白的是,我如何定位最常用的單詞,並在實際顯示在瀏覽器中之前在整個文本中對其進行更改。在我看來,我

    0熱度

    1回答

    這個特定頻率就是我的表: chr pos refalt --------------- chr1 123 AA chr1 123 AA chr1 123 AA chr1 123 AA chr1 123 AA chr1 123 AC chr1 123 AC chr1 123 AC chr2 456

    2熱度

    2回答

    我正在使用NLTK並試圖讓單詞短語數達到特定文檔的特定長度以及每個短語的頻率。我將字符串標記爲獲取數據列表。 from nltk.util import ngrams from nltk.tokenize import sent_tokenize, word_tokenize from nltk.collocations import * data = ["this", "is", "n

    2熱度

    4回答

    我有一組文本文件中的數據,我想根據預先定義的單詞(驅動器,街道,我,生活)建立一個頻率表。下面是例子 ID | Text ---|-------------------------------------------------------------------- 1 | i drive to work everyday in the morning and i drive back in

    0熱度

    1回答

    我有一個作業問題。我應該編寫一個名爲「WordsByLine」的函數,它應該計算文件中每行唯一字的頻率,並將唯一字的頻率打印到輸出文件中的相應行。我的教授告訴我們輸出應該是什麼樣子。例如,如果輸入的文本文件中說: one fish two fish red fish blue fish (一條魚兩條魚是第一行紅色的魚藍色的魚是第二行。) 輸出有看起來像這樣: two:1 one:1 fish:2

    0熱度

    1回答

    我沒有使用正則表達式這樣一個詞版本: public Dictionary<string, int> MakeOneWordDictionary(string content) { Dictionary<string, int> words = new Dictionary<string, int>(); // Regex checking word match va

    1熱度

    1回答

    我有30億字符串存儲在postgresql數據庫中。我想製作一張頻率圖,這樣我就可以丟棄少於100次或超過10萬次的字符串。我應該使用什麼樣的數據結構?我在想一些布隆過濾器。

    -1熱度

    2回答

    我想從給定的字符串 ST = 「SSSSEEEECCCCEE CCCCCCCCC SSSSEEECCCCSSSSSSSEEESS CCCCCCC SEESSSSCCCCCCSSEEEE」找到的字母「C」第二個最連續發生的價值 在上面的字符串中,第一個粗體「C」是條紋中最連續的「C」。我想找到第二個連勝。它可能與第一個相同。 我有以下代碼: st = 'SSSSEEEECCCCEECCCCCCCCC

    0熱度

    1回答

    我是新來的python,我試圖從使用eclat的日誌文件生成頻繁的項目集。我直接從fim調用eclat函數並將整個日誌文件作爲嵌套列表傳遞。我希望在調用eclat時使用各種選項,例如直接將文件作爲輸入傳遞,傳遞輸出文件名以寫入結果,最小支持,最大項目集大小等。有人可以告訴如何將參數傳遞給被調用的eclat作爲fim的一個函數? Attached image of the code