word-frequency

0熱度

2回答

我寫一個python級使用一個簡單的功能，其計算從文本單字組用頻率： for listIndex in range(len(words)): uniGramDict[words[listIndex]] = float(float(words.count(words[listIndex]))/float(len(words))) 我測試腳本中窗口命令行用於語料庫6個令牌並取得所

0熱度

1回答

如何在.txt文件中查找/定位最頻繁的單詞並將其更改爲

我想弄清楚如何在文本文件中找到最頻繁的單詞並更改單個單詞以便它包裹某些東西否則，例如：freewordchoice（自由+頻繁詞+選擇）和文本中的任何地方，該詞是該詞可以改變的文本。我一直在尋找像這樣瘋狂的東西，但我找不到它。我很新的JavaScript，這是我想用這個。要上傳和顯示文本正常工作，我不明白的是，我如何定位最常用的單詞，並在實際顯示在瀏覽器中之前在整個文本中對其進行更改。在我看來，我

0熱度

1回答

每樣

這個特定頻率就是我的表： chr pos refalt --------------- chr1 123 AA chr1 123 AA chr1 123 AA chr1 123 AA chr1 123 AA chr1 123 AC chr1 123 AC chr1 123 AC chr2 456

2熱度

2回答

Python nltk計數單詞和短語頻率

我正在使用NLTK並試圖讓單詞短語數達到特定文檔的特定長度以及每個短語的頻率。我將字符串標記爲獲取數據列表。 from nltk.util import ngrams from nltk.tokenize import sent_tokenize, word_tokenize from nltk.collocations import * data = ["this", "is", "n

2熱度

4回答

Python Word的頻率與預先定義的字

我有一組文本文件中的數據，我想根據預先定義的單詞（驅動器，街道，我，生活）建立一個頻率表。下面是例子 ID | Text ---|-------------------------------------------------------------------- 1 | i drive to work everyday in the morning and i drive back in

0熱度

1回答

如何獲取計數器以將輸入文本文件中每行的唯一字的頻率打印到輸出文本文件上的相應行上？

我有一個作業問題。我應該編寫一個名爲「WordsByLine」的函數，它應該計算文件中每行唯一字的頻率，並將唯一字的頻率打印到輸出文件中的相應行。我的教授告訴我們輸出應該是什麼樣子。例如，如果輸入的文本文件中說： one fish two fish red fish blue fish （一條魚兩條魚是第一行紅色的魚藍色的魚是第二行。）輸出有看起來像這樣： two:1 one:1 fish:2

0熱度

1回答

如何計算C＃中字符串之後的兩個單詞的出現次數？

我沒有使用正則表達式這樣一個詞版本： public Dictionary<string, int> MakeOneWordDictionary(string content) { Dictionary<string, int> words = new Dictionary<string, int>(); // Regex checking word match va

1熱度

1回答

數十億字符串的計數頻率

我有30億字符串存儲在postgresql數據庫中。我想製作一張頻率圖，這樣我就可以丟棄少於100次或超過10萬次的字符串。我應該使用什麼樣的數據結構？我在想一些布隆過濾器。

-1熱度

2回答

從字符串第二個最大的連續字母查找計數

我想從給定的字符串 ST = 「SSSSEEEECCCCEE CCCCCCCCC SSSSEEECCCCSSSSSSSEEESS CCCCCCC SEESSSSCCCCCCSSEEEE」找到的字母「C」第二個最連續發生的價值在上面的字符串中，第一個粗體「C」是條紋中最連續的「C」。我想找到第二個連勝。它可能與第一個相同。我有以下代碼： st = 'SSSSEEEECCCCEECCCCCCCCC

0熱度

1回答

如何使用pyfim將選項和參數傳遞給eclat算法？

我是新來的python，我試圖從使用eclat的日誌文件生成頻繁的項目集。我直接從fim調用eclat函數並將整個日誌文件作爲嵌套列表傳遞。我希望在調用eclat時使用各種選項，例如直接將文件作爲輸入傳遞，傳遞輸出文件名以寫入結果，最小支持，最大項目集大小等。有人可以告訴如何將參數傳遞給被調用的eclat作爲fim的一個函數？ Attached image of the code