word-frequency

    0熱度

    1回答

    所以我正在騎自行車瀏覽41段文件。對於每個段落,我試圖[1]首先將字符串分解成數組,然後獲取段落的詞頻。然後,我想結合所有段落的數據並獲取整個文檔的詞頻。 我能夠獲得數組,它給出了給定段落的「單詞」及其「頻率」,但我無法合併每段的結果以獲得「整個詞頻」 。文檔以下是我有: function sectionWordFrequency($sectionFS) { $section_frequenc

    1熱度

    1回答

    我想抓取網頁並保存關鍵字的頻率。例如,我想要從URL:http://www.dmoz.org/Arts/中抓取類別Arts,並保存其頻率列表。所以我想下面的輸出 詞頻 電影400 歌100 雜誌120 這是實現最簡單的方法是什麼?任何語言的任何工具或庫都將非常有幫助。

    2熱度

    1回答

    是否有任何人知道鏈接到包含所有英語單詞的頻率等級的列表。 大約六個月前,我在包含這個列表的'wiki'上找到了一個列表,但不幸的是我沒有收藏它,現在我無法找到相同的鏈接或任何更好的鏈接。 如果有人有這個鏈接或更好的東西,請發佈它。

    5熱度

    1回答

    我有一些代碼給我一個單詞列表,它們在文本中出現的頻率,我期待它使代碼自動將前10個單詞轉換成一個ARFF @RELATION wordfrequencies @ATTRIBUTE字串 @ATTRIBUTE頻率數字 和頂部10,與它們的頻率的數據。 我與如何與我當前的代碼 import re import nltk # Quran subset filename = 'subsetQuran

    0熱度

    1回答

    我想查找文件每一行中單詞的頻率。我想爲文件中的每個單詞執行此操作。我在java中使用BufferedReader和FileReader。

    2熱度

    3回答

    有人可以幫助我找到所有lucene索引中的詞頻: 例如,如果文檔A有3個詞(B),文檔C有2個詞,我想要一個方法,以返回圖5是表示在所有Lucene索引詞(B)的頻率

    5熱度

    1回答

    可能重複: php: sort and count instances of words in a given string 我尋找寫一個PHP函數,它接受一個字符串作爲輸入,將其分解成單詞,然後返回通過頻率來分類的字的一個陣列每個詞的出現。 完成此操作的算法最有效的方法是什麼?

    7熱度

    3回答

    是否可以從包含Postgres中的文本字符串的字段中爲每個字標識不同的單詞和計數?

    3熱度

    3回答

    我最近發現了Vim Tip n°1531(文件的字頻統計)。 至於建議我把下面的代碼在我的.vimrc function! WordFrequency() range let all = split(join(getline(a:firstline, a:lastline)), '\A\+') let frequencies = {} for word in all

    4熱度

    2回答

    我有一個目錄,其中有1000個txt.files。我想知道每個單詞在1000文檔中出現的次數。所以,即使在X中出現100次「奶牛」這個詞,它仍然會被視爲一個。如果它發生在不同的文檔中,則會增加1。因此,如果每個文檔中出現「cow」,最大值爲1000。如何在不使用任何其他外部庫的情況下輕鬆完成此操作。這裏是我到目前爲止 private Hashtable<String, Integer> getA