我有一個文本文件存儲爲字符串變量。該文本文件被處理,以便它只包含小寫字和空格。現在,假設我有一個靜態詞典,它只是一個特定單詞列表,我想從文本文件中計算詞典中每個單詞的頻率。例如:計算文本文件中特定字的頻率
Text file:
i love love vb development although i m a total newbie
Dictionary:
love, development, fire, stone
我想看到的輸出如下所示,列出字典單詞和它的計數。如果它使編碼更簡單,它也只能列出出現在文本中的字典單詞。
===========
WORD, COUNT
love, 2
development, 1
fire, 0
stone, 0
============
使用正則表達式(例如,「\ w +」),我可以得到所有的字比賽,但我不知道怎麼去說也都在字典中的計數,所以我堅持。效率至關重要,因爲字典非常大(約100,000字),文本文件也不小(每個約200kb)。
我很感激任何幫助。
Dictionary<string, int> count =
theString.Split(' ')
.GroupBy(s => s)
.ToDictionary(g => g.Key, g => g.Count());
現在你可以檢查是否存在於字典的話,並表示如果計數:
也許像將字符串拆分成一個`Array`或`List`,然後迭代/處理列表? – 2010-12-23 17:08:52
您已將此標籤標記爲c#和vb.net。這是什麼? – 2010-12-23 17:10:07