2011-12-19 64 views
0

的文件具體的話我想在這裏計算特定字詞我的文集中的每個文件.. 是我的代碼..它工作正常。的Python:在統計語料

num= nltk.FreqDist(
     (target,fileid) 
     for fileid in reader.fileids() 
     for w in reader.words(fileid) 
     for target in ['have']) 

,但結果是這樣的.. FreqDist: '2009.txt':141205,'20 .TXT「:43201, '2.txt':41232, '4.txt':40859, '5.txt':40805,.....

我希望在一行中看到所有的值。如..

'2009.txt' 141205

'20 .TXT」 43201

我想這個代碼另外

for results in num: 
     print results 

但只顯示 '有','200 .txt'...不顯示FreqDist號碼。

而且,我也試過nltk.ConditionalFreqDist()..它永遠..

我不知道爲什麼.. 請幫助我。我花了將近4-5個小時來處理這個問題。

預先感謝您。

回答

2

我不熟悉的NLTK,但似乎你遍歷類似字典的對象。

這是怎麼回事?

for file, n in num.iteritems(): 
    print file, n 
+0

WOW它的工作原理!!!!謝謝sooooo多!哦! – user976856 2011-12-19 14:50:33