2011-12-18 69 views
0
之後,寫入文件

我只是想刪除HTML標記,然後再保存文件相同的文件.. 的文本文件中的HTML標籤..的Python:修改內容

,但它不工作!我得到的消息....

IOError: [Errno 0] Error 
+0

你的文件列表被稱爲'low_firm'但你迭代'all_firm' – 2011-12-18 05:20:45

+0

你是正確的!謝謝! :) – user976856 2011-12-18 06:03:23

回答

1

我會打開一個文件讀,讀成線及其所有內容的列表,關閉該文件,然後重新打開它上面寫:

for aa in all_firm: 
    r = open (aa,'r+') 
    lines = r.readlines() 
    r.close() 
    w = open (aa,'w') 
    for bb in lines: 
     raw = nltk.clean_html(bb) 
     raw2=str(raw) 
     w.write(low_firm) 

這是因爲我覺得當它包含文本(而不是寄存器或其他二進制數據)時重寫整個文件比較容易。 差不多總是不是對文本文件的處理很慢,因爲文本文件並不像數據庫文件那麼大。它可能不是更好的解決方案,但我會建議嘗試它。

+0

它的作品!非常感謝! – user976856 2011-12-18 06:19:38

0

您的文件列表被稱爲low_firm,但您正在迭代all_firm

你寫完它後,你也應該關閉文件。