2011-02-18 101 views
0


我有一個文本文件,裏面有一些電子郵件。我需要刪除所有沒有關鍵字的電子郵件(即:Gmail,雅虎......)。
有沒有辦法做到這一點?
在此先感謝。如何只保留文本文件中的一些關鍵字

+0

該文件有多大,它是否適合內存。你如何分離文件中的電子郵件? – 2011-02-18 08:25:05

+0

該文件是關於1Mb和電子郵件。我用分行符分隔電子郵件。 – Vinzgore 2011-02-18 13:42:06

回答

0

是的。你想用哪種語言?

例如在Smalltalk:

((FileStream fileNamed: 'emails.txt') 
    substrings: eMailSeparatorChar) 
    reject: [:a|a includesSubString: aKeyWord] 
0

假設每個電子郵件是在單線

grep -wEi 'gmail|yahoo|aol' emailFile 

-w單詞

-i不區分大小寫

emailFile是包含該文件電子郵件。

以下更改輸入文件。

grep -wEi 'gmail|yahoo|aol' emailFile > tempFile && cp tempFile emailFile && rm tempFile 

如果你想添加更多的列表只需添加'|' serviceProvide

相關問題