2009-12-01 38 views
1

我有一些源代碼文件是通過HTML輸出給我的,所以它們很不可用。有沒有什麼可以將文件中的HTML特殊字符轉換爲普通字符?

我有這樣的事情:

%include "macros.mac" 

這應該是:

%include "macros.mac" 

是否有任何腳本(SH,PERL,批次,...),以每個文件轉換(有約200)到適當的字符?字符包括& lt;& gt;,...(我把一個空間在中間,這樣它不會將它們轉換爲<和>。

謝謝,這是非常讚賞。

回答

2

如果只是四個&"<>字符,sed(1)可以幫助:

sed 's/&quot;/"/g; s/&lt;/</g; s/&gt;/>/g; s/&amp;/\&/g' 

更新:我原來的建議是下面,有一個錯誤:

sed 's/&amp;/\&/g; s/&quot;/"/g; s/&lt;/</g; s/&gt;/>/g' 

這將轉換「&放大器; GT;」進「>」,這是錯誤的。

+0

謝謝,我製作了一個腳本來交換這些字符(我在幾個文件中看到的字符)。我希望沒有更多這樣的人物。 – 2009-12-01 16:56:31

+0

是否有工具或庫處理所有特殊字符(在specialcharacters.info中的列表)? – Xiao 2012-02-28 05:14:13

0

你可以嘗試像Windows的工具grep的或textcrawler此

相關問題