2009-01-19 48 views
0

我使用的是谷歌文檔,我們使用的一些模板是使用MS-Office創建的。
由此產生的HTML是肥胖和醜陋的,並且每個文檔限制谷歌500KB使得一些清理強制性。 我能夠找到多餘的「風格」屬性並將它們移動到某個CSS類,並將最冗餘的類名重命名爲較短的類,這使我節省了大約原始大小的50%。
你是否知道一些現有的工具/腳本/ lib可以爲我做這個痛苦的工作,或者至少幫我寫這個神奇的工具?減少生成的HTML大小的工具

在此先感謝!

編輯:我給一個嘗試既整齊,demoronizer和 「手動重寫」:
- 輸入:140KB
- Tidy'ed:110KB
- Demoronized:135KB

所以我最喜歡的答案「重寫它!」

謝謝!

回答

3

MS-Office讓蹩腳的HTML,時期。你最好花時間從原始文本中重新構建HTML,而不是試圖穿越該雷區。

我做了一些宏在Word上執行一些搜索/替換功能來做基本的事情,比如將<p>標籤包裝成段落和類似的東西,然後從頭開始重新標記整個事物。

3

你可以試試tidy它會清理很多東西。

0

不評論它的名字,我可以提到demoronizer,這是作者描述爲:

... Perl程序可以從這個網站校正因產生大量錯誤和不兼容的HTML下載,或使用Microsoft應用程序編輯。

YMMV。

0

現在我最喜歡的一個實用程序實際上是Windows Live Writer--它可以很好地清除Word文檔中的垃圾。有些人可能會不同意,但我經常使用它!