2013-02-21 50 views
-1

因此,我製作了一個應用程序,用於交叉檢查數據庫中的信息,並將其與Excel表單進行比較,最終的結果是一個巨大的html文件。以前我將每個HTML文件分開,但是當我試圖將它們全部打印出來(雙面)時,它不能在批處理中正確打印,因此我必須手動完成打印。如何打開一個巨大的HTML文件或將其分割成可管理的塊?

的HTML代碼如下所示:

<html> 
<head></head> 
<body> 
....random form crap 
</body> 
</html> 
<html> 
<head></head> 
<body> 
.... etc 
</body> 
</html> 

,並有千元以下。我需要:只需打開這個文件(它是84mb,並在我嘗試過的每個瀏覽器中崩潰)並打印整個文件。或者將它分成5mb左右的小塊,這樣我就可以將它們打印出來。

我很欣賞你們對我如何完成這個任務的建議!

+2

所以單個文件包含多個''? – sll 2013-02-21 15:26:19

+1

你可以使用一些linux工具來做到這一點。或者如果你是一個Windows用戶,你可能想要安裝cygwin並嘗試使用它們:) – 2013-02-21 15:26:50

+0

@VenomFangs:這將是一個骯髒的黑客:) – sll 2013-02-21 15:27:34

回答

1
+1

這是完美的,我通過使用分割-l 31700 test.htm減少文件大小 - 謝謝! – kogh 2013-02-21 21:48:28

+1

@ kogh沒問題:)許多程序不知道如何正確地緩衝大文件,並嘗試將它們全部加載到內存中,這是您看到的東西炸燬的地方。很高興在這裏它做了你所需要的。乾杯! – 2013-02-21 23:12:47

1

因爲這是C#的標籤,我會假設你想在Windows上完成這個。

如果您正在做這一件事,想要一個實用的解決方案,請安裝Cygwin並使用split -p "<html>"

如果您需要C#中的可重複解決方案,請打開文件並逐行閱讀,將每行輸出到新文件(不要忘記添加CRLF字符!)。每次遇到<html>時,請關閉要輸出到的文件並打開一個新文件,在該文件中將輸出重定向到。

+0

你們的迴應是如何得到我的? – 2013-02-21 19:38:28

相關問題