2010-10-22 71 views
0

我很清楚,用正則表達式解析HTML有它的許多警告和大聲的對手。因此,我不是試圖重新發明輪子,而是尋找一種工具,我可以指向一個網頁並說「給我評論,b * tch」。HTML評論Extracter

任何人都可以建議?

我正在閱讀一些OWASP文檔或安全博客,我幾乎肯定我看到一個工具來執行此任務。不幸的是,Google一直在幫助零。

乾杯

+1

什麼語言/平臺? – 2010-10-22 12:18:07

+0

什麼語言?此外,你想提取什麼樣的內容?所有的文字?一些文字?圖片?你有一個示例頁面嗎? – Simon 2010-10-22 12:18:48

+0

@Pekka,你不能在HTML中做到這一點?天啊。 – Marko 2010-10-22 21:37:05

回答

0

Mhhhhh ...我認爲在Google上搜索您使用的操作系統和一些聰明的關鍵字會爲您提供所需的一切。對於基於UNIX的系統看起來:parse HTML with SED and PERL

對於Windows操作系統,我認爲你可以用VBS(VBScript)搜索某些東西。