2010-05-30 132 views
5

我希望將任何網頁反向工程化爲頁面的邏輯表示。 例如,如果一個網頁有一個菜單,那麼我想要一個邏輯菜單結構可能是XML。如果網頁有一篇文章,我想要一篇文章XML節點,如果它有一篇文章的標題,我想要一個標題XML節點。基本上,我想要沒有任何用戶界面的網頁的邏輯形式。反向工程網頁

這個邏輯模型既可以是代碼中的對象,也可以是XML,這並不重要,重要的部分是它已經確定了頁面上的所有內容。

回答

3

聽起來像你想要的,需要一個人分類一個頁面的內容。

這可能是自動的,但它會有誤報,不適用於任何情況。

例如,如果一個頁面使用ul作爲菜單而另一個頁面使用表格單元呢?

你想要特別針對一個網站或互聯網上的任何網站嗎?

0

如何已經解析XML頁面上,看到

http://en.wikipedia.org/wiki/XHTML

+3

我會建議過,他轉換了整個互聯網XHTML;) – Onots 2010-05-30 11:22:21

+0

讓我想發現Windows的GIF轉移對話框說'下載互聯網...' – alex 2010-05-30 11:44:26

+2

@alex - http://www.gifbin.com/982378 :)雖然,現在的大小似乎有點小.... – 2010-05-30 12:07:44