2008-12-01 55 views
0

我正在尋找一種方法來獲取網頁的本質或最重要的方面?如果我提供一個URL,是否有任何外部服務可以實現這一點?我不在尋找像服務一樣的snap.com,因爲它提供了一個快照。有沒有可以讓我創建網頁片段的服務

我可能願意自己實施這樣一個系統。開始的時候我不想付出太多的努力,而是希望能夠得到一些基本的結果。對於我如何解決這個問題有什麼想法嗎?

+0

我認爲你需要澄清你的意思是「頁面最重要的方面」。 snap.com的替代品是http://browsershots.org/ – 2008-12-02 17:33:48

回答

0

通過snippet,你的意思是像一個報價,總結你想鏈接到整個頁面?

所以如果snap.com不是一個幻想,整個頁面呢?爲了冗長?如果您想要緩存整個網站的緩存而不是其中一部分的快照,您可以嘗試使用BackupURL

1

您可以嘗試Yahoo's Term extraction service

更新02月 - 2012

雅虎發佈新Content Analysis Web service將替代單詞提取服務。它可以通過語法甜YQL如下圖所示

select * from contentanalysis.analyze where url='http://www.cnn.com/2011/11/11/world/europe/greece-main/index.html'; 

還有AlchemyAPI它提供了一個weservice其可以用於你的目的被調用。