2011-04-23 47 views
2

創建RSS閱讀器時,您可以下載由RSS源鏈接指向的XML格式的文檔,並且可以手動解析它或使用SyndicationFeed命名空間中的功能。正在檢索比feed更早的RSS帖子

因此,如果我們以Scott Guthrie的博客爲例,您可以下載RSS訂閱文檔here並解析它。我的問題是,這個文件只能保存15個項目,但他已經寫了好幾年了。

是否有一種標準或已建立的方式來獲取舊的帖子未包含在RSS提要文檔中?或者你是否必須找到博客文章的基地址,然後從那裏解析網站的頁面以獲取它們?您如何避免在大量博客上丟失帖子?

+1

可能重複的

第1頁(HTTP://計算器。 COM /問題/ 576552 /怎麼辦,我取,所有老項目,上一個 - RSS源) – random 2013-04-14 22:01:00

回答

0

作爲對How Do I Fetch All Old Items on an RSS Feed?的回覆已經提到,飼料可能不提供檔案數據,但可能從其他來源獲得歷史項目。

Archive.org的Wayback Machine有一個API來訪問歷史內容,包括RSS源(如果他們的機器人已經下載了它)。我創建了網絡工具Backfeed,它使用此API重新生成包含連結歷史項目的供稿。如果您想詳細討論實施情況,請與我們聯繫。

1

使用RSS/Atom,您無法查詢較早的文章。

我建立了一個RSS檔案服務(https://app.pub.center)。我們所有的數據都可以通過REST免費使用。我們收取推送通知的費用。

PubCenter每天輪詢它的RSS源目錄,並緩存文章。然後,您可以按照時間順序重新獲得這些文章。例如:[?如何抓上一個RSS源的所有舊項目]的大西洋https://pub.center/feed/02702624d8a4c825dde21af94e9169773454e0c3/articles?limit=10&page=1

第2頁的大西洋https://pub.center/feed/02702624d8a4c825dde21af94e9169773454e0c3/articles?limit=10&page=2