Slashdot的RSS源是http://rss.slashdot.org/Slashdot/slashdot。如果我直接下載XML文件,那麼我只能從今天獲得一些帖子。但是,如果我在Google閱讀器中訂閱Feed,並在其「無限滾動」界面中向下滾動,似乎我可以從過去獲得任意數量的Slashdot帖子 - 也許我可以獲得每個Slashdot帖子?Google閱讀器如何獲取RSS提要中的每個項目?
- Google閱讀器如何從RSS提要中檢索無限量的帖子?
- 我該怎麼辦?
Slashdot的RSS源是http://rss.slashdot.org/Slashdot/slashdot。如果我直接下載XML文件,那麼我只能從今天獲得一些帖子。但是,如果我在Google閱讀器中訂閱Feed,並在其「無限滾動」界面中向下滾動,似乎我可以從過去獲得任意數量的Slashdot帖子 - 也許我可以獲得每個Slashdot帖子?Google閱讀器如何獲取RSS提要中的每個項目?
谷歌遵循的飼料對所有用戶的一個實例,所以他們一直在跟蹤和存儲Slashdot的文章,例如,很久以前任何新的用戶開始讀。
要這麼做,你將不得不輪詢您想定期RSS源和存儲您在本地找到任何獨特的文章。
他們已經索引網頁數年,並存儲他們過來了一切。所以,當你爲你的頁面添加一個「訂閱這個」鏈接時,谷歌爬行器將開始索引該頁面並存儲它。
對於RSS,他們還擁有多人訂閱相同訂閱源的好處。
因此,對於你的應用程序,我建議通過在本地保存任何下載的項目解決這一點,所以新的訂閱可以回去的時間點預訂了該飼料的第一個用戶。它不會給你無限的,但隨着時間的推移,它會給你一個比20個最新項目更大的存檔。
我剛剛發現,如果你驗證你可以這樣做:
http://www.google.com/reader/atom/feed/http://rss.slashdot.org/Slashdot/slashdot?n=100
獲得從進料結果的任意數字。
現在任何人都可以如何使用feedparser從python腳本訪問此提要?只有在登錄Google閱讀器時纔可以獲取此提要的條目。但我不知道如何從腳本登錄... – 2009-11-04 21:08:34
我建了一個RSS檔案服務,只要你在談論(https://app.pub.center)是什麼。所有的RSS都可以通過REST免費使用。如果你想推送通知,你必須切換到付費計劃。
PubCenter每天輪詢它的RSS源目錄,並緩存文章。然後,您可以按照時間順序重新獲得這些文章。例如:大西洋https://pub.center/feed/02702624d8a4c825dde21af94e9169773454e0c3/articles?limit=10&page=1
第2頁的大西洋https://pub.center/feed/02702624d8a4c825dde21af94e9169773454e0c3/articles?limit=10&page=2
問得好
1,我很好奇這個自己。 – Anton 2010-01-09 11:36:01