2010-07-25 68 views
9

什麼是跟蹤的RSS訂閱可靠的最好辦法,而不使用FeedBurner?一些顯而易見的方法,如通過IP或點擊次數跟蹤有一些缺點。 IP地址可能會隨着每個請求而改變,或者多個用戶可以使用相同的IP。此外,供稿閱讀器可以每天甚至每小時多次請求供稿。這兩個問題都很難讓唯一用戶獲得可靠的統計數據。追蹤RSS訂戶的標準和可靠方法?

我已閱讀關於該主題的文章Leo NotenboomTim Bray,但他們的任何建議似乎都無法真正解決如何以準確可靠的方式跟蹤訂閱者。 Leo建議每次加載引薦頁面時都要以編程方式生成唯一ID,以便將其附加到RSS Feed URL。 Tim主張讓RSS閱讀器生成一個獨特的主題標籤,並且還提供從跟蹤推薦人到使用Cookie的建議。一個唯一的URL是可靠的,但它有兩個缺陷:它不是一個用戶友好的URL,它創造了SEO的重複內容。還有其他可靠的跟蹤RSS訂閱者的方法嗎? Feedburner如何評估訂閱者?

+0

爲您網站的每個訂閱用戶生成唯一的xml文件,例如:www.site.com/rss/12345/;所以,通過使用XML標題類型&通過時間()跟蹤它生成與XML的XML!這可能是計算對您的RSS的唯一訪問的安全方式。恕我直言,非常激烈但可操作! ;) – 2010-08-03 19:13:03

回答

0

您可以查詢您的Web服務器日誌流量到您的RSS源,可能通過IP過濾它來獲得的唯一身份號碼。

的問題是,這將依賴於人們的日常檢查飼料。一個人點擊RSS提要的頻率可能每天都有所不同,而且數量可能會更低。

+0

感謝您的建議。但是,這種方法存在問題。 IP地址可能會隨着每個請求而改變,或者多個用戶可以使用相同的IP。此外,供稿閱讀器可以每天甚至每小時多次請求供稿。這兩個問題都很難讓唯一用戶獲得可靠的統計數據。 – VirtuosiMedia 2010-07-25 01:57:56

3

沒有一個真正的標準方法來做到這一點。訂戶計數總是不可靠,但您可以通過它獲得較好的估計。

下面是谷歌是怎麼做的(source):

訂戶計數通過匹配IP地址和feed閱讀器 組合,然後使用我們的 讀者,彙集衆人的詳細的瞭解計算,機器人上市場作出額外的推斷。

當然這對Google來說很容易,因爲他們可以首先計算有多少個Google閱讀器用戶訂閱了相關的Feed。之後,他們也使用IP地址匹配,這也是你應該使用的。

你可以計算單個IP地址(即唯一的)從網絡服務器日誌,但是這也要算10個人1,如果它們都使用相同的地址。這就是爲什麼你應該檢查由客戶端發送的HTTP頭,更具體地說是頭部字段HTTP_X_FORWARDED_FORHTTP_VIA。您可以使用地址HTTP_VIA作爲「主要」地址,然後計算訂閱該訂閱源的唯一地址數量爲HTTP_X_FORWARDED_FOR。如果用戶沒有這些代理添加的字段,則它被視爲唯一的IP地址。這些應該在生成提要的代碼中處理。您也可以爲IP添加GeoIP查找並將所有內容存儲到數據庫中。這可以讓你看到哪個國家的訂閱者人數最多。

這也是它的問題。所有代理都不使用這些字段,它不能解決計算NAT網關後面用戶的問題。然而,這是一個很好的估計。此外,你可能對數量級更感興趣,而不是訂戶的確切數量,不是嗎?如果櫃檯說你有5989個訂戶,你可能有更多的訂戶,因爲櫃檯給你的下限。

0

如果您將RSS訂閱源配置爲需要某種身份驗證,則可以執行基於用戶的指標而不是基於IP的指標。雖然這將是一個技術上正確的解決方案,但讓人們選擇進入經過身份驗證的博客是非Intranet場景的一部分。

+0

這將是理想的,但不幸的是,認證不是大多數飼料在野外工作的方式。我甚至不確定大多數RSS閱讀器是否支持這樣的事情。 – VirtuosiMedia 2010-07-31 20:55:50

3

Standard和Reliable在RSS字典中並不完全是詞:-)要記住,事情多少年後甚至沒有標準的XSD?如果通過跟蹤你的意思是「計數」,你可以做的事情有幾件事情,而策略取決於目的,即顯示大數還是小數?這是一個市場營銷的事情,所以你必須確定你的目標:-)

你可能必須分類的IP號碼的開始 - 擁有大/企業/傘的IP號碼的基本集合。對於他們來說,除非事實證明,否則您可以使用引薦來源作爲合理的過濾標準並計算其他所有內容。絕大多數IP地址號碼在2天內保持穩定,但再次使用基本引用者邏輯作爲過濾器來保持「點擊」可以說話的人總是很好。

然後,您需要一個體面的聚合列表和他們如何處理URL的分類,並且如果他們完全模糊了最終讀者,那麼您需要發佈或推斷的平均數 - 使用公平分配的平均數總是公平的遊戲。使用cookie可能有助於收集聚合器IP並區分自動代理和個人。

一個非常重要的事情是要記住,你不能只使用一種方法,並期望它是一個銀色的子彈 - 你需要同時使用這3-4個方面加上基本的統計推理。