這更多的是試圖瞭解HTTP如何工作然後實現它的問題。如何分離背景HTTP請求
我需要一個HTTP分析器,它能夠將主頁面請求和來自某些HTTP日誌數據的「背景」請求分開。這個想法是將用戶發出的HTTP請求與後臺自動發生的請求(鬆散地使用這個術語)分開。因此,從我看到的HTTP數據的前幾個印象看來,似乎當我訪問任何普通網站時,會獲取文本/ html對象,然後是很多其他對象,如css,xml,javascript,圖像等。
現在,問題是如何區分這些「背景」請求,其中用戶主動不生成請求。這主要取決於我所知道的廣告提取,重定向和一些基於Ajax的事情。
有沒有人對此有任何意見。一些,經驗或可能是您可以指示我開始進行此分析的資源?
我覺得平時(最簡單的)方式是文件類型將它們分開:'html','PHP '等請求是真正的命中,'css','js',圖像文件等是「背景」命中。當然,這不包含Ajax請求,它也可能會遇到'html'和'php'文件。 – Wukerplank 2011-03-04 09:52:13