2012-07-24 66 views
0

我剛剛發現了R,它似乎是獲取Web服務器日誌文件統計信息的理想工具。我研究了幾個庫,如zooplyr,但它們都沒有提供直接解決方案來聚合時間戳數據。使用R處理日誌文件

是否有任何R lib或教程或文檔專注於分析日誌文件,如數據?哪些強調集中時間片?

可能usecases:

  • 平均每天申請時間每人每天會議
  • 平均請求
  • 得到最慢的請求本週
  • ...
+0

爲什麼'zoo'和'plyr'不適合你?目前你的問題很模糊,難以回答。你能對你的問題更具體嗎?也許發佈一些示例數據,並顯示你到目前爲止嘗試過的? – Andrie 2012-07-24 07:10:48

+0

我的問題是一般性的;)我只是想要某種概述,也許有人已經潛心於用R分析日誌。我已經「以某種方式」解決了我的問題,但不是以一種優雅的方式。 – 2012-07-24 07:12:54

+0

你爲什麼要用R來做這個?爲什麼不使用[AWstats](http://awstats.sourceforge.net)等Web服務器日誌分析器程序? – 2012-07-24 11:15:14

回答

2

這種處理時間戳數據的問題其實很常見。因爲你的問題含糊不清,我的答案僅限於一些指針。爲了聚合時間序列看(這順便說一句是我自己的所有答案)的例子:

這些答案都使用相同的策略,與plyrggplot2包相結合。這應該讓你開始。請注意,這些只是我自己在幾分鐘內找到的答案。可能還有更多要找的東西,特別是如果你正在尋找更具體的問題。