我們收集我們網站流量的數據,每天有大約50k到100k的 次訪問。德魯伊隊列分析?
隊列分析:
查找用戶的24小時內,其登記在 網站,然後真正去我們的採購網頁(計算的 百分比的百分比有多少用戶中的第一個做到這一點,第二,第三等 小時後註冊)。
兩個非常簡短的樣本文件:
- 的sessionId:我們進行計數唯一標識符
- 網址:網址評估同夥
- 時間:Unix時間戳事件
{ 「sessionId」:「some-random-id」, 「time」:1428238800000,(unix timestamp:Apr 5th,3:00 pm) 「網址「: 」/註冊「 }
{ 」的sessionId「: 」一些隨機-ID「, 」時間「:1428241500000,(UNIX時間戳:4月5日,下午3:45) 」URL「 :「/買入」 }
如果我想要做同樣聚集了一段,說,6月 &想檢查執行同夥回頭客? 數據集太龐大了。
附註:我對獲得100%準確的結果也不感興趣, 近似值足以用於趨勢分析。
我們可以用德魯伊來實現嗎?或者它不適合這種分析?除了隊列分析之外,還有其他的東西嗎?
感謝您指出數據草圖。 –