2017-05-14 49 views
0

我們收集我們網站流量的數據,每天有大約50k到100k的 次訪問。德魯伊隊列分析?

隊列分析:

查找用戶的24小時內,其登記在 網站,然後真正去我們的採購網頁(計算的 百分比的百分比有多少用戶中的第一個做到這一點,第二,第三等 小時後註冊)。

兩個非常簡短的樣本文件:

  • 的sessionId:我們進行計數唯一標識符
  • 網址:網址評估同夥
  • 時間:Unix時間戳事件

{ 「sessionId」:「some-random-id」, 「time」:1428238800000,(unix timestamp:Apr 5th,3:00 pm) 「網址「: 」/註冊「 }

{ 」的sessionId「: 」一些隨機-ID「, 」時間「:1428241500000,(UNIX時間戳:4月5日,下午3:45) 」URL「 :「/買入」 }

如果我想要做同樣聚集了一段,說,6月 &想檢查執行同夥回頭客? 數據集太龐大了。

附註:我對獲得100%準確的結果也不感興趣, 近似值足以用於趨勢分析。

我們可以用德魯伊來實現嗎?或者它不適合這種分析?除了隊列分析之外,還有其他的東西嗎?

回答

0

我想你可以用德魯伊和數據草圖做到這一點。 看看最後一個例子是這樣的page 如果你想用這種近似方法,你可以看看here來理解近似的邊界誤差和交易記憶的折衷。

+0

感謝您指出數據草圖。 –