2011-06-04 48 views
1

考慮下面的數據集我的網站上一篇文章:基本速度算法?

Article 1 
2/1/2010 100 
2/2/2010 80 
2/3/2010 60 

Article 2 
2/1/2010 20000 
2/2/2010 25000 
2/3/2010 23000 

,其中第1列是日期,第2列是瀏覽量爲物品的數量。什麼是可以做的基本速度計算來確定這篇文章在最近3天內是向上還是向下?

注意事項,文章將不知道瀏覽量總數只有他們自己的總數。理想情況下,數字在0和1之間。指向這類算法的指針是什麼?

謝謝!

回答

3

更新:你的數據實際上已經速度(瀏覽量/天)的列表。以下答案簡單地顯示如何查找過去三天的平均速度。請參閱我的other answer瞭解如何計算瀏覽量加速,這是您可能正在尋找的真實統計數據。

Velocity是簡單地在一個值(增量瀏覽量)隨時間的變化:

對於物品1上2010年2月3日:

delta pageviews = 100 + 80 + 60 
       = 240 pageviews 
delta time = 3 days 

pageview velocity (over last three days) = [delta pageviews]/[delta time] 
             = 240    /3 
             = 80 pageviews/day 

關於第2對2/3/2010:

delta pageviews = 20000 + 25000 + 23000 
       = 68000 pageviews 
delta time = 3 days 

pageview velocity (over last three days) = [delta pageviews]/[delta time] 
             = 68,000   /3 
             = 22,666 + 2/3 pageviews/day 

現在我們知道的最大速度,我們可以擴展所有的速度得到0和1之間的相對速度(或0%和100%之間):

relative pageview velocity of article 1 = velocity/MAX_VELOCITY 
             = 240 /(22,666 + 2/3) 
             ~ 0.0105882353 
             ~ 1.05882353% 

relative pageview velocity of article 2 = velocity /MAX_VELOCITY 
             = (22,666 + 2/3)/(22,666 + 2/3) 
             = 1 
             = 100% 
+0

那麼您是否像思考速度時間圖那樣思考? – James 2011-06-04 02:58:48

+0

@James:您也可以將其視爲瀏覽量時間圖。速度是任何時候瀏覽量功能的瞬時斜率。 – Leftium 2011-06-04 03:06:34

+0

你說的delta瀏覽量是什麼意思?你想要給你三角洲的計算是什麼? – James 2011-06-04 03:18:15

1

「網頁瀏覽趨勢」 可能指的是網頁瀏覽加速度,而不是速度。您的數據集實際上是已經是速度列表(網頁瀏覽量/天)。綜合瀏覽量是非遞減值,因此綜合瀏覽量速度永遠不會是負面的。以下介紹如何計算瀏覽量加速,這可能是負面的。

PV_acceleration(t1,t2) = (PV_velocity{t2} - PV_velocity{t1})/(t2 - t1) 
("PV" == "Pageview") 

說明: 加速簡單地在速度通過改變在時間上被劃分改變。由於數據集是頁面瀏覽速度的列表,你可以直接將它們插入公式:

PV_acceleration("2/1/2010", "2/3/2010") = (60 - 100)/("2/3/2010" - "2/1/2010") 
             = -40  /2 
             = -20 pageviews per day per day 

注爲「2010/2/2」數據沒有被使用。另一種方法是計算三個PV_accelerations(使用僅返回一天的日期範圍)並對它們進行平均。沒有你的榜樣,以三天做了足夠的數據,但在這裏是如何做到這一點的最後兩天:

PV_acceleration("2/3/2010", "2/2/2010") = (60 - 80)/("2/3/2010" - "2/2/2010") 
             = -20  /1 
             = -20 pageviews per day per day 

PV_acceleration("2/2/2010", "2/1/2010") = (80 - 100)/("2/2/2010" - "2/1/2010") 
             = -20  /1 
             = -20 pageviews per day per day 

PV_acceleration_average("2/3/2010", "2/2/2010") = -20 + -20/2 
               = -20 pageviews per day per day 

這種替代方法並沒有發揮作用的第1個數據,因爲頁面視圖加速度在兩天之間沒有變化,但是它會對第2條產生影響。