2010-09-06 84 views
0

我正在嘗試對Twitter-Live Search進行反向工程。也許我們可以在這裏討論它。我說的是在那裏推文顯示,即使最晚「1秒前」等試圖瞭解以下可能發生的特點 -Twitter Live搜索

  1. 必須有當用戶鳴叫&當之間的一些層索引(更新)發生。這層MySQL或其他緩存層(memcached,cassandra)?也許...
  2. 索引 -索引更新如何發生?他們不可能從頭建立一個新的索引?
  3. 索引 -這裏必須有分佈式索引。如何更新所有索引而不必從一個索引&提供最新的數據?
  4. 索引編制 -或者這樣的事情發生了嗎?老實說,我不這麼認爲:)哪位用戶會注意到...

任何人都有什麼有趣的增加/討論。我只是想明白...

回答

0

確實很有意思,但我想這是更多的「架構」問題,而不是一個真正的編程問題。

但FYI有一個在高可擴展性的大量信息:posts tagged with twitter

難道他們把所有的鳴叫?我的猜測是,他們只是在一段時間後拋棄它們,當然他們不需要ACID屬性? ..

我不相信那些時間戳,如果我在哪裏你:)

+0

準確地說! Twitter的時間戳顯示(就此而言)可能不完全準確。但他們至少必須以使每個人都能同時看到的方式進行同步。也許有索引轉換(即從舊索引到新索引)?或者使用一些大型索引+小型索引組合? – 2010-09-06 11:03:36

+0

不知道他們做什麼索引明智,但我懷疑這是一個大的主索引。爲什麼每個人都必須一直看到同樣的東西?它可能都是「最終一致的」 - 事實上,你看到的東西並不意味着其他人會這樣做。如果你發佈了一些你可能會馬上看到的東西,但我可能不會在短時間內看到它。 – 2010-09-06 12:17:12