2014-12-02 60 views
4

我在嘗試但未能將新的(舊的,但已被擦除的)節點加入到現有集羣中。卡桑德拉2.1.2節點卡在加入集羣上

當前羣集由2個節點組成,運行C * 2.1.2。我使用2.1.2啓動第三個節點,它進入加入狀態,啓動它,即傳輸一些數據,如nodetool netstats所示,但一段時間後,它會卡住。從這一點起,沒有任何東西可以流式傳輸,新節點保持連接狀態。我重新啓動節點兩次,每次流傳輸更多數據,但後來再次卡住。 (我目前正在進行第三輪比賽)。

其他事實:

  • 我沒有看到任何節點上的日誌中的任何錯誤。
  • 連接看起來很好,我可以ping通,netcat到端口7000的所有方式。
  • 我有267 GB負載每個運行節點,複製2,16令牌。
  • 現在新節點的負載大約爲100GB
  • 我猜測節點在重新啓動幾輪之後,最終會吸收來自運行節點的所有數據並加入羣集。但絕對不是它應該工作的方式。

編輯:我發現了一些更多的信息:

  • 引導過程中的流媒體的一些表的中間站,總是

    正好將一些的SSTable的10MB,如:

    $ nodetool netstats | grep -P -v "bytes\(100" Mode: NORMAL Bootstrap e0abc160-7ca8-11e4-9bc2-cf6aed12690e /192.168.200.16 Sending 516 files, 124933333900 bytes total /home/data/cassandra/data/leadbullet/page_view-2a2410103f4411e4a266db7096512b05/leadbullet-page_view-ka-13890-Data.db 10485760/167797071 bytes(6%) sent to idx:0/192.168.200.16 Read Repair Statistics: Attempted: 2016371 Mismatch (Blocking): 0 Mismatch (Background): 168721 Pool Name Active Pending Completed Commands n/a 0 55802918 Responses n/a 0 425963

我無法診斷錯誤&我會很感激任何幫助!

+2

您在加入過程中是否一直在觀看JVM?堆是否被充分利用,並且您是否看到C *日誌中存在長時間的GC? – RussS 2014-12-02 22:56:22

+0

在將其添加回去之前是否已解除節點的使用?八卦偶爾會記住節點,並在稍後將節點添加回來時導致麻煩。 – mildewey 2014-12-03 18:18:17

+1

@RussS,是的,我看着它。它看起來很好。堆使用率達到最大值,但是它會正確地將CMS修改爲1GB。 – zarzyk 2014-12-05 18:26:12

回答

1
  1. 嘗試使用正確的端口從一個節點telnet到另一個節點。
  2. 確保您加入了正確的名稱羣集。
  3. 嘗試使用:nodetool修復
  4. 您可能會ping外部IP尋址,並且您的羣集使用內部IP地址進行通信。
  5. 如果您正在亞馬遜AWS上運行,請確保您的內部IP地址上都有防火牆打開。