2015-02-10 54 views
5

「失落的通知」,我經常看到運行nodetool repair當出現以下消息:從nodetool修復

[2015-02-10 16:19:40,042] Lost notification. You should check server log for repair status of keyspace xxx 

是什麼真正的意思(以及如何預防它,如果它是危險的)?

我在四節點集羣中使用Cassandra 2.1.2。

回答

2

這似乎是一個known bug已在最新版本中已被修復。

+1

謝謝。但正如我寫的,我正在使用最新版本的Cassandra(2.1.2),該版本的發佈時間晚於鏈接bug的「修復版本」。更重要的是,這個bug是關於nodetool收到事件後退出的,而不是關於事件的原因。 – 2015-02-10 16:55:18

+0

是的,「固定」狀態是關於防止nodetool退出,而不是修復JMX問題。在票證中描述並鏈接退出節點工具不必要的確切原因。 – 2015-02-10 17:12:02

5

此消息本身無害。這隻意味着節點工具丟失了修復狀態的軌跡。它不影響修理本身。如果在完成上一個命令時發出下一個修復命令,則可能會很危險,因此會導致多個併發修復,從而在系統上產生更高的負載。我曾經有一個腳本(現在沒有這個腳本)監視由「丟失的通知」消息觸發的修復週期開始/結束消息的日誌,以避免產生相互競爭的修復。

0

您可以隨時按照錯誤消息的建議去檢查cassandra的系統日誌並收集有關修復活動的信息。

$ cd /var/log/cassandra/ 
$ cat system.log | grep repair 

請注意,我爲某些目的測試了一個cassandra 2.1.15,但仍遇到了問題。作爲考慮因素,由於它不是一個主要的錯誤,並不真正影響修復過程,我認爲它會堅持一段時間。