2016-12-05 67 views
1

我有一項服務連接到我們的Cassandra羣集,每天使用Lightweight (ACID) Transactions執行數以萬計的查詢來實現被請求的共享系統here。大多數情況下,它工作正常,但零星地寫道將失敗,並顯示「操作超時 - 只收到1個響應」(或者不太常見,只有0個響應)。我們正在使用Datastax Python驅動程序。當錯誤發生時,完整的錯誤線(在堆棧跟蹤的結尾)寫道:使用輕量級事務時發生零星Cassandra寫錯誤

WriteTimeout: Error from server: code=1100 [Coordinator node timed out waiting for replica nodes' responses] message="Operation timed out - received only 1 responses." info={'received_responses': 1, 'required_responses': 2, 'consistency': 'LOCAL_SERIAL'} 

這東西,似乎有望從時間發生時間在生產卡桑德拉設置?還是看起來像我們的Cassandra集羣或網絡有配置問題?

有關我們Cassandra羣集的一些信息:它是跨2個Amazon EC2區域(每個區域4個節點)分佈的8節點設置。所有節點都運行Datastax Cassandra發行版的3.3.0版本。

+0

同樣的問題在這裏,我想補充:都這麼回答與這個問題有關的是關於增加超時的問題。在我的情況下,WriteTimeout在請求開始後的10-100ms秒內收到,我的所有超時在cassandra yaml config中大於10s。 我想這也可能是Datastax Python的卡桑德拉客戶問題.. –

+0

僅供參考,這些都不是有幫助的: [回答1](http://stackoverflow.com/questions/30575125/coordinator-node-timed-out-等待複製節點在cassandra-datastax-while), [answer 2](http://stackoverflow.com/questions/33194860/cassandra-coordinator-node-timed-out-waiting-for-replica -nodes-應答?noredirect = 1&LQ = 1) –

回答

1

https://issues.apache.org/jira/browse/CASSANDRA-9328

有一種情況下爭協調失去的 跟蹤案件提交給Paxos的值是否可能適用與否(見 CASSANDRA-6013)。在這一點上,我們不能做任何其他的事情, 回答「抱歉,我不知道」。而且,由於一個WriteTimeoutException 已經表示「我不知道」,我們把它扔在那種情況下,即使 雖然它不是一個適當的超時每本身