fault-tolerance

    0熱度

    1回答

    在基於被動複製的分佈式系統中,如果主服務器發生故障,其中一個備份被提升爲主服務器。但是,假設原始主服務器恢復,那麼我們如何從當前備份切換回主服務器? 我想知道 如果發生故障的主服務器恢復,它必須被併入該系統作爲二次和更新,以反映在給定的時間點上的最準確的信息。要將其作爲主服務器恢復,在當前主服務器(最初是備份服務器)出現故障的情況下,可將其作爲主服務器進行提升,否則,如果需要,當前主服務器可能會被

    0熱度

    1回答

    我試圖用RabbitMQ實現工作隊列架構。我有一個發件人應用程序和多個消費者。 我對消費者使用手動確認,所以在處理請求失敗的情況下,它將被重新排隊等待另一個消費者處理。 我想知道如果所有的消費者在特定的請求返回nack會發生什麼。有沒有辦法識別這種行爲並將請求標記爲「已死」,以便將其重新路由到死信交換?在這種情況下,我希望在綁定到死信交換的隊列上打開一個單獨的使用者,並接收所有消費者無法處理的所有

    0熱度

    2回答

    我知道Apache Helix允許動態集羣擴展/收縮(例如添加/失敗/刪除物理節點)。但是,如果單個物理節點無法處理單個分區副本,則需要將分區分成兩部分。我知道我們需要預先估計工作量,所以我們可以預先設置足夠數量的分區。但是,隨着流量不可預測地上升,幾乎不可能做出這樣的預估。任何人都可以告訴我Helix是否支持重新分區開箱即用?如果我需要對其進行定製以添加重新分區功能,那麼原理上的努力程度和方法如

    1熱度

    1回答

    我正在實施使用實用拜占庭容錯的分佈式系統。這個方法委託一個委員會爲每個提交投票。但是,如果它們全部崩潰或在DDoS攻擊下,整個網絡將崩潰。我很好奇是否有辦法改變整個委員會。這與視圖更改不同,因爲視圖更改只會替換錯誤的節點,而這需要替換所有委員會成員,從而組成一個充滿活力的委員會。

    0熱度

    1回答

    我已經遇到了這個問題之前幾個HTTP交易(如一百個左右的帖子)。今天我試圖做7k HTTP請求。這似乎很愚蠢,但它是與目標系統交互的唯一方式。我已經能夠做的最好的事情將在大約96%的請求中停頓。它會停下來,永遠不會完成最後幾個請求。 也許我錯誤地使用了OiBackoff。它似乎工作正常,但最後3%的GETs將永遠不會完成。當日志中的最高重試間隔爲40秒時,我讓它設置爲5分鐘,沒有請求返回。 我不知

    2熱度

    1回答

    我目前正試圖找到一種方法來處理我的應用程序中意外的HBase故障。更具體地說,我試圖解決的是我的應用程序向HBase插入數據然後HBase失敗並重新啓動的情況。 爲了檢查我的應用程序如何對該場景做出反應,我編寫了一個應用程序,該應用程序使用HBase Async client進行嚴格循環並將結果保存在HBase中。當我啓動應用程序時,我可以看到行被保存到表中,如果在此期間我故意失敗我的HBase服

    0熱度

    1回答

    我有一個測試模塊和一個simple_one_for_one主管。 test.erl -module(test). -export([ run/1, do_job/1 ]). run(Fun) -> test_sup:start_child([Fun]). do_job(Fun) -> Pid = spawn(Fun), io:for

    1熱度

    1回答

    我想在運行的java應用程序中獲取執行的確切點或運行代碼行。 我正在研究一些容錯方法並試圖實現一些解決方案。我將一個Thread對象序列化爲文件並強制關閉我的應用程序。我的目標是重新運行可序列化的線程,而不是從「運行」方法開始,而是從序列化時的線程開始。 問題是:在一個正在運行的線程中,在調用一個「暫停」方法後,獲取暫停代碼的行。在此之後,我想實例化一個新的線程類型並從該線路運行。 任何人都知道我

    3熱度

    3回答

    我已經閱讀了Akka docs on fault tolerance & supervision和我認爲我完全得到他們,有一個很大的例外(沒有雙關語意圖)。 爲什麼你會想要/需要stop一個小孩演員??? 在文檔中唯一的線索是: 接近二郎方式是戰略只停留在他們失敗的孩子,然後採取主管糾正措施...... 但對我來說,停止一個孩子就像說「不再執行此代碼」一樣,對我來說,這與對代碼進行新的更改實際上是

    1熱度

    1回答

    我想通過TCP傳輸Java POJO。 讓A和B成爲參與者,C1是它們之間的主要連接,C2是C1失敗時使用的另一個連接。 我有兩種對象:可靠和不可靠。 當C1斷開連接時,每個未傳送的對象和新的對象應通過C2發送。如果C1再次建立它將是主要連接,數據將流過C1。 參與者可能需要識別重複的對象。 我不太瞭解ESB。我看了一下Apache Camel。 哪些技術可以解決上述問題?例如駱駝可以做到嗎?它是