2017-04-14 77 views
2

我在我的Django項目中使用最新的穩定芹菜(4)與RabbitMQ。芹菜擊敗有時停止工作

RabbitMQ在本地網絡內的獨立服務器上運行。並週期性地停下來發送任務給工作人員,沒有任何錯誤,只有重新啓動才能解決問題。

工人中沒有例外(簽入日誌&也我用Sentry來捕捉異常)。它只是停止發送任務。

服務配置:

[Unit] 
Description=*** Celery Beat 
After=network.target 

[Service] 
User=*** 
Group=*** 
WorkingDirectory=/opt/***/web/ 
Environment="PATH=/opt/***/bin" 
ExecStart=/opt/***/bin/celery -A *** beat --max-interval 30 

[Install] 
WantedBy=multi-user.target 

是否有可能解決這一問題?或者有什麼好的選擇? (克朗似乎不是最好的解決方案)。

+0

也許你應該嘗試使用strace的或東西,如果你can'f得到的東西整理一下,芹菜節拍可以通過OOM被殺。系統監視器上有什麼異常?內存使用情況? – pingz

回答

3

你的描述聽起來很像這個開放的錯誤:https://github.com/celery/celery/issues/3409

有很多的細節都有,但高層次的錯誤描述是,如果到RabbitMQ的連接丟失,它是無法重新連接。

不幸的是,我看不出有誰明確地解決了這個問題。

您可以通過調試這個使用這個啓動:

ExecStart=/opt/***/bin/celery -A *** beat --loglevel DEBUG --max-interval 30