2017-07-14 97 views
2

Official documentation上使GPU支持狀態:Kubernetes GPU支持:如何啓用?

一個特殊的α特徵柵極加速器具有要在系統設置爲true跨越 :--feature-門=「加速器=真」。

我無法解碼「在系統中設置爲真」部分。

我發現kubelet,kube-apiserverkube-controller-manager都具有--feature-gates運行時參數。規範說明他們都聽取對配置文件的修改。

這些配置文件在哪裏可以啓用--feature-gates =「Accelerators = true」選項?

我也嘗試添加選項/etc/kubernetes/manifests/kube-apiserver.yaml: 規格:

containers: 
    - command: 
    - kube-apiserver 
    - -- <...> 
    - --feature-gates=Accelerators=true 

然而,導致KUBE-API服務器停止並永遠不再回來。

在端我發現以下解決方法here

3.I添加GPU支持到Kubeadm配置,同時簇未初始化。這必須針對羣集中的每個節點完成,即使其中一些節點沒有任何GPU,也是如此。

須藤VIM /etc/systemd/system/kubelet.service.d/ <> -kubeadm.conf 因此,用標誌追加ExecStart --feature-門= 「加速器=真」,因此它看起來像這樣:

ExecStart =的/ usr/bin中/ kubelet $ KUBELET_KUBECONFIG_ARGS [...] --feature-門= 「加速器=真正的」 3.II重啓kubelet

須藤systemctl守護重裝須藤systemctl restart kubelet

但是,我認爲上述方法並不是Kubernetes開發人員打算爲此功能啓用的方式。任何幫助,將不勝感激。


[編輯]我能打開這兩個API服務器和控制器經理的選擇 - 既沒有給GPU的期望的結果變得可見。

所以這是kubelet服務需要得到這個選項。

問題變成:如何通過kubelet配置文件設置選項?

+0

當您添加標誌後,無法啓動的'kube-apiserver'日誌會說明什麼? – kichik

+0

我在/ var/log/kube *下沒有很好的日誌,我看到的唯一輸出是在journalctl中。我可以推斷下面幾行是相關的: kubelet.go:1596]刪除鏡像盒「kube-apiserver-XX_kube-system(f30d81e3-6b4d-11e7-8d98-4ccc6af724b9)」,因爲它已過時 kubelet.go :1607]無法爲「kube-apiserver-eg101_kube-system(635d00135d0920d6083b2b5a38a22810)」創建鏡像站點:後XX:6443/api/v1 /命名空間/ kube-system/pods:dial tcp XX:6443:getsockopt:連接被拒絕 當試圖設置控制管理器的feature-gates參數時,我也遇到同樣的錯誤。 –

+0

這是沒有意義的,因爲上面的日誌說的是:無法到達API服務器來啓動鏡像API服務器... –

回答

0

從邏輯上說,您需要在節點上啓用GPU支持。這意味着正確的位置是kubelet或節點配置。

Kube apiserver不會是正確的地方。

一旦啓用「節點將自動發現並公開所有Nvidia GPU作爲可調度資源。」

+0

有關如何通過配置文件啓用對kubelet的支持的任何建議? –

3

我使用Ubuntu16.04。

Add --feature-gates="Accelerators=true"KUBELET_ARGS在文件/etc/kubernetes/kubelet應該沒問題。

+0

這應該在主節點還是集羣中的每個節點上完成? – mdornfe1

+0

我希望我可以通過配置文件來設置這個...有什麼建議嗎? –

1

如果使用kops運行您的K8S那麼你可以使用此指令: https://github.com/kubernetes/kops/blob/master/docs/gpu.md

這基本上可以歸結爲編輯集羣 kops edit cluster gpu.example.com

並添加特定的配置使GPU處理kubelet spec: ... kubelet: featureGates: Accelerators: "true"

然後,您需要更新羣集並執行滾動更新,以便所有節點都將使用新的kubelet配置。

使用集羣卷可以檢查功能門標誌是否在kublet上啓用並使用GPU部署窗格。

+0

感謝您的回答,但我不使用kops ... –