Official documentation上使GPU支持狀態:Kubernetes GPU支持:如何啓用?
一個特殊的α特徵柵極加速器具有要在系統設置爲true跨越 :--feature-門=「加速器=真」。
我無法解碼「在系統中設置爲真」部分。
我發現kubelet,kube-apiserver和kube-controller-manager都具有--feature-gates運行時參數。規範說明他們都聽取對配置文件的修改。
這些配置文件在哪裏可以啓用--feature-gates =「Accelerators = true」選項?
我也嘗試添加選項/etc/kubernetes/manifests/kube-apiserver.yaml: 規格:
containers:
- command:
- kube-apiserver
- -- <...>
- --feature-gates=Accelerators=true
然而,導致KUBE-API服務器停止並永遠不再回來。
在端我發現以下解決方法here:
3.I添加GPU支持到Kubeadm配置,同時簇未初始化。這必須針對羣集中的每個節點完成,即使其中一些節點沒有任何GPU,也是如此。
須藤VIM /etc/systemd/system/kubelet.service.d/ <> -kubeadm.conf 因此,用標誌追加ExecStart --feature-門= 「加速器=真」,因此它看起來像這樣:
ExecStart =的/ usr/bin中/ kubelet $ KUBELET_KUBECONFIG_ARGS [...] --feature-門= 「加速器=真正的」 3.II重啓kubelet
須藤systemctl守護重裝須藤systemctl restart kubelet
但是,我認爲上述方法並不是Kubernetes開發人員打算爲此功能啓用的方式。任何幫助,將不勝感激。
[編輯]我能打開這兩個API服務器和控制器經理的選擇 - 既沒有給GPU的期望的結果變得可見。
所以這是kubelet服務需要得到這個選項。
問題變成:如何通過kubelet配置文件設置選項?
當您添加標誌後,無法啓動的'kube-apiserver'日誌會說明什麼? – kichik
我在/ var/log/kube *下沒有很好的日誌,我看到的唯一輸出是在journalctl中。我可以推斷下面幾行是相關的: kubelet.go:1596]刪除鏡像盒「kube-apiserver-XX_kube-system(f30d81e3-6b4d-11e7-8d98-4ccc6af724b9)」,因爲它已過時 kubelet.go :1607]無法爲「kube-apiserver-eg101_kube-system(635d00135d0920d6083b2b5a38a22810)」創建鏡像站點:後XX:6443/api/v1 /命名空間/ kube-system/pods:dial tcp XX:6443:getsockopt:連接被拒絕 當試圖設置控制管理器的feature-gates參數時,我也遇到同樣的錯誤。 –
這是沒有意義的,因爲上面的日誌說的是:無法到達API服務器來啓動鏡像API服務器... –