k8s部署問題解決方案(節(jié)點狀態(tài)為 NotReady)
問題
使用kubectl get nodes查看已加入的節(jié)點時,出現(xiàn)了Status為NotReady的情況。
root@master1:~# kubectl get nodes NAME STATUS ROLES AGE VERSION master1 NotReady master 152m v1.18.1 worker1 NotReady <none> 94m v1.18.1
這種情況是因為有某些關(guān)鍵的 pod 沒有運行起來,首先使用如下命令來看一下kube-system的 pod 狀態(tài):
kubectl get pod -n kube-system
NAME READY STATUS RESTARTS AGE coredns-bccdc95cf-792px 1/1 Pending 0 3h11m coredns-bccdc95cf-bc76j 1/1 Pending 0 3h11m etcd-master1 1/1 Running 2 3h10m kube-apiserver-master1 1/1 Running 2 3h11m kube-controller-manager-master1 1/1 Running 2 3h10m kube-flannel-ds-amd64-9trbq 0/1 ImagePullBackoff 0 133m kube-flannel-ds-amd64-btt74 0/1 ImagePullBackoff 0 174m kube-proxy-27zfk 1/1 Pending 2 3h11m kube-proxy-lx4gk 1/1 Pending 0 133m kube-scheduler-master1 1/1 Running 2 3h11m
如上,可以看到 pod kube-flannel 的狀態(tài)是ImagePullBackoff,意思是鏡像拉取失敗了,所以我們需要手動去拉取這個鏡像。這里可以看到某些 pod 運行了兩個副本是因為我有兩個節(jié)點存在了。
你也可以通過kubectl describe pod -n kube-system <服務(wù)名>來查看某個服務(wù)的詳細情況,如果 pod 存在問題的話,你在使用該命令后在輸出內(nèi)容的最下面看到一個[Event]條目,如下:
root@master1:~# kubectl describe pod kube-flannel-ds-amd64-9trbq -n kube-system ... Events: Type Reason Age From Message ---- ------ ---- ---- ------- Normal Killing 29m kubelet, worker1 Stopping container kube-flannel Warning FailedCreatePodSandBox 27m (x12 over 29m) kubelet, worker1 Failed create pod sandbox: rpc error: code = Unknown desc = failed to create a sandbox for pod "kube-flannel-ds-amd64-9trbq": Error response from daemon: cgroup-parent for systemd cgroup should be a valid slice named as "xxx.slice" Normal SandboxChanged 19m (x48 over 29m) kubelet, worker1 Pod sandbox changed, it will be killed and re-created. Normal Pulling 42s kubelet, worker1 Pulling image "quay.io/coreos/flannel:v0.11.0-amd64"
手動拉取鏡像
flannel的鏡像可以使用如下命令拉到,如果你是其他鏡像沒拉到的話,百度一下就可以找到國內(nèi)的鏡像源地址了,這里記得把最后面的版本號修改成你自己的版本,具體的版本號可以用上面說的kubectl describe命令看到:
拉去鏡像:
docker pull quay-mirror.qiniu.com/coreos/flannel:v0.11.0-amd64
等鏡像拉取完了之后需要把鏡像名改一下,改成 k8s 沒有拉到的那個鏡像名稱,我這里貼的鏡像名和版本和你的不一定一樣,注意修改:
docker tag quay-mirror.qiniu.com/coreos/flannel:v0.11.0-amd64 quay.io/coreos/flannel:v0.11.0-amd64
修改完了之后過幾分鐘 k8s 會自動重試,等一下就可以發(fā)現(xiàn)不僅flannel正常了,其他的 pod 狀態(tài)也都變成了Running,這時再看 node 狀態(tài)就可以發(fā)現(xiàn)問題解決了:
[kubeadm@server1 ~]$ kubectl get nodes NAME STATUS ROLES AGE VERSION server1 Ready master 150m v1.18.1 server2 Ready <none> 150m v1.18.1 server3 Ready <none> 150m v1.18.1 [kubeadm@server1 ~]$
總結(jié)
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
刪除Helm使用時關(guān)于kubernetes文件的警告問題
這篇文章主要介紹了刪除Helm使用時關(guān)于kubernetes文件的警告問題,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-11-11Kubernetes存儲系統(tǒng)數(shù)據(jù)持久化管理詳解
這篇文章主要為大家介紹了Kubernetes存儲系統(tǒng)數(shù)據(jù)持久化管理詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2022-11-11tkestack/gpu-manager在k8s1.23版本之后的使用方法
這篇文章主要介紹了tkestack/gpu-manager在k8s1.23版本之后的使用,本文給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2023-04-04K8S?prometheus?operator監(jiān)控工作原理介紹
這篇文章主要為大家介紹了K8S?prometheus?operator監(jiān)控工作原理介紹,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2022-11-11kubelet為cadvisor添加namespace/pod/container標簽示例詳解
這篇文章主要為大家介紹了kubelet為cadvisor添加namespace/pod/container標簽示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2023-09-09