k8s部署問(wèn)題解決方案(節(jié)點(diǎn)狀態(tài)為 NotReady)
問(wèn)題
使用kubectl get nodes查看已加入的節(jié)點(diǎn)時(shí),出現(xiàn)了Status為NotReady的情況。
root@master1:~# kubectl get nodes NAME STATUS ROLES AGE VERSION master1 NotReady master 152m v1.18.1 worker1 NotReady <none> 94m v1.18.1
這種情況是因?yàn)橛心承╆P(guān)鍵的 pod 沒(méi)有運(yùn)行起來(lái),首先使用如下命令來(lái)看一下kube-system的 pod 狀態(tài):
kubectl get pod -n kube-system
NAME READY STATUS RESTARTS AGE coredns-bccdc95cf-792px 1/1 Pending 0 3h11m coredns-bccdc95cf-bc76j 1/1 Pending 0 3h11m etcd-master1 1/1 Running 2 3h10m kube-apiserver-master1 1/1 Running 2 3h11m kube-controller-manager-master1 1/1 Running 2 3h10m kube-flannel-ds-amd64-9trbq 0/1 ImagePullBackoff 0 133m kube-flannel-ds-amd64-btt74 0/1 ImagePullBackoff 0 174m kube-proxy-27zfk 1/1 Pending 2 3h11m kube-proxy-lx4gk 1/1 Pending 0 133m kube-scheduler-master1 1/1 Running 2 3h11m
如上,可以看到 pod kube-flannel 的狀態(tài)是ImagePullBackoff,意思是鏡像拉取失敗了,所以我們需要手動(dòng)去拉取這個(gè)鏡像。這里可以看到某些 pod 運(yùn)行了兩個(gè)副本是因?yàn)槲矣袃蓚€(gè)節(jié)點(diǎn)存在了。
你也可以通過(guò)kubectl describe pod -n kube-system <服務(wù)名>來(lái)查看某個(gè)服務(wù)的詳細(xì)情況,如果 pod 存在問(wèn)題的話(huà),你在使用該命令后在輸出內(nèi)容的最下面看到一個(gè)[Event]條目,如下:
root@master1:~# kubectl describe pod kube-flannel-ds-amd64-9trbq -n kube-system ... Events: Type Reason Age From Message ---- ------ ---- ---- ------- Normal Killing 29m kubelet, worker1 Stopping container kube-flannel Warning FailedCreatePodSandBox 27m (x12 over 29m) kubelet, worker1 Failed create pod sandbox: rpc error: code = Unknown desc = failed to create a sandbox for pod "kube-flannel-ds-amd64-9trbq": Error response from daemon: cgroup-parent for systemd cgroup should be a valid slice named as "xxx.slice" Normal SandboxChanged 19m (x48 over 29m) kubelet, worker1 Pod sandbox changed, it will be killed and re-created. Normal Pulling 42s kubelet, worker1 Pulling image "quay.io/coreos/flannel:v0.11.0-amd64"
手動(dòng)拉取鏡像
flannel的鏡像可以使用如下命令拉到,如果你是其他鏡像沒(méi)拉到的話(huà),百度一下就可以找到國(guó)內(nèi)的鏡像源地址了,這里記得把最后面的版本號(hào)修改成你自己的版本,具體的版本號(hào)可以用上面說(shuō)的kubectl describe命令看到:
拉去鏡像:
docker pull quay-mirror.qiniu.com/coreos/flannel:v0.11.0-amd64
等鏡像拉取完了之后需要把鏡像名改一下,改成 k8s 沒(méi)有拉到的那個(gè)鏡像名稱(chēng),我這里貼的鏡像名和版本和你的不一定一樣,注意修改:
docker tag quay-mirror.qiniu.com/coreos/flannel:v0.11.0-amd64 quay.io/coreos/flannel:v0.11.0-amd64
修改完了之后過(guò)幾分鐘 k8s 會(huì)自動(dòng)重試,等一下就可以發(fā)現(xiàn)不僅flannel正常了,其他的 pod 狀態(tài)也都變成了Running,這時(shí)再看 node 狀態(tài)就可以發(fā)現(xiàn)問(wèn)題解決了:
[kubeadm@server1 ~]$ kubectl get nodes NAME STATUS ROLES AGE VERSION server1 Ready master 150m v1.18.1 server2 Ready <none> 150m v1.18.1 server3 Ready <none> 150m v1.18.1 [kubeadm@server1 ~]$

總結(jié)
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
刪除Helm使用時(shí)關(guān)于kubernetes文件的警告問(wèn)題
這篇文章主要介紹了刪除Helm使用時(shí)關(guān)于kubernetes文件的警告問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-11-11
Kubernetes存儲(chǔ)系統(tǒng)數(shù)據(jù)持久化管理詳解
這篇文章主要為大家介紹了Kubernetes存儲(chǔ)系統(tǒng)數(shù)據(jù)持久化管理詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-11-11
tkestack/gpu-manager在k8s1.23版本之后的使用方法
這篇文章主要介紹了tkestack/gpu-manager在k8s1.23版本之后的使用,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2023-04-04
K8S?prometheus?operator監(jiān)控工作原理介紹
這篇文章主要為大家介紹了K8S?prometheus?operator監(jiān)控工作原理介紹,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-11-11
kubelet為cadvisor添加namespace/pod/container標(biāo)簽示例詳解
這篇文章主要為大家介紹了kubelet為cadvisor添加namespace/pod/container標(biāo)簽示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-09-09

