K8S节点NotReady排错思路

背景

在K8S中这种问题节点出现问题导致NotReady的情况并不少见,比如资源不足导致节点不可用,这里简单介绍下我遇到的情况以及我是如何解决的。

排查思路

我使用的是VMware虚拟化出来的三个节点,一个master两个node,在kubectl get node的时候发现节点不可用:

image-20240114182639915

以往一般会直接去重启对应节点机器,但是集群是重启过的,进一步查看原因,使用kubectl describe node node1

image-20240114182853476

可以看到kublet启动了,并且上报了对应节点状态,接着看到kube-proxy出现了问题,所以将思路聚焦在节点网络上:

image-20240114183016235

节点上网卡并没有启动,所以只需要启动网卡即可。

1
2
nmcli networking on
nmcli connection up ens160 #这里替换成你的网卡名称

image-20240114183223918

image-20240114183255962

问题解决,最后一个node2同样的排查思路。


K8S节点NotReady排错思路
http://example.com/2024/01/14/K8S节点NotReady排错思路/
Author
John Doe
Posted on
January 14, 2024
Licensed under