删除k8s某命名空间,一直卡住了怎么办?

发布于:2025-05-01 ⋅ 阅读:(85) ⋅ 点赞:(0)

以 kubectl delete ns cert-manager 命令卡住为例,并且命名空间一直处于 Terminating 状态,说明 Kubernetes 无法完成删除操作,通常是因为 Finalizers 阻塞或某些资源无法正常清理。


解决方法

1. 检查命名空间状态

kubectl get ns cert-manager -o yaml

检查 finalizers 字段,例如:

spec:
  finalizers:
  - kubernetes

如果 finalizers 存在,但删除卡住,可能是某些资源未清理或 API 通信问题。


2. 检查残留资源

有些资源可能未被正确清理,尝试列出 cert-manager 命名空间下的所有资源:

kubectl api-resources --verbs=list --namespaced -o name | xargs -n 1 kubectl get -n cert-manager

如果返回 No resources found,说明资源已删除,但 finalizers 仍然阻塞。


3. 强制移除 Finalizers(推荐)

方法 1:使用 kubectl patch
kubectl patch ns cert-manager -p '{"spec":{"finalizers":[]}}' --type=merge

如果成功,命名空间会立即删除。

方法 2:手动编辑 JSON(适用于 patch 失败的情况)
  1. 导出命名空间的 JSON 配置:

    kubectl get ns cert-manager -o json > cert-manager.json
  2. 编辑 cert-manager.json,删除 spec.finalizers 字段:

    {
      "spec": {
        "finalizers": []  # 删除原有内容,改为空数组
      }
    }
  3. 使用 curl 或 kubectl replace 强制完成删除:

    curl -X PUT --insecure \
      --header "Content-Type: application/json" \
      --data-binary @cert-manager.json \
      "https://<KUBE-API-SERVER>/api/v1/namespaces/cert-manager/finalize"
    • 替换 <KUBE-API-SERVER> 为你的 Kubernetes API 地址(如 https://kubernetes.default.svc)。

    或者使用 kubectl proxy + curl(更安全)

    kubectl proxy &
    curl -X PUT \
      --header "Content-Type: application/json" \
      --data-binary @cert-manager.json \
      "http://127.0.0.1:8001/api/v1/namespaces/cert-manager/finalize"

4. 检查 Kubernetes 控制平面状态

如果仍然无法删除,可能是 API Server 或 Controller Manager 出现问题

kubectl get pods -n kube-system | grep -E "apiserver|controller-manager"

确保它们正常运行,没有 CrashLoopBackOff 或 Error 状态。


5. 重启相关控制器(极端情况)

如果所有方法都失败,可以尝试重启 kube-controller-manager(仅适用于自建集群):

# 如果是 kubeadm 集群
kubectl delete pod -n kube-system -l component=kube-controller-manager

总结

方法 适用场景 命令
kubectl patch Finalizers 阻塞 kubectl patch ns cert-manager -p '{"spec":{"finalizers":[]}}' --type=merge
手动编辑 JSON patch 失败 kubectl get ns -o json > ns.json + curl 提交修改
检查残留资源 资源未清理 kubectl api-resources --verbs=list --namespaced -o name | xargs -n 1 kubectl get -n cert-manager
重启控制器 API 问题 kubectl delete pod -n kube-system -l component=kube-controller-manager

如果仍然无法解决,可能是 集群存储(etcd)问题,建议检查 etcd 健康状况或联系集群管理员。


网站公告

今日签到

点亮在社区的每一天
去签到