集群创建卡在 Creating 状态有几种可能的原因

  • 组件的 Pod 始终无法 ready,可能的状态可能有 ImagePullBackOff,Pending,CrashBackLoopOff 等
  • GMS 中 metadb 的元数据无法准备完成
  • 无法从 CN 处获取版本
  • ...

排查思路主要是两个:

  1. 查看本集群 Pod 状态,看是否有异常状态的 Pod
  2. 查看 polardbx-operator 日志 ,查看是否有对应集群的 ERROR 日志
kubectl get pods -l polardbx/name={集群名}
Pod 状态 可能的原因 排查 & 解决思路
  • READY STATUS
  • 0/ 3 ImagePullBackOff
镜像拉取失败
  • 镜像写错了
  • 私有仓库,没有权限
使用 kubectl describe 进一步确定
  • 镜像写错了,更新 PolarDBXCluster 的 spec
  • 私有仓库,需要[添加权限](https://kubernetes.io/docs/tasks/configure-pod-container/pull-image-private-registry/)
  • READY STATUS
  • 0/ 3 Pending
资源不足 使用 kubectl describe 进一步确定
  • 添加节点
  • 腾挪资源
  • READY STATUS
  • 2/ 3 CrashBackLoopOff
  • 容器反复 crash
  • cn 进程挂了
使用 kubectl describe 进一步确定
  • 具体问题具体分析
  • describe 看不到错误信息,可以通过[关闭探活](../ops/component/cn/2-liveness.md) 的方式让pod先起来,进入pod 查看相关的日志。

results matching ""

    No results matching ""