poderror状态？ preproof状态？

原标题：poderror状态？ preproof状态？

导读：

kubernetes常见故障原因：端口映射错误，服务正常工作但不能提供服务。解决方法：删除SVC，重新映射端口。Kubernetes集群服务暴露失...

Kubernetes常见故障

原因：端口映射错误，服务正常工作但不能提供服务。解决方法：删除SVC，重新映射端口。kubernetes 集群服务暴露失败：原因：容器已暴露服务，但SVC配置有误。解决方法：删除SVC，重新映射端口。外网无法访问KuberNETes集群提供的服务：原因：集群的type为ClusterIP，未将服务暴露至外网。

就绪探针失败是应用程序的特定错误，因此你应检查 kubectl describe中的“ 事件”部分以识别错误。服务的故障排除如果你的Pod正在运行并处于就绪状态，但仍无法收到应用程序的响应，则应检查服务的配置是否正确。 Service旨在根据流量的标签将流量路由到pod。因此，你应该检查的第一件事是服务关联了多少个POD。

Kubernetes核心组件故障：ETCd集群异常表现为API server 返回504错误，需使用SSD磁盘、定期备份。控制平面瘫痪可采用高可用配置。网络系统故障：CNI插件异常、DNS 解析中断、网络策略冲突会影响集群。可通过检查对等连接、快速检测 dns解析、监控关键指标排查问题。

离线环境中，Kubernetes启动Pod异常时，可以按照以下步骤进行排查和解决：检查Node状态：使用kubectl get nodes命令检查所有Node的状态。如果发现有Node处于非Ready状态，需要确认异常Pod是否部署在该Node上。如果是，尝试将Pod迁移至状态正常的Node上，或者解决该Node的故障。

诊断OOMKilLED错误时，可以查询Pod对应的宿主机日志。常见原因包括已达到容器内存限制（可能是由于内存限制设置不当或应用程序遇到内存泄漏），节点过载（Pod使用的总内存大于可用的总节点内存），以及在调整内存请求和限制时考虑优先级顺序。

可能误解的常见原因特定地区或配置限制：部分用户可能因地区合规要求（如数据本地化）、旧版集群配置不兼容新版本，或临时的服务区域维护，误以为GKE不可用。服务名称混淆：GKE有多个衍生服务（如GKE On-Prem、GKE Autopilot），若用户混淆服务类型或遇到单个服务的临时问题，易产生误解。

iterm2配置+Kubernetes+GoCD初探

1、itermKubernetes、GoCD的配置与初探可分三部分进行，iterm2侧重终端优化，Kubernetes聚焦容器编排，GoCD关注持续集成与交付。以下为具体内容：iterm2 配置核心功能：iterm2 是 Mac 平台的终端工具，支持分屏、热键、高亮、自定义主题等功能，可显著提升命令行操作效率。

SpringBoot如何给对应的pod进行chaosblade故障注入

Spring Boot应用给对应Pod做ChaosBlade故障注入的核心步骤是先在Pod内部署ChaosBlade工具，再通过指定应用特征或Pod标签定位目标，最后执行注入命令。

然而，在业务落地时，ChaosBlade 存在一些问题，如故障注入过程可视化不足、无法同时对多个集群或主机进行故障注入、难以获取整体演练的统计信息等。因此，在 ChaosBlade 之上还需要平台层，对混沌工程执行工具进行管理与演练编排。

k8s 查看pod重启日志

查看K8s Pod重启日志可通过kubectl命令结合日志与事件分析，核心方法包括查看Pod日志、节点日志、事件及重启原因，以下是具体操作步骤：查看Pod自身日志（定位应用级问题）实时查看Pod日志：执行 `kubectl logs pod名称 -n 命名空间`，若Pod有多个容器，需加 `-c 容器名称` 指定容器。

首先，前往运行该 pod 的节点，查找 kubelet 存放的日志文件。这些文件通过数字表示重启次数，例如 2393 和 2394，分别代表第 2393 次和第 2394 次重启后的日志。这些日志文件实际上是链接文件，指向 Docker 容器的日志文件。

使用kubectl命令行工具适用于临时调试或简单日志查看场景。

calico-node的pod实例一直报错重启的问题

kubekey calico-node起不来，经常重启的问题可能由证书过期、网络配置错误、资源限制或探针设置不当等原因导致。解决方法如下：更新证书和配置：如果k8s集群长时间未使用，可能会导致master节点的证书过期。此时需要更新证书，并检查calico的配置，确保它能正确访问apiserver。

检查节点上的系统日志和容器运行时日志（如containerd或Docker），看是否有与calico-node相关的错误信息。尝试重启Pod：尝试手动删除并重新创建calico-node Pod，看是否能解决问题。使用kubectl delete pod pod-name删除Pod，然后等待k3s自动重新调度并创建新的Pod。

切换到cROSs-subnet模式，kubectleditipPool/default-ipv4-ippool，将ipipmode改为crossSubnet，在UI将calico-node的POD删了重建，重启检查calico网络，可以看见同子网的主机出口走的是bgp，不同子网主机走的是tunl0网卡走ipip模式。

标签：Pod 重启服务