搜索: kubectl

容器运维核心命令参考手册：Docker + K8s 全场景速查

| 列出 Pod | `kubectl get pods -n ` |

| Pod 详情（含事件） | `kubectl describe pod -n ` |

| 查看 YAML | `kubectl get pod -n -o yaml` |

| 查看日志 | `kubectl logs -f -n ` |

| 查看退出的容器日志 | `kubectl logs -n --previous` |

容器网络排障 6 层模型 — K8s/Docker/containerd 统一排查体系

| ⑥ 集群与策略层（K8s） | CNI/kube-proxy/NetworkPolicy/Service/Endpoint 一致？ | `kubectl get pod,svc,ep -A`, `kubectl get netpol -A` |

1. **K8s Pod 状态** — `kubectl get pod -A -o wide` → 看 STATUS / IP / NODE 字段

2. **Service 与 Endpoint** — `kubectl get svc,ep -A` → 看 CLUSTER-IP / PORT(S) / ENDPOINTS 是否为空

| Service 不通但 Pod IP 直连可通 | `kubectl get svc,ep` 看 ENDPOINTS | Selector/TargetPort 不匹配 / kube-proxy 异常 |

| NetworkPolicy 假性故障 | `kubectl get netpol -A` | PodSelector 或规则未放行默认流量 |

Jenkins 多 Master 架构部署方案 — K8S + Gateway API

| Gateway API CRD | ≥ 1.0.0 | `kubectl get gatewayclass` 验证 |

kubectl apply -f https://github.com/kubernetes-sigs/gateway-api/releases/download/v1.2.0/standard-install.yaml

kubectl get crd | grep gateway

kubectl get storageclass

kubectl create ns jenkins-team-a

Kubernetes kube-proxy 模式选型与切换：iptables vs IPVS

kubectl logs -n kube-system -l k8s-app=kube-proxy --tail=50 | grep -E "Using|proxier"

kubectl get cm kube-proxy -n kube-system -o yaml | grep -E "^ mode:"

kubectl edit cm kube-proxy -n kube-system

kubectl delete pod -n kube-system -l k8s-app=kube-proxy # 触发重启

kubectl logs -n kube-system | grep "Using ipvs Proxier"

Pod Pending 排障指南 — 7 个角度快速定位调度失败根因

> Pod 卡在 Pending 意味着 Scheduler 找不到合适的节点分配，或 Kubelet 在创建容器阶段卡住。核心排查工具：**`kubectl describe pod` 的 Events 段**直接告诉你原因。

kubectl describe pod -n | tail -20

kubectl get events -n --sort-by='.lastTimestamp'

kubectl top nodes

kubectl top pods -n

K8s 生产环境 10 大故障复盘 — 集群级灾难到应用级问题

**故障链：** 集群突然不可用 → `kubectl` 全部 timeout → 发现 API Server Pod 被 OOMKilled 循环重启。

kubectl get events -A --field-selector reason=OOMKilled

kubectl logs -n kube-system kube-apiserver-master01 --tail=50

**故障链：** 某天上班发现 `kubectl` 全部报 `x509: certificate has expired` → 整个集群不可管理。

kubectl describe node | grep -A5 Conditions

K8s 资源限制配置指南 — Request / Limit / QoS / CPU Throttling

kubectl get pod -o jsonpath='{.status.qosClass}'

kubectl describe pod | grep -E "QoS|Memory|Limit|Request"

kubectl top pods --all-namespaces

kubectl top pod -n --containers

kubectl describe node | grep -A 10 "Allocated resources"

K8s Pod 调度策略完全指南 — 六大机制全解析

| Pod Pending，0/N nodes available | nodeSelector/Affinity 无匹配节点 | `kubectl get nodes --show-labels` |

kubectl label node key=value # 添加标签

kubectl label node key- # 删除标签

kubectl get nodes --show-labels # 查看所有标签

kubectl taint nodes key=value:NoSchedule # 添加污点

K8s 服务访问排查 — 从 Pod、Service 到 Ingress 十步工作流

kubectl get svc -n

kubectl get pods -n -l app=

kubectl get endpoints -n

kubectl get pods -n -o wide | grep

kubectl get pods -n -o wide

StatefulSet 完全指南 — 稳定网络标识 / 独立存储 / 有序部署

kubectl get pod -L apps.kubernetes.io/pod-index

kubectl run test --image=busybox -- nslookup mysql-0.mysql.default.svc.cluster.local

kubectl rollout status sts/

- **PVC 未绑定 → Pod Pending：** `kubectl describe pod` 可看到 `pod has unbound immediate PersistentVolumeClaims`

- **回滚更新：** `kubectl rollout undo sts/`

K8s 存储生产配置与排障实战：PV/PVC/StorageClass 避坑指南

kubectl describe pvc -n

kubectl get sc # 确认 PVC 中指定的 SC 存在

kubectl get sc -o yaml

kubectl get pods -n kube-system | grep -E "provisioner|csi"

kubectl logs -n kube-system

K8s 高频问题一站式排查清单 — 10 大故障场景快速参考

**诊断入口：** `kubectl describe pod` → Events 段看最后几行

| **资源不足** | `kubectl top nodes` → 检查 Allocatable | 扩容节点 / 降低资源请求 / 清理低优 Pod |

| **污点/容忍** | `kubectl get node -o custom-columns=NAME:.metadata.name,TAINTS:.spec.taints` | 添加 tolerations 或临时 `kubectl taint node ... -` |

| **PVC 未就绪** | `kubectl get pvc -n ` → `kubectl describe pvc` | 检查 StorageClass / PV 绑定 / 存储后端 |

> 🔙 **回滚：** 如果是改 YAML 解决的，直接 `kubectl apply` 原配置；涉及污点则 taint 命令恢复。

K8s 生产排障基本原则与快速定位流程

tags: [kubernetes, troubleshooting, production, kubectl]

`kubectl get pod` 的 STATUS 列已能给出初步方向。CrashLoopBackOff 和 ImagePullBackOff 的处理路径完全不同。

kubectl get deployment -n -o yaml > backup_.yaml

| 1 | `kubectl get pods -n ` | 确认 STATUS（CrashLoopBackOff / ImagePullBackOff / Pending / Terminating） |

| 2 | `kubectl describe pod -n ` | 查看 Events 和 Conditions，判断方向 |

Node 排障 — NotReady 九步排查 / Kubelet / 容器运行时 / 资源压力 / 证书 / 预防

1. 确认 NotReady 现象和受影响范围（`kubectl describe node`）

kubectl get nodes -o wide

kubectl get nodes | grep -v Ready

kubectl describe node

kubectl get pods -o wide --all-namespaces | grep

Pod 排障 — CrashLoopBackOff / Exit Code 排查 / OOM / 探针 / 依赖服务 / ConfigMap

> ⚠️ **核心认知：** CrashLoopBackOff 从来都不是根因。它只是 K8s 告诉你「容器一直在崩，我已经重启很多次了」。真正的问题一定在容器内部——**不要上来就 `kubectl delete pod`**，会丢失日志现场导致问题更难定位。

① kubectl get pod -A → 看 STATUS + RESTARTS

② kubectl describe pod → 看 Events 段（已直接告诉你原因）

③ kubectl logs --previous → 看上一次崩溃时的日志

④ kubectl exec / debug-pod → 进入容器内部排查

资源配额 / OOMKilled / RBAC / 调度排障

kubectl describe pod -n | grep -E "Last State|Reason|Exit Code"

kubectl get pod -n \

kubectl top nodes

1. **增大 memory limits**（如果是正常业务增长）`kubectl patch deployment`

2. **检查内存泄漏**（使用 `kubectl top pod` 观察趋势）

Service 与网络排障 — Endpoints / DNS / kube-proxy / CNI / NetworkPolicy / Ingress

kubectl get svc -n -o jsonpath='{.spec.selector}'

kubectl get pods -n --show-labels | grep

kubectl get pods -n -l "="

kubectl get pods -n kube-system -l k8s-app=kube-dns

kubectl get pods -n kube-system -l app.kubernetes.io/name=coredns

存储排障 — PVC Pending / 挂载失败

kubectl describe pvc -n

kubectl get storageclass

kubectl get pods -n kube-system | grep -E "csi|storage"

kubectl get csidriver

kubectl get pvc -n -o jsonpath='{.spec.accessModes}'

CPU 100% 故障排查实战：从告警到根因的全链路分析与 10 大场景

kubectl top nodes

kubectl get pods -o wide | grep -v Running

kubectl rollout history deployment/ -n

kubectl rollout undo deployment/ -n

kubectl rollout undo deployment/ -n --to-revision=

Linux 服务器 CPU 飙高排查 — 完整方法论 + 应急响应实战

kubectl top node

kubectl top pod -A --containers | head -30

kubectl describe node | egrep -A3 'Allocated resources'

| 代码 Bug（刚发布） | 回滚 | `kubectl rollout undo` |

| 集群级 | 紧急扩容 | `kubectl scale --replicas=N` |

Kubernetes 负载均衡深度实践：Service 数据面到生产级流量治理全链路

1. 检查 Endpoints 是否正常：`kubectl get endpoints `

2. 检查 kube-proxy 模式：`kubectl logs -n kube-system kube-proxy-xxx`

2. 查看 Ingress 日志：`kubectl logs -n ingress-nginx deploy/ingress-nginx-controller`

3. 检查 Ingress 资源配置：`kubectl describe ingress `

ConfigMap 挂载踩坑指南 — 符号链接 / 只读 / 热更新 / 标准挂载模式

kubectl exec -- mount | grep config

kubectl get configmap -n

kubectl describe pod -n

K8s CI/CD 架构实战 — Jenkins / GitLab CI / Argo CD / Helm 全链路

云原生时代业务从月级版本变为分钟级交付，传统"人工打包 + 手动 kubectl apply"已无法满足高频发布、多环境隔离、可回滚可追溯、自动化安全的需求。

kubectl create namespace argocd

kubectl apply -n argocd -f https://raw.githubusercontent.com/argoproj/argo-cd/stable/manifests/install.yaml

Kubernetes CoreDNS 自定义域名解析 — 五种场景从原理到生产实操

| **生效** | `kubectl rollout restart -n kube-system deployment/coredns` |

| **验证** | `kubectl run -it --rm debug --image=busybox -- nslookup <域名>` |

| **回滚** | `kubectl rollout undo -n kube-system deployment/coredns` |

K8s DNS 间歇性解析超时 5s 排查：conntrack 竞态与 ndots 放大

kubectl -n kube-system top pod -l k8s-app=kube-dns

kubectl -n kube-system describe pod coredns-xxx

3. 📊 `kubectl -n kube-system top pod -l k8s-app=kube-dns` — CoreDNS 资源

K8s DNS 故障排查实战：iptables 封禁 53 端口引发的 DNS 雪崩

kubectl get pods -n kube-system | grep coredns

kubectl logs coredns-5d78c9869d-4xvqk -n kube-system --previous

kubectl rollout restart deployment coredns -n kube-system

搜索结果: "kubectl"

容器运维核心命令参考手册：Docker + K8s 全场景速查

容器网络排障 6 层模型 — K8s/Docker/containerd 统一排查体系

Jenkins 多 Master 架构部署方案 — K8S + Gateway API

Kubernetes kube-proxy 模式选型与切换：iptables vs IPVS

Pod Pending 排障指南 — 7 个角度快速定位调度失败根因

K8s 生产环境 10 大故障复盘 — 集群级灾难到应用级问题

K8s 资源限制配置指南 — Request / Limit / QoS / CPU Throttling

K8s Pod 调度策略完全指南 — 六大机制全解析

K8s 服务访问排查 — 从 Pod、Service 到 Ingress 十步工作流

StatefulSet 完全指南 — 稳定网络标识 / 独立存储 / 有序部署

K8s 存储生产配置与排障实战：PV/PVC/StorageClass 避坑指南

K8s 高频问题一站式排查清单 — 10 大故障场景快速参考

K8s 生产排障基本原则与快速定位流程

Node 排障 — NotReady 九步排查 / Kubelet / 容器运行时 / 资源压力 / 证书 / 预防

Pod 排障 — CrashLoopBackOff / Exit Code 排查 / OOM / 探针 / 依赖服务 / ConfigMap

资源配额 / OOMKilled / RBAC / 调度排障

Service 与网络排障 — Endpoints / DNS / kube-proxy / CNI / NetworkPolicy / Ingress

存储排障 — PVC Pending / 挂载失败

CPU 100% 故障排查实战：从告警到根因的全链路分析与 10 大场景

Linux 服务器 CPU 飙高排查 — 完整方法论 + 应急响应实战

Kubernetes 负载均衡深度实践：Service 数据面到生产级流量治理全链路

ConfigMap 挂载踩坑指南 — 符号链接 / 只读 / 热更新 / 标准挂载模式

K8s CI/CD 架构实战 — Jenkins / GitLab CI / Argo CD / Helm 全链路

Kubernetes CoreDNS 自定义域名解析 — 五种场景从原理到生产实操

K8s DNS 间歇性解析超时 5s 排查：conntrack 竞态与 ndots 放大

K8s DNS 故障排查实战：iptables 封禁 53 端口引发的 DNS 雪崩

网络基础必知必会 — IP/子网掩码/网关/路由/VLAN 完全解读

K8s Java DirectMemory OOM 诊断 — 堆内存充足但 OOMKilled 的根因与复现

K8s 下 Java 内存调优完整指南 — 预算模型、生产配置与治理体系

Wiki Schema

DevOps 技术面试指南 — 容器/云原生/内核 59 题

JVM 容器 OOM 排障指南 — 堆外内存视角

K8s 持久化存储 — PV / PVC / StorageClass 生产实战

K8s 滚动更新无损发布误区 — RollingUpdate 真相与真正无感发布体系

Nginx 典型配置错误复盘 — 20+ 个踩坑点详解