搜索结果: "kubectl"
共找到 27 个页面
容器网络排障 6 层模型 — K8s/Docker/containerd 统一排查体系
| ⑥ 集群与策略层(K8s) | CNI/kube-proxy/NetworkPolicy/Service/Endpoint 一致? | `kubectl get pod,svc,ep -A`, `kubectl get netpol -A` |
1. **K8s Pod 状态** — `kubectl get pod -A -o wide` → 看 STATUS / IP / NODE 字段
2. **Service 与 Endpoint** — `kubectl get svc,ep -A` → 看 CLUSTER-IP / PORT(S) / ENDPOINTS 是否为空
| Service 不通但 Pod IP 直连可通 | `kubectl get svc,ep` 看 ENDPOINTS | Selector/TargetPort 不匹配 / kube-proxy 异常 |
| NetworkPolicy 假性故障 | `kubectl get netpol -A` | PodSelector 或规则未放行默认流量 |
Jenkins 多 Master 架构部署方案 — K8S + Gateway API
| Gateway API CRD | ≥ 1.0.0 | `kubectl get gatewayclass` 验证 |
kubectl apply -f https://github.com/kubernetes-sigs/gateway-api/releases/download/v1.2.0/standard-install.yaml
kubectl get crd | grep gateway
kubectl get storageclass
kubectl create ns jenkins-team-a
Pod Pending 排障指南 — 7 个角度快速定位调度失败根因
> Pod 卡在 Pending 意味着 Scheduler 找不到合适的节点分配,或 Kubelet 在创建容器阶段卡住。核心排查工具:**`kubectl describe pod` 的 Events 段**直接告诉你原因。
kubectl describe pod
kubectl get events -n
kubectl top nodes
kubectl top pods -n
K8s 生产环境 10 大故障复盘 — 集群级灾难到应用级问题
**故障链:** 集群突然不可用 → `kubectl` 全部 timeout → 发现 API Server Pod 被 OOMKilled 循环重启。
kubectl get events -A --field-selector reason=OOMKilled
kubectl logs -n kube-system kube-apiserver-master01 --tail=50
**故障链:** 某天上班发现 `kubectl` 全部报 `x509: certificate has expired` → 整个集群不可管理。
kubectl describe node
K8s 资源限制配置指南 — Request / Limit / QoS / CPU Throttling
kubectl get pod
kubectl describe pod
kubectl top pods --all-namespaces
kubectl top pod
kubectl describe node
K8s Pod 调度策略完全指南 — 六大机制全解析
| Pod Pending,0/N nodes available | nodeSelector/Affinity 无匹配节点 | `kubectl get nodes --show-labels` |
kubectl label node
kubectl label node
kubectl get nodes --show-labels # 查看所有标签
kubectl taint nodes
K8s 服务访问排查 — 从 Pod、Service 到 Ingress 十步工作流
kubectl get svc -n
kubectl get pods -n
kubectl get endpoints -n
kubectl get pods -n
kubectl get pods -n
StatefulSet 完全指南 — 稳定网络标识 / 独立存储 / 有序部署
kubectl get pod -L apps.kubernetes.io/pod-index
kubectl run test --image=busybox -- nslookup mysql-0.mysql.default.svc.cluster.local
kubectl rollout status sts/
- **PVC 未绑定 → Pod Pending:** `kubectl describe pod` 可看到 `pod has unbound immediate PersistentVolumeClaims`
- **回滚更新:** `kubectl rollout undo sts/
K8s 高频问题一站式排查清单 — 10 大故障场景快速参考
**诊断入口:** `kubectl describe pod` → Events 段看最后几行
| **资源不足** | `kubectl top nodes` → 检查 Allocatable | 扩容节点 / 降低资源请求 / 清理低优 Pod |
| **污点/容忍** | `kubectl get node -o custom-columns=NAME:.metadata.name,TAINTS:.spec.taints` | 添加 tolerations 或临时 `kubectl taint node ... -` |
| **PVC 未就绪** | `kubectl get pvc -n
> 🔙 **回滚:** 如果是改 YAML 解决的,直接 `kubectl apply` 原配置;涉及污点则 taint 命令恢复。
K8s 生产排障基本原则与快速定位流程
tags: [kubernetes, troubleshooting, production, kubectl]
`kubectl get pod` 的 STATUS 列已能给出初步方向。CrashLoopBackOff 和 ImagePullBackOff 的处理路径完全不同。
kubectl get deployment
| 1 | `kubectl get pods -n
| 2 | `kubectl describe pod
Node 排障 — NotReady 九步排查 / Kubelet / 容器运行时 / 资源压力 / 证书 / 预防
1. 确认 NotReady 现象和受影响范围(`kubectl describe node`)
kubectl get nodes -o wide
kubectl get nodes | grep -v Ready
kubectl describe node
kubectl get pods -o wide --all-namespaces | grep
Pod 排障 — CrashLoopBackOff / Exit Code 排查 / OOM / 探针 / 依赖服务 / ConfigMap
> ⚠️ **核心认知:** CrashLoopBackOff 从来都不是根因。它只是 K8s 告诉你「容器一直在崩,我已经重启很多次了」。真正的问题一定在容器内部——**不要上来就 `kubectl delete pod`**,会丢失日志现场导致问题更难定位。
① kubectl get pod -A → 看 STATUS + RESTARTS
② kubectl describe pod → 看 Events 段(已直接告诉你原因)
③ kubectl logs --previous → 看上一次崩溃时的日志
④ kubectl exec / debug-pod → 进入容器内部排查
资源配额 / OOMKilled / RBAC / 调度排障
kubectl describe pod
kubectl get pod
kubectl top nodes
1. **增大 memory limits**(如果是正常业务增长)`kubectl patch deployment`
2. **检查内存泄漏**(使用 `kubectl top pod` 观察趋势)
Service 与网络排障 — Endpoints / DNS / kube-proxy / CNI / NetworkPolicy / Ingress
kubectl get svc
kubectl get pods -n
kubectl get pods -n
kubectl get pods -n kube-system -l k8s-app=kube-dns
kubectl get pods -n kube-system -l app.kubernetes.io/name=coredns
存储排障 — PVC Pending / 挂载失败
kubectl describe pvc
kubectl get storageclass
kubectl get pods -n kube-system | grep -E "csi|storage"
kubectl get csidriver
kubectl get pvc
Linux 服务器 CPU 飙高排查 — 完整方法论 + 应急响应实战
kubectl top node
kubectl top pod -A --containers | head -30
kubectl describe node
| 代码 Bug(刚发布) | 回滚 | `kubectl rollout undo` |
| 集群级 | 紧急扩容 | `kubectl scale --replicas=N` |
Kubernetes 负载均衡深度实践:Service 数据面到生产级流量治理全链路
1. 检查 Endpoints 是否正常:`kubectl get endpoints
2. 检查 kube-proxy 模式:`kubectl logs -n kube-system kube-proxy-xxx`
2. 查看 Ingress 日志:`kubectl logs -n ingress-nginx deploy/ingress-nginx-controller`
3. 检查 Ingress 资源配置:`kubectl describe ingress
ConfigMap 挂载踩坑指南 — 符号链接 / 只读 / 热更新 / 标准挂载模式
kubectl exec
kubectl get configmap
kubectl describe pod
K8s CI/CD 架构实战 — Jenkins / GitLab CI / Argo CD / Helm 全链路
云原生时代业务从月级版本变为分钟级交付,传统"人工打包 + 手动 kubectl apply"已无法满足高频发布、多环境隔离、可回滚可追溯、自动化安全的需求。
kubectl create namespace argocd
kubectl apply -n argocd -f https://raw.githubusercontent.com/argoproj/argo-cd/stable/manifests/install.yaml
Kubernetes CoreDNS 自定义域名解析 — 五种场景从原理到生产实操
| **生效** | `kubectl rollout restart -n kube-system deployment/coredns` |
| **验证** | `kubectl run -it --rm debug --image=busybox -- nslookup <域名>` |
| **回滚** | `kubectl rollout undo -n kube-system deployment/coredns` |
K8s 下 Java 内存调优完整指南 — 预算模型、生产配置与治理体系
kubectl describe pod
kubectl get pod
Wiki Schema
- kubectl: kubectl 命令
DevOps 技术面试指南 — 容器/云原生/内核 59 题
| 33 | 多集群管理? | kubectl 多上下文 + 集群联邦(Karmada) + Rancher/OpenShift + 跨集群服务发现 + 统一监控 |
JVM 容器 OOM 排障指南 — 堆外内存视角
kubectl describe pod
K8s 持久化存储 — PV / PVC / StorageClass 生产实战
| PVC Pending | `kubectl describe pvc` 查看事件 / `kubectl get pv` / `kubectl get storageclass` |
K8s 滚动更新无损发布误区 — RollingUpdate 真相与真正无感发布体系
不靠 `kubectl rollout status`,而靠实时监控数据判断:
Nginx 典型配置错误复盘 — 20+ 个踩坑点详解
├── 4. upstream 进程状态(OOM/容器重启/kubectl)