搜索: node

Node 排障 — NotReady 九步排查 / Kubelet / 容器运行时 / 资源压力 / 证书 / 预防

标题匹配

title: Node 排障 — NotReady 九步排查 / Kubelet / 容器运行时 / 资源压力 / 证书 / 预防

tags: [kubernetes, troubleshooting, node, production, monitoring, networking, certificate]

- raw/articles/k8s-node-notready-troubleshooting.md

# Node 排障

> Node 是 Pod 运行的基础底层，Node 不可用会直接影响其上所有 Pod。

Docker 镜像优化完全指南：瘦身、构建加速与安全加固

FROM node:20.11-alpine3.19

| `node:20.11-alpine3.19` | ~5 MB | 生产推荐，最小化 Linux 环境 |

**原则：** 生产环境优先选 `alpine` 或 `slim` 版本。完整版本号锁定（如 `node:20.11.1-alpine3.19`），不用 `latest`。

node_modules/

容器运维核心命令参考手册：Docker + K8s 全场景速查

| 查看节点详情 | `kubectl describe node <node>` |

# 查看调度结果（Node）

# 查看 Node 资源分配

kubectl describe node <node> | grep -A 10 "Allocatable"

# 查看 Node 污点

Jenkins 多 Master 架构部署方案 — K8S + Gateway API

K8s Node (物理/虚拟机)

nodeUsageMode: NORMAL

| `jenkins_node_online_count` | 在线 Agent 数 | = 0 持续 5min |

| `jenkins_node_disk` | Master 磁盘使用率 | > 85% |

| 构建任务一直 Pending | Agent Pod 创建失败或资源不足 | `kubectl describe pod ` 查看 Events + `kubectl top nodes` |

K8s 架构与核心概念深度解析 — 面试通关秘籍（一）

│ Worker Nodes │

| **Controller Manager** | 运行各类控制器 | Deployment/ReplicaSet/Node 等控制器持续调谐 |

### Worker Node 组件

Pod Pending 排障指南 — 7 个角度快速定位调度失败根因

kubectl top nodes

kubectl describe node <node-name>

# 重点看：spec.nodeName, spec.nodeSelector, spec.affinity,

# 0/5 nodes are available: 3 Insufficient memory.

kubectl describe node <node> | grep -A5 "Allocated resources"

K8s 资源限制配置指南 — Request / Limit / QoS / CPU Throttling

- 调度器检查：Node 已分配 Request 总量 + 新 Pod 的 Request ≤ Node 实际容量

- 容器实际使用超过 Request 仍可运行，但 Node 会发生资源超售

CPU 是"可压缩资源"（compressible resources）。Node 资源紧张时，K8s 通过降低 CPU 时间片"挤出"更多资源，

| Burstable | min(max(2, 1000 - 1000×memoryRequest/nodeMemory), 999) | 中等 |

Node 内存紧张时，**Pod A 反而更容易被 OOMKill**，即使它的 Request 是 2Gi。

K8s Pod 调度策略完全指南 — 六大机制全解析

1. `nodeName`（最高优先级，直接指定节点名，跳过调度器）

3. nodeSelector（简单标签匹配）

4. nodeAffinity（灵活的节点亲和性）

### 1. nodeSelector — 最简单的调度约束

nodeSelector:

K8s 服务访问排查 — 从 Pod、Service 到 Ingress 十步工作流

### 场景二：集群外部通过 NodePort 访问

外部客户端 → NodeIP:NodePort → kube-proxy → EndpointIP:ContainerPort → PodB

外部请求到达任意节点的 NodePort，kube-proxy 将流量转发到后端 Pod（不一定是 Pod 所在节点）。

外部客户端 → Ingress Controller Pod → Ingress 规则匹配 → Service:NodePort → kube-proxy → PodB

- 从 Pod 内直接访问 Service IP（绕过 Ingress 和 NodePort）

K8s 高频问题一站式排查清单 — 10 大故障场景快速参考

tags: [kubernetes, troubleshooting, production, debugging, pod, node, service, storage, networking, security]

| **资源不足** | `kubectl top nodes` → 检查 Allocatable | 扩容节点 / 降低资源请求 / 清理低优 Pod |

| **污点/容忍** | `kubectl get node -o custom-columns=NAME:.metadata.name,TAINTS:.spec.taints` | 添加 tolerations 或临时 `kubectl taint node ... -` |

## 问题五：Node NotReady

**诊断入口：** `kubectl get nodes` → `kubectl describe node <node-name>`

K8s 生产排障基本原则与快速定位流程

- raw/articles/k8s-node-notready-troubleshooting.md

先看 **Node 状态**，再看 **Pod 状态**，最后看 **应用日志**。跳过底层基础设施直接看 Pod 内部容易误判。

| 4 | `kubectl top pod / kubectl top node` | 确认资源使用情况 |

- **集群层:** `kubectl get nodes`, `kubectl get events --all-namespaces`

| NotReady | `kubectl describe node` Conditions | 磁盘满、内存满、网络异常 |

资源配额 / OOMKilled / RBAC / 调度排障

kubectl top nodes

| Burstable | min(max(2, 1000 - 1000×memoryRequest/nodeMemory), 999) | 中等 |

Node 内存紧张时，**Pod A 反而更容易被 OOMKill**——尽管它的 Request 更大。

kubectl get node -o jsonpath='{.spec.taints}'

- `node.kubernetes.io/not-ready:NoExecute`

Service 与网络排障 — Endpoints / DNS / kube-proxy / CNI / NetworkPolicy / Ingress

ssh <node> "sudo iptables -t nat -L -n | grep "

ssh <node> "sudo iptables -t filter -L FORWARD -n | grep KUBE"

ssh <node> "sudo ipvsadm -L -n"

ssh <node> "lsmod | grep ip_vs"

# 查看 calico-node 是否 Running

生产级 Linux 磁盘 IO 调优 — 从核心概念到实战落地

| inode 使用率 | > 80% | > 95% |

### Prometheus + node_exporter

rate(node_disk_io_time_seconds_total[5m]) * 100

rate(node_disk_read_time_seconds_total[5m]) / rate(node_disk_reads_completed_total[5m]) * 1000

rate(node_disk_read_bytes_total[5m]) / 1024 / 1024

Linux 磁盘空间排查 — 8 个命令 / 四种场景 / 生产清理流程

> 磁盘满有三种情况：**空间真满** / **Inode 耗尽** / **文件已删但空间未释放**。不分清楚就删文件，可能白费力气。

### ② df -i — Inode 使用率

小文件太多时 inode 先于空间耗尽。每个文件消耗一个 inode（不管大小）。

copytruncate # 复制后截断，不改变 inode

| [[node-troubleshooting]] | K8s Node DiskPressure 处理（节点磁盘清理） |

Linux Load Average 完全解读 — 内核原理 / 排查方法论 / 容器环境实战

- **历史基线**：关键是和基线对比，Prometheus 用 `avg_over_time(node_load1[7d])` 计算 baseline

两次采样差值计算 CPU 使用率分布。Prometheus node_exporter 就是这样采集的。

同时失真的还有 `/proc/cpuinfo`（显示宿主机全部核数）和 `/proc/stat`（宿主机的 CPU 统计）。Java/Node.js 等运行时如果用 Load Average 做自适应调优，在容器内全部失效。

node_load5 / count without(cpu)(node_cpu_seconds_total{mode="idle"}) > 0.7

node_load5 / count without(cpu)(...) > 1.0

Linux 内存管理深潜 — Buffer/Cache/Page Cache/Slab/回收/OOM 全链路

SReclaimable: 520000 kB # 可回收 Slab（dentry、inode 缓存）

echo 2 > /proc/sys/vm/drop_caches # 释放 Slab（dentry/inode）

| inode_cache | inode 缓存 | 同上 |

Linux rm -rf 误删文件恢复实战指南 — 从事故复盘到数据恢复的完整手册

**致命陷阱：** `/data/backup/tmp` 是一个指向父目录 `/data/backup` 的软链——上一任运维为了偷懒创建的。`find -L` 主动跟随软链，结果把整个 `/data/backup` 当成"临时目录"展开去清理了。`/data/backup/mysql`（mysqldump 文件）和 `/data/backup/app`（应用归档包）全部被删，`/data/backup/logs` 因为被后台进程打开了几个文件（rm 删掉了硬链接但 inode 还在进程手上），看起来"还在"实际也是假象。

只有当文件 unlinked **且没有被任何进程持有**（open file count = 0）时，内核才会把这个 inode 释放回 inode 位图。inode 被释放后，对应的磁盘块才会被标记为 free，加入到空闲块池里，等待被新数据覆写。

**所以"删除"只动了 inode 和目录项的元数据，磁盘上的实际数据是完整保留的——直到被新数据覆盖。**

→ 如果是文件：调用 ext4_free_inode_after_ordered，把 inode 标为 free

- xfs 使用 B+ 树管理 inode（AGI）和 block（AGF）

服务器性能五维排查 — CPU/内存/磁盘/网络/文件系统深度解析

文件系统是容易被忽视的第五个瓶颈维度。磁盘空间够 ≠ 能写文件（Inode 耗尽）。

df -i # Inode 使用率（小文件多时易踩坑）

- IUse% > 90% → Inode 即将耗尽（小文件密集场景预警）

- `df -i` 定期监控 Inode，别等到 100% 才发现

Keepalived+Nginx 高可用实战 — 3 个隐藏坑位与生产级防护方案

OTHER_NODE="192.168.1.11"

echo "Step 3: Verifying peer node health..."

ssh root@$OTHER_NODE "curl -s http://127.0.0.1/health" >/dev/null

echo "Peer node health check failed!"; exit 1

echo "Step 4: Restarting nginx on current node..."

Nginx 典型配置错误复盘 — 20+ 个踩坑点详解

### 误区一：sendfile / tcp_nopush / tcp_nodelay 三选一

tcp_nodelay on; # 禁用 Nagle 算法，小包立即发送（对交互式 API 重要）

**策略：** 对大文件下载（静态资源）用 `sendfile on + tcp_nopush on` 提升吞吐；对 API 代理用 `tcp_nodelay on` 降低延迟。三者可以同时开启——`tcp_nopush` 确保缓冲区满再发，`tcp_nodelay` 对个别小包突破此规则立即发送，互不矛盾。

limit_req zone=login_limit burst=3 nodelay;

limit_req zone=api_limit burst=20 nodelay;

Nginx 安全配置实战 — 防DDoS/限流/WAF 规则编写

limit_req zone=req_login burst=10 nodelay;

limit_req zone=req_sms burst=5; # 不加 nodelay：平滑排队

**`nodelay` vs 不加：**

- `nodelay` → 超过速率后快速拒绝，适合不允许多次重试的接口

- 不加 `nodelay` → 短时突刺被延迟处理，用户体验更平滑

Wiki Log

- Created concepts: k8s-troubleshooting-principles, pod-troubleshooting, node-troubleshooting, service-troubleshooting, storage-troubleshooting, resource-rbac-scheduling-troubleshooting

- Created raw: raw/articles/k8s-node-notready-troubleshooting.md

- Merged into: node-troubleshooting

- Updated: k8s-rolling-update-pitfalls, k8s-statefulset-guide, node-troubleshooting（添加案例交叉引用）

- 覆盖：Pod Pending / CrashLoopBackOff / Service 访问失败 / 镜像拉取失败 / Node NotReady / 存储挂载异常 / 资源配额耗尽 / etcd 故障 / DNS 异常 / Pod 安全策略 — 10 大场景

运维工程师面试 50 题 — 经典 Linux/网络/数据库基础全覆盖

| inode | 相同 | 不同 |

### 47. inode 与 block

- **inode**: 存储文件元数据（权限、大小、时间、block 位置）

- `df -i` 查看 inode 使用情况

K8s 面试通关指南 — 100 道核心题全解析

| 21 | Node/Pod Affinity？ | 控制 Pod 调度位置的规则（亲和性和反亲和性） | — |

| 66 | 服务发现和负载均衡？ | DNS 服务发现 + ClusterIP/NodePort/LoadBalancer/Ingress 负载均衡 |

| [[node-troubleshooting]] | 节点排障（NotReady/Kubelet/资源压力） |

K8s 生产环境 10 大故障复盘 — 集群级灾难到应用级问题

kubectl describe node <node> | grep -A5 Conditions

**修复：** 分散定时任务执行时间、kubelet `--node-status-update-frequency=10s`（默认 10s）、`--node-monitor-grace-period=40s`。

kubectl drain <node> --ignore-daemonsets --dry-run=client

| [[node-troubleshooting]] | 案例 4：节点 NotReady 排查 |

K8s 存储生产配置与排障实战：PV/PVC/StorageClass 避坑指南

name: local-pv-node1

nodeAffinity:

nodeSelectorTerms:

- node1

Pod 排障 — CrashLoopBackOff / Exit Code 排查 / OOM / 探针 / 依赖服务 / ConfigMap

# Message: "0/3 nodes are available: 1 Insufficient memory, 2 node(s) had taints..."

kubectl top nodes

kubectl describe nodes | grep -A5 "Allocated resources"

kubectl get nodes -o jsonpath='{range .items[*]}{.metadata.name}{"\t"}{.spec.taints[*].key}{"\n"}{end}'

Linux 服务器 CPU 飙高排查 — 完整方法论 + 应急响应实战

kubectl top node

kubectl describe node | egrep -A3 'Allocated resources'

100 - (avg by(instance) (rate(node_cpu_seconds_total{mode="idle"}[5m])) * 100) > 85

avg by(instance) (rate(node_cpu_seconds_total{mode="softirq"}[5m])) * 100 > 25

K8s 容量规划、Pod QoS 与成本优化实战指南

节点可分配资源 = node allocatable - 系统预留 - DaemonSet 预留

### Node.js 容器

NODE_OPTIONS="--max-old-space-size=768" # RSS 需留余量

K8s DNS 间歇性解析超时 5s 排查：conntrack 竞态与 ndots 放大

> **一句话复盘：** Pod 访问外部域名偶发 `dial tcp: lookup api.example.com: i/o timeout`，超时稳定卡在 5s（glibc resolver 默认 timeout）。根因并非 CoreDNS 繁忙，而是 **DNS UDP 请求经过 kube-proxy iptables 转发时，conntrack 发生竞态丢包，加上 ndots:5 放大了请求量**。组合方案：NodeLocal DNSCache + ndots 调优。

| **NodeLocal DNSCache** | 高 | 中 | 中大规模集群、DNS QPS 高 |

3. 集群灰度上线 NodeLocal DNSCache

Kubernetes 负载均衡深度实践：Service 数据面到生产级流量治理全链路

客户端 -> DNS -> 外部负载均衡 -> Ingress/Gateway API -> NodePort/ClusterIP -> kube-proxy -> Endpoints -> Pod

- **NodePort**：在每个节点开放端口，外部流量通过节点端口进入

- **LoadBalancer**：云厂商 LB + NodePort 组合

Wiki Index

- [[k8s-scheduling-strategy-guide]] — K8s Pod 调度策略完全指南：nodeSelector/Affinity/Taint/Topology/PriorityClass 六大机制

- [[k8s-top10-troubleshooting-checklist]] — K8s 高频问题一站式排查清单：10 大故障场景快速参考（Pod Pending/CrashLoopBackOff/Node NotReady/etcd/DNS 等）

- [[node-troubleshooting]] — Node 排障：NotReady 九步排查 / Kubelet / 容器运行时 / 资源压力 / 证书

搜索结果: "node"