导语
Oracle 的 10 月季度 CPU 通常在第三个周二发布(2025 年为 10/21),10/20 作为“前夜”,是完成“终检—预热—回滚表”的关键窗口。本文给出一份值班 Runbook:如何在不打扰业务的前提下,把风险压缩到最小,把证据留得最全。
终检清单(当晚 21:00 前完成)
- 版本矩阵:
- 运行时:25 LTS 为主线、21/17 LTS 同步;
- 构建链:CI 使用的 JDK 版本与生产一致;
- 容器镜像:基础镜像与系统库(glibc/musl)对齐;
- 兼容性:
- 反射/模块/序列化路径;
- TLS/证书链/混合 KEM 互通与回退;
- 数据库驱动/HTTP 客户端;
- 基线与探针:
- P95/P99/GC 停顿/CPU/内存基线;
- 健康探针与关键交易路径探针就绪。
发布当晚(10/21)操作节奏
- 获取与封板
- 从发行版(Temurin 等)获取相应 JDK 构建,生成 SBOM 与签名记录;
- 在构建仓与镜像仓“封板”留档,避免误替换;
- 预发与金丝雀
- 预发集群替换并跑回归套件;
- 金丝雀 5%–10% 流量引入,设置错误/延迟/GC 异常阈值;
- 可观测与报警
- 在 OTel/Prometheus 面板对比“升级前/后”指标;
- 对异常设置冷却时间与自动回退钩子。
回滚表(紧急场景)
- 一键回退:镜像标签/版本指纹已准备;
- 功能开关:降级非关键 TLS 套件或关闭新特性;
- 旁路:对外端点临时加固(WAF/速率限制);
- 通知:变更与回退在工单/IM 同步,写明影响范围与窗口。
合规与证据
- 证据链:CVE–资产–变更–预发–金丝雀–探针–回滚预案;
- 签名与溯源:制品与镜像签名,外部供应链来源证明(SLSA/Sigstore)。
结语
良好的前夜准备不是“神操作”,而是“把每一个环节写清楚、演一次”。留足回滚时间与证据,才是对稳定性的最大尊重。