2025-10-20 Java 运维值班:10/21 Oracle CPU 发布前夜的“终检与回滚表”


导语

Oracle 的 10 月季度 CPU 通常在第三个周二发布(2025 年为 10/21),10/20 作为“前夜”,是完成“终检—预热—回滚表”的关键窗口。本文给出一份值班 Runbook:如何在不打扰业务的前提下,把风险压缩到最小,把证据留得最全。

终检清单(当晚 21:00 前完成)

  • 版本矩阵:
    • 运行时:25 LTS 为主线、21/17 LTS 同步;
    • 构建链:CI 使用的 JDK 版本与生产一致;
    • 容器镜像:基础镜像与系统库(glibc/musl)对齐;
  • 兼容性:
    • 反射/模块/序列化路径;
    • TLS/证书链/混合 KEM 互通与回退;
    • 数据库驱动/HTTP 客户端;
  • 基线与探针:
    • P95/P99/GC 停顿/CPU/内存基线;
    • 健康探针与关键交易路径探针就绪。

发布当晚(10/21)操作节奏

  1. 获取与封板
  • 从发行版(Temurin 等)获取相应 JDK 构建,生成 SBOM 与签名记录;
  • 在构建仓与镜像仓“封板”留档,避免误替换;
  1. 预发与金丝雀
  • 预发集群替换并跑回归套件;
  • 金丝雀 5%–10% 流量引入,设置错误/延迟/GC 异常阈值;
  1. 可观测与报警
  • 在 OTel/Prometheus 面板对比“升级前/后”指标;
  • 对异常设置冷却时间与自动回退钩子。

回滚表(紧急场景)

  • 一键回退:镜像标签/版本指纹已准备;
  • 功能开关:降级非关键 TLS 套件或关闭新特性;
  • 旁路:对外端点临时加固(WAF/速率限制);
  • 通知:变更与回退在工单/IM 同步,写明影响范围与窗口。

合规与证据

  • 证据链:CVE–资产–变更–预发–金丝雀–探针–回滚预案;
  • 签名与溯源:制品与镜像签名,外部供应链来源证明(SLSA/Sigstore)。

结语

良好的前夜准备不是“神操作”,而是“把每一个环节写清楚、演一次”。留足回滚时间与证据,才是对稳定性的最大尊重。


文章作者: 张显达
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 张显达 !
  目录