导语:
JDK21 的虚拟线程、ZGC 以及 Netty 堆栈让低延迟 Java 服务有了更高的可控性。本文给出“线程模型 + GC + 依赖舱壁”的落地打法,并附上线/回滚清单。
1. 线程模型
- 适用:阻塞 IO/短任务优先虚拟线程;长计算/锁冲突用平台线程。
- 规范:避免在虚拟线程持有重锁;使用 Loom 兼容驱动/连接池。
- 观测:线程数、调度延迟、阻塞栈;异常时可一键回退到平台线程。
2. GC 选型与参数
- 首选 ZGC(JDK17+),参数示例:
-XX:+UseZGC -XX:+ZGenerational -XX:ConcGCThreads=4 -XX:ZCollectionInterval=1。 - 看板:GC 暂停/并发时间、晋升失败、堆占用;设阈值告警。
- 压测:对比 ZGC vs G1 的 P99、CPU,记录选型与参数到 Runbook。
3. IO 与协议
- Netty:EPOLL/KQueue,
write_buffer_water_mark控制背压;大文件用FileRegion/sendfile。 - HTTP/2:流控与头压缩白名单;大响应分块/流式。
- 序列化:优先零拷贝解码,减少对象分配与 GC 压力。
4. 依赖舱壁、超时与降级
- 舱壁:依赖分线程池/超时/断路器;熔断后降级到缓存或静态响应。
- 重试:带抖动,禁止级联重试;记录重试原因与次数。
- 兜底:高风险接口预置缓存/静态模板,熔断时直接返回。
5. 队列与背压
- 线程池分级(计算/IO/阻塞);队列长度基于压测设置。
- 消费端自适应拉取,超阈值自动降级为小批量。
- 返回排队信息,避免重试风暴。
6. 数据路径与缓存
- 热点缓存:本地/分布式缓存 + 版本号;防穿透/击穿;写路径幂等。
- 读写隔离:写走主库,读走只读副本/搜索;读失败回退主库需限流。
- CDC:Binlog/CDC 更新缓存与搜索;监控复制延迟。
7. 容量与压测
- 模型:QPS、P99、CPU/内存、依赖时延;按增长率预估 buffer。
- 压测:核心链路验证背压/限流/降级效果;形成容量基线。
- 成本:高成本接口设配额与预算,防刷爆。
8. 部署、灰度与回滚
- 灰度:1%-10%-50%-全量,覆盖高峰;观察 P99/错误/GC/线程池水位。
- 回滚:镜像+配置双通道;回滚后 30 分钟验证核心指标。
- 证据包:压测报告、参数、容量模型、限流/熔断配置、回滚记录。
9. 快速核查
- 虚拟线程开关与回退路径明确,ZGC 参数与监控在线。
- 线程池/队列/限流/断路器配置清晰,压测基线已产出。
- 灰度/回滚脚本可执行,证据包可查。
结语:
用“虚拟线程 + ZGC + 舱壁/背压 + 观测”形成固定套路,Java 低延迟服务才能在高峰期稳态运行并可快速回滚。
11. 快速检查清单
- 虚拟线程开关与回退脚本可演练,阻塞点监控可见。
- ZGC 参数与监控在线,暂停/并发时间有告警;ZGC vs G1 压测报告可查。
- 线程池/队列/限流/断路器配置清晰,背压与降级触发可追踪。
- 灰度与回滚脚本可执行,30 分钟验证脚本通过。