张显达 zxd blog
后端平台到了联合升级窗口:Kubernetes补丁、Runner门槛与Node24要一起评估 后端平台到了联合升级窗口:Kubernetes补丁、Runner门槛与Node24要一起评估
导语:截至 2026 年 3 月 15 日,后端平台团队最需要警惕的,不是某个组件单独升级,而是多个基础设施窗口正在重叠。Kubernetes v1.35.3 已在 3 月 11 日发布;GitHub 对 self-hosted runne
2026-03-15
后端平台进入切换窗口:补丁节奏、Runner门槛与Node24迁移的联合治理 后端平台进入切换窗口:补丁节奏、Runner门槛与Node24迁移的联合治理
导语:截至 2026 年 3 月 12 日,后端平台团队最需要警惕的,不是单个组件问题,而是多个基础设施变更窗口叠加。Kubernetes v1.35.x 补丁版本持续推进;GitHub 在 2026 年 2 月 5 日宣布 self-ho
2026-03-12
后端平台补丁周作战法:围绕Kubernetes节奏做安全与容量协同 后端平台补丁周作战法:围绕Kubernetes节奏做安全与容量协同
导语:截至 2026 年 3 月 8 日,后端团队需要面对更密集的基础设施变更节奏。Kubernetes patch release 页面显示多个分支持续补丁更新,并给出 v1.35.3 的目标发布日(2026-03-10);v1.35.2
2026-03-08
后端补丁与容量协同:围绕Kubernetes补丁节奏构建稳态交付 后端补丁与容量协同:围绕Kubernetes补丁节奏构建稳态交付
导语:截至 2026 年 3 月 6 日,后端平台的核心挑战是“变更密度提高”。Kubernetes patch release 页面显示 v1.35、v1.34、v1.33 分支都在持续更新;其中 v1.35.2 发布说明提到升级 Go
2026-03-06
后端控制平面实战:任务分层与预算触发调度 后端控制平面实战:任务分层与预算触发调度
导语:AI 业务下后端平台的难点是任务结构复杂化。短请求和长任务混跑会导致拥塞、超时和成本失控。解决关键不在盲目扩容,而在建立控制平面:按任务分层调度,按预算触发动作,按账本复核收益。 1. 关键短板 任务混跑导致抢占。 单一扩容指标无法反
2026-03-05
后端控制平面优化:SLO分层与预算触发调度 后端控制平面优化:SLO分层与预算触发调度
导语:AI 业务把后端从“接口服务”推向“任务平台”。短请求和长任务并存后,传统单一扩容策略很快失效。真正有效的路径是建立任务控制平面:按 SLO 分层调度、按预算触发策略、按账本复核收益。 1. 核心短板 任务混跑导致抢占。 扩容指标过少
2026-03-04
后端稳态运行策略:任务分层调度与预算驱动降级 后端稳态运行策略:任务分层调度与预算驱动降级
导语:后端平台在 AI 场景下的难点越来越集中:任务类型复杂、负载波动大、成本压力高。很多团队已经完成了自动扩容,但仍频繁出现拥塞和超时,根因通常是“调度不分层、策略不联动”。要在 2026 年保持稳态运行,必须把任务、弹性和预算统一到一个
2026-03-03
后端任务控制面实战:分层调度、弹性守护与成本阈值 后端任务控制面实战:分层调度、弹性守护与成本阈值
导语:Kubernetes 1.35.1 在 2026-02-10 发布后,后端团队的重点不再是“有没有扩容能力”,而是“能不能在复杂任务结构下稳定调度”。AI 场景下短请求和长任务并存,如果统一调度策略不改,系统会出现峰值拥塞、重试风暴和
2026-03-02
后端任务调度体系:队列分层、弹性策略与预算联动 后端任务调度体系:队列分层、弹性策略与预算联动
导语:Kubernetes 在 2 月底继续发布 1.35.x 补丁后,后端平台治理重点更加明确:在高并发短请求和高耗时长任务并存的情况下,如何保持稳定与成本平衡。很多团队的问题不在算力不足,而在调度策略混乱:任务不分层、扩容指标单一、预算
2026-03-01
后端弹性实战:Kubernetes补丁周期下的队列治理与成本控制 后端弹性实战:Kubernetes补丁周期下的队列治理与成本控制
导语:Kubernetes 1.35.1 在 2 月中旬发布后,后端团队的重点仍是老问题的新形态:请求结构分化、长任务堆积、成本上扬。尤其在 AI 场景下,单纯依赖 CPU 扩容策略已无法应对复杂负载。更有效的方法是把任务治理、弹性策略和预
2026-02-27
2 / 18