导语:
11 月 9 日,软件工程领域围绕“平台反哺业务”展开:Atlassian Compass GA 的服务目录 + 评分卡在企业加速落地,Backstage 联盟发布可插拔黄金路径规范,Temporal Cloud 推出多区域一致性与成本分析工具,DoorDash 分享“AI 暴增流量下的可用性治理”。平台工程从“工具提供方”转向“组织教练”。
1. Atlassian Compass GA
- Compass 现已与 Jira、Bitbucket、Opsgenie、Datadog、PagerDuty 深度集成,可自动采集部署频率、事件、所有权、SLO,生成健康评分。
- 新增“Scorecard Templates”,可按照 DORA、内部规范、AI 合规要求自定义指标,并将结果回写到 Jira Sprint 中。
- 这让平台团队可以量化服务状态,驱动业务团队自助优化。
2. Backstage 联盟的黄金路径规范
- CNCF/Spotify/Red Hat 等联合提出“Golden Path Specification”,定义模板、检查项、可观测、权限的最小集合,并提供验证 CLI。
- 通过插件市场,平台团队可快速发布“创建数据管道、AI 工作流、移动应用”等黄金路径,减少重复搭建。
3. Temporal Cloud 新能力
- Temporal 推出 Multi-Region Sync,允许工作流在多 Region 自动复制状态,并提供一致性 SLA;非常适合金融、物流等跨境业务。
- Cost Analyzer 可以统计每个 Workflow 的执行时间、活动成本、第三方 API 费用,帮助 FinOps。
- 官方还发布了 AI 调度示例:利用模型判断工作流路径,并自动落地审计日志。
4. 行业实践:DoorDash 的可用性治理
- DoorDash 分享在 AI 推荐、语音客服爆发式增长下,如何用 Incident Command、自动化回滚、容量预估来保持 99.99% 可用。
- 他们将“AI 请求”视作新的流量类型,单独设定 SLO、熔断策略、数据隔离。
5. 建议与行动
- 服务目录运营:把 Compass/Backstage 打造成“事实源”,确保每个服务有 owner、SLO、运行手册、依赖关系。
- 黄金路径产品化:平台团队像产品经理一样维护模板、文档、指标,并设置满意度调查。
- 工作流与成本:使用 Temporal、Step Functions、Camunda 等可观测编排引擎,把成本、合规、审计纳入 Workflow Definition。
- 事件文化:建立统一 Incident 模型、指挥官制度、事后复盘模板,将 AI/新业务纳入演练。
行动清单
- 部署 Compass/Backstage 集成,导入所有微服务、数据管道、AI 工作流,补齐所有权与 SLO。
- 设计至少两个黄金路径模板(例如 API 服务、数据流水线),并通过验证 CLI 强制执行基线。
- 在 Temporal Cloud 上启用 Multi-Region Sync,对关键工作流进行演练。
- 更新 Incident Playbook,加入 AI 流量与第三方依赖的应急策略。
结语
平台工程的价值不在工具堆砌,而在“让正确的事变得容易”。通过服务目录、黄金路径、可观测工作流与事件文化,组织可以在 AI 与多云的复杂环境中保持稳健与高效。