导语:国内视频模型与大模型集中发布,推理任务规模迅速扩大。视频生成任务耗时长、资源占用大,大模型任务频率高、成本敏感。后端必须构建“可排队、可降级、可审计”的推理平台。
1. 后端平台的新需求
视频任务长时占用,排队与调度压力高。
大模型调
2026-02-14