Netflix 专题

1 篇文章,按时间倒序展示。

Netflix 模型服务中的路由现状

Netflix 官方技术博客介绍了模型服务中的路由现状。在大规模在线推理系统中,路由需在延迟、吞吐、成本、可用性和模型异构性之间权衡。文章从简单负载均衡演进到自适应路由,强调结合模型副本、容量、SLO 和观测数据动...

TechFoco
Netflix 模型服务中的路由现状