
需求端的爆发。托管需求持续激增,过去一年,尤其是互联网大客户的token需求实现了10倍增长,今年仍将保持10倍甚至几十倍的增速,且可能远超市场预期。如clawdbot等通用Agent,其所需的推理算力或token需求,几乎是去年基础需求的数十倍甚至数个数量级。当下爆款应用的任务需求量都远超过去的单程交互需求,再叠加多模态技术(如达摩院相关多模态方案),需求再度攀升几个数量级。因此,推理需求的量级
相关搜索
当前文章:http://w2k.luobaice.cn/im0/rmlbv2.htm
发布时间:01:30:36