最新搜看股票
报价
| 返回 放大 + 缩小 - | |
|
小米(01810.HK):MiMo-V2.5实现五大核心突破 降价后仍能维持收支平衡
推荐 23 利好 53 利淡 13 AASTOCKS新闻
|
|
|
|
|
小米(01810.HK)公开MiMo-V2.5系列模型的推理系统全链路优化方案。据小米方面介绍,团队围绕Hybrid SWA+MoE+多模态的覆合架构,系统性重构从KVCache管理、分级缓存、前缀缓存到调度策略与Prefill/Decode链路的完整推理栈,KVCache存储压缩至同级方案的约1/7,在长序列场景下推理成本大幅下降——这是本次降价的核心技术基础。 MiMO-V2.5实现KVCache双池+SWA-aware前缀树等五大核心突破,降价后仍能维持收支平衡。MiMo对开发者生态的投入持续加码。日前推出的百万亿Token创造者激励计划,总申请人数超过54万人,累计发放100万亿免费Token,折合超过6,500万元人民币。 五大核心突破包括KVCache双池+SWA-aware前缀树;GCache分布式缓存;KVCache亲和调度;Decode阶段MTP加速;多模态推理优化。 於5月27日,MiMo-V2.5系列API完成永久降价,最高降幅达99%,不区分输入长度。(jl/u)AASTOCKS新闻 |
|
