返回    放大 +    缩小 -
腾讯混元AI Infra推开源生产级高性能LLM推理核心算子库HPC-Ops 推理吞吐提升三成
推荐
10
利好
23
利淡
11
AASTOCKS新闻
腾讯(00700.HK)旗下大语言模型腾讯混元AI Infra团队宣布,推出开源生产级高性能LLM推理核心算子库HPC-Ops,基於生产环境痛点,采用CUDA和CuTe从零构建,通过抽象化工程架构、微架构深度适配及指令级极致优化等,降低底层算子开发门槛,将核心算子性能逼近硬件高峰,实现性能突破。

在真实场景下,基於HPC-Ops,混元模型推理QPM提升30%,DeepSeek模型QPM提升17%。同时,在单算子性能方面,HPC-Ops实现Attention相比FlashInfer / FlashAttention最高提升2.22 倍;GroupGEMM相比 DeepGEMM最高提升1.88倍;FusedMoE相比TensorRT-LLM最高提升1.49倍。(jl/w)

相关内容《大行》法巴重申腾讯(00700.HK)「跑赢大市」评级 具备条件成为AI赢家
AASTOCKS新闻