新榜讯 据悉,2024 年 6 月,月之暗面 Kimi 与清华大学 MADSys 实验室携手发布 Kimi 底层的 Mooncake 推理系统设计方案。此系统凭借以 KVCache 为核心的 PD 分离及以存换算架构,提高了推理吞吐量。 近期,为推动该技术框架的应用及推广,月之暗面 Kimi 与清华大学 MADSys 实验室联合 9#AISoft、阿里云、华为存储、面壁智能、趋境科技等,共同发布开源项目 Mooncake,合力构建以 KVCache 为核心的大模型推理架构。 11 月 28 日,Mooncake 技术框架已开源上线。据相关介绍,Mooncake 开源项目由论文拓展而来,以超大规模 KVCache 缓存池为重点,借由以存换算的创新思维,大幅降低算力开销,增强了推理吞吐量。 此次开源将分阶段进行,逐步公开高性能 KVCache 多级缓存 Mooncake Store 的实现,同时对各类推理引擎以及底层存储/传输资源予以兼容。其中,传输引擎 Transfer Engine 部分现已在 GitHub 全球开源。Mooncake 开源项目的终极目标在于,为大模型时代塑造一种新型高性能内存语义存储的标准接口,并提供参考实现方案。
扫描二维码
手机浏览
月之暗面Kimi联合清华大学等开源大模型推理架构Mooncake
分享文章链接
相似推荐

阿里通义首个音频生成模型ThinkSound正式开源
新榜讯 7月5日讯,阿里“通义大模型”公众号发布消息,通义实验室首个音频生成模型ThinkSound正式开源,此举将突破“静音画面”所带来的想象力限制。

智谱将开源推理模型GLM-Z1-Air和基座模型GLM-4-Air0414
新榜讯 智谱将于4 月 14 日开源推理模型 GLM-Z1-Air 及基座模型 GLM-4-Air0414,且上述模型将于近期陆续上线 bigmodel.cn。

清华系创企清程极智开源大模型推理引擎“赤兔Chitu”
新榜讯 清华大学高性能计算研究所翟季冬教授团队与清华系科创企业清程极智联合宣称,开源大模型推理引擎“赤兔 Chitu”。