新榜讯 6月5日,字节跳动技术团队通过微信公众号发布消息。由字节跳动ByteBrain团队牵头,联合美国加州大学默塞德分校(UC Merced)和加州大学伯克利分校(UC Berkeley)提出了VMR²L,并研发出一套基于深度强化学习的VMR系统。该系统在保持近似最优性能的情况下,将推理时间大幅压缩至1.1秒,成功达成了系统性能与工业可部署性的统一。此项研究成果已在系统领域顶级会议EuroSys25上发表。值得一提的是,论文的两位共同一作均为字节跳动ByteBrain团队的实习生,他们的研究聚焦于长期以来被忽视却极为关键的虚拟机重调度(VMR)问题。
扫描二维码
手机浏览
字节跳动ByteBrain团队提出秒级推理强化学习VMR系统
分享文章链接
相似推荐

小红书Hi Lab团队提出可大幅降低平均思考长度的强化学习训练方式
新榜讯 6月19日,小红书技术团队发布消息,其深度思考模型借助Test - Time Scaling(测试时扩展)显著提升了模型推理能力,不过也产生了大量冗余和无效思考情况。

字节豆包大模型团队提出稀疏模型架构UltraMem
新榜讯 2 月 12 日消息,据字节跳动豆包大模型团队透露,其 Foundation 团队于近期推出 UltraMem,这是一种能将计算和参数解耦的稀疏模型架构,在确保模型效果的基础上成功化解了推理的访存难题。

字节跳动:赵明要去字节跳动做手机的消息不实
新榜讯 近日市场传出消息,称荣耀前 CEO 赵明将前往字节跳动从事手机业务,且字节跳动有意开展手机业务,并主打 AI 概念。