新榜讯 昨日,阿里通义实验室重磅开源 R1-Omni 模型,此模型为业界首例将具备可验证奖励的强化学习(RLVR)运用于全能多模态大语言模型。研究人员通过 RLVR 对开源 Omni 模型 HumanOmni-0.5B 加以优化,使其在推理能力、情感识别准确性以及泛化能力这三个关键层面的性能有了显著提升。R1-Omni 可以更明晰地理解视觉和听觉信息对情绪识别的促进作用,能够确切展现出哪些模态信息在特定情绪的判断中发挥了关键效用。
扫描二维码
手机浏览
阿里开源全模态模型R1-Omni 情感识别能力更优
分享文章链接
相似推荐

DeepSeek R1模型完成小版本试升级
新榜讯 解析:文本讲述了今日DeepSeek在官方交流群发布通知,其R1模型完成小版本试升级,可到官方网页等进行测试且API接口和使用方式不变,还提及今年3月曾对V3模型小版本升级并通过官方交流群率先宣布后续公布更新内容。

阿里开源首个全模态大模型Qwen2.5-Omni,7B尺寸实现全球最强性能
新榜讯 3 月 27 日凌晨,阿里巴巴最新发布且开源了首个端到端全模态大模型——通义千问 Qwen2.5-Omni-7B。

阿里云通义开源首个多模态推理模型QVQ
新榜讯 12 月 25 日,阿里云通义千问重磅推出首个开源多模态推理模型 QVQ-72B-Preview。