新榜讯 昨日,阿里通义实验室重磅开源 R1-Omni 模型,此模型为业界首例将具备可验证奖励的强化学习(RLVR)运用于全能多模态大语言模型。研究人员通过 RLVR 对开源 Omni 模型 HumanOmni-0.5B 加以优化,使其在推理能力、情感识别准确性以及泛化能力这三个关键层面的性能有了显著提升。R1-Omni 可以更明晰地理解视觉和听觉信息对情绪识别的促进作用,能够确切展现出哪些模态信息在特定情绪的判断中发挥了关键效用。
扫描二维码
手机浏览
阿里开源全模态模型R1-Omni 情感识别能力更优
分享文章链接
相似推荐

阿里云开源多模态视频生成模型通义万相“Wan2.2-S2V”
新榜讯 8月26日消息,阿里云今日正式开源多模态视频生成模型通义万相“Wan2.2 - S2V”。

阿里通义首个音频生成模型ThinkSound正式开源
新榜讯 7月5日讯,阿里“通义大模型”公众号发布消息,通义实验室首个音频生成模型ThinkSound正式开源,此举将突破“静音画面”所带来的想象力限制。

DeepSeek R1模型完成小版本试升级
新榜讯 解析:文本讲述了今日DeepSeek在官方交流群发布通知,其R1模型完成小版本试升级,可到官方网页等进行测试且API接口和使用方式不变,还提及今年3月曾对V3模型小版本升级并通过官方交流群率先宣布后续公布更新内容。