新榜讯 12 月 25 日,阿里云通义千问重磅推出首个开源多模态推理模型 QVQ-72B-Preview。该模型展现出超乎预期的视觉理解与推理能力,尤其在应对数学、物理、科学等领域的复杂推理问题时表现抢眼。多项评测数据表明,QVQ 已超越此前的视觉理解模型 Qwen2-VL,整体性能与 OpenAI o1、Claude3.5 Sonnet 等推理模型旗鼓相当。
扫描二维码
手机浏览
阿里云通义开源首个多模态推理模型QVQ
分享文章链接
相似推荐

阿里通义首个音频生成模型ThinkSound正式开源
新榜讯 7月5日讯,阿里“通义大模型”公众号发布消息,通义实验室首个音频生成模型ThinkSound正式开源,此举将突破“静音画面”所带来的想象力限制。

智谱将开源推理模型GLM-Z1-Air和基座模型GLM-4-Air0414
新榜讯 智谱将于4 月 14 日开源推理模型 GLM-Z1-Air 及基座模型 GLM-4-Air0414,且上述模型将于近期陆续上线 bigmodel.cn。

阿里开源首个全模态大模型Qwen2.5-Omni,7B尺寸实现全球最强性能
新榜讯 3 月 27 日凌晨,阿里巴巴最新发布且开源了首个端到端全模态大模型——通义千问 Qwen2.5-Omni-7B。