新榜讯 最新发布的2024年3月版《SuperBench大模型综合能力评测报告》是由清华大学基础模型研究中心与中关村实验室联合研制的。这次评测涵盖了14个具有代表性的国内外模型。在人类对齐能力评测中,文心一言4.0在中文推理和中文语言等方面表现出色,凭借高分明显领先其他模型。在中文理解方面,文心一言4.0也遥遥领先,超过第二名GLM-4 0.41分的差距。相比之下,GPT-4系列模型在评测中的表现较差,排名位于中下游,与第一名文心一言4.0的得分相差超过1分。
扫描二维码
手机浏览
清华大模型报告:文心一言中文理解、数学等多项能力全球第一
分享文章链接
相似推荐

百度向旗下公司转让文心一言商标
综合消息 近日,百度在线网络技术有限公司向北京百度网讯科技有限公司转让多枚“文心一言”商标,国际分类均为通讯服务,上述商标申请于2023年2月至3月,当前商标状态多为已注册,其中一枚商标状态为驳回复审中。

百度向旗下公司转让文心一言商标
新榜讯 据天眼查知识产权信息披露,近期,百度在线网络技术(北京)有限公司将多枚“文心一言”商标转让给北京百度网讯科技有限公司,其国际分类皆为通讯服务。

月之暗面Kimi联合清华大学等开源大模型推理架构Mooncake
新榜讯 据悉,2024 年 6 月,月之暗面 Kimi 与清华大学 MADSys 实验室携手发布 Kimi 底层的 Mooncake 推理系统设计方案。