新榜讯 1 月 20 日晚,月之暗面重磅推出多模态思考模型 k1.5,成功达成 SOTA(state-of-the-art)级别的多模态推理及通用推理能力。据悉,该 k1.5 多模态思考模型具备强大的多模态推理功能,能够同步处理与分析来自文本、图像、声音等不同模态的信息,进而提供更为全面、精准的理解与知识。此能力对于诸如视觉问答、视觉常识推理、视觉语言导航等各类复杂任务的支撑,意义非凡。 此外,官方宣称 Kimi k1.5 在数学、代码、视觉多模态和通用能力方面,大幅领先于全球范围内短思考 SOTA 模型 GPT-4o 和 Claude 3.5 Sonnet;其数学、代码、多模态推理能力,亦达到长思考 SOTA 模型 OpenAI o1 正式版的水准。 当下,k1.5 多模态思考模型的预览版已逐步灰度上线至 Kimi.com 网站及最新版的 Kimi 智能助手 App 中。用户在使用期间若发现模型切换按钮,便能体验这一全新升级的模型。
扫描二维码
手机浏览
Kimi发布多模态思考模型k1.5
分享文章链接
相似推荐

快手Kwaipilot-AutoThink模型正式发布,让大模型不再“过度思考”
新榜讯 快手Kwaipilot团队重磅发布自动思考大模型KAT - V1!该模型具备独特优势,能够依据任务难度自动切换“思考”与“非思考”模式,成功攻克大模型“过度推理”难题。

字节视觉-语言多模态大模型Seed VLM技术报告首次公开
新榜讯 5 月 13 日讯,字节跳动 Seed 团队最新推出视觉-语言多模态大模型 Seed1.5-VL,其通用多模态理解与推理能力更强,推理成本大幅降低,在 60 个公开评测基准中的 38 个上斩获 SOTA 成绩。

腾讯混元自研深度思考模型“T1”正式发布
新榜讯 3 月 21 日,腾讯混元自研的深度思考模型混元 T1 正式版重磅推出。