登录/注册
扫描二维码
手机浏览

“AI罗永浩”再升级,百度能让数字人超越真人吗?

AI新榜
新榜独家AIGC


作者 | 云飞扬
编辑 | 张洁


百度又来WAIC秀AI“肌肉”了。


今天,WAIC 2025世界人工智能大会在上海世博展览馆和世博中心正式召开,老熟人百度也再次参展。


在2024年世界大会上,百度CEO李彦宏曾提到,百度不是要推出一个“超级应用”,而是要打造数百万级“超级有用”的应用。在今年WAIC大会上,百度继续贯彻让AI“超级有用”的思路,展示了多个AI应用场景。


WAIC会场附近,参会者就可以看到一辆辆来回穿梭的萝卜快跑,将来自全球各地的科学家、企业家、初创团队等参会者带去不同主题的场馆,让他们去探讨AI的现在和未来。此次WAIC,萝卜快跑不仅担任WAIC大会的官方接驳车,还和百度飞桨深度学习平台、百度智算集群一起,入选中国人工智能产业创新成果展。


走进场馆内部,来到百度的数字人展位,可以看到朝着参会者打招呼、说段子的罗永浩数字人。一个月前,在百度慧播星的技术支持下,罗永浩尝试了自己的数字人直播带货首秀,最终带货超5500万元,吸引超1300万人次观看。



除此之外,百度的文心大模型4.5Turbo、X1Turbo等四款大模型、无代码应用搭建平台秒哒、智能代码助手文心快码、一站式AI内容获取和创作平台百度文库、一站式内容服务平台百度网盘,以及百度百舸GPU算力平台、百度智能云千帆大模型平台等也在WAIC一一亮相。


现如今,“百模大战”的硝烟逐渐散去,能落地的AI应用成为新的竞争焦点。李彦宏曾多次强调,应用才是大模型的真正价值所在。


一年过去了,百度的AI应用战略都交出了哪些答卷?百度又是如何让AI变得“超级有用”的?



百度大模型加持,

让数字人超越真人?


百度的数字人展厅位于大会的H1馆,展位上既有百度数字人的相关技术介绍,也有首席体验官罗永浩的数字人效果展示。


展示画面中,罗永浩的数字人几乎完全复刻了罗永浩的声音、样貌和动作,不仅能说出一些罗氏梗,能根据说的话搭配一些手势动作,还能和搭档朱萧木娴熟配合、插科打诨,接力对产品进行介绍,几乎看不出违和感。



一个月前的数字人直播中,除了介绍产品,罗永浩数字人还能和直播间评论区实时互动。在“朱萧木”介绍一款茶叶时,面对“我是颜粉”的评论,“罗永浩”及时插话并幽默回复:“你不黑,我就谢天谢地了,但不管你是真颜粉还是假颜粉,龙哥听了你这句话都高兴。”


难怪直播结束时,罗永浩在微博感慨:“说真的,这数字人效果把我自己都吓了一跳。我和萧木两个数字人在那儿眉来眼去,讲着跟我一样风格的段子,有点恍惚。”


据悉,这场数字人直播由百度慧播星提供技术支持,整场直播时长近7小时,用AI生成了9.7万字的产品讲解内容,以及双数字人搭档做出的超8300个动作。



数字人本身并不算是新物种,早在2022年,直播带货行业就掀起了一股数字人热潮,不少人相信,数字人有望解决真人主播价格高、不可控,以及生产力不足等问题。天眼查数据显示,截至目前,我国现存在业、存续状态的直播电商相关企业超37.3万家。如果数字人能大规模应用,将极大解放直播带货行业的生产力。


遗憾的是,因为技术限制等诸多因素,数字人始终未能给直播带货行业带来太多改变。交个朋友副总裁吴加录提到,过去几年交个朋友一直对数字人直播持怀疑和严谨探索态度,很重要的原因就是数字人在画面、语音、交互上存在不足。


直到今年,随着AI技术的进步,数字人变得越来越像真人,且成本越来越低。百度副总裁、百度电商总经理平晓黎透露,百度的罗永浩数字人的单个成本不仅控制在了千元左右,还是3.0阶段的高说服力数字人,在体验、内容、视觉、效果四个方面实现了突破。



在今天的WAIC上,百度慧播星又发布了以罗永浩数字⼈为蓝本的新⼀代数字人NOVA,这标志着超头主播能力复刻进入规模化量产时代,让数字人带货又往前走了一步,更多带货主播、商家将有机会体验罗永浩的同款快乐。


以往的数字人之所以效果欠佳,很大一部分原因在于他们既不够像,很容易让消费者看出破绽,又不够聪明,无法应对各种复杂情况,解决用户的实际问题。


此次新一代NOVA数字人实现了三大核心突破:依托文心大模型4.5Turbo的大师级剧本模式,能生成优质脚本并驱动多模态协同,让数字人在直播间实现形神音容的高度匹配;搭载的 AI 大脑可实时接收直播数据并自主决策,调度多智能体完成问答互动,并结合热点输出风格化内容;高效复刻能力仅需10分钟真人样本,就能完成声情动作复刻,实现声音、动作与氛围的精准匹配。



目前,NOVA 技术已进入邀测阶段,提前应用于教育、健康等十余个行业的达人与商家。数据显示,知识博主艾弥儿的数字人凭借万亿级知识库,将用户停留时长提升 101%;蒙牛悠瑞的数字人通过全时段服务与动态策略,使转化率提高 33%。据悉,NOVA数字人预计将于10月向全行业开放。


本质上,数字人直播其实是一个可控的、长视频的生成工作,需要通过视频、剧本、语言、骨骼等特征,进行知识的输出,通过视频生成大模型,最后生成多模协同的视频片段,完成高一致性长视频的生成。百度数字人之所以能达到以假乱真的效果,得益于文心大模型4.5Turbo的升级。通过深度训练,数字人不仅能“懂创作”,带货塑品拥有更高的专业度,还可以“有个性”,甚至能“玩梗”。文心大模型4.5Turbo为数字人注入了个性化的灵魂。


吴加录提到,交个朋友正是在详细了解百度的数字人解决方案,意识到百度数字人技术的领先性后,才有了6月份的那次罗永浩数字人首播。


在他看来,随着AI相关技术的进步,未来数字人将是真人主播的有力补充。当数字人主播能承担起产品参数讲解、非高峰时段直播值守等重复性、规律性工作时,真人主播才能将更多精力投入到选品把控、深度用户互动等核心环节。



从数字人到萝卜快跑,

百度如何让AI更好用?


如果说NOVA数字⼈以及此前的罗永浩数字人体现了百度在数字内容领域的多模态融合能力,那萝卜快跑就是百度大模型在物理世界的落地证明。


据悉,萝卜快跑第六代无人车应用了“Apollo ADFM大模型+硬件产品+安全架构”方案,通过10重安全冗余方案、6重MRC安全策略确保车辆稳定可靠。比如在决策层,萝卜快跑的双计算中枢互为“纠错大脑”,0.01秒内就能完成异常接管,系统故障率低至十亿分之一。


这背后依靠的是百度在算力、框架、应用等AI核心领域强大的全栈自研能力。截至目前,萝卜快跑已为全球用户提供超过1100万次出行服务。今年以来,萝卜快跑不仅获批香港上路测试,还加速出海,接连落地迪拜、阿布扎比等国家。



此次WAIC大会,百度还展出了文心大模型、秒哒、文心快码、百度文库、百度网盘等一系列AI应用。


今年以来,百度连续发布了文心大模型4.5Turbo、X1Turbo等四款大模型,其中文心大模型X1 Turbo在中国信通院大模型推理能力评估中,获当前最高评级。6月30日,文心大模型4.5系列10款模型正式开源。近期发布的IDC报告显示,文心大模型在8大维度调研中独占7项满分,综合实力最强。



秒哒通过 “⼀句话做应用+多智能体协作+多工具调用”的技术组合,用户通过自然语言描述就可以自动生成完整功能代码,实现“3分钟⽣成+1小时迭代”的极致开发体验。



在大模型重构下,百度文库上线了智能PPT、智能写作、AI绘本、AI全网搜等数百项多模态AI能力,覆盖了学习办公、生活娱乐等场景。2025年6⽉,极光旗下月狐数据发布的《2025年智能PPT行业市场研究报告》显示,百度文库智能PPT月访问量超3400万,用户规模年同比翻倍增长。



除此之外,在WAIC上,百度还展示了文心快码、百度网盘、百度智能云千帆大模型平台等分别面向C端和B端用户的⼀系列AI应用,构成了百度的“超级有用”AI全栈图。



作为国内最早投入AI研发的企业之⼀,百度没有专注于“技术炫技”,也没有执着于打造“超级应用”,而是依托其AI四层架构全栈⾃研的能力,持续推动AI产品普及,打造出一套面向技术用户和普罗大众的AI应用矩阵。今年的NOVA数字⼈、萝卜快跑以及文心大模型等都是这一AI应用战略的成果。


事实上,作为整个AI行业的核心引擎,大模型是重中之重,但能实际落地、能为大众的生活带来实实在在改变的应用同样重要。任何一个行业,只有扎根用户需求,紧密融入到真实的商业社会中,才能获得更茁壮、长久的生命力。AI技术的突破固然令人兴奋,但更令人惊喜的是AI给生活带来的实际改变。


未来,比拼大模型之外,能否以大模型为基础延伸出丰富多元、有用好用的AI应用,让AI走进千行百业,将成为AI时代的关键一环。


图片
     
        

AI新榜交流群」进群方式:添加微信“banggebangmei”并备注姓名+职业/公司+进群,欢迎玩家们来群里交流,一起探索见证AI的进化。

      
         
 欢迎分享、点赞、推荐
 一起研究AI

分享文章链接