新榜讯 近日在北京举办的中国计算机学会(CCF)大模型论坛线下专题活动上,清华大学人工智能研究院副院长、生数科技首席科学家朱军教授透露出了Vidu的最新突破进展:目前,Vidu具备了一键生成32秒视频的能力,并支持音视频合成。此外,该技术还能够进行四维生成,意味着从单一视频中生成出时空一致的四维内容。这一创新无疑将为视频制作带来全新的可能性。
扫描二维码
手机浏览
视频大模型Vidu进展曝光:时长延至32秒,首次支持音视频合成
分享文章链接
相似推荐

阿里发布开源推理模型QwQ-32B 支持消费级显卡本地部署
新榜讯 阿里巴巴日前发布并开源全新推理模型通义千问 QwQ-32B,该模型在数学、代码及通用能力方面整体性能与 DeepSeek-R1 不相上下,且成功降低部署使用成本,甚至在消费级显卡上亦可实现本地部署。

清华联合百度,共建生态环境垂直领域预训练大模型
新榜讯 2025 年 1 月 13 日,在“中国环境科学学会生态环境人工智能专委会成立大会暨学术论坛”上,清华大学环境学院徐明教授宣称,清华大学将与百度展开战略合作。

Adobe发布视频音效生成模型MultiFoley
新榜讯 近日,Adobe 重磅推出专为视频配音的模型 MultiFoley,其支持经由文本、音频以及视频进行多模态生成。