新榜讯 近日,字节跳动重磅推出视频生成模型OmniHuman - 1.5。据悉,该模型架构创新性地将多模态大语言模型与扩散Transformer相结合,模拟出两种不同思维模式,即缓慢深思的规划与迅捷直觉的反应。凭借这种强大的协同效应,该模型能够生成时长超一分钟的动态视频,视频中呈现出流畅的镜头运动、复杂的多角色互动以及高度动态的动作表现。