登录/注册
扫描二维码
手机浏览

腾讯发布并开源混元语音数字人模型

新榜商桥
情报行业动态

新榜讯 5月28日消息,腾讯混元正式发布并开源语音数字人模型HunyuanVideo - Avatar。该模型由腾讯混元视频大模型(HunyuanVideo)与腾讯音乐天琴实验室MuseV技术联合研发而成。它具备强大功能,支持头肩、半身与全身景别,可适用于多风格、多物种与双人场景,能为视频创作者提供高一致性、高动态性的视频生成能力。用户只需上传人物图像与音频,HunyuanVideo - Avatar模型便能自动对图片和音频进行解析,包括识别出人物所处环境、音频蕴含的情感等,进而让图中人物自然地说话或唱歌,生成带有自然表情、唇形同步且包含全身动作的视频。(财联社)


分享文章链接