新榜讯 36 氪最新消息,10 月 24 日,趣丸科技宣称,其与香港中文大学(深圳)携手联合研发的语音大模型“MaskGCT”已在 Amphion 系统中正式开源,向全球用户全面开放使用。与传统 TTS 模型不同,此模型运用掩码生成模型与语音表征解耦编码的全新范式,于声音克隆、跨语种合成、语音控制等任务里呈现出非凡性能。
扫描二维码
手机浏览
语音大模型“MaskGCT”正式在Amphion系统中开源
分享文章链接
相似推荐

华为昇腾适配阶跃星辰多模态开源模型
新榜讯 3 月 10 日,魔乐社区(Modelers)推出了由阶跃星辰自主研发的 Step-Video 视频生成与 Step-Audio 语音模型这两款开源多模态大模型。

Meta计划在其最新的开源大型语言模型Llama 4中引入改进的语音功能
新榜讯 财联社 3 月 7 日讯,据知情人士透露,Meta 打算在其最新的开源大型语言模型 Llama 4 当中引入改进的语音功能,预计将在未来几周内正式推出。

腾讯混元大语言模型和3D模型正式开源
新榜讯 11 月 5 日,腾讯混元的最新 MoE 模型“混元 Large”以及混元 3D 生成大模型“ Hunyuan3D-1.0”正式实现开源。