“通义” · 近30天声量数据
作品数作品数趋势作品数分布
互动数互动数趋势互动数分布
- 小红书36.5w/23%
- 公众号32.2w/21%
- B站30.2w/19%
- 视频号27.5w/18%
- 抖音23w/15%
- 微博6.8w/4%
- 快手1478/0%
代表作品
作品导出
深度报告
内容 | 评论 | 分享 | 收藏 | 获赞 |
---|---|---|---|---|
![]() ![]() 【AI视频教程】最新官方Wan2.2视频模型本地部署教学,Wan2.2整合包无私分享,Wan2.2图生视频工作流! AI视频教程 发布时间2025/09/19 13:44:06 | 1311 | 2495 | 1.3w | 1.6w |
![]() 邪修老师备课法 | 学生追着要上课🔥 ![]() 地理你收哥 发布时间2025/09/01 09:10:19 | 96 | 1476 | 1.6w | 1.5w |
![]() ![]() 什么?语音识别现在也要“调监控”啦? 线上会议的录音听起来像一锅粥,转录软件完全分不清谁在说哪句话!
🤯传统的说话人日志(Speaker Diarization)系统仅依赖于声音信息,就像一个只靠耳朵的侦探,一旦环境嘈杂、有人插嘴或者声音很像,它就彻底“失聪”了 。
✨ 通义实验室首创三栖框架,把音频、视频、文本 三种信息全部协同起来,更准更稳地解决“谁在什么时候说了什么”这个难题 。
框架的核心过程是这样的:
音频侦探 👮:主力担当,负责从声音中提取每个语音片段的“声纹”特征。
视频侦探 🕵️:视觉辅助,通过追踪人脸和口型变化,判断谁是当前的活跃发言人 。
文本侦探 👩💻:逻辑大师,分析对话内容,通过语义判断精准判断哪里发生了说话人转换 。
#通义 #大模型 #涨知识 #语音识别 #线上会议 ![]() 通义大模型 发布时间2025/08/28 07:13:19 | 124 | 162 | 1563 | 1.3w |
![]() ![]() 阿里发布最新通义全家桶,大模型+Agent双开花#阿里巴巴 #2025云栖大会现场直击 #2025云栖大会 #ai新星计划 ![]() 硬核的博哥 发布时间2025/09/25 05:21:50 | 448 | 87 | 558 | 1.3w |
![]() 贫穷真的会让人丧失社交能力吗???? 杂食柯柯 发布时间2025/09/01 12:25:54 | 64 | 26 | 1166 | 1.1w |