7月28日消息,2025世界大会(WAIC)上,正式发布其新版对话式 AI ,该版本新增声纹识别、与理解三项核心功能,实现从“能说话”到“能理解、能共情”的跨越式升级,进一步拓展对话式 AI 在多模态交互中的边界。
据介绍,新版引擎引入声纹识别功能,可精准识别个体声音特征,有效区分多说话者并屏蔽背景噪音,为多用户并发对话提供技术支撑。
数字人能力方面,声网支持接入如商汤等主流方案,赋予 AI 拟人化表情与动作,适用于虚拟客服、教育陪伴等情境对话场景。
视觉理解功能则令 AI 能“看懂”用户环境与图像信息,支持拍照识图与实时手势识别,实现“所见即所说”。