智能体:太好了是语音交互新功能,我们说话有救了! 特工宇宙 • 2024-11-15 19:47 • 产品 • 173 views 你是否经历过,给客服打电话总是遇到让人高血压的 AI? 买的智能音箱对话时总是被错误识别? 以及,最新的 AI 陪伴机器人总是感觉有点呆板? 提效不明显,也提供不了足够的情绪价值… 语音交互体验成为了 AI 落地的一块绊脚石。 而如今扣子推出的技术,有望使这种情况成为过去式。 经过近两年来的发展与验证,大语言模型(LLM)和智能体(Agent)已经逐渐成为行业共识,落地到了生活各处。 AI 游戏陪玩、AI 虚拟陪伴、AI 口语陪练、AI NPC等应用遍地开花,由此也激发了对更优质的 AI 语音交互的强烈需求。 不少产品的语音过于机械,响应速度过慢…这种“对讲机式”的对话,极大的降低了用户体验。 对此,扣子上线了全新的智能语音 OpenAPI,让 AI 从“能说话”到“会说话”。 此前的所有方案,都是在用工程思维处理人文问题。 Google Assistant 虽然能识别几十种语言,却理解不了“中式英语”;Alexa 虽然能控制一整个智能家居,却无法自然地应对打断;Siri 虽然能讲笑话,却始终没有真实的情感温度… 而扣子的方案,首次将“理解”的能力注入了整个语音交互链路。 它不只是在听你说话,而是在理解你说话的场景、语境、甚至情绪。 这让 AI 终于开始像人一样思考和表达。 基于扣子这套“组合拳”做出来的智能体或是 AI 应用,当你跟它交谈时,它不只是在应答,而是在理解、思考、然后用最恰当的方式回应! 这一切的实现归功于以下四个核心突破: 1. 精准语音识别:使用 ASR 语音转成文本,且具备上下文理解能力(比如上文出现过的名词等信息能够在识别中复用,说话等风格和代称也能理解的较好),并对中英混说、噪音、垂直领域等复杂场景识别效果有所提升; 2. 强大的 AI Agent 能力:扣子不只听懂你所说的,更能真正理解你的需求。它拥有 Agent 的各项能力,能够像人一样有记忆力(文件盒子、数据库、变量)、有知识(文本、表格、照片)、有技能(插件、触发器)、还能编排(工作流、图像流)等; 3. 低延迟、可打断:使用了火山引擎 RTC 方案,将链路中的延迟充分降低,并确保即使在弱网络环境下也能通话顺畅。此外,智能体能毫秒级响应用户打断,流畅切换话题并即时反馈,通过火山引擎 RTC 的智能降噪技术,能有效过滤 90% 以上的背景噪音,降低误触发概率,提升对话质量; 4. 自然的语音效果:使用大模型的 TTS 进行文本转语音,根据上下文,智能预测文本的情绪、语调等信息;生成超自然、高保真、个性化的语音,在自然度、音质、韵律、气口、情感、语气词表达等方面更像真人;即使是中英文混说也能行云流水应答自如。 通过将 Agent 的认知能力引入整个语音交互链路,扣子让 AI 首次具备了真正的“对话感”。 以下是实测演示👇 1. Demo 配置流程视频演示。 2. 与智能体实时对话测试。 3. 语音对话过程中,支持实时打断。 4. 轻松完成逼真的音色克隆。 目前该功能还在内测,有相关需求可以在下方链接或点击阅读原文申请。 https://www.coze.cn/survey/7431180581536268314?FG_source=15 回望 AI 发展史,从最初的命令式交互,到基于规则的对话,再到今天的自然语音交流,我们一直在试图跨越人机之间的鸿沟。 扣子的这次突破,终于让AI具备了真正的“理解力”——不是简单的听和说,而是像人一样思考、表达与回应。 这绝对不是简单的功能叠加,而是交互范式的革新,是智能体走向真正智能的关键一步。 原创文章,作者:特工宇宙,如若转载,请注明出处:https://www.agent-universe.cn/2024/11/21699.html Like (0) 0 Generate poster 关于作者 特工宇宙 大模型日报(11月15日 学术篇) Previous 2024-11-15 19:23 糟糕!我被 AI 电影包围了! Next 2024-11-16 17:49 相关推荐 产品 真格基金刘元:在这个时代,什么样的创业者更能脱颖而出?|Z Talk Z Talk 是真格分享认知的栏目。 近日,由 wteam 主办的 2024 中国 Z 世代青年创业者大会在广州圆满落下帷幕。大会吸引了 500 余位 Z 世代青年创业者,汇聚了近… 2024-09-24 2720 产品 红杉:AI 大厦将成,2025 三大 AI 预测 2024 年是 AI 的元年。到 2025 年,AI 的大厦将逐步稳固。 去年一月,我们将 ChatGPT 比作 AI 的“大爆炸”,并预测 2024 年将是 AI 的元年(原文为… 2024-12-15 360 产品 大模型日报(10月9日 资讯篇) 我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.… 2024-10-09 1080 产品 真格早期项目「芯华章」完成数亿元B轮融资 更多被投新闻 Momenta | 地平线 | 燧原科技 | 云天励飞 芯华章 | 沐曦 |… 2022-11-29 1460 产品 大模型日报(11月16-17日 资讯篇) 我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。 「奇绩大模型日报」知识库现已登陆飞书官方社区: https://www.feishu.… 2024-11-17 1320 产品 MolarData| AI领域资讯速递 MOLAR NEWS 2020年第28期 MolarData人工智能每周见闻分享,每周一更新。 AI语音独角兽思必驰完成数亿元Pre-IPO融资,冲刺苏州AI创业第一股 思必驰… 2020-08-31 1330 产品 对话禾赛科技创始人李一帆:上市之后,是机遇也是挑战|真格老友记 2014 年在硅谷结识了禾赛的三位创始人,那时候的他们怀着无比真诚的初心,想通过创业实现自己的梦想。禾赛团队在激光雷达领域不断深耕发展,现如今成长为行业… 2023-02-15 1330 产品 MolarData| 热“AI”身边新鲜事 新鲜趣闻周五见 MOLAR FRESH 2020年第17期 MolarData人工智能新鲜趣闻,每周五更新。 Nature:迄今最全致癌基因图谱:66种癌症中的568个致癌基因汇总2020年8… 2020-12-26 1750 产品 Vozo AI 周昌印:Google X 早期工程师,视频产品爆火 Product Hunt,全球 600 万用户|Z Talk Z Talk 是真格分享认知的栏目。 今年 7 月,Vozo AI 一经上线即登 Product Hunt 榜首,甚至 Product Hunt CEO 也投了一票。其核心功能 R… 2024-11-14 1720 产品 ima 升级共享知识库,团队大脑的下一步在哪里? 内容编辑丨特工女巫 排版审核丨特工少女 去年 11 月,特工宇宙率先关注到腾讯推出了 ima copilot,并带大家体验了这款围绕知识库展开「搜、读、写」生产力提效的 AI Na… 2025-01-06 680