Agent 生态级玩家智谱,上线全新 AutoGLM,能沉思、会动手,无需邀请码,免费使用!

Agent 生态级玩家智谱,上线全新 AutoGLM,能沉思、会动手,无需邀请码,免费使用!

内容丨特工女巫

审核丨特工少女

2025 年,AI Agent 高歌猛进。从海外大厂如 OpenAI、Google、Grok 纷纷下场做 DeepResearch,到国内前段时间 Manus 一炮而红,Agent 呈现出更强的推理能力和更高的自主性特点,能代理人们完成任务,交付结果。

但要么由于功能付费不便宜,要么由于体验资源稀缺,国内大多数用户目前还是需要一款能轻松无门槛用起来的通用 Agent 产品。还好,智谱 AutoGLM 沉思,这不就来了!

Agent 生态级玩家智谱,上线全新 AutoGLM,能沉思、会动手,无需邀请码,免费使用!

摄于智谱 OpenDay 现场

Agent 生态级玩家智谱,上线全新 AutoGLM,能沉思、会动手,无需邀请码,免费使用!

智谱的 AutoGLM 大家已经不陌生了,可以根据用户一句话的指令,AI 自主帮用户操作手机,之前我们也有文章体验分析过

这次的 AutoGLM 沉思,是智谱在 AI Agent 方面的重磅升级。AutoGLM 沉思,是一个能探究开放式问题,并根据模型推理分析的结果,执行操作的自主 Agent它能够模拟人类的思维过程,完成从数据检索、内容分析、到生成和执行结果。

Agent 生态级玩家智谱,上线全新 AutoGLM,能沉思、会动手,无需邀请码,免费使用!

产品能力方面,尤其亮眼的两大核心点是推理能力和执行能力。基于智谱推理模型 GLM-Z1-Air 训练,融入 AutoGLM 的动手操作能力,AutoGLM 沉思会深思熟虑,还能动手做事。

面对用户的开放式深度问题,AutoGLM 沉思可自主思考解答步骤,规划任务,像人类一样自动操作和浏览网页(通过浏览器操作,以页面截图形式获取如知网、小红书、公众号、京东等优质但不对外开放 API 的网页信源,同时利用多模态模型对网页上的图文信息理解,最后生成研究报告或直接执行任务。

技术能力方面,所用到的模型都是智谱自研的纯国产大模型AutoGLM 沉思用到的大模型,从基础模型 GLM-4-Air0414,到推理模型 GLM-Z1-Air,再到 AutoGLM,每个模型都是智谱团队的自研,并且据了解即将全部开源AI Agent的核心是自主性,能够自主进行规划、推理、记忆、调用工具行动。

智谱做 Agent 就体现出技术优势了,他们端到端布局了行业第一梯队的全栈 Agent 技术,包括推理模型、多模态感知模型、工具调用模型等。

Agent 生态级玩家智谱,上线全新 AutoGLM,能沉思、会动手,无需邀请码,免费使用!

AutoGLM 沉思即日就发布上线到智谱清言桌面端(可通过官网下载),还是无需邀请码全民可立即就用起来的那种。

相比 OpenAI 的 Deep Research 200 美元/月的会员价格还只能提问 120 个问题,智谱的 AutoGLM 沉思则是免费不限量使用,可以说十分大方,真有技术普惠那味了👍

在 AutoGLM 沉思首页,看到官方封装了学术、攻略、金融、生活、创作这大场景。特工们也第一时间上手实测,给大家看看效果,也欢迎读者在评论区分享下你们觉得有意思的 case~

总结来说,AutoGLM 沉思适合的场景任务有这样 4 类共性特征:

  • 搜索提炼场景:搜索调研海量网页

  • 深度研究场景:撰写深度研究报告

  • 网页浏览场景:操作浏览网页信源

  • 网站操作场景:操作网站任务如邮箱、购物、视频等

以演唱会攻略推荐为例。

首先,特工女巫输入这样的简单提示词:“我在今年五一假期时,要从广州去佛山看华晨宇的演唱会,要求你根演唱会的时间、地点等因素,为我安排合理的出行行程,以及告诉我抢票攻略建议。你需要多看一看微博、小红书、公众号等相关度高的内容,尤其要注意华晨宇官方账号的信息”。

过程中可以看到:

AutoGLM 沉思,首先进行了推理分析,联网搜索,信息总结,然后自主规划需要浏览器操作,于是自己打开了 Chrome 浏览器,自动操作浏览微博、知乎、小红书等网页。

Agent 生态级玩家智谱,上线全新 AutoGLM,能沉思、会动手,无需邀请码,免费使用!

过程中除了登录,几乎不需要用户介入,AutoGLM 沉思在自己打开浏览器目标页面后,会首先理解当前页面内容,然后根据需要,能自主点击完成搜索、点击、筛选等操作

Agent 生态级玩家智谱,上线全新 AutoGLM,能沉思、会动手,无需邀请码,免费使用!

更厉害的是,AutoGLM 还会基于大目标自己拆解多步骤子任务,根据之前步骤的已知结果自我反思,继续规划下一步行动,直到认为任务完成为止

此外,在等待过程中,用户也可以把正在执行的浏览器窗口最小化,继续做自己其他的事情,解放双手奴役 AI 干活。

Agent 生态级玩家智谱,上线全新 AutoGLM,能沉思、会动手,无需邀请码,免费使用!

最后,AutoGLM 沉思在经历将近 15 分钟 20 步的推理、分析、执行后,给我输出了一份内容真实准确、丰富全面、逻辑清晰、格式美观的最终答案

不仅有演唱会时间地点基本信息,还向我提供了抢票指南,交通、住宿建议,行程安排建议,甚至景点和美食推荐。

本女巫五一假期可以美美参考 AutoGLM 沉思的攻略冲演唱会了😊

Agent 生态级玩家智谱,上线全新 AutoGLM,能沉思、会动手,无需邀请码,免费使用!
Agent 生态级玩家智谱,上线全新 AutoGLM,能沉思、会动手,无需邀请码,免费使用!

此外,AutoGLM 沉思还能去 B 站搜索视频,浏览视频,知道怎么选优质视频,看了几个还要看几个,推理规划拆解任务分步执行,基于已完成任务的结果反思和调整接下来的行动,直到完成为止。

比如让它找 5 条优质的自由泳教学视频,然后总结提炼出可信可靠的自由泳进阶练习提升方法。

Agent 生态级玩家智谱,上线全新 AutoGLM,能沉思、会动手,无需邀请码,免费使用!
Agent 生态级玩家智谱,上线全新 AutoGLM,能沉思、会动手,无需邀请码,免费使用!

整体操作过程和结果让本女巫直呼牛逼。不过还有一些美中不足,比如不支持点赞等操作,在测试进入小红书上特工少女这个账号主页,给最近十篇图文点赞,然后分析他们内容的选题方向和写作风格”时便失败了。

以及目前 AutoGLM 的 Browser Use 会存在我们之前提到的这个问题:“AI 在跟用户抢夺控制权,当你下达任务之后,只能在一旁欣赏 AI 的表演,如果误触,流程就可能被打断。”

Agent 生态级玩家智谱,上线全新 AutoGLM,能沉思、会动手,无需邀请码,免费使用!

虽然业界当前对 Agent 的概念还没有唯一共识,但我们可以抽象出一些标准的理解。AI Agent 具备自主性、适应性、交互性、功能性这四大特征。

  • 自主性:更根据自身的知识和经验,独立做出决策和执行行动

  • 适应性:能够学习和适应环境,不断提高自己的能力

  • 交互性:能够与人类互动,提供信息和服务

  • 功能性:可以在特定领域内执行特定的任务

自主 Agent 与 ChatBot 或 Workflow 最大的差异就是自主性和适应性。自主 Agent 由模型自己决策操作过程,能够通过连续、多步推理,实现模型自主规划,执行任务,并通过反思实现动态调整。在模型的 Intelligence 进一步升级后,未来自主 Agent 可能将不再需要现有的工作流编排。

AutoGLM 沉思是自主 Agent 的 “Preview 版本”从技术角度,基础模型是智谱自研的推理模型 GLM-Z1-Air,这是一个能力比肩 DS R1 的模型,训练过程与 Deep Research 基于 o3 模型的训练过程相似。

从用户角度,AutoGLM 产品,也是首个 toC 免费不限量使用的拥有强反思能力的 Agent。从效果角度,目前 AutoGLM 沉思的平均思考步骤在 20 步以上,再加上结合浏览器进行深度信息检索、操作执行,拥有处理复杂问题的能力

不论是大模型公司、AI 创业公司、还是成熟大厂,各家都在或激进或谨慎地跃跃欲试结合大模型将 AI Agent 应用落地。今年,我们持续看好和期待国内外出现更多更加智能和有用的 AI Agent。

图片

图片

图片

原创文章,作者:特工宇宙,如若转载,请注明出处:https://www.agent-universe.cn/2025/03/47186.html

Like (0)
Previous 2025-03-31 10:00
Next 2025-03-31 18:33

相关推荐

发表回复

Please Login to Comment