昨天,智谱 AI 在中关村论坛上正式发布了其最新产品:AutoGLM 沉思
这款产品被定位为 全球首个集深度研究能力和操作能力于一体的 AI Agent
标志着 AI 智能体正式进入"边想边干"的新阶段。
我简单的用图形的方式把重点捋一下,还有一些体验后的感受~
最核心的就是 边想边干 :不只会空想,能像人类一样 一边分析问题,一边动手操作 。比如查资料、翻网页、整理报告,还能附上所有引用来源,确保信息靠谱。
智谱最近的动作很少,所以基础的架构在我们看来没有太多的更新,还是基于 GLM
从 DeepSeek R1 推理模型大火之后,很多公司都在开始做推理模型了
智谱也不例外,“沉思”也是在推理模型的基础之上演变而来。
大家最喜欢比来比去
和 OpenAI 的 DeepResearch 相比
和前段时间爆火的 manus 比
让大家熟知这种 Agent 形式的应该还是 manus, 能够自动安装一些 python 环境,在虚拟电脑上面操作网页、搜索
和 智谱这个很像,但从使用上面来说,国内用户更能直观的体验,体感更好,效果先不说。
在网页版和 PC 客户端都可以使用,但是体感完全不一样,这里建议去客户端使用,能够直接感受。
地址:https://autoglm-research.zhipuai.cn/
1、沉思是类似 manus 的 AI Agent 工具,符合大多数人的 Agent 设想, 给定一个目标,自动完成任务。
2、没有用上 manus 的用户,完全可以使用智谱的这个进行体验, 能够直观感受什么是 “大家都在吹爆的 Agent”, 推荐用 PC 客户端 ,能感受操作浏览器,在知乎,小红书,B 站等自动搜索的功能。
3、沉思的自我怀疑,这个符合 Agent 自我探索的设定,因为我们只给定了一个终点,走到终点的过程是未知的,AI 为了能够顺利的走到终点,达到我们的预期,会在这个过程中多次思考和判断自己的路径是否正确,达到某个置信度才会确认,所以有时候你会觉得他 思考过度,做了很多无用功 。
4、AutoGLM 沉思好像特别喜欢知乎这个网站,不知道为什么,而且每次对话搜索的网站很单一,逮着一个往死了 search,可能和问的问题有关?
5、 理解能力,工具识别能力较差 :比如我让它“搜索小红书,生成清明出游路线”,搜了很多无关的网站,也不直接在浏览器打开小红书搜索,在这个过程中,你有可能会被气死(`へ ´)
6、竟然知道怎么搜索公众号文章,我们都知道公众号文章外部是没办法检索的,但是在搜狗搜索上面有个专门的微信搜索的接口,这也是公众号唯一给外部开的接口了吧。在某次尝试中, 竟然知道从这里检索公众号文章 ,这个比较惊喜。
7、某些需要扫码登录的网站,会等待你手动操作,这个不错的, 涉及到权限的问题还是要慎重 ,毕竟 AI 是协作,人才是主力。
8、至于最后生成的内容可不可用,我打 60 分吧,看起来还行,实际看具体场景吧。
我是大林,持续关注 AI 发展,和大家一起交流。微信(dalinvip2023),备注【公众号 AIGC】,进 AIGC 交流群一起交流。
主页:https://www.dalinaip.com/about
如果文章对你有一点点 🤏🏻 帮助, 关注公众号并【星标】 ,可以及时收到最新 AI 信息, 点赞、在看、转发给更多的朋友,后面我继续分享更多的 AI 内容。
往期推荐
Sam Altman 喊话:冷静使用GPT-4o画图,团队没法睡觉了
两件大事。谷歌发布Gemini 2.5 Pro,打榜第一,OpenAI 发布GPT-4o 图像生成功能,功能强大
StarVector,从图像和文本生成SVG的开源模型,最大的只有8B, 可以自己部署
混元-T1: 强化学习驱动,业内首个超大规模混合Mamba推理模型正式发布
DeepSeek这个大好人,官方公布的他们的系统提示词,让全网都能体验最佳效果