AI应用行业点评：智谱新一代AI AGENT升级 AI“主驾”时刻到来-和讯网

事件：2025 年3 月31 日智谱正式发布AutoGLM 沉思，实现具备深度研究能力和实际操作能力的AI Agent，推动AI 与人类协同进一步从“副驾”到“主驾”。目前已正式上线智谱清言网页端、PC 端和App 端，免费不限量。
首次实现深度研究大脑与工具操作能力结合：1）强化学习训练的新推理模型基座为大脑，根据不同任务自主规划和动态决策，根据反馈调整计划；2）感知体现于GUI 阅读能力，结合视觉理解读取屏幕内容；3）行动能力体现在工具调用，例如根据规划结果自动调用小红书、知乎等。
背后是更强性能的推理模型和视觉理解能力。1）基座提升：重新训练的320 亿参数基座模型GLM-4-Air-0414，在工具调用、联网搜索、代码等智能体任务能力增强。2）推理模型：GLM-Z1-Air 性能上媲美DeepSeek-R1，同时在推理速度上相比R1 提升8 倍，成本降低至1/30，支持消费级卡运行。3）沉思模型：GLM-Z1-Rumination 提升模型结合工具使用完成长程推理的能力，结合环境交互能够自主反思，动态调整方案，形成完整自主流程。视觉理解能力为核心，不依赖API。当前主流端侧Agent 通过视觉理解方式绕过API 接口限制，对于无权限读取数据的资源网站，能够通过模拟人类读取屏幕的方式来获取。
模型推理能力的提升仍是Agent 发展重点。AutoGLM 此次发布看到在强化学习提升推理能力下Agent 能够更自主动态的完成任务，Agent 能力目前处于类似GPT3 到ChatGPT 阶段。基准测试OSWorld 中 LLM 目前最高得分是OpenAI CUA，得分仅38.1%，仍有跃升空间。
发现Agent Scaling Law，对算力需求提升。发布会提出Agent 存在推理计算的Scaling Law，即通过扩展生成答案时的计算优化，能够看到Agent 任务完成准确度提升以及出现涌现。经实测，AutoGLM 完成任务平均20 分钟，对算力需求大幅提升。
更轻量化的趋势，利于端侧使用。此次智谱GLM-Z1-Air 能够做到DeepSeek-R1 价格的1/30，预计主要是更轻量化的原因，而GLM-Z1-Air 能够在一张消费级卡运行，更有利于AI 端侧的发展。
核心链路的模型和技术将开源，AI 应用有望继续爆发。AutoGLM 沉思的核心链路模型和技术将于2025 年4 月14 日全面开源，25 年初至今看到DeepSeek 的低成本高性能带动AI 应用爆发，AutoGLM 开源有望进一步带动AI 应用热潮，推动AI 主驾继续渗透科研、编程软件开发、办公流程自动化、医疗健康、金融等场景。
核心标的：金山办公、科大讯飞、泛微网络、鼎捷数智、汉得信息、新致软件、焦点科技、中科创达、税友股份、福昕软件、虹软科技、同花顺、润达医疗。
风险提示：Agent 模型进展不及预期；前期研发投入导致短期利润不及预期；下游景气度不及预期导致相关公司收入不及预期。
【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。（责任编辑:王治强）

AI应用行业点评：智谱新一代AI AGENT升级 AI“主驾”时刻到来

推荐频道