下载看详情
社评:美方可以讹诈一家公司以讹诈一家公司以讹

AI应用行业点评:智谱新一代AI AGENT升级 AI“主驾”时刻到来

04-01 和讯 申万宏源研究洪依真/黄忠煌/刘洋/陈晴华
语音播报预计7分钟
事件:2025 年3 月31 日智谱正式发布AutoGLM 沉思,实现具备深度研究能力和实际操作能力的AI Agent,推动AI 与人类协同进一步从“副驾”到“主驾”。目前已正式上线智谱清言网页端、PC 端和App 端,免费不限量。
首次实现深度研究大脑与工具操作能力结合:1)强化学习训练的新推理模型基座为大脑,根据不同任务自主规划和动态决策,根据反馈调整计划;2)感知体现于GUI 阅读能力,结合视觉理解读取屏幕内容;3)行动能力体现在工具调用,例如根据规划结果自动调用小红书、知乎等。
背后是更强性能的推理模型和视觉理解能力。1)基座提升:重新训练的320 亿参数基座模型GLM-4-Air-0414,在工具调用、联网搜索、代码等智能体任务能力增强。2)推理模型:GLM-Z1-Air 性能上媲美DeepSeek-R1,同时在推理速度上相比R1 提升8 倍,成本降低至1/30,支持消费级卡运行。3)沉思模型:GLM-Z1-Rumination 提升模型结合工具使用完成长程推理的能力,结合环境交互能够自主反思,动态调整方案,形成完整自主流程。视觉理解能力为核心,不依赖API。当前主流端侧Agent 通过视觉理解方式绕过API 接口限制,对于无权限读取数据的资源网站,能够通过模拟人类读取屏幕的方式来获取。
模型推理能力的提升仍是Agent 发展重点。AutoGLM 此次发布看到在强化学习提升推理能力下Agent 能够更自主动态的完成任务,Agent 能力目前处于类似GPT3 到ChatGPT 阶段。基准测试OSWorld 中 LLM 目前最高得分是OpenAI CUA,得分仅38.1%,仍有跃升空间。
发现Agent Scaling Law,对算力需求提升。发布会提出Agent 存在推理计算的Scaling Law,即通过扩展生成答案时的计算优化,能够看到Agent 任务完成准确度提升以及出现涌现。经实测,AutoGLM 完成任务平均20 分钟,对算力需求大幅提升。
更轻量化的趋势,利于端侧使用。此次智谱GLM-Z1-Air 能够做到DeepSeek-R1 价格的1/30,预计主要是更轻量化的原因,而GLM-Z1-Air 能够在一张消费级卡运行,更有利于AI 端侧的发展。
核心链路的模型和技术将开源,AI 应用有望继续爆发。AutoGLM 沉思的核心链路模型和技术将于2025 年4 月14 日全面开源,25 年初至今看到DeepSeek 的低成本高性能带动AI 应用爆发,AutoGLM 开源有望进一步带动AI 应用热潮,推动AI 主驾继续渗透科研、编程软件开发、办公流程自动化、医疗健康、金融等场景。
核心标的:金山办公科大讯飞泛微网络鼎捷数智汉得信息新致软件、焦点科技、中科创达、税友股份、福昕软件、虹软科技、同花顺、润达医疗。
风险提示:Agent 模型进展不及预期;前期研发投入导致短期利润不及预期;下游景气度不及预期导致相关公司收入不及预期。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。 (责任编辑:王治强)
查看全文
去“和讯财经”看本文专题

推荐频道