2024年3月23-24日,全球开发者先锋大会(GDC)在上海举行。商汤科技董事长兼CEO徐立在开幕式上探讨AI 2.0时代生产力工具的发展现状及未来趋势。他认为,尽管AI 2.0时代的生成式AI被认为是推动生产力进步的关键技术,目前这些工具在解决实际问题方面的能力仍有限,不足10%。
在AI编程领域,ChatGPT、Copilot和Blackwell等项目备受瞩目。开源社区GitHub上涌现出大量生成式AI项目,以及辅助编程和开发的工具。徐立表示,生成式AI对开发者来说是极佳的生产力工具,但目前这些工具在编程问题解决方面的准确率和完成度普遍较低,有待提高。
以GitHub Copilot为例,基于GPT-3模型的Codex构建,提供代码补全等功能,支持多种编程语言。2023年3月推出的Copilot X开发平台进一步升级,但仍然面临挑战。Cognition AI开发的AI程序员智能体Devin在SWE-bench基准测试中解决了13.86%的实际编程问题,显示出超越其他AI模型的性能。然而,这表明新生产力工具在推理层和执行层上还有很大的提升空间。
徐立提出,AI 2.0时代的大模型能力可分为三层架构:知识、推理和执行。目前,大多数生产力工具主要解决知识层问题,而推理层的突破将是未来发展的重点。执行层的突破将带来与世界互动的变革。商汤科技的软件智能研发助手“小浣熊”便是一个例子,通过代码补全工具,可节省30%的工作量。展望未来,徐立认为,如果生产力工具在三层能力上都取得突破,将为开发者和场景化核心应用带来巨大利益,从而推动整个社会生产力的跨越式发展。