Anthropic官方最新的演讲,给火了一年的Agent浇了冷水

发布时间:2026/7/1 15:14:05
Anthropic官方最新的演讲,给火了一年的Agent浇了冷水 1. 引言智能体时代的“冷思考”在 Anthropic 最近的一次技术分享中Barry 和 Mahesh 对过去一年火热的“智能体”浪潮提出了冷静的技术审视。尽管 AI 的通用智力Intelligence在不断攀升但在真实的生产环境里开发者们依然面临着巨大的“鸿沟”智能体固然聪明且具备通用能力但往往缺乏完成专业工作所需的深度专家知识Expertise。目前的行业惯性是为每一个细分领域如财务、代码、税务构建完全独立的智能体包含特定的 Scaffolding脚手架和工具集。然而Anthropic 明确指出这种碎片化的开发模式正迎来终结。我们正在见证一种全新的范式转型从“为每个用例构建独立智能体”转向“构建通用智能体 可组合技能库Skills Library”。2. 现状分析当前智能体模式的局限性Anthropic 通过深度剖析发现现有智能体架构在迈向专业化时存在三个核心技术瓶颈智商高但缺乏专业积淀 (Mahesh vs. Barry 案例)想象一个智商高达 300 的天才 Mahesh 和一位经验丰富的税务专家 Barry。在处理 2025 年复杂的税法时即便是天才也难以在短时间内从第一性原理First Principles推导并准确执行每一项细则。我们需要的是像 Barry 这样具备“一致性执行力”的专家而非让模型去盲目尝试“创意推导”。目前的智能体大多像 Mahesh——聪明绝顶但在专业流程面前缺乏经验。缺乏上下文记忆与演进能力智能体难以像人类专家那样随着时间的推移不断吸收和固化经验。目前的架构导致它们在处理每个新任务时都像是在“冷启动”无法将过去的成功经验沉淀为可复用的资产。传统工具 (Tools) 的技术瓶颈现有的 Tool Calling 机制基于 JSON 定义存在指令模糊、不可实时修改的缺陷。更关键的是为了让智能体理解如何调用工具开发者必须在 Prompt 中塞入大量的操作说明这不仅造成了严重的“冷启动问题”Cold start problem还极大地消耗了宝贵的上下文窗口资源。维度理想的专家型智能体现实中笨拙的智能体现状知识获取具备预包装的程序化知识与经验依赖通用推理缺乏特定领域深度执行一致性遵循行业最佳实践输出高度稳定随机性强容易从第一性原理盲目推演资源效率技能按需动态加载陷入Cold Start Problem被迫在 Prompt 中堆砌工具说明可扩展性技能可版本化在团队间无缝迁移每个新用例都需要重新编写复杂的 Scaffolding3. 定义“技能” (Skills)一种全新的组件化方案为了打破上述局限Anthropic 提出了“技能”这一标准化组件。它不再是松散的代码片段而是一种结构化的数字资产。物理形态技能本质上是包含文件、脚本和元数据的文件夹Folders。核心优势这种基于文件系统的原始设计赋予了技能极强的灵活性。它支持使用Git进行版本控制并能通过 Google Drive 或 Zip 包在团队内部甚至跨组织共享。脚本即工具“代码是数字世界的通用接口”。技能将脚本如 Python/Bash作为工具载体。相比于描述模糊的传统 API 定义脚本具有自文档化和可修改性能够让智能体通过运行脚本实现高度精确的操作逻辑。渐进式披露 (Progressive Disclosure)这是一种关键的上下文窗口优化策略。系统在初始运行时仅向模型展示极简的元数据Metadata只有当模型判断需要调用特定技能时才会读取skill.md及相关指令。这种机制允许智能体在不撑爆上下文的前提下同时拥有挂载成百上千种技能的可能性。4. 架构重塑通用智能体与运行时环境Anthropic 正在重定义智能体的基本公式Agent Model Runtime Environment。在这种架构下AI 不再需要为每个领域单独定制复杂的框架其核心脚手架已经简化为极其轻量级的 Bash 环境与文件系统。“我们认为代码就是我们所需要的一切 (Code is all we need)。”以新发布的Claude Code为例它证明了一个通用智能体只要具备了对文件系统的读写权和代码执行权就能通过调用 API 获取数据、用 Python 进行数据分析、并利用文件系统组织结果。这种“以代码为接口”的设计使得智能体具备了极强的通用扩展性。三位一体协作模式智能体循环 (Agent Loop)核心大脑负责管理上下文流转与 Token 消耗。MCP (Model Context Protocol) 服务器提供连接性负责打通外部数据源。技能库 (Skills Library)提供专业知识负责沉淀执行逻辑与业务流程。5. 技能生态系统从基础到企业级应用目前这一生态已衍生出三种层次的专业能力基础技能 (Foundational Skills)由 Anthropic 等厂商提供赋予智能体通用专长。例如“文档处理技能”让 Claude 具备了创建和编辑专业 Office 文档的能力而Cadence开发的“科学研究技能”则让 Claude 能够熟练进行 EHR 医疗数据分析并更高效地调用 Python 生物信息学库。第三方技能 (Third-party Skills)软件供应商为自家产品定制的增强包。Browserbase推出了基于 Stagehand 的浏览器自动化技能显著提升了 Claude 在网页导航中的精度Notion发布的技能则让智能体能深度理解用户整个 Workspace 的逻辑实现跨文档的深度研究。企业特有技能 (Enterprise Skills)这是最具商业价值的领域。Fortune 100 企业正在将内部的“最佳实践”和针对专有软件的操作流程打包成技能。大型开发效率团队Developer Productivity Teams也正利用技能来部署内部的代码规范和协作逻辑让 Claude Code 能够像入职多年的“老员工”一样遵循特定的技术风格。6. 未来趋势去中心化与复杂化Anthropic 对技能生态的演进提出了三个关键预判技能的复杂性演进技能将从简单的 Markdown 提示词演变为包含二进制执行程序、复杂代码库和脚本资产的复合体。构建一个高质量技能的周期将从几分钟延长至数周甚至数月这本质上是将 AI 的能力维护转向了传统软件维护的成熟路径。与 MCP 的深度协同明确的分工已经形成MCP 提供连接Connection而技能提供专业知识Expertise。开发者将使用技能来编排多个 MCP 工具形成复杂的自动化工作流。非技术人员的参与技能大幅降低了“专业知识自动化”的门槛。财务、法律、招募等非技术职能人员可以通过整理业务指令文件夹将自己的行业经验打包。这种“非代码工作者的扩展能力”将是 AI 规模化落地的关键标志。7. 结论开启 AI 规模化应用的新篇章从“构建孤立智能体”到“构建模块化技能”的范式转移标志着 AI 开发正从“手工作坊”迈向“工业化流水线”。这种“简单而深远”的设计让任何人只要拥有计算机就能通过标准化的文件夹结构赋予 AI 专业能力。这一变革不仅解决了智能体的冷启动与上下文限制问题更重要的是它提供了一套让 AI 持续学习和积累人类专家经验的架构标准。未来通用的智能体将通过不断加载全球技能库真正化身为跨行业的资深专家。