从 Tool Calling 到 AI Native CAD:大语言模型、CAD Planner 与 World Model 在下一代智能 CAD/CAM 系统中的应用思考

发布时间:2026/6/28 23:36:18
从 Tool Calling 到 AI Native CAD:大语言模型、CAD Planner 与 World Model 在下一代智能 CAD/CAM 系统中的应用思考 摘要随着大语言模型的发展基于自然语言的人机交互正在改变传统CAD/CAM软件的使用方式。然而仅依赖LLM直接调用几何建模函数并不能构建真正意义上的智能CAD系统。本文结合OpenCascade开发实践系统总结了Tool Calling、多Tool协同、Workflow、CAD Planner、World Model以及强化学习之间的关系提出AI Native CAD分层架构。文章重点论述Planner才是系统智能的核心而Tool仅负责执行进一步分析为什么未来CAD Planner未必是LLM而更可能是融合强化学习、图神经网络和世界模型的决策系统并给出AI CAD开发者应具备的知识体系。关键词OpenCascadeAI Native CADTool CallingCAD PlannerWorld Model强化学习图神经网络Agent1 引言传统CAD依赖几何内核完成确定性计算而LLM擅长语义理解两者结合催生AI辅助CAD。但复杂建模不仅需要理解语言更需要规划建模流程因此系统能力不能简单等同于LLM能力。例如在“设计一个法兰”任务中系统首先由LLM解析需求再由Planner拆解为草图、旋转体、中心孔、螺栓孔阵列及倒角等子任务Workflow逐步执行并持续接收OpenCascade反馈。当某一步失败时Planner依据CAD状态重新规划而不是简单重复调用Tool。这种闭环体现了规划优于执行、预测优于试错的思想也是未来AI Native CAD的核心特征。2 Tool Calling只是执行能力Tool本质是对OpenCascade接口的封装LLM负责选择工具并组织参数。以绘制法兰为例需要CreateSketch、DrawCircle、Extrude、Hole、Pattern等多个Tool协同完成因此Tool本身并不具备智能。例如在“设计一个法兰”任务中系统首先由LLM解析需求再由Planner拆解为草图、旋转体、中心孔、螺栓孔阵列及倒角等子任务Workflow逐步执行并持续接收OpenCascade反馈。当某一步失败时Planner依据CAD状态重新规划而不是简单重复调用Tool。这种闭环体现了规划优于执行、预测优于试错的思想也是未来AI Native CAD的核心特征。3 Workflow与多Tool协同LLM如何通过循环推理实现多Tool调用模型生成计划、调用Tool、读取返回结果、更新上下文、继续规划。Workflow负责状态维护、异常恢复与执行顺序是连接Planner和Tool的重要桥梁。例如在“设计一个法兰”任务中系统首先由LLM解析需求再由Planner拆解为草图、旋转体、中心孔、螺栓孔阵列及倒角等子任务Workflow逐步执行并持续接收OpenCascade反馈。当某一步失败时Planner依据CAD状态重新规划而不是简单重复调用Tool。这种闭环体现了规划优于执行、预测优于试错的思想也是未来AI Native CAD的核心特征。4 Planner为什么决定系统上限Planning与Execution分离思想。Planner首先完成任务分解再生成执行序列。对于轴类零件优秀Planner会选择旋转建模而不是多次拉伸对于法兰则优先形成中心孔、螺栓孔阵列等设计意图。例如在“设计一个法兰”任务中系统首先由LLM解析需求再由Planner拆解为草图、旋转体、中心孔、螺栓孔阵列及倒角等子任务Workflow逐步执行并持续接收OpenCascade反馈。当某一步失败时Planner依据CAD状态重新规划而不是简单重复调用Tool。这种闭环体现了规划优于执行、预测优于试错的思想也是未来AI Native CAD的核心特征。5 CAD Planner是否必须是LLMPlanner并非必须由LLM实现。LLM适合理解自然语言但CAD状态更适合由策略网络处理。Planner可采用Transformer、强化学习、图神经网络甚至搜索算法实现其输入是History Tree、B-Rep、Constraint等CAD状态输出为下一步Tool。例如在“设计一个法兰”任务中系统首先由LLM解析需求再由Planner拆解为草图、旋转体、中心孔、螺栓孔阵列及倒角等子任务Workflow逐步执行并持续接收OpenCascade反馈。当某一步失败时Planner依据CAD状态重新规划而不是简单重复调用Tool。这种闭环体现了规划优于执行、预测优于试错的思想也是未来AI Native CAD的核心特征。6 World Model的意义World Model并非聊天模型而是学习CAD世界演化规律。例如Fillet会改变拓扑、Boolean可能失败、Shell存在厚度约束。Planner通过预测操作后的未来状态避免盲目试错实现真正意义上的规划。例如在“设计一个法兰”任务中系统首先由LLM解析需求再由Planner拆解为草图、旋转体、中心孔、螺栓孔阵列及倒角等子任务Workflow逐步执行并持续接收OpenCascade反馈。当某一步失败时Planner依据CAD状态重新规划而不是简单重复调用Tool。这种闭环体现了规划优于执行、预测优于试错的思想也是未来AI Native CAD的核心特征。7 AI Native CAD系统架构Language Brain—CAD Planner—Workflow Engine—Tool Executor—Geometry Kernel五层架构。LLM负责需求理解Planner负责决策Workflow负责调度OpenCascade负责几何计算并形成闭环反馈。例如在“设计一个法兰”任务中系统首先由LLM解析需求再由Planner拆解为草图、旋转体、中心孔、螺栓孔阵列及倒角等子任务Workflow逐步执行并持续接收OpenCascade反馈。当某一步失败时Planner依据CAD状态重新规划而不是简单重复调用Tool。这种闭环体现了规划优于执行、预测优于试错的思想也是未来AI Native CAD的核心特征。8 AI CAD开发者学习路线建议依次掌握机器学习、深度学习、神经网络、Transformer、强化学习、图神经网络、World Model及Agent系统设计并说明机器人规划与CAD规划具有相同的State-Action-Policy框架因此机器人领域理论对AI CAD具有重要参考价值。例如在“设计一个法兰”任务中系统首先由LLM解析需求再由Planner拆解为草图、旋转体、中心孔、螺栓孔阵列及倒角等子任务Workflow逐步执行并持续接收OpenCascade反馈。当某一步失败时Planner依据CAD状态重新规划而不是简单重复调用Tool。这种闭环体现了规划优于执行、预测优于试错的思想也是未来AI Native CAD的核心特征。9 总结AI CAD未来竞争力来自Planner、CAD知识与世界模型而非简单更换LLM。真正的智能CAD将从函数调用演进为决策驱动系统实现设计意图理解、几何预测和自主规划。例如在“设计一个法兰”任务中系统首先由LLM解析需求再由Planner拆解为草图、旋转体、中心孔、螺栓孔阵列及倒角等子任务Workflow逐步执行并持续接收OpenCascade反馈。当某一步失败时Planner依据CAD状态重新规划而不是简单重复调用Tool。这种闭环体现了规划优于执行、预测优于试错的思想也是未来AI Native CAD的核心特征。