AgentsCAD:基于多智能体大模型推理与几何特征识别的FDM增材制造自动化设计
原文arXiv链接:https://arxiv.org/html/2607.02448v1
摘要
熔融沉积成型(FDM)3D打印零件通常需要面向制造的设计(DFAM)几何修改,保证可打印性、结构强度并减少后处理工序。现有切片软件仅能识别悬空等缺陷,但无法自动修改底层B-Rep边界表示几何。
本文提出AgentsCAD多智能体系统,打通B-Rep几何与大语言模型(LLM)推理链路,实现DFAM自动化优化。整体工作流:解析STEP标准几何文件→图神经网络识别几何特征→Claude Sonnet设计推理智能体生成几何修改方案→GPT-4o多模态视觉校验器验证几何有效性。系统输出优化后STEP文件与可读制造分析报告。
以鸟屋CAD模型为完整测试案例,系统可自动识别45°以上悬空缺陷,选择合理几何修正策略并输出物理可行修改方案,解决“三维几何转自然语言”这一大模型CAD改造核心难题。
关键词:面向增材制造设计DFAM、FDM熔融沉积、大语言模型LLM、多智能体流水线、B-Rep边界表示、STEP文件、GraphSAGE图神经网络
缩写:FDM/DFAM/LLM/VLM/B-Rep/STEP
1 引言
1.1 研究背景
FDM逐层堆积材料制造三维零件,向下倾斜超过45°的曲面属于典型悬空结构,若无支撑会打印失效。DFAM设计规范通过修改几何消除悬空、提升尺寸精度与力学性能、减少支撑与后处理。
现有切片工具仅标记缺陷区域,工程师需在CAD与切片软件间反复手动迭代,流程低效。近年LLM/VLM开始介入CAD领域,但现有工具仅能从文生CAD、完成缺陷预测,不存在读取现有STEP模型并自动修改B-Rep几何的闭环DFAM系统。
1.2 相关研究现状
- 文生CAD类模型:Text2CAD、Query2CAD、CADSmith仅支持根据文本生成全新模型,无法编辑已有零件;
- 几何自动特征识别AFR:传统规则+浅层网络、3D CNN、UV-Net、Hierarchical CADNet基于B-Rep面邻接图提取加工特征,但仅分类不输出修改方案;
- 图神经网络基础:GCN为直推式图分类,无法泛化全新CAD图;GraphSAGE为归纳式学习,适配未见过的STEP零件;
- 制造缺陷预测模型:LLM3D打印、Alloy智能体仅监控打印过程,不前置优化CAD几何。
现有工作均为孤立子模块,缺少完整闭环:读取STEP→识别制造缺陷→LLM推理修改→几何生成→视觉校验。本文核心问题:能否构建多智能体LLM系统全自动完成FDM零件DFAM改造?
1.3 论文核心贡献
- 提出AgentsCAD黑板架构多智能体流水线,完整实现STEP几何解析、图特征提取、LLM DFAM推理、CAD自动修改、多模态视觉校验闭环;
- 基于MFC++数据集训练GraphSAGE归纳式几何特征分类器,对比GCN证明其泛化优势,支持全新零件自动识别25类加工特征;
- 设计几何结构化JSON序列化方案,将B-Rep拓扑、曲面特征压缩至LLM上下文窗口,解决三维几何向文本转化难题;
- 引入MCP几何工具约束LLM推理,消除3D坐标幻觉,搭配GPT-4o视觉校验保证修改物理有效性;
- 以鸟屋模型完成完整端到端验证,输出可直接用于3D打印的优化STEP文件与标准化制造报告。
图1 AgentsCAD多智能体整体流水线
流程说明:原始CAD(a)输入推理智能体(b)生成几何调整方案,执行CAD代码修改©,VLM校验迭代后输出可打印验证模型(d)。
2 相关工作
- LLM3D打印智能体:基于相机层内缺陷实时调整打印参数,仅针对成型过程,不前置优化CAD几何;
- 合金设计多智能体:依托MCP协议调用ThermoCalc材料工具,用于增材合金工艺图生成,无几何编辑能力;
- RocketSmith火箭设计系统:整合OpenRocket、CADSmith生成火箭STEP,无FDM悬空DFAM优化模块;
- 各类文生CAD、特征识别网络均无法实现“读取已有零件并自动消除打印缺陷”的完整闭环。
3 理论基础
3.1 GCN图卷积网络(直推式)
以面为节点、邻接面为边构建B-Rep二部图,层更新公式:
H(l+1)=σ (D~−1/2A~D~−1/2H(l)W(l))\mathbf{H}^{(l+1)}=\sigma\!\left(\tilde{\mathbf{D}}^{-1/2}\tilde{\mathbf{A}}\tilde{\mathbf{D}}^{-1/2}\mathbf{H}^{(l)}\mathbf{W}^{(l)}\right)H(l+1)=σ(D~−1/2A~D~−1/2H(l)W(l))
A~\tilde{A}A~为自环邻接矩阵,D~\tilde{D}D~度矩阵,缺点:仅能在训练图上推理,无法处理全新CAD模型。
3.2 GraphSAGE归纳图网络(本文核心特征提取器)
邻域特征拼接聚合,保留节点自身几何属性,支持未见过的零件推理:
hv(l+1)=σ (W(l)⋅CONCAT (hv(l), MEANu∈N(v)hu(l)))h_{v}^{(l+1)}=\sigma\!\left(W^{(l)}\cdot\mathrm{CONCAT}\!\left(h_{v}^{(l)},\;\mathrm{MEAN}_{u\in\mathcal{N}(v)}h_{u}^{(l)}\right)\right)hv(l+1)=σ(W(l)⋅CONCAT(hv(l),MEANu∈N(v)hu(l)))
优势:独立学习聚合函数而非固定图嵌入,少量新零件即可泛化。
3.3 RAG检索增强生成
解决LLM无长期零件记忆问题:每完成一个零件分析,将几何特征、修改方案向量化存入FAISS向量库;新零件推理时检索相似历史DFAM案例,提供领域先验知识,持续提升系统随数据累积的推理精度。
4 方法:AgentsCAD完整系统实现
4.1 CAD几何文本表征方案(核心前置模块)
原始STEP二进制B-Rep无法直接输入LLM,本文设计结构化JSON表征,包含三大模块:
- 单曲面特征:曲面类型(平面/圆柱/圆锥/B样条)、面积、质心、法向量倾斜角、回转半径、伸长系数;
- 拓扑邻接关系:面ID共享边邻接图,记录孔洞、台阶等拓扑关联;
- GraphSAGE语义标签:25类加工特征(口袋/通孔/倒角等)+置信度。
数据来源:基于OpenCASCADE内核、CadQuery遍历B-Rep,UV网格采样曲面曲率补充特征,最终压缩JSON可完整放入LLM上下文窗口,同时保留三维空间关系,避免纯浮点数组无拓扑信息的缺陷。
4.2 黑板模式多智能体全局架构
摒弃LangChain/CrewAI消息传递架构,采用经典黑板共享状态设计:
- 全局唯一黑板存储所有几何数据、缺陷标记、特征标签、修改方案、渲染图;
- 各智能体独立读写黑板,模块完全解耦,可单独替换LLM、GNN、几何引擎;
三大核心特性:
- 确定性前置规则检测:无需LLM,通过面法向量与Z轴夹角直接标记>45°悬空,提供可验证真值;
- 条件分支执行:无悬空缺陷时自动跳过推理、修改、校验阶段,节省API开销;
- 双模型解耦:推理端Claude Sonnet,视觉校验端GPT-4o,任意模型可独立替换。
4.3 系统九阶段完整执行流水线
- STEP解析:CadQuery+OCCT读取模型,提取所有曲面几何参数、包围盒、质心;
- 规则悬空检测:计算面法向量与打印Z轴夹角,θ≤0标记为悬空缺陷;
- 拓扑图构建:遍历共享边生成面邻接关系图存入黑板;
- GraphSAGE特征推理:输入B-Rep二部图,输出25类加工语义标签;无预训练权重则降级Node2vec;
- RAG案例检索:当前几何向量匹配历史DFAM案例,追加至LLM提示词;
- 设计推理智能体(Claude Sonnet):CoT链式推理,调用2个MCP几何工具:
check_orientation_overhangs:评估各旋转方案悬空数量;lay_face_to_build_surface:计算最优平铺欧拉旋转角;
推理优先级:全局旋转→局部圆角/泪滴修改→支撑方案→零件拆分;
- 几何修改执行:CadQuery按面ID批量执行修改,旋转操作最后执行(旋转会改变面索引);
- VLM视觉校验(GPT-4o):四视图2048×2048渲染,针对每处修改生成Yes/No校验问题,识别几何失效;
- 输出归档:优化STEP、2×2渲染图、DFAM修改报告、完整黑板快照。
4.4 GraphSAGE与GCN消融实验设计
对比三组特征输入:
- 仅基础5维曲面特征;
- 基础特征+层级面邻接聚合;
- 基础特征+UV网格曲率增强特征;
网络均3层卷积,隐藏维度64,Dropout=0.5,评价指标宏F1(平衡稀有加工特征分类精度)。
表1 MFCAD++测试集分类性能对比
| 网络架构 | 特征配置 | 准确率 | 宏F1 | 宏精确率 | 宏召回 |
|---|---|---|---|---|---|
| GCN(基线) | 仅基础特征 | 0.443 | 0.338 | 0.336 | 0.396 |
| GCN | 层级聚合 | 0.363 | 0.306 | 0.345 | 0.377 |
| GCN | UV增强特征 | 0.538 | 0.469 | 0.472 | 0.552 |
| GraphSAGE | 仅基础特征 | 0.638 | 0.545 | 0.534 | 0.579 |
| GraphSAGE | 层级聚合 | 0.794 | 0.727 | 0.716 | 0.753 |
| GraphSAGE | UV增强特征 | 0.850 | 0.785 | 0.774 | 0.805 |
| 结论:GraphSAGE归纳式拼接聚合显著优于GCN归一化加权,UV曲率特征进一步提升稀有特征识别精度。 |
图2 MeshViz可视化特征分类结果
- 左:原始零件三维模型;
- 右:GraphSAGE+UV预测着色模型,红色为错分面;
错分集中于加工特征与基体边界,边界混合邻域导致表征模糊,为后续优化方向。
4.5 MCP几何工具消融关键结论
无MCP工具约束时,LLM频繁幻觉错误旋转角度;引入check_orientation_overhangs、lay_face_to_build_surface后,所有坐标变换计算完全基于真实几何,消除推理幻觉,是系统必备组件而非优化项。
4.6 视觉校验模块
复用CADCodeVerify校验范式,修改后模型生成四张正交视图,针对每一处几何修改生成定向校验提问,GPT-4o输出判定与推理,检测圆角缺失、旋转失效、干涉等隐性几何错误,自动化替代人工肉眼审核。
5 端到端鸟屋模型完整实验
图3 鸟屋模型前后对比
- 原始模型:两个90°水平圆柱通孔,严重悬空,无法无支撑打印;
- 系统优化流程:
1 RAG检索水平通孔DFAM历史案例;
2 推理智能体评估6组旋转方案,选择X轴90°平铺,消除一个通孔悬空;
3 剩余通孔自动生成泪滴轮廓修改;
4 VLM校验几何完整性,体积仅减少0.75%;
5 输出无悬空可直接打印STEP文件。
完整链路仅一轮迭代完成全部DFAM优化,无人工干预。
6 实验结论
- B-Rep拓扑+结构化JSON表征可完整向LLM传递三维制造信息,仅浮点数组会丢失空间关联,推理失效;
- GraphSAGE归纳图网络在全新CAD零件特征识别上全面超越直推式GCN,UV曲率特征进一步提升稀有加工特征识别;
- MCP几何工具是消除LLM三维坐标幻觉的必要条件,无工具约束会输出大量不可行几何修改;
- AgentsCAD实现从原始STEP到可打印优化模型全自动闭环,输出几何文件、标准化DFAM制造报告,填补现有CAD+LLM工具空白。
7 未来工作方向
- 支持多装配体、复杂大模型子图压缩,缓解LLM上下文窗口限制;
- 拆分多专用推理子智能体(应力、薄壁、桥接缺陷专项模块);
- 扩展缺陷检测种类:薄壁、桥接、内支撑、自相交;
- 完善RAG向量库,累积海量零件DFAM案例持续提升推理;
- 适配下一代多模态原生LLM,抛弃JSON中间表征,直接输入三维渲染图推理。
8 复现资源、环境与脚本
8.1 依赖软件与库
- 几何内核:OpenCASCADE、CadQuery;
- 图神经网络:PyTorch Geometric、GraphSAGE、Node2vec;
- 向量检索:FAISS;
- LLM/VLM:Claude Sonnet 4.6、GPT-4o API;
- 可视化:MeshViz、Matplotlib、2048分辨率渲染工具;
- 数据集:MFCAD++(59665个CAD零件加工标注数据集)。
8.2 环境一键安装脚本
# 1 基础依赖sudoaptinstallpython3 python3-pip libocct-dev-y# 2 CAD几何库pipinstallcadquery opencascade-python# 3 图学习库pipinstalltorch torch_geometric faiss-cpu# 4 LLM与可视化依赖pipinstallopenai anthropic matplotlib numpy# 5 项目代码(论文配套仓库)gitclone https://github.com/AgentsCAD/cad-dfam-llmcdcad-dfam-llm8.3 完整运行脚本
# 1 GraphSAGE模型训练(MFCAD++数据集)python train_graphsage.py--featureuv--datasetmfad_plus# 2 单STEP零件DFAM全自动优化python agentscad_pipeline.py--inputbirdhouse.step\--llm_provideranthropic\--vlm_provideropenai\--output./optimized_model.step\--report./dfam_report.md# 3 仅运行特征可视化MeshVizpython meshviz.py--modelbirdhouse.step--weightgraphsage_uv.pth8.4 资源下载地址
- 论文PDF完整文档:https://arxiv.org/pdf/2607.02448v1
- AgentsCAD开源代码仓库:https://github.com/AgentsCAD/cad-dfam-llm
- MFCAD++数据集下载:论文仓库data目录内置下载脚本
- GraphSAGE预训练权重:仓库release页面
- 鸟屋测试STEP样例:仓库examples/birdhouse.step
附录补充
- 完整MCP工具提示词模板;
- GraphSAGE网络完整训练超参;
- 鸟屋模型原始/优化STEP文件;
- 所有实验定量消融完整表格;
- 完整DFAM报告输出模板。
图片说明
原文PDF内含全部图表(网页版无图片资源,仅保留图文字描述与Mermaid复刻流程图):
- 图1:AgentsCAD多智能体流水线总流程图;
3. 图2:MeshViz零件特征着色可视化图;
(a)Original Part
(b)Predicted (97% face acc.)
- 图3:鸟屋模型优化前后四视图对比图;
(a)Original Birdhouse CAD input
(b)Modified Birdhouse CAD output