制造业 AI Agent 平台 — 分阶段架构设计

编制日期：2026-06-03 | agent平台架构方案

总体路线（先看全景，再看分步）

阶段 1
0-3个月
单场景验证
1个Agent
单体应用
SaaS云

→

阶段 2
3-9个月
部门级平台
5-15个Agent
模块化服务
私有化起步

→

阶段 3
9-18个月
企业级Agent OS
30-100个Agent
微服务+消息队列
混合云

→

阶段 4
18个月+
生态化全球复制
100+Agent
多云+边缘
开放市场

核心理念：不学上古中天一上来就做"大而全"的 OS，也不学灵核只做纯 SaaS 应用层。我们走中间路线——先轻量验证场景，再逐步建设平台能力，最终形成自己的 Agent OS。每一步都有明确的架构决策和升级触发条件。

第一步：阶段 1 — 单场景快速验证（0-3 个月）（现有demo里已经实现了）

1.1 阶段目标

用最小成本、最快速度跑通一个具体业务场景的 AI Agent，验证"这条路走得通"。

1.2 架构全景图

┌──────────────────────────────────────────────────────────────────────────────┐ │ 阶段 1 架构：单场景单Agent单体（最小可用） │ │ │ │ ┌──────────────────────────────────────────────────────────────────────┐ │ │ │ 用户接入 │ │ │ │ Web 控制台 + 企微/钉钉 bot │ │ │ └──────────────────────────────┬───────────────────────────────────────┘ │ │ │ HTTPS │ │ ▼ │ │ ┌──────────────────────────────────────────────────────────────────────┐ │ │ │ 单体应用服务 (FastAPI) │ │ │ │ │ │ │ │ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────────────┐ │ │ │ │ │ 用户/登录 │ │ 知识库 │ │ Agent │ │ 场景业务逻辑 │ │ │ │ │ │ (简单JWT) │ │ (RAG) │ │ 执行器 │ │ (如：合同审查) │ │ │ │ │ └──────────┘ └──────────┘ └────┬─────┘ └──────────────────┘ │ │ │ │ │ │ │ │ │ ┌─────────▼──────────┐ │ │ │ │ │ LLM 调用层（单路） │ │ │ │ │ │ DeepSeek API │ │ │ │ │ └────────────────────┘ │ │ │ └──────────────────────────────────────────────────────────────────────┘ │ │ │ │ │ ┌────────────┼────────────┐ │ │ ▼ ▼ ▼ │ │ ┌──────────────────────┐ ┌──────────┐ ┌──────────────────┐ │ │ │ SQLite / PostgreSQL │ │ 文件存储 │ │ LLM API (外网) │ │ │ │ (业务数据 + 向量) │ │ (本地) │ │ DeepSeek / Qwen │ │ │ └──────────────────────┘ └──────────┘ └──────────────────┘ │ └──────────────────────────────────────────────────────────────────────────────┘

1.3 组件清单与选型理由

组件	阶段 1 选型	为什么这么选
后端框架	FastAPI（单体）	开发快，现有 demo 直接复用
数据库	PostgreSQL + pgvector	业务数据 + 向量检索一套搞定
缓存	不需要	用户量少，不构成瓶颈
LLM	DeepSeek API（云）	按量付费，零硬件投入
Embedding	BGE-M3（本地 CPU）	免费，1024 维，中文效果好
文档解析	MinerU / Unstructured	开箱即用
前端	React + Vite（现有 demo）	直接复用
部署	单台云服务器 / 内网服务器	Docker Compose 一键起

1.4 数据流（以"合同审查 Agent"为例）

用户上传
合同文件

→

文档解析
MinerU

→

文本切片
BGE-M3 Embedding

→

pgvector
向量存入

→

用户发起
审查请求

→

RAG 检索
+ Prompt 拼接

→

调用
DeepSeek API

→

解析结果
返回前端

1.5 阶段 1（防止过度设计）

✗ 先跑通基础架构，不引入过多组件

1.6 第 3 个月结束 — 关键决策点

评估项	通过标准	不通过则
Agent 解决真实业务问题	业务方验收通过，愿意日常使用	换场景重新验证
LLM 响应可接受	首 token < 5 秒，完整响应 < 30 秒	换模型 / 加缓存
数据安全无风险	无敏感数据泄露，合规检查通过	提前引入私有化
ROI 初步回正	省了人力或提了效率，有数字支撑	重新评估是否继续

→ 全部通过后，进入阶段 2。

第二步：阶段 2 — 部门级平台（3-9 个月）（现有demo实现了部分，还待完善）

2.1 阶段目标

从一个 Agent 扩展到 5-15 个 Agent，覆盖 1-2 个部门的核心业务。平台基础能力（多租户、权限、Agent 市场、计费计量）开始搭建。

2.2 架构全景图

┌───────────────────────────────────────────────────────────────────────────────────────┐ │ 阶段 2 架构：模块化多Agent平台 │ │ │ │ ┌──────────────────────────────────────────────────────────────────────────────────┐ │ │ │ 接入层 │ │ │ │ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐ │ │ │ │ │ Web控制台 │ │ 企微/钉钉 │ │ iframe │ │ JS SDK │ │ OpenAPI │ │ │ │ │ │ │ │ 机器人 │ │ 嵌入 │ │ 悬浮窗 │ │ (API Key)│ │ │ │ │ └────┬─────┘ └────┬─────┘ └────┬─────┘ └────┬─────┘ └────┬─────┘ │ │ │ └───────┼──────────────┼──────────────┼──────────────┼──────────────┼───────────────┘ │ │ └──────────────┼──────────────┼──────────────┼──────────────┘ │ │ ▼ ▼ ▼ │ │ ┌──────────────────────────────────────────────────────────────────────────────────┐ │ │ │ API 网关 (Nginx/APISIX) │ │ │ │ JWT 鉴权 / API Key 鉴权 / 限流 / 路由 │ │ │ └────────────────────────────────────┬─────────────────────────────────────────────┘ │ │ │ │ │ ┌────────────────────────────────────┼─────────────────────────────────────────────┐ │ │ │ 业务中台 (FastAPI 模块化，仍为单体) │ │ │ │ │ │ │ │ │ ┌───────────┐ ┌───────────┐ ┌──┴────────┐ ┌───────────┐ ┌───────────┐ │ │ │ │ │ 租户管理 │ │ 用户与权限 │ │ Agent市场 │ │ 计量计费 │ │ 集成管理 │ │ │ │ │ │(多租户隔离)│ │(RBAC+ABAC)│ │(模板+实例) │ │(Token计数) │ │(iframe/SDK)│ │ │ │ │ └─────┬─────┘ └─────┬─────┘ └─────┬──────┘ └─────┬─────┘ └─────┬─────┘ │ │ │ │ └──────────────┼──────────────┼───────────────┼──────────────┘ │ │ │ │ ▼ ▼ ▼ │ │ │ │ ┌────────────────────────────────────────────────────────────┐ │ │ │ │ │ Agent 执行内核（核心） │ │ │ │ │ │ ┌──────────────┐ ┌──────────────┐ ┌──────────────┐ │ │ │ │ │ │ │ Prompt管理器 │ │ 工具调用层 │ │ 知识检索层 │ │ │ │ │ │ │ │ (模板渲染) │ │ (MCP协议) │ │ (RAG混合检索) │ │ │ │ │ │ │ └──────┬───────┘ └──────┬───────┘ └──────┬───────┘ │ │ │ │ │ │ └────────────────┼──────────────────┘ │ │ │ │ │ │ ▼ │ │ │ │ │ │ ┌──────────────────────────────────────────────────┐ │ │ │ │ │ │ │ LLM 路由层 │ │ │ │ │ │ │ │ DeepSeek V3 (主力) / Qwen3 (兜底) / 本地(离线) │ │ │ │ │ │ │ └──────────────────────────────────────────────────┘ │ │ │ │ │ └────────────────────────────────────────────────────────────┘ │ │ │ └──────────────────────────────────────────────────────────────────────────────────┘ │ │ │ │ │ ┌────────────────────────────────────┼─────────────────────────────────────────────┐ │ │ │ 数据层 │ │ │ │ ┌───────────┐ ┌───────────┐ ┌─────────────┐ ┌───────────┐ │ │ │ │ │ PostgreSQL│ │ Redis │ │ MinIO(S3) │ │ 企业系统 │ │ │ │ │ │ +pgvector │ │ 会话/限流 │ │ 文件存储 │ │ ERP/MES │ │ │ │ │ └───────────┘ └───────────┘ └─────────────┘ └───────────┘ │ │ │ └──────────────────────────────────────────────────────────────────────────────────┘ │ │ │ │ 部署方式：Docker Compose 一键部署，运行在 1-2 台服务器（或私有云） │ └────────────────────────────────────────────────────────────────────────────────────────┘

2.3 阶段 2 新增组件（相比阶段 1）

新增组件	选型	解决什么问题
多租户体系	tenant_id 全表隔离 + JWT 租户上下文	多个部门/客户数据完全隔离
RBAC 权限	Casbin / 自研	平台管理员、租户管理员、普通员工不同权限
Agent 市场	ai_agent_template（demo 已有）	AI 员工模板上架，租户按需招募
计量计费	自研 Token 计数器 + 套餐额度表	按 Token 数 / 调用次数 / 存储容量计费
Redis 缓存	Redis	会话缓存、限流计数器、分布式锁
对象存储	MinIO	文档文件统一存储，不再存本地磁盘
API 网关	Nginx / APISIX	统一鉴权、限流、路由
LLM 路由	多模型切换层	DeepSeek 主路 + Qwen3 兜底 + 本地离线备胎
MCP 协议	自研 MCP Client	Agent 以标准协议调用外部工具

2.4 Agent 执行流程（阶段 2 完整版）

① 鉴权
JWT→租户ID
→权限点

→

② 限流检查
Redis QPS
Token配额

→

③ 加载Agent
模板+租户
配置

→

④ 构建上下文
会话历史+
RAG检索+文件

→

⑤ Prompt
渲染

→

⑥ 工具调用
MCP Client
(如需)

→

⑦ LLM 路由
主→备→兜底

→

⑧ 后处理
扣Token+审计
+Webhook

→

返回
结果

2.5 第 9 个月结束 — 关键决策点

评估项	通过标准
5+ Agent 稳定运行	日均调用 > 100 次，成功率 > 95%
多部门实际使用	2+ 部门日常使用，非 IT 部门
知识库形成规模	至少 1 个知识库 > 1000 文档
计费体系跑通	能准确计量、出账单
单体性能未到瓶颈	API P99 < 2 秒（不含 LLM）

→ 全部通过后，进入阶段 3。

第三步：阶段 3 — 企业级 Agent OS（9-18 个月）

3.1 阶段目标

从部门级平台升级为企业级 Agent 操作系统（对标上古中天 AgentOS）。30-100 个 Agent 覆盖全公司主要岗位。引入多 Agent 协同、自我进化闭环。架构从单体拆分为微服务。

3.2 架构全景图（五层完整版）

全貌

┌──────────────────────────────────────────────────────────────────────────────────────────────┐ │ 第五层 · 应用层（Agent 应用市场） │ │ │ │ ┌──────────────────┐ ┌──────────────────┐ ┌──────────────────┐ ┌──────────────────┐ │ │ │ 内部提效智能体 │ │ 工业智能智能体 │ │ 全球增长智能体 │ │ 通用工具市场 │ │ │ └────────┬─────────┘ └────────┬─────────┘ └────────┬─────────┘ └────────┬─────────┘ │ │ └────────────────────┼─────────────────────┴────────────────────┘ │ │ │ │ │ 多端入口：Web控制台 │ 钉钉/企微/飞书 │ iframe内嵌 │ JS SDK │ OpenAPI │ 移动H5 │ └────────────────────────────────┬─────────────────────────────────────────────────────────────┘ │ ▼ ┌──────────────────────────────────────────────────────────────────────────────────────────────┐ │ 第四层 · 调度层（Agent OS 核心引擎） │ │ │ │ ┌──────────────────────┐ ┌──────────────────────┐ ┌──────────────────────┐ │ │ │ Agent 编排引擎 │ │ 任务调度引擎 │ │ 群控系统 │ │ │ │ LangGraph 状态图 │ │ Celery + RabbitMQ │ │ 多Agent并发管理 │ │ │ │ 顺序/并行/条件/循环 │ │ 优先级/重试/定时 │ │ Agent间通信总线 │ │ │ └──────────┬───────────┘ └──────────┬───────────┘ └──────────┬───────────┘ │ │ └─────────────────────────┼──────────────────────────┘ │ │ │ │ │ ┌────────────────────────────────────┼─────────────────────────────────────────────────┐ │ │ │ Skills / Tools / MCP 工具层（连接ERP/MES/CRM/PLC...） │ │ │ └────────────────────────────────────┼─────────────────────────────────────────────────┘ │ │ │ │ │ ┌────────────────────────────────────┼─────────────────────────────────────────────────┐ │ │ │ Human-in-the-Loop 人机协同层 —— 审核节点 / 干预修正 / 反馈评分 / 审批流集成 │ │ │ └────────────────────────────────────┼─────────────────────────────────────────────────┘ │ │ │ │ │ ┌────────────────────────────────────┼─────────────────────────────────────────────────┐ │ │ │ 自我进化闭环：执行→监控→评估→优化→沉淀 → (循环) ← 阶段 3 核心差异化能力 │ │ │ └────────────────────────────────────────────────────────────────────────────────────┘ │ └─────────────────────────────────────┬───────────────────────────────────────────────────────┘ │ ▼ ┌──────────────────────────────────────────────────────────────────────────────────────────────┐ │ 第三层 · 认知层（AI 大脑） │ │ │ │ LLM 推理集群(DeepSeek V3 / Qwen3-72B / Kimi K2) │ 多模态(Qwen2.5-VL / PaddleOCR / 语音) │ │ 行业微调模型(LoRA) │ 规划反思引擎(ReAct / Plan+Execute / Reflexion) │ 短期+长期记忆系统 │ └─────────────────────────────────────┬───────────────────────────────────────────────────────┘ │ ▼ ┌──────────────────────────────────────────────────────────────────────────────────────────────┐ │ 第二层 · 数据层（企业记忆沉淀） │ │ │ │ PostgreSQL+pgvector │ Milvus(向量) │ Neo4j(知识图谱) │ TimescaleDB(时序) │ MinIO(对象存储) │ │ 消息中间件：RabbitMQ(任务队列) + Kafka(事件流) + Redis(缓存/锁) │ │ 数据治理：Flink CDC → ETL Pipeline → 数据血缘(Atlas) → 生命周期管理 │ └─────────────────────────────────────┬───────────────────────────────────────────────────────┘ │ ▼ ┌──────────────────────────────────────────────────────────────────────────────────────────────┐ │ 第一层 · 算力层（基础设施） │ │ │ │ ┌──────────────────────┐ ┌──────────────────────┐ ┌──────────────────────┐ │ │ │ GPU服务器 ×2 │ │ CPU服务器 ×2 │ │ 存储服务器 ×1 │ │ │ │ 8×H20/H100 │ │ 鲲鹏/Xeon 64核 │ │ 100TB SSD+500T HDD │ │ │ │ LLM推理 + 模型微调 │ │ 知识图谱+数据治理 │ │ MinIO + 热数据 │ │ │ └──────────────────────┘ └──────────────────────┘ └──────────────────────┘ │ │ │ │ K8s + Istio(服务网格) │ ArgoCD(GitOps) │ Harbor(镜像) │ Vault(密钥) │ Prometheus+Grafana │ │ 阿里云/华为云GPU(弹性补充) │ 边缘推理节点(工厂现场) │ 灾备机房(异地容灾) │ └──────────────────────────────────────────────────────────────────────────────────────────────┘ 横向贯穿全栈：安全与治理 ┌──────────────────────────────────────────────────────────────────────────────────────────────┐ │ 国密SM2/SM4 │ RBAC+ABAC细粒度权限 │ 全链路审计日志 │ OT/IT隔离(工业网闸) │ 沙箱执行(gVisor) │ 等保合规 │ └──────────────────────────────────────────────────────────────────────────────────────────────┘

3.3 阶段 3 新增组件（相比阶段 2）

新增组件	选型	解决什么问题
消息队列	RabbitMQ（任务）+ Kafka（事件）	异步任务解耦、事件驱动
独立向量数据库	Milvus	pgvector 不够用（百万级向量需专用库）
图数据库	Neo4j	知识图谱关系推理，企业知识资产化
时序数据库	TimescaleDB	设备 IoT 数据、生产数据
K8s 集群	K8s + Istio	微服务编排、灰度发布、自动扩缩
微服务拆分	从单体拆出 6-8 个服务	独立部署、独立扩缩、故障隔离
LLM 本地推理	vLLM 部署 Qwen3-72B	断网可用、敏感数据不出厂
自我进化闭环	自研（5 步循环）	越用越好，持续积累
知识图谱	Neo4j + 自研抽取Pipeline	从非结构化文档自动构建知识图谱
API 网关升级	Kong / APISIX	微服务路由、多租户限流、插件化
全链路监控	Prometheus + Grafana + SkyWalking + ELK	全链路可观测

3.4 微服务拆分方案

阶段 2 单体阶段 3 拆分 ───────────── ──────────── ┌─────────────────────┐ ┌─────────────┐ API网关 │ │ │ auth-svc │ 用户/权限/租户 │ FastAPI 单体应用 │ → │ agent-svc │ Agent执行/Prompt │ (所有模块一起) │ │ kb-svc │ 知识库/RAG │ │ │ billing-svc│ 计费/账单 │ │ │ market-svc │ 市场/模板 └─────────────────────┘ │ workflow-svc│ 编排/调度 │ integrate-svc│ 集成/iframe/SDK │ audit-svc │ 审计/日志 └─────────────┘ 服务间通信：HTTP REST（同步） + RabbitMQ（异步事件）服务发现：K8s Service + Consul/Nacos 配置管理：Nacos 集中配置链路追踪：SkyWalking

3.5 多 Agent 协同工作模式（阶段 3 引入）

阶段 2（单Agent）阶段 3（多Agent协同） ───────────────── ───────────────────── 用户 → Agent → 结果用户 → 总协调Agent │ ┌────────────┼────────────┐ ▼ ▼ ▼ Agent A Agent B Agent C (数据查询) (分析推理) (报告生成) │ │ │ └────────────┼────────────┘ ▼ 结果汇总 → 用户四种协同模式： 1. 顺序链式：A → B → C → 结果 2. 并行分派：一个问题同时问 A、B、C，汇总最优答案 3. 条件路由：根据用户意图，路由到不同的专家 Agent 4. 人机协同：Agent 遇到高置信度决策时，暂停等待人工审核

3.6 自我进化闭环（阶段 3 核心差异化）

① 执行
Agent 执行
任务

→

② 监控
全链路追踪
耗时/质量

→

③ 评估
结果打分
用户反馈

→

④ 优化
Prompt调整
Tool更新

→

⑤ 沉淀
知识写入
知识图谱

→

回到①
下次更好

这是对标上古中天"五步循环"但同时对标灵核"记记空间"知识沉淀的设计——既有自动化闭环，也有人工反馈入口。

3.7 第 18 个月结束 — 关键决策点

评估项	通过标准
30+ Agent 覆盖	至少覆盖 3 个部门的 30 个岗位场景
知识图谱 > 10 万实体	实体关系和业务规则可被 Agent 调用推理
自我进化闭环跑通	至少 1 个 Agent 经反馈迭代后准确率提升 10%+
系统可用性 > 99.9%	无单点故障，单服务故障不影响整体
运维成熟度	自动化部署、监控告警、日志排查达标

→ 全部通过后，进入阶段 4。

第四步：阶段 4 — 生态化与全球复制（18 个月+）

4.1 阶段目标

从企业级平台升级为开放生态平台。支持多语言、多时区、跨工厂/跨国部署。开放 Agent 市场生态供外部开发者贡献。

4.2 架构全景图

┌──────────────────────────────────────────────────────────────────────────────────────────────┐ │ 阶段 4 架构：开放生态 + 多云 + 全球化 │ │ │ │ ┌─────────────────────────────────────────────────────────────────────────────────────────┐ │ │ │ 接入层（全球化） │ │ │ │ │ │ │ │ 中国大陆 ────────┐ ┌────────── 东南亚 │ │ │ │ 欧洲 ────────────┼────────────────────────┼─────────── 北美 │ │ │ │ 中东 ────────────┘ ┌─────────┴─────────────┐ │ │ │ │ │ 全局 DNS 智能解析 │ │ │ │ │ │ (就近接入、合规路由) │ │ │ │ │ └───────────────────────┘ │ │ │ └──────────────────────────────────────────────────────────────────────────────────────────┘ │ │ │ │ │ ┌────────────────────────────────────────────────┼──────────────────────────────────────────┐ │ │ │ 开放生态层 │ │ │ │ ┌──────────────────────┐ ┌──────────────────────┐ ┌──────────────────────┐ │ │ │ │ │ Agent 应用市场 │ │ Skills 插件市场 │ │ 行业解决方案市场 │ │ │ │ │ │ · 平台官方Agent │ │ · MCP Server 上传 │ │ · 汽车/电子/医药 │ │ │ │ │ │ · 第三方开发者Agent │ │ · 社区贡献工具 │ │ · 模板化部署 │ │ │ │ │ │ · 企业内部贡献Agent │ │ · 付费/免费工具 │ │ │ │ │ │ │ │ · 评分/评论/计费 │ │ │ │ │ │ │ │ │ └──────────────────────┘ └──────────────────────┘ └──────────────────────┘ │ │ │ └──────────────────────────────────────────────────────────────────────────────────────────┘ │ │ │ │ │ ┌────────────────────────────────────────────────┼──────────────────────────────────────────┐ │ │ │ 多云调度层 │ │ │ │ ┌──────────────┐ ┌──────────────┐ ┌──────────────┐ ┌──────────────┐ │ │ │ │ │ 私有云（总部）│ │ 阿里云 │ │ 华为云 │ │ AWS/Azure │ │ │ │ │ │ 核心Agent OS │ │ 弹性推理 │ │ 国产化区域 │ │ 海外区域 │ │ │ │ │ │ 敏感数据 │ │ 非敏感Agent │ │ 信创合规 │ │ 全球加速 │ │ │ │ │ └──────────────┘ └──────────────┘ └──────────────┘ └──────────────┘ │ │ │ │ 跨云编排：K8s Federation / Terraform / Crossplane │ │ │ └──────────────────────────────────────────────────────────────────────────────────────────┘ │ │ │ │ │ ┌────────────────────────────────────────────────┼──────────────────────────────────────────┐ │ │ │ 边缘计算层 │ │ │ │ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐ │ │ │ │ │ 工厂A │ │ 工厂B │ │ 工厂C │ │ 海外工厂D │ │ 海外工厂E │ │ │ │ │ │ 轻量推理 │ │ 轻量推理 │ │ 轻量推理 │ │ 轻量推理 │ │ 轻量推理 │ │ │ │ │ │ Qwen-7B │ │ Qwen-7B │ │ Qwen-7B │ │ Qwen-7B │ │ Qwen-7B │ │ │ │ │ │ +本地PLC │ │ +本地PLC │ │ +本地MES │ │ +本地PLC │ │ +本地MES │ │ │ │ │ │ 断网可用 │ │ 断网可用 │ │ 断网可用 │ │ 断网可用 │ │ 断网可用 │ │ │ │ │ └──────────┘ └──────────┘ └──────────┘ └──────────┘ └──────────┘ │ │ │ │ 边缘与中心同步：KubeEdge / OpenYurt + 知识库增量同步 │ │ │ └──────────────────────────────────────────────────────────────────────────────────────────┘ │ └──────────────────────────────────────────────────────────────────────────────────────────────┘

4.3 阶段 4 新增能力

新增能力	说明
开放 Agent 市场	第三方开发者可上传 Agent/Skills，类似 App Store，平台抽成
多语言支持	i18n 国际化，支持中/英/日/韩/德等制造业主要语言
多地部署	中国/东南亚/欧洲/北美各自部署就近节点
边缘推理节点	每个工厂部署轻量推理节点（Qwen3-7B），断网可用
跨云编排	私有云 + 阿里云 + 华为云 + AWS，Terraform 统一管理
联邦学习（可选）	跨工厂共享模型能力但不共享原始数据
信创适配	适配国产 CPU（鲲鹏/飞腾）+ GPU（昇腾）+ OS（麒麟/欧拉）
灾备升级	两地三中心 → 异地多活

未来可能的升级方向（阶段 5+）

方向	说明	触发条件
自研行业大模型	从 LoRA 微调 → 从头训练制造业垂直大模型	行业数据积累 > 10TB 高质量文本
AI 一体机产品化	把你的平台打包成一体机售卖（对标上古中天）	私有化需求 > 20 家客户
具身智能 Agent	Agent 直接控制工业机器人/AGV/机械臂	产线自动化程度足够
数字孪生融合	Agent 平台与工厂数字孪生系统融合	已有数字孪生基础设施
行业标准制定	主导制定制造业 Agent 行业标准	市场占有率行业前三

各阶段技术栈总览

层次	阶段 1	阶段 2	阶段 3	阶段 4
接入层	Web + Bot	+ iframe/SDK/API	+ 移动H5/飞书	+ 全球多端
API网关	无	Nginx/APISIX	Kong	Kong(多区域)
业务层	单体 FastAPI	模块化 FastAPI	微服务(8+服务)	微服务+Serverless
编排引擎	硬编码	LangChain	LangGraph	LangGraph+自研
消息队列	无	无	RabbitMQ+Kafka	Kafka集群
数据库	PG+pgvector	PG+pgvector+Redis	+Milvus+Neo4j+时序	+ClickHouse
文件存储	本地磁盘	MinIO	MinIO集群	多云对象存储
LLM推理	云API	云API+本地兜底	vLLM+私有化	云+本地+边缘
容器	Docker Compose	Docker Compose	K8s+Istio	K8s Federation
监控	无	Prometheus基础	全链路观测	AIOps
部署	单台服务器	1-2台私有服务器	3-5台一体机	多云+边缘
Agent数	1个	5-15个	30-100个	100+（含社区）

升级触发条件速查

当出现以下情况时	执行对应的升级动作
单个 Agent 被业务方验收通过	阶段 1 → 阶段 2
Agent 日均调用量 > 100	引入 Redis 缓存
租户数 > 5	强化多租户隔离方案
文档数 > 10000	引入独立向量数据库 Milvus
API 响应 P99 > 2秒（不含LLM）	单体拆分，引入消息队列
Agent 数 > 15	引入 Agent 编排框架 LangGraph
跨部门协作需求出现	引入多 Agent 协同
知识库准确率不再提升	引入知识图谱 + 自我进化闭环
数据安全合规要求	引入私有化一体机
跨工厂/跨国需求出现	边缘节点 + 多云部署
第三方想贡献 Agent	开放 Agent 市场
工厂断网场景	边缘推理节点（轻量模型本地跑）

与竞品的架构差异（我们的差异化设计）

维度	灵核 LinkCrux	上古中天 AgentOS	我们的方案
架构抽象	扁平（岗位→技能→连接）	五层OS（固定）	五层OS + 分阶段演进
起步方式	SaaS 纯云	一体机重型起步	轻量云验证 → 逐步私有化
生态策略	"派派市场"（封闭）	无独立市场	开放市场 + MCP 标准
知识管理	"记记空间"（沉淀）	"知识库治理"（主动管理）	被动沉淀 + 主动治理 + 图谱化
自我进化	未明确	五步闭环	量化闭环：准确率追踪 + 自动优化
多Agent	蜂群协同	协同矩阵	LangGraph 编排 + 人机协同审核点
MCP支持	未提及	未提及	一等公民，所有工具走 MCP 标准

核心差异化：我们不学上古中天一上来就做重型 OS，也不学灵核只做应用层。我们的方案是"渐进式 OS"——先用轻量 SaaS 验证场景，验证通过后逐步把 Agent 编排、知识图谱、自我进化闭环自建起来。每一步都有明确的架构决策和升级触发条件，知道什么时候该加什么、什么时候不该加。

专题：桌面客户端架构方案

结论先行：加桌面客户端对现有架构影响很小——接入层多一个端，后端加一个设备认证流和推送通道。90% 的前端代码可从 Web 端复用。

1. 桌面端在整体架构中的位置

┌───────────────────────────────────────────────────────────────────────────────────────┐ │ 接入层（阶段 2+ 新增桌面端入口） │ │ │ │ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐ │ │ │ Web控制台 │ │ 企微/钉钉 │ │ iframe │ │ JS SDK │ │ OpenAPI │ │ 桌面客户端│ ← 新增 │ │ │ │ │ 机器人 │ │ 嵌入 │ │ 悬浮窗 │ │ (API Key)│ │(Electron)│ │ │ └────┬─────┘ └────┬─────┘ └────┬─────┘ └────┬─────┘ └────┬─────┘ └────┬─────┘ │ │ └─────────────┴─────────────┴─────────────┴─────────────┴────────────┘ │ │ │ │ │ ▼ │ │ ┌─────────────────────────┐ │ │ │ API 网关 (APISIX) │ ← 不新增任何接口 │ │ │ JWT / API Key / 限流 │ 仅新增 Device Auth 认证流 │ │ └─────────────────────────┘ │ └───────────────────────────────────────────────────────────────────────────────────────┘

2. 桌面客户端内部架构

┌──────────────────────────────────────────────────────────────────────────────┐ │ Electron 桌面客户端（内部架构） │ │ │ │ ┌─────────────────────────────────────────────────────────────────────────┐ │ │ │ Renderer (React) │ │ │ │ ┌────────────────────────────────────────────────────────────────────┐ │ │ │ │ │ 复用现有 frontend-portal 90% 的 UI 代码 │ │ │ │ │ │ │ │ │ │ │ │ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐ │ │ │ │ │ │ │ Agent市场 │ │ 对话中心 │ │ 知识库 │ │ 合同审查 │ │ 管理后台 │ │ │ │ │ │ │ └──────────┘ └──────────┘ └──────────┘ └──────────┘ └──────────┘ │ │ │ │ │ └────────────────────────────────────────────────────────────────────┘ │ │ │ └─────────────────────────────────────────────────────────────────────────┘ │ │ │ IPC │ │ ┌─────────────────────────────────▼───────────────────────────────────────┐ │ │ │ Main Process (Node.js) │ │ │ │ │ │ │ │ ┌──────────────┐ ┌──────────────┐ ┌──────────────┐ ┌──────────────┐ │ │ │ │ │ 窗口管理 │ │ 自动更新 │ │ 本地存储 │ │ 系统托盘 │ │ │ │ │ │ BrowserWindow │ │ electron- │ │ better- │ │ Tray + │ │ │ │ │ │ 多窗口/分屏 │ │ updater │ │ sqlite3 │ │ 通知+菜单 │ │ │ │ │ └──────────────┘ └──────────────┘ └──────┬───────┘ └──────────────┘ │ │ │ │ │ │ │ │ │ ┌──────────────┐ ┌──────────────┐ ┌──────┴───────┐ ┌──────────────┐ │ │ │ │ │ 文件系统集成 │ │ 截图/录屏 │ │ 离线消息队列 │ │ 本地推理 │ │ │ │ │ │ 拖拽上传 │ │ desktop- │ │ msg-queue │ │ llama.cpp │ │ │ │ │ │ 文件夹监听 │ │ capturer │ │ (断网缓存) │ │ (阶段3+) │ │ │ │ │ └──────────────┘ └──────────────┘ └──────────────┘ └──────────────┘ │ │ │ └─────────────────────────────────────────────────────────────────────────┘ │ │ │ HTTPS + WSS │ │ ▼ │ │ ┌─────────────────────┐ │ │ │ 后端 API 服务 │ ← 与 Web 端完全共用 │ │ │ (不需新增接口) │ │ │ └─────────────────────┘ │ └──────────────────────────────────────────────────────────────────────────────┘

3. 桌面端独有的能力（Web 端做不到的）

能力	实现方式	制造场景价值	引入阶段
本地文件拖拽上传	Electron 原生文件对话框 + 拖拽区域，支持批量文件/文件夹，自动解析 PDF/DWG/DXF/STEP	工程师直接拖图纸文件夹进 Agent，不用一个个上传	阶段 1→2
系统级通知推送	Electron Notification API + WebSocket 长连接，Agent 任务完成、审查结果出来时弹窗提醒	不用盯着浏览器，后台跑着任务，完成自动弹窗	阶段 2
截图/录屏输入	desktopCapturer + 剪贴板监听，截图直接粘贴到对话里让 Agent 分析	产线异常拍照 → Agent 识别 → 给出处理建议，一气呵成	阶段 2
离线消息缓存	better-sqlite3 本地存储，断网时消息暂存本地队列，网络恢复后自动重发	车间网络不稳定时，消息不丢	阶段 2
本地小模型推理	llama.cpp / Ollama 嵌入 Electron，跑 Qwen3-1.8B/4B 量化版（仅需 2-4GB 内存）	完全断网时也能用基础 Agent：文档摘要、OCR、简单问答	阶段 3
开机自启动 + 系统托盘	Electron auto-launch + Tray，最小化到托盘，后台常驻	Agent 像"数字员工"一样始终在线，随时呼出	阶段 2

4. 各阶段桌面端的能力演进

阶段	桌面端形态	说明
阶段 1	不单独做桌面端	用 Web 端 + 企业微信 bot 就够了，验证场景优先
阶段 2	Electron 壳 + Web 套壳	复用全部 Web UI，加文件拖拽、系统通知、托盘常驻、离线缓存。投入：1 个前端工程师 2-4 周
阶段 3	+ 本地小模型推理	嵌入 llama.cpp + Qwen3-4B 量化模型，断网也能用基础能力。投入：额外 1-2 周适配
阶段 4	+ 工厂专用客户端	对接 PLC/DCS 数据采集、串口扫码枪、工业平板适配（Win 触屏 + 防爆安卓）

5. 后端需要新增的能力

新增能力	说明	复杂度
Device Auth 认证流	OAuth 2.0 Device Authorization Grant。桌面端显示一个短码，用户在手机/Web 上确认登录，不用在客户端输密码	低，1-2 天开发
长 Refresh Token	桌面端 Token 有效期 30 天（Web 端 24 小时），支持"记住我"，JWT 里加 device_id 字段用于远程踢下线	低，改 JWT 配置
WebSocket 推送通道	长连接推送通知（Agent 任务完成、审查结果等），替代轮询。复用已有 Webhook 事件体系	中，FastAPI WebSocket 或独立 Socket.IO 服务
设备管理 API	租户管理员可查看/管理已登录设备列表，远程踢下线。审计日志记录设备信息	低，CRUD

6. 桌面端的多租户与安全

登录态隔离：每个桌面端拥有独立的 device_id + refresh_token，不与其他端共享登录态
数据不落地（默认）：敏感文档不上传到本地缓存，仅在内存中处理；可配置"允许离线缓存"开关
远程擦除：租户管理员可以在后台对某个设备执行"远程退出 + 清除本地数据"（通过 WebSocket 指令）
本地推理数据隔离：本地小模型推理完全在本地完成，数据不经过服务器，满足极端安全需求
代码完整性校验：Electron 打包时启用 ASAR 加密 + 代码签名，防止篡改

7. 技术选型

组件	推荐	备注
框架	Electron 33+	直接复用 React 前端，90% UI 共享
自动更新	electron-updater (electron-builder)	增量更新、静默安装、强制更新策略
本地数据库	better-sqlite3	轻量、与 PostgreSQL 的 SQL 兼容
本地向量检索	sqlite-vec	与 better-sqlite3 同一进程，零额外依赖
本地推理引擎	llama.cpp (node-llama-cpp)	CPU 即可跑 4B 量化模型，2-4GB 内存
打包	electron-builder	Win/Mac/Linux 三端，NSIS/DMG/AppImage
代码保护	bytenode + ASAR 加密	防止 Electron 主进程源码泄露

关键判断：桌面客户端对后端架构几乎零影响。API 完全复用，仅新增 Device Auth + WebSocket 推送。它本质上是把你的 Web 前端用 Electron 包了一层，外加本地文件系统、通知、离线缓存和本地推理能力。如果你阶段 2 的 OpenAPI 和 JS SDK 都做好了，加桌面端只是个纯前端工程工作。

附录：现有 Demo 与目标架构的差距分析

基于 E:\demo\agentjuhe 已有能力（FastAPI 后端 + React 前端 + JS SDK）：

✅ 已有能力（可直接复用）

能力	对应阶段
多租户 JWT + API Key	阶段 2
RBAC 权限模型	阶段 2
Agent 市场（模板+实例）	阶段 2
计量计费（Token/套餐）	阶段 2
知识库 RAG (pgvector)	阶段 2
iframe / JS SDK / OpenAPI	阶段 2
Webhook 事件	阶段 2
审计日志	阶段 2
合同审查 Agent	阶段 1

🔜 待建设能力

能力	阶段
真实 LLM 接入	阶段 1→2
Agent 编排 (LangGraph)	阶段 3
多 Agent 协同	阶段 3
MCP 协议支持	阶段 2→3
知识图谱 (Neo4j)	阶段 3
自我进化闭环	阶段 3
消息队列异步化	阶段 3
K8s 微服务化	阶段 3→4
私有化一体机	阶段 3
边缘推理节点	阶段 4
开放 Agent 市场	阶段 4

版本 V1.0 | 编制日期：2026-06-03 | agent平台架构方案

制造业 AI Agent 平台 — 分阶段架构设计

总体路线（先看全景，再看分步）

第一步：阶段 1 — 单场景快速验证（0-3 个月）（现有demo里已经实现了）

1.1 阶段目标

1.2 架构全景图

1.3 组件清单与选型理由

1.4 数据流（以"合同审查 Agent"为例）

1.5 阶段 1（防止过度设计）

1.6 第 3 个月结束 — 关键决策点

第二步：阶段 2 — 部门级平台（3-9 个月）（现有demo实现了部分，还待完善）

2.1 阶段目标

2.2 架构全景图

2.3 阶段 2 新增组件（相比 阶段 1）

2.4 Agent 执行流程（阶段 2 完整版）

2.5 第 9 个月结束 — 关键决策点

第三步：阶段 3 — 企业级 Agent OS（9-18 个月）

3.1 阶段目标

3.2 架构全景图（五层完整版）

全貌

3.3 阶段 3 新增组件（相比 阶段 2）

3.4 微服务拆分方案

3.5 多 Agent 协同工作模式（阶段 3 引入）

3.6 自我进化闭环（阶段 3 核心差异化）

3.7 第 18 个月结束 — 关键决策点

第四步：阶段 4 — 生态化与全球复制（18 个月+）

4.1 阶段目标

4.2 架构全景图

4.3 阶段 4 新增能力

未来可能的升级方向（阶段 5+）

各阶段技术栈总览

升级触发条件速查

与竞品的架构差异（我们的差异化设计）

专题：桌面客户端架构方案

1. 桌面端在整体架构中的位置

2. 桌面客户端内部架构

3. 桌面端独有的能力（Web 端做不到的）

4. 各 阶段 桌面端的能力演进

5. 后端需要新增的能力

6. 桌面端的多租户与安全

7. 技术选型

附录：现有 Demo 与目标架构的差距分析

✅ 已有能力（可直接复用）

🔜 待建设能力

2.3 阶段 2 新增组件（相比阶段 1）

3.3 阶段 3 新增组件（相比阶段 2）

4. 各阶段桌面端的能力演进