正确理解AI代理术语：Harness、Scaffold等

别再傻傻分不清：AI Agent 术语“Harness”与“Scaffold”到底是什么意思？ AI Agent 领域正以前所未有的速度演进，但随之而来的，是术语的混乱与滥用。同一个词在不同框架里有不同含义，有些概念被重新包装，有些则流行数月后悄然消失。这不仅让新手困惑，连资深从业者也常常感到无所适从。在 ICLR 2026 大会上，一位研究者提出了一个直击痛点的问题：“在 Agent 语境下，你们说的‘Harness’和‘Scaffold’到底指什么？我在大会上听到了很多解释，但始终不明白为什么它们不能统一成一个说法。” 为了厘清这些模糊概念，HuggingFace 的两位作者 Sergio Paniego 和 Aritra Roy Gosthipaty 撰写了一份实用术语指南。这份指南并非包罗万象的词典，而是聚焦于那些最容易被混淆、被误用、或被想当然的术语。无论你是在构建 Agent、部署 Agent，还是使用 Claude Code、Codex 或 Hermes Agent 等工具，这些概念都会频繁出现。 核心概念拆解：从 Model 到 Agent 1. Model（模型） 这是最基础的概念。模型就是大语言模型（LLM），如 Claude、Qwen、GPT、Kimi、DeepSeek 等。它接收文本输入，输出文本。模型本身没有记忆，没有循环，只能响应一次提示然后停止。它可以表达调用工具的意图，但需要一个“Harness”来实际执行。只有当它被包裹在“Scaffolding”和“Harness”中时，它才成为一个真正的 Agent。 2. Scaffolding（脚手架） 这是围绕模型的行为定义层。它包括系统提示（System Prompt）、工具描述、模型响应的解析方式、跨步骤的记忆（上下文管理）等。Scaffolding 塑造了模型看待世界和在其中行动的方式，无论是在训练阶段还是推理阶段。关键点在于，像 Claude Code、Codex 和 Antigravity CLI 这类产品，会把整个非模型部分统称为“Harness”。Claude Code 的官方文档就直言：“Claude Code 充当了 Claude 的 Agentic Harness。” 这是“Harness”的广义用法：指代除模型之外的一切。那么，为什么还要区分 Scaffold 和 Harness？当你在训练流水线中需要分别推理它们时，这种区分就变得至关重要。此外，“Scaffold”有时也被更广泛地用来指代 Harness 所依赖的任何基础设施：钩子（Hooks）、运行时配置，甚至目录结构。 3. Harness（执行器/框架） 这是 Agent 内部的执行层。它负责调用模型、处理模型的工具调用、决定何时停止。简而言之，Harness 是让 Agent 真正运行起来的引擎。而前面定义的 Scaffolding，则是模型工作的基础：它的指令、它的工具、它的格式。 Harness Engineering（执行器工程） 是一门设计好这一层的学问：决定 Agent 何时应该停止、如何处理错误、设置哪些护栏来确保其按预期运行。它同时适用于训练和推理阶段。Addy Osmani 的文章和 OpenAI 关于用 Codex 构建产品的报告，都从推理侧探讨了这一点。在评估（Evaluation）阶段，同样的模式也会出现。 其他关键术语速览 除了上述核心概念，指南还梳理了其他易混淆的术语： * Agent（智能体）：一个完整的系统，包含模型、Scaffolding 和 Harness，能够自主执行任务。 * Context Engineering（上下文工程）：设计和管理 Agent 能“看到”的信息，包括历史对话、检索到的文档、工具返回结果等。 * Policy（策略）：决定 Agent 在给定状态下采取什么行动的规则或模型。在训练中，它通常指强化学习中的策略网络。 * Tool Use（工具使用）：Agent 调用外部 API、函数或数据库的能力。 * Skills（技能）：一组可复用的工具或子任务序列，可以被 Agent 学习和调用。 * Sub-agents（子智能体）：由主 Agent 调用的、专门处理特定任务的更小 Agent。 * Training（训练）：涉及 RL（强化学习）、Environment（环境）、Trainer（训练器）、Rollout（展开）、Reward（奖励）等概念，主要面向模型训练从业者。 对中国卖家和 AI 从业者的启示 对于正在探索 AI Agent 应用的跨境电商卖家和出海创业者来说，理解这些术语的细微差别至关重要。 * 选型决策：当你评估 Claude Code、Codex 或开源方案如 Hermes Agent 时，知道它们的“Harness”和“Scaffold”是如何设计的，能帮你判断哪个更符合你的业务场景。例如，有的产品与自家模型深度绑定（如 Claude Code 与 Claude），而有的则允许你自由替换模型（如 Antigravity CLI）。 * 工程实践：在构建自己的 Agent 应用（如自动化客服、智能选品、广告投放优化）时，清晰地区分“Scaffold”（定义行为逻辑）和“Harness”（负责执行与容错），能让你更高效地调试和迭代。Harness Engineering 中的错误处理和停止策略，直接关系到 Agent 的稳定性和成本控制。 * 避免沟通歧义：在与团队或技术供应商沟通时，使用统一、精准的术语，能大幅降低理解成本，避免“鸡同鸭讲”的尴尬。 AI Agent 的术语仍在快速演变中，这份指南提供了一个宝贵的“坐标系”。它的目的不是强制统一词汇，而是提供一个实用的思维模型，让讨论更容易跟上。记住，理解这些概念背后的逻辑，远比死记硬背定义更重要。

留言 · 0 条