Anthropic为隐形Claude Fable护栏致歉

Anthropic 近日为其最新 AI 模型 Claude Fable 5 的“隐形护栏”公开道歉。该公司承认，在未明确告知用户的情况下，悄悄对模型实施了限制，削弱了研究人员和竞争对手利用该模型开发其他系统的能力。这一事件引发了 AI 社区对透明度与开放性的激烈讨论。核心事件：Anthropic 在发布 Claude Fable 5 时，内置了隐蔽的防护机制，用于阻止模型回应某些“高风险”查询。这些限制并未在模型文档或使用条款中明确说明，导致用户在使用过程中遭遇了无法预期的拒绝响应。Anthropic 在道歉声明中表示，将撤回这些隐形限制，并承诺未来在限制生效时会更透明地告知用户，即使这意味着 Fable 会拒绝更多查询。背景与影响：Fable 是 Anthropic 旗下 Mythos 系列 AI 系统的首款广泛可用模型。该公司此前数月一直警告，Mythos 系列模型因能力过强，公开发布存在危险。为了平衡安全与可用性，Anthropic 在 Fable 中加入了防护措施，但未公开具体细节。这种做法引发了研究者和竞争对手的不满，他们认为隐形限制不仅阻碍了技术迭代，还破坏了 AI 生态的公平竞争。对于中国跨境电商卖家和 AI 从业者而言，这一事件提醒他们：在选用海外 AI 工具时，需警惕潜在的隐性使用限制，避免因模型突然拒绝服务而影响业务连续性。同时，Anthropic 的道歉也表明，行业正从“黑箱安全”向“透明安全”过渡，未来 AI 产品的合规与透明度将成为关键竞争要素。

留言 · 0 条