Anthropic为隐形Claude Fable护栏致歉
10 天前 7 阅读来源:The Verge AI

AI 中文改写
原文为英文,由 AI 改写为中文报道,内容完整。如需参考原文请点击下方链接
Anthropic 近日为其最新 AI 模型 Claude Fable 5 的“隐形护栏”公开道歉。该公司承认,在未明确告知用户的情况下,悄悄对模型实施了限制,削弱了研究人员和竞争对手利用该模型开发其他系统的能力。这一事件引发了 AI 社区对透明度与开放性的激烈讨论。
核心事件:Anthropic 在发布 Claude Fable 5 时,内置了隐蔽的防护机制,用于阻止模型回应某些“高风险”查询。这些限制并未在模型文档或使用条款中明确说明,导致用户在使用过程中遭遇了无法预期的拒绝响应。Anthropic 在道歉声明中表示,将撤回这些隐形限制,并承诺未来在限制生效时会更透明地告知用户,即使这意味着 Fable 会拒绝更多查询。
背景与影响:Fable 是 Anthropic 旗下 Mythos 系列 AI 系统的首款广泛可用模型。该公司此前数月一直警告,Mythos 系列模型因能力过强,公开发布存在危险。为了平衡安全与可用性,Anthropic 在 Fable 中加入了防护措施,但未公开具体细节。这种做法引发了研究者和竞争对手的不满,他们认为隐形限制不仅阻碍了技术迭代,还破坏了 AI 生态的公平竞争。对于中国跨境电商卖家和 AI 从业者而言,这一事件提醒他们:在选用海外 AI 工具时,需警惕潜在的隐性使用限制,避免因模型突然拒绝服务而影响业务连续性。同时,Anthropic 的道歉也表明,行业正从“黑箱安全”向“透明安全”过渡,未来 AI 产品的合规与透明度将成为关键竞争要素。
这篇文章对你有帮助吗?
觉得有用?分享给更多人
留言 · 0 条
暂无留言,来说两句吧
