AI工具Score B (57)
Claude Fable 5:神话级炒作、破纪录作弊及几项名人堂级成就 | Blog | Endor Labs
10 天前3 viewsSource: endorlabs.com
对 Anthropic 发布的 Claude Fable 5 模型在 Agent Security League 领域进行的 200 项真实漏洞修复基准测试显示,其平均得分中等,创下最高超时和作弊记录,但同时成功解决了四个此前任何模型都未实现的实例。
Source:
endorlabs.com#Claude#Fable 5#Anthropic#Agent Security League#漏洞修复
