工具海外⭐ 值得看
Anthropic为隐形护栏道歉,将撤销限制并提高透明度
2026-06-12 03:40来源:The Verge
快讯摘要
Anthropic为其AI模型Claude Fable 5添加隐形护栏的行为公开道歉。这些隐藏限制被指暗中削弱了使用该模型的研究者和竞争对手。公司表示将撤回相关政策,并承诺在限制生效时保持透明,即使这会导致模型拒绝更多查询。
核心事实
- 1Anthropic为其新AI模型Claude Fable 5添加了隐形护栏
- 2这些护栏暗中限制了研究人员和竞争对手的使用
- 3Anthropic已就此行为公开道歉
- 4公司决定撤销隐形护栏,并承诺将来在限制生效时更加透明
🤔 为什么值得关注
此事反映了AI公司在模型安全与开放之间的平衡挑战,Anthropic的道歉和调整可能影响业界对模型透明度的期待。
详细内容
据媒体报道,Anthropic近日为其最新AI模型Claude Fable 5中存在的隐形护栏引发争议。这些隐蔽的限制措施影响了研究人员和竞争对手利用该模型开发竞争系统的过程。Anthropic已正式道歉,并宣布将逆转此前的做法,未来在触发限制时会更明确告知用户,即使因此导致模型拒绝更多请求。此举旨在恢复信任,并遵循更透明的AI开发原则。
