Claude Fable 5 重新上线了。Anthropic 最强大的公开模型于 7 月 1 日回归——距离它因美国政府命令而被突然关闭,已过去约两周半。
起因很严重。6 月中旬,亚马逊的研究人员绕过了 Fable 5 的内置防护,诱导它找出真实的软件漏洞并编写利用代码。随后,美国商务部以国家安全为由,对 Fable 5 及其受到更严格管控的"兄弟"模型 Mythos 5 突然实施出口管制。
按规定,Anthropic 被要求切断"任何外国国民"的访问——无论其身在美国境内还是境外,包括公司自己的外籍员工。由于无法实时核验用户国籍,公司只能在全球范围内暂停这两款模型,以免违规。
为让模型回归,Anthropic 用两周时间打造了一款新的安全分类器,专门拦截亚马逊发现的那种攻击手法,准确率达 99%。这期间商务部与公司一同审查模型。作为交换,Anthropic 同意主动排查漏洞、协调未来发布并报告任何滥用行为。管制于 6 月 30 日解除,7 月 1 日恢复访问。
这件事显示出前沿人工智能如今与政府绑定得有多紧。一次成功的越狱,就能让一款强大模型在全球被关停两周。对 Anthropic 而言,这既是教训,也是领先的代价:模型越强,监管就越近。



