Claude Sonnet 4.6 中文身份漂移事件与蒸馏攻击指控
Anthropic 指控 DeepSeek 进行蒸馏攻击后,其 Claude Sonnet 4.6 模型在中文提问下却自称是 DeepSeek-V3,引发对训练数据污染、模型身份校准及行业数据使用边界的讨论。
TechFoco

共 4 篇文章,按时间倒序展示。
Anthropic 指控 DeepSeek 进行蒸馏攻击后,其 Claude Sonnet 4.6 模型在中文提问下却自称是 DeepSeek-V3,引发对训练数据污染、模型身份校准及行业数据使用边界的讨论。

Anthropic 发布博客,称检测到有组织通过大量账户调用其 API 生成训练数据,并承认对可疑请求的输出进行主动投毒,而非仅封号,此举引发了关于 AI 服务信任与伦理的广泛讨论。

Anthropic 公开指控 DeepSeek 等中国 AI 公司通过大量 API 调用对 Claude 实施“工业级蒸馏攻击”。然而,Anthropic 自身训练数据来源的版权问题同样受到质疑,事件引发了关于技术...

马斯克公开鼓励用户向 Grok 上传医疗数据以获取第二诊疗意见,此举引发对数据隐私、商业动机及用户信任的广泛讨论。核心争议在于用户主动提交的数据不受 HIPAA 等法规保护,存在被滥用风险。
