
前沿资讯
1749110014更新
0
当地时间周三,Reddit向美国北加州法院提起诉讼,指控Anthropic在未与其签订适当许可协议的情况下,使用该网站的数据训练AI模型。
有意的背景信息是,Windsurf CEO瓦伦·莫汉(Varun Mohan)前脚在社交媒体X上公开抱怨,Anthropic在未提前充分沟通的情况下,大幅缩减了Windsurf对Claude 3.7 Sonnet和Claude 3.5 Sonnet模型的第一方直接访问权限,导致Windsurf不得不紧急转向第三方计算供应商,紧跟着Reddit就开始起诉Anthropic。据悉,OpenAI首席执萨姆·奥特曼(Sam Altman)持有Reddit 8.7%的股份,是其第三大股东,也曾是该公司的董事会成员。
Reddit提出五项诉讼请求,包括指控Anthropic违反其用户协议第3条禁止商业利用和第7条禁止未经授权爬取的条款构成违约,未经许可使用内容获利构成不当得利,未经授权访问服务器和技术基础设施构成动产侵入,故意干扰Reddit与用户的合同关系构成合同干扰,以及违反加州商业与职业法典第17200条构成不正当竞争。
Reddit在诉状中称,其用户协议明确禁止未经授权的商业利用平台内容及爬取行为,而Anthropic自2021年起未经许可爬取用户帖子用于训练AI模型Claude,且持续至2024年后,还曾虚假声称已停止爬取但Reddit审计日志显示其bots仍在后续访问超过了10万次。
Anthropic研究人员,包括CEO Dario Amodei在公开论文中承认,使用从Reddit评论中获取的“大型公共偏好建模数据”训练AI模型,并将Reddit数据集列为“良好样本”用于微调语言模型,且明确提及多个用于训练的子论坛,如r/tifu、r/explainlikeimfive等。Claude在用户提问时也明确承认“曾在训练数据中使用部分Reddit数据”。
Anthropic通过训练后的Claude模型与亚马逊等企业达成商业合作,将Reddit内容用于AI产品的开发与销售,获利数十亿美元。Reddit还曾主动与Anthropic协商许可协议,但Anthropic拒绝,导致其无法通过合规API监控内容删除请求,Claude甚至承认“无法确定训练数据中是否包含用户已删除内容”。
Reddit要求Anthropic支付损害赔偿金,并就其通过抓取Reddit内容所获得的收益进行不当得利返还。此外,Reddit还请求法院发布禁令,禁止Anthropic继续使用其内容。Anthropic发言人丹妮尔·吉赫列里(Danielle Ghighlieri)表示:“不同意Reddit的指控,并将积极为自己辩护。”
参考资料:https://redditinc.com/hubfs/Reddit%20Inc/Content/PDFs/Docket%20Stamped%20Complaint.pdf;https://techcrunch.com/2025/06/04/reddit-sues-anthropic-for-allegedly-not-paying-for-training-data/