社交媒體平臺Reddit週三起訴了人工智慧公司Anthropic,指控其非法「抓取」數百萬Reddit用戶的評論,用於訓練其聊天機器人Claude。
Reddit稱,儘管被要求不要這樣做,Anthropic仍使用自動機器人獲取Reddit內容,並且「在沒有征得Reddit用戶同意情況下,有意利用他們的個人數據進行訓練」。
Anthropic在一份聲明中表示,它不同意Reddit的說法,「並將為自己強力辯護。」
兩家公司總部均在San Francisco。Reddit週三向在San Francisco的加州高等法院提起訴訟。
Reddit首席法務官Ben Lee在週三一份聲明中表示:「在沒有明確限制如何使用這些數據的情況下,不應允許人工智慧公司從人們那裏抓取信息和內容。」
Reddit許可協議
Reddit此前已與Google、OpenAI和其他公司簽訂了許可協議。這些公司向Reddit 付費,以便能根據Reddit超過1億日常用戶的公開評論訓練他們的人工智慧系統。
Lee說,這些協議「使我們能對用戶實施有意義的保護,包括刪除您的內容的權利、用戶隱私保護,以及防止用戶避免收到使用內容發送的垃圾郵件」。
這些許可協議還幫助這家已成立二十年的線上平臺在去年作為上市公司在華爾街首次亮相前籌集資金。從Reddit上市中受益的人包括OpenAI首席執行官Sam Altman:他作為早期Reddit投資者積累的股份使他成為該公司最大股東之一。
Claude和Alexa
Anthropic由前OpenAI高管於2021年成立,其旗艦Claude聊天機器人仍是OpenAI ChatGPT主要競爭對手。OpenAI與Microsoft關係密切,而Anthropic主要商業合作夥伴則是Amazon。Amazon使用Claude改進它的Alexa語音助手。
與其他人工智能公司一樣,Anthropic嚴重依賴Wikipedia和Reddit等網站,這些網站有大量可以幫助人工智慧助手瞭解人類語言模式的書面材料。
2021年由Anthropic首席執行官Dario Amodei合著的一篇論文在訴訟中被引用。在這篇論文中,該公司研究人員確定了包含最高品質人工智慧訓練數據的子版塊或主題論壇,例如,關注園藝、歷史、關係建議或人們在淋浴時的想法的子版塊。
Anthropic在2023年給U.S. Copyright Office一封信中稱,通過複製資訊對大量數據進行統計分析,「訓練Claude 的方式符合對材料的典型合法使用」。Anthropic目前已在抗爭主要音樂出版商發起的訴訟,音樂出版商指控Claude照搬照抄受版權保護的歌曲的歌詞。
但Reddit的訴訟與其他針對人工智慧公司的訴訟不同,因為它沒有指控侵犯版權;相反,它關注的是涉嫌違反Reddit使用條款的行為,並表示這是不公平競爭的產物。