Reddit tuži Anthropic, optužujući umjetničku inteligenciju tvrtku da je neovlašteno preuzela sadržaj korisnika s platforme i koristila ga za obuku svojih Claude AI modela. Tužba, podnesena na sudu u Kaliforniji, tvrdi da je Anthropic izvršio više od 100.000 neovlaštenih zahtjeva prema Redditovim poslužiteljima, čak i nakon što je javno izjavila da je prestala s tim postupcima.
Predmet tužbe temelji se na tvrdnji Reddita da je Anthropic ignorirao tehnička ograničenja i uvjete korištenja. Prema tužbi, Anthropic je zaobišao zaštitne mjere poput robots.txt datoteke koja bi trebala spriječiti automatizirano prikupljanje podataka. Reddit također optužuje Anthropic za kršenje privatnosti korisnika prikupljanjem i korištenjem osobnih objava, uključujući uklonjeni sadržaj, u komercijalne svrhe.
Reddit tvrdi da nudi strukturirani pristup svojim podacima putem ugovornih odnosa s tvrtkama poput OpenAI i Googlea. Ovi ugovori uključuju uvjete vezane uz korištenje sadržaja, zaštitu privatnosti i brisanje podataka. Prema platformi, Anthropic je odbio potpisivanje formalnog ugovora i umjesto toga izravno je prikupljao podatke s web stranice, izbjegavajući naknade za licenciranje i preskočivši zaštitu korisnika.
Tužba ističe istraživački rad iz 2021. godine, koji su koautorirali izvršni direktor Anthropic-a Dario Amodei, a koji je Reddit označio kao bogat izvor podataka za obuku jezičnih modela. Reddit je također uključio primjere u kojima se činilo da Claude gotovo doslovno reproducira objave s Reddita, čak i ponavljajući objave koje su korisnici uklonili. To, prema tvrdnjama tvrtke, pokazuje da Anthropic nije postavio zaštitne mjere za poštivanje privatnosti korisnika ili uklanjanje sadržaja.
Reddit traži novčanu naknadu i sudsku zabranu koja bi spriječila Anthropic da koristi Redditov sadržaj u budućim verzijama svojih modela.
Anthropic je reagirao, tvrdeći da se ne slaže s optužbama i planira se braniti. Međutim, ovo nije prvi put da je tvrtka pod pravnim pritiskom zbog načina na koji prikuplja podatke za obuku.
U kolovozu 2024. godine, grupa autora podnijela je tužbu koja se temelji na optužbama da je Anthropic koristio njihovo autorsko djelo bez dopuštenja. Tvrdili su da je tvrtka obučila svoje modele na knjigama i drugim napisanim materijalima bez njihovog pristanka i zatražila naknadu za korištenje njihovog sadržaja.
U sličnom slučaju iz listopada 2023. godine, Universal Music Group i drugi izdavači tužili su Anthropic zbog tvrdnji da njegov Claude chatbot reproducira zaštićene tekstove pjesama. Glazbene tvrtke tvrdile su da je ta upotreba prekršila njihova prava intelektualnog vlasništva i zatražile od suda da blokira daljnju upotrebu njihovih tekstova.
Za razliku od tih tužbi, Redditov slučaj ne fokusira se na autorska prava. Umjesto toga, usredotočuje se na kršenje ugovora i nepravednu konkurenciju. Redditova tvrdnja je da podaci preuzeti s njihove stranice nisu samo javni—oni su regulirani uvjetima koje je Anthropic svjesno ignorirao. Ta razlika mogla bi učiniti slučaj važnim za druge platforme koje hostaju korisnički sadržaj, ali žele kontrolirati kako se taj sadržaj koristi u komercijalnim AI sustavima.
Reddit također optužuje Anthropic za obmanu javnosti. Tužba ukazuje na javne izjave Anthropic-a u kojima tvrde da poštuju pravila prikupljanja podataka i cijene privatnost korisnika, što Reddit kaže da je suprotno djelovanju tvrtke.
“S obzirom na to, unatoč tome što kaže njihov marketinški materijal, Anthropic se ne brine za Redditova pravila ili korisnike,” stoji u tužbi. “Vjeruje da ima pravo uzeti bilo koji sadržaj koji želi i koristiti taj sadržaj kako želi, bez posljedica.”
Nakon podnošenja tužbe, Redditove dionice porasle su gotovo 67%, što je znak da su investitori podržali ovaj potez. Ishod slučaja mogao bi postaviti presedan za to kako tvrtke pronalaze ravnotežu između sadržaja otvorenog interneta i prava korisnika i vlasnika sadržaja.
Kako sve više AI tvrtki ovisi o velikim količinama podataka s interneta, pravna i etička pitanja oko prikupljanja podataka postaju sve teža za ignorirati. Redditov slučaj pridružuje se rastućem popisu tužbi koje oblikuju način na koji se odvija ova sljedeća faza razvoja AI.



