Apple pristupa novom načinu treniranja svojih AI modela – onom koji izbjegava prikupljanje ili kopiranje korisničkog sadržaja s iPhonea ili Maca.
Prema nedavnom blogu, tvrtka planira nastaviti oslanjati se na sintetičke podatke (konstruirani podaci koji se koriste za oponašanje korisničkog ponašanja) i diferencijalnu privatnost za poboljšanje značajki poput sažetaka e-pošte, bez pristupa osobnim e-porukama ili porukama.
Za korisnike koji se prijave u Appleov program analitike uređaja, AI modeli uspoređuju sintetičke poruke slične e-pošti s malim uzorkom stvarnog sadržaja korisnika pohranjenog lokalno na uređaju. Uređaj zatim identificira koja od sintetičkih poruka najviše odgovara uzorku korisnika i šalje informacije o odabranom skladu natrag Appleu. Niti jedan stvarni korisnički podatak ne napušta uređaj, a Apple tvrdi da prima samo agregirane informacije.
Ova tehnika omogućit će Appleu poboljšanje svojih modela za zadatke generiranja dugog teksta bez prikupljanja stvarnog korisničkog sadržaja. To je proširenje dugogodišnje upotrebe diferencijalne privatnosti, koja uvodi randomizirane podatke u šire skupove podataka kako bi zaštitila pojedinačne identitete. Apple koristi ovu metodu od 2016. godine za razumijevanje obrazaca korištenja, u skladu s politikama zaštite tvrtke.
Poboljšanje Genmoji i drugih značajki Appleove inteligencije
Tvrtka već koristi diferencijalnu privatnost za poboljšanje značajki poput Genmoji, gdje prikuplja opće trendove o tome koji su upiti najpopularniji bez povezivanja bilo kojeg upita s određenim korisnikom ili uređajem. U nadolazećim izdanjima, Apple planira primijeniti slične metode na druge značajke Appleove inteligencije, uključujući Image Playground, Image Wand, Memories Creation i Writing Tools.
Za Genmoji, tvrtka anonimno ispituje sudjelujuće uređaje kako bi utvrdila jesu li specifični fragmenti upita viđeni. Svaki uređaj odgovara šumovitim signalom – neki odgovori odražavaju stvarnu upotrebu, dok su drugi randomizirani. Ovaj pristup osigurava da samo široko korišteni pojmovi postanu vidljivi Appleu, a nijedan pojedinačni odgovor ne može se povezati s korisnikom ili uređajem, tvrdi tvrtka.
Kuratiranje sintetičkih podataka za bolje sažetke e-pošte
Dok je prethodna metoda dobro funkcionirala za kratke upite, Apple je trebao novi pristup za složenije zadatke kao što je sažimanje e-pošte. Za to, Apple generira tisuće uzoraka poruka, a te sintetičke poruke se pretvaraju u numeričke reprezentacije, ili ’embeddinge’, na temelju jezika, tona i teme. Uređaji sudionici zatim uspoređuju embeddinge s lokalno pohranjenim uzorcima. Opet, samo se odabrani sklad dijeli, ne i sadržaj.
Apple prikuplja najčešće odabrane sintetičke embeddinge sa sudjelujućih uređaja i koristi ih za usavršavanje svojih podataka za obuku. Tijekom vremena, ovaj proces omogućuje sustavu generiranje relevantnijih i realističnijih sintetičkih e-poruka, pomažući Appleu da poboljša svoje AI outpute za sažimanje i generiranje teksta bez očitog kompromisa korisničke privatnosti.
Dostupno u beta verziji
Apple uvodi sustav u beta verzijama iOS 18.5, iPadOS 18.5 i macOS 15.5. Prema Marku Gurmanu iz Bloomberga, Apple pokušava na ovaj način riješiti izazove u svom razvoju AI, koji uključuju odgode u uvođenju značajki i posljedice promjena u vodstvu tima za Siri.
Hoće li njegov pristup donijeti korisnije AI outpute u praksi ostaje za vidjeti, ali signalizira jasan javni napor za ravnotežu između privatnosti korisnika i performansi modela.
(Fotografija od Unsplash)



