Shawn Shen vjeruje da će umjetna inteligencija morati pamtiti ono što vidi kako bi uspjela u fizičkom svijetu. Njegova tvrtka Memories.ai koristi Nvidia AI alate za izgradnju infrastrukture za nosive uređaje i robote koji će moći pamtiti i prisjećati se vizualnih uspomena.
Memories.ai je najavila suradnju s gigantom poluvodiča Nvidijom na svom GTC konferenciji. Kroz ovo partnerstvo, Memories.ai koristi Nvidia’s Cosmos-Reason 2, model jezika za razmišljanje i vizualizaciju, te Nvidia Metropolis, aplikaciju za pretraživanje i sažimanje videa, kako bi nastavila razvijati svoju tehnologiju vizualnog pamćenja.
Shen (na slici lijevo) rekao je za TechCrunch da su on i njegov suosnivač i CTO, Ben Zhou (na slici desno), došli na ideju za tvrtku dok su radili na AI sustavu za Meta Ray-Ban naočale. Izgradnja AI naočala natjerala ih je na razmišljanje o tome kako bi ljudi zapravo koristili ovu tehnologiju u stvarnom životu ako korisnici ne bi mogli prisjetiti se podataka koje snimaju.
Tražili su nekoga tko već razvija takvo rješenje vizualnog pamćenja za AI. Kada nisu našli nikoga, odlučili su se odvojiti od Mete i razviti to sami.
“AI već odlično funkcionira u digitalnom svijetu. Što je s fizičkim svijetom?” rekao je Shen. “AI nosivi uređaji i roboti također trebaju pamćenje… Na kraju, AI treba imati vizualna sjećanja. Vjerujemo u tu budućnost.”
Moć pamćenja AI sustava, općenito, relativno je nova. OpenAI je ažurirao ChatGPT da počne pamtiti prošle razgovore 2024. i dorađivao tu značajku 2025. Elon Muskova xAI i Google Gemini također su lansirali vlastite alate za pamćenje u protekle dvije godine.
No, ova poboljšanja uglavnom su se fokusirala na tekstualno pamćenje, rekao je Shen. Tekstualno pamćenje je mnogo strukturiranije i lakše za indeksiranje, ali nije toliko korisno za fizičke AI aplikacije koje uglavnom komuniciraju sa svijetom kroz vid i vizuale.
Memories.ai je pokrenuta 2024. godine i do sada je prikupila 16 milijuna dolara, kroz 8 milijuna dolara u prvoj rundi financiranja u srpnju 2025. i dodatnih 8 milijuna dolara. Rundu je vodio Susa Ventures, a uključivala je i Seedcamp, Fusion Fund i Crane Venture Partners, među ostalima.
Shen je rekao da je uspješno izgraditi ovu vizualnu memorijsku sloj zahtijevalo dvije stvari: izgradnju infrastrukture potrebne za umetanje i indeksiranje videa u format podataka koji se može pohraniti i prisjetiti, te prikupljanje podataka potrebnih za obuku modela da to učini.
Tvrtka je pokrenula svoj veliki vizualni memorijski model (LVMM) u srpnju 2025. Shen je rekao da se to može usporediti s manjom verzijom Gemini Embedding 2, modela za multimodalno indeksiranje i preuzimanje, koji je objavljen ranije ovog mjeseca.
Za prikupljanje podataka, tvrtka je stvorila LUCI, hardverski uređaj koji nose “sakupljači podataka” i koji snima video koji se koristi za obuku modela. Shen je rekao da ne planiraju postati proizvođači hardvera, niti prodavati ove uređaje, već su ih izgradili jer nisu bili zadovoljni gotovim video rekorderima koji su se fokusirali na visoku razlučivost i potrošnju baterije.
Tvrtka je objavila drugu generaciju ovog LVMM-a i potpisala partnerstvo s Qualcommom za rad na Qualcommovim procesorima počevši od kasnije ove godine.
Shen je rekao da Memories.ai već surađuje s nekim velikim tvrtkama za nosive uređaje, ali nije otkrio koje. Unatoč trenutnoj potražnji, Shen vidi još veće prilike u nosivim uređajima i robotici koje tek dolaze.
“Što se tiče komercijalizacije, više smo usredotočeni na model i infrastrukturu, jer na kraju mislimo da će tržište nosivih uređaja i robotike doći, ali vjerojatno nije sada,” rekao je Shen.



