Tvrtke koje se bave AI-jem bore se za dominaciju u industriji, a ponekad se natječu i u Pokémon teretanama.
Dok Google i Anthropic proučavaju kako njihovi najnoviji AI modeli prolaze kroz rane Pokémon igre, rezultati mogu biti jednako zabavni koliko i poučni — a ovaj put, Google DeepMind je napisao u izvješću da Gemini 2.5 Pro reagira panikom kada su njegovi Pokémoni blizu smrti. To može uzrokovati “kvalitativno uočljivo pogoršanje u sposobnosti rezoniranja modela”, prema izvješću.
Benchmarking AI-a — ili proces usporedbe performansi različitih AI modela — je sumnjiva umjetnost koja često pruža malo konteksta za stvarne sposobnosti određenog modela. No neki istraživači smatraju da proučavanje načina na koji AI modeli igraju video igre može biti korisno (ili, barem, pomalo smiješno).
U posljednjih nekoliko mjeseci, dva programera koja nisu povezana s Googleom i Anthropicom postavila su Twitch streamove pod nazivom “Gemini Plays Pokémon” i “Claude Plays Pokémon,” gdje svatko može u stvarnom vremenu gledati kako AI pokušava navigirati dječjom video igrom starom više od 25 godina.
Svaki stream prikazuje “razmišljanje” AI-a — ili, prirodnu jezičnu pretvorbu načina na koji AI procjenjuje problem i dolazi do odgovora — pružajući nam uvid u način na koji ovi modeli rade.

Iako je napredak ovih AI modela impresivan, još uvijek nisu jako dobri u igranju Pokémona. Treba im stotine sati da razmišljaju kroz igru koju dijete može završiti u eksponencijalno kraćem vremenu.
Ono što je zanimljivo u promatranju AI-a kako navigira Pokémon igrom nije toliko vrijeme završetka, koliko njegovo ponašanje tijekom igre.
“Tijekom igranja, Gemini 2.5 Pro se našao u raznim situacijama koje uzrokuju da model simulira ‘paniku’,” navodi izvješće.
Ovo stanje “panike” može rezultirati pogoršanjem performansi modela, jer AI može iznenada prestati koristiti određene alate na raspolaganju tijekom igre. Iako AI ne razmišlja niti doživljava emocije, njegovi postupci oponašaju način na koji bi čovjek mogao donositi loše, brzoplete odluke kada je pod stresom — fascinantan, ali uznemirujući odgovor.
“Ovo ponašanje se dogodilo u dovoljno odvojenih situacija da su članovi Twitch chata aktivno primijetili kada se to događa,” navodi izvješće.
Claude je također pokazao neka zanimljiva ponašanja tijekom svojih putovanja po Kantu. U jednom slučaju, AI je primijetio obrazac da kada svi njegovi Pokémoni ostanu bez zdravlja, lik igrača će “izgubiti svijest” i vratiti se u Pokémon Centar.
Kada se Claude zaglavio u špilji Mt. Moon, pogrešno je pretpostavio da će, ako namjerno natjera sve svoje Pokémon-e da se onesvijeste, biti prenesen preko špilje do Pokémon Centra u sljedećem gradu.
Međutim, to nije kako igra funkcionira. Kada svi vaši Pokémoni umru, vraćate se u posljednji Pokémon Centar koji ste koristili, a ne najbliži geografski. Gledatelji su s užasom pratili kako se AI zapravo pokušava ubiti u igri.
Unatoč svojim manama, postoji nekoliko načina na koje AI može nadmašiti ljudske igrače. Od izlaska Gemini 2.5 Pro, AI može rješavati zagonetke s impresivnom točnošću.
Uz pomoć nekih ljudi, AI je stvorio agentne alate — potaknute instance Gemini 2.5 Pro prilagođene specifičnim zadacima — kako bi riješio zagonetke s kamenjem i pronašao učinkovite rute za postizanje odredišta.
“Uz samo jedan upit koji opisuje fiziku kamenja i opis kako provjeriti valjanu stazu, Gemini 2.5 Pro može riješiti neke od ovih složenih zagonetki s kamenjem, koje su potrebne za napredovanje kroz Victory Road,” navodi izvješće.
Budući da je Gemini 2.5 Pro većinu posla na stvaranju ovih alata obavio samostalno, Google teoretizira da bi trenutni model mogao biti sposoban stvarati ove alate bez ljudske intervencije. Tko zna, možda će Gemini sama sebi stvoriti modul “ne paniči”.



