Današnje područje umjetne inteligencije definirano je razlikama između neuronskih mreža i ljudskog mozga. Dok mališani uče kako učinkovito komunicirati uz samo tisuću kalorija dnevno i redovite razgovore, tehnološke kompanije ponovno otvaraju nuklearne elektrane, zagađuju marginalizirane zajednice i neovlašteno preuzimaju terabajte knjiga kako bi trenirali i pokretali svoje velike jezične modele (LLM). No, neuronske mreže su, na kraju krajeva, neuronske – inspirirane su mozgom. Iako imaju vrlo različite potrebe za energijom i podacima, veliki jezični modeli i ljudski mozgovi dijele mnogo zajedničkog. Oba su sastavljena od milijuna podkomponenti: bioloških neurona u slučaju mozga i simuliranih ‘neurona’ u slučaju mreža. To su jedine dvije stvari na Zemlji koje mogu tečno i fleksibilno proizvoditi jezik. A znanstvenici jedva razumiju kako bilo koja od njih funkcionira.
Osobno mogu posvjedočiti tim sličnostima: u novinarstvo i AI ušao sam nakon šest godina studija neuroznanosti. U znanstvenim krugovima smatra se da je izgradnja neuronskih mreža sličnih mozgu jedan od najperspektivnijih pravaca za ovo polje, a taj stav počinje se širiti i na psihologiju. Prošlog tjedna prestižni časopis Nature objavio je par studija koje prikazuju korištenje neuronskih mreža za predviđanje kako ljudi i druge životinje reagiraju u psihološkim eksperimentima. Obje studije sugeriraju da bi ove trenirane mreže mogle pomoći znanstvenicima da unaprijede svoje razumijevanje ljudskog uma. No, predviđanje ponašanja i objašnjenje kako je do njega došlo su dvije vrlo različite stvari.
U jednoj od studija, istraživači su transformirali veliki jezični model u ono što nazivaju ‘temeljnim modelom ljudske kognicije.’ Iz kutije, veliki jezični modeli nisu baš dobri u oponašanju ljudskog ponašanja – ponašaju se logično u situacijama gdje ljudi napuštaju razum, poput kasina. Stoga su istraživači fino prilagodili Llama 3.1, jedan od Meta-ovih otvorenih LLM-a, na podacima iz 160 psiholoških eksperimenata, uključujući zadatke poput odabira iz skupa ‘automata’ za maksimalnu isplatu ili pamćenja nizova slova. Rezultantni model nazvali su Centaur.
U usporedbi s konvencionalnim psihološkim modelima, koji koriste jednostavne matematičke jednadžbe, Centaur je daleko bolje predviđao ponašanje. Točne prognoze o tome kako ljudi odgovaraju u psihološkim eksperimentima same su po sebi vrijedne: Na primjer, znanstvenici bi mogli koristiti Centaur za simuliranje svojih eksperimenata na računalu prije nego što angažiraju i plate ljudske sudionike. U svom radu, međutim, istraživači predlažu da Centaur može biti više od samo mašine za predikciju. Proučavanjem mehanizama koji omogućuju Centauru da učinkovito replicira ljudsko ponašanje, tvrde, znanstvenici bi mogli razviti nove teorije o unutarnjem funkcioniranju uma.



