Petak, 24 travnja, 2026
7 C
London

OpenAI predstavio GPT-5.4, novi model umjetne inteligencije

U četvrtak, OpenAI je predstavio GPT-5.4, novi temeljni model koji se opisuje kao “naš najcapabilniji i najučinkovitiji model za profesionalni rad.” Osim standardne verzije, GPT-5.4 je također dostupan kao model razmišljanja (GPT-5.4 Thinking) ili optimiziran za visoke performanse (GPT-5.4 Pro).

API verzija modela bit će dostupna s kontekstualnim prozorima velikim do 1 milijun tokena, što je dosad najveći kontekstualni prozor dostupan od OpenAI.

OpenAI je također naglasio poboljšanu učinkovitost tokena, ističući da je GPT-5.4 sposoban rješavati iste probleme s znatno manje tokena nego njegov prethodnik.

Ovaj novi model donosi znatno poboljšane rezultate na benchmark testovima, uključujući rekordne rezultate u računalnim benchmarkovima OSWorld-Verified i WebArena Verified. Novi model također je postigao rekordnih 83% na OpenAI-ovom GDPval testu za zadatke znanja.

GPT-5.4 je također zauzeo vodeću poziciju na Mercorovom APEX-Agents benchmarku, dizajniranom za testiranje profesionalnih vještina u pravu i financijama, prema izjavi izvršnog direktora Mercora, Brendana Foodyja.

“[GPT-5.4] izvanredno stvara dugoročne isporuke poput prezentacija, financijskih modela i pravne analize,” rekao je Foody u izjavi, “pružajući vrhunske performanse uz brže i jeftinije troškove od konkurentskih modela.”

GPT-5.4 nastavlja napore tvrtke da ograniči halucinacije i činjenične pogreške. OpenAI je izjavio da je novi model 33% manje sklon pogreškama u pojedinačnim tvrdnjama u usporedbi s GPT-5.2, a ukupni odgovori su 18% manje skloni sadržavanju pogrešaka.

Kao dio lansiranja, OpenAI je preoblikovao način na koji API verzija GPT-5.4 upravlja pozivima alata, uvodeći novi sustav nazvan Tool Search. Ranije su sustavi poziva davali definicije svih dostupnih alata prilikom pozivanja modela — proces koji je mogao potrošiti mnogo tokena kako bi se povećao broj dostupnih alata. Novi sustav omogućava modelima da pretražuju definicije alata po potrebi, što rezultira bržim i jeftinijim zahtjevima u sustavima s mnogim dostupnim alatima.

OpenAI je također uključio novu sigurnosnu evaluaciju koja testira lanac razmišljanja svojih modela, kontinuiranu komentaciju koju modeli daju kako bi prikazali proces razmišljanja kroz višestepene zadatke. Istraživači sigurnosti AI-a dugo su se brinuli da bi modeli razmišljanja mogli pogrešno predstaviti svoj lanac razmišljanja, a testovi pokazuju da se to može dogoditi pod pravim okolnostima.

Nova evaluacija OpenAI-a pokazuje da je obmanjivanje manje vjerojatno u verziji Thinking modela GPT-5.4, “sugerirajući da model nema sposobnost skrivanja svog razmišljanja i da monitoring CoT ostaje učinkovito sredstvo sigurnosti.”

Hot this week

Izazovi rasta AI startupa

Preživjeti prve dane kao AI startup nije samo pitanje...

Noscroll: AI bot za vašu informatičnu udobnost

Što ako biste mogli outsourcingirati svoje doomscrolling? To je...

OpenAI predstavio GPT-5.5, najnapredniji AI model

OpenAI je u četvrtak predstavio GPT-5.5, svoj najnoviji AI...

StrictlyVC događaj u San Franciscu

Prvi događaj godine organizacije StrictlyVC u San Franciscu se...

Skandali oko tvrtke Delve i sigurnosnih certifikacija

Priča o problematičnom startupu Delve nastavlja se razvijati. TechCrunch...

Topics

Izazovi rasta AI startupa

Preživjeti prve dane kao AI startup nije samo pitanje...

Noscroll: AI bot za vašu informatičnu udobnost

Što ako biste mogli outsourcingirati svoje doomscrolling? To je...

OpenAI predstavio GPT-5.5, najnapredniji AI model

OpenAI je u četvrtak predstavio GPT-5.5, svoj najnoviji AI...

StrictlyVC događaj u San Franciscu

Prvi događaj godine organizacije StrictlyVC u San Franciscu se...

Skandali oko tvrtke Delve i sigurnosnih certifikacija

Priča o problematičnom startupu Delve nastavlja se razvijati. TechCrunch...

NASA lansira teleskop Nancy Grace Roman 2026.

NASA je najavila da će lansirati teleskop Nancy Grace...

Sony AI razvio autonomnog robota za stolni tenis

Autonomni robot za stolni tenis kojeg je razvila tvrtka...

Indijsko tržište mobilnih aplikacija bilježi rekordne prihode

Indijsko tržište mobilnih aplikacija bilježi rekordne prihode, s prihodima...
spot_img

Related Articles

Popular Categories

spot_imgspot_img