Tvrtke u industriji počinju se opirati cijenama umjetne inteligencije. Uber je potrošio cijeli svoj budžet za AI kodiranje za 2026. godinu već u travnju. Microsoft je povukao licence za Claude Code svojim programerima nekoliko mjeseci nakon što ih je omogućio. Zaposlenik u Pricelineu rekao je TechCrunchu da je obnovljeni ugovor za Cursor postao 4-5 puta skuplji.
Iako su cijene po tokenu pale, potražnja za većom primjenom AI i sve autonomnijim agentima povećala je potrošnju tokena. Tvrtke koje su se u ranoj 2025. prekomjerno opskrbile pretplatama ‘all-you-can-eat’ sada se bore da shvate kamo odlazi njihov novac, smanje troškove i utvrde mogu li spasiti neki ROI iz ruševina svojih budžeta.
U međuvremenu, tržište se formira kako bi im pomoglo. Startupi, etablirani dobavljači i nova tijela standardizacije utrkuju se kako bi tvrtkama pružili alate i jezik za praćenje svojih troškova.
“Prije šest mjeseci, razgovarao sam s klijentom i sve se svodilo na ‘Što to može? Je li dovoljno dobro?’” rekao je Alexander Embiricos, voditelj poduzeća OpenAI, za TechCrunch na događaju u New Yorku. “Naši razgovori sada nikada nisu o tome. Sada se radi o ‘hej, toliko trošimo. Kakvu vidljivost imate? Kakvu reviziju imate? Kakvu kontrolu tokena imate? Kolika je učinkovitost vaših modela?’”
U tom kontekstu, Linux Foundation je ovog tjedna predstavila planove za Tokenomics Foundation, novo tijelo standarda koje ima za cilj uvesti istu disciplinu troškova oko AI tokena kakvu je FinOps uvela za troškove u oblaku.
“U travnju i svibnju počeli smo od tvrtki slušati: ‘Oh moj Bože, trošimo 3 puta više od našeg cijelog budžeta za tokene za 2026. godinu, a još je samo travanj,’” rekao je J.R. Storment, izvršni direktor FinOps Foundation, projekta pod Linux Foundationom. “Počeli smo slušati egzistencijalne krize, a cijeli razgovor prešao je s tokenmaxxing i ‘idi brzo’ na ‘trebamo zaštitne mjere, kako to kontrolirati?’”
U svijetu tehnologije čule su se vike nakon žestokih zahtjeva CEO-a koji su poticali svoje timove da koriste najbolje modele i brzo napreduju, bez obzira na troškove. Novi modeli objavljeni u studenom, poput Anthropicovog Claude Opus 4.5, OpenAI-ovog GPT-5.1 i Googleovog Gemini 3 Pro, donijeli su značajna poboljšanja agentnim alatima, što je povećalo potrošnju. Tako je jedna tvrtka navodno dobila račun od 500 milijuna dolara za Claude nakon što je zaboravila postaviti ograničenja korištenja za zaposlenike.
“To je poput epidemije crack-kokaina,” rekao je Chris Reed, viši direktor IT financija u Pricelineu, napominjući da je tvrtka počela postavljati ograničenja tokena za određene grupe. “Dali su vam da probate kako biste se navukli, a sada ste na neki način obvezani za to.”
Vitaly Gordon, izvršni direktor platforme za inženjerske operacije Faros AI, rekao je da je nedavno razgovarao s CTO-om koji mu je rekao: “Jedan od mojih inženjera potrošio je 40.000 dolara na tokene prošlog mjeseca, a iskreno ne znam trebam li ga zaustaviti ili reći svima ostalima da budu poput njega.”



