Izazovi upravljanja fizičkom umjetnom inteligencijom

Upravljanje fizičkom umjetnom inteligencijom postaje sve složenije kako autonomni AI sustavi ulaze u robote, senzore i industrijsku opremu. Problem nije samo u tome mogu li AI agenti izvršavati zadatke, već i kako se njihova djelovanja testiraju, nadziru i zaustavljaju kada komuniciraju s realnim sustavima.

Industrijska robotika već ima široku osnovu za tu raspravu. Međunarodna federacija robotike izvijestila je da je 542,000 industrijskih robota instalirano širom svijeta u 2024. godini, što je više od dvostruko godišnjeg nivoa zabilježenog prije deset godina. Očekuje se da će instalacije doseći 575,000 jedinica do 2025. i preći 700,000 jedinica do 2028.

Istraživači tržišta također primjenjuju oznaku Fizička AI na širu grupu sustava, uključujući robotiku, edge computing i autonomne strojeve. Grand View Research procjenjuje globalno tržište Fizičke AI na 81,64 milijarde USD do 2025., s projekcijom rasta na 960,38 milijardi USD do 2033., iako ta kategorija ovisi o tome kako dobavljači definiraju inteligenciju u fizičkim sustavima.

Od izlaza modela do fizičke akcije

Izazov upravljanja je drugačiji od automatizacije samo putem softvera jer fizički sustavi mogu raditi oko radnih mjesta, infrastrukture i ljudskih korisnika. Također, mogu biti povezani s opremom koja zahtijeva jasne sigurnosne granice. Izlaz modela može postati pokret robota ili instrukcija stroju. Također može postati odluka temeljena na podacima senzora, što znači da sigurnosne granice i putanje eskalacije postaju dio dizajna sustava.

Rad u robotici Google DeepMind-a je nedavni primjer kako se AI modeli prilagođavaju ovom okruženju. Tvrtka je u ožujku 2025. predstavila Gemini Robotics i Gemini Robotics-ER, opisujući ih kao modele izgrađene na Gemini 2.0 za robotiku i utjelovljenu AI. Gemini Robotics je model vizije-jezika-akcije dizajniran za izravno upravljanje robotima, dok se Gemini Robotics-ER fokusira na utjelovljeno rasuđivanje, uključujući prostorno razumijevanje i planiranje zadataka.

Robot koji koristi ovu vrstu modela može trebati identificirati objekt, razumjeti instrukciju i planirati niz pokreta. Također mora procijeniti je li zadatak ispravno završen, što stvara problem kontrole koji uključuje ponašanje modela i mehanička ograničenja sustava.

Google DeepMind tvrdi da korisni roboti trebaju općost, interaktivnost i spretnost. Općost obuhvaća nepoznate objekte i okruženja. Interaktivnost se odnosi na ljudski unos i promjenjive uvjete. Spretnost se odnosi na fizičke zadatke koji zahtijevaju precizno kretanje.

U svojim promotivnim materijalima, Google DeepMind je izjavio da Gemini Robotics može slijediti upute na prirodnom jeziku i izvoditi višestepene manipulacijske zadatke, kao što su presavijanje papira, pakiranje predmeta u torbu i rukovanje objektima koji nisu viđeni tijekom obuke.

Tehnički zahtjevi za Fizičku AI su širi od razumijevanja jezika. Sustavi trebaju vizualnu percepciju i prostorno rasuđivanje. Također trebaju planiranje zadataka i detekciju uspjeha. U robotici, detekcija uspjeha je važna jer sustav mora odlučiti je li zadatak završen, treba li ponoviti pokušaj ili treba li stati.

Google DeepMind-ov Gemini Robotics-ER 1.6, predstavljen u travnju 2026., pokazuje kako se te funkcije pakiraju u novije modele. Tvrtka opisuje model kao podržava prostornu logiku, planiranje zadataka i detekciju uspjeha, s mogućnošću rasuđivanja kroz međustepene korake i odlučivanja o tome treba li napredovati ili pokušati ponovno.

Dokumentacija za programere Google-a navodi da je Gemini Robotics-ER 1.6 dostupan u pregledu putem Gemini API-ja. Dokumentacija ga opisuje kao model vizije-jezika koji donosi agencijske sposobnosti Gemini-u u robotiku. Te sposobnosti uključuju vizualnu interpretaciju, prostorno rasuđivanje i planiranje iz uputa na prirodnom jeziku.

Google AI Studio pruža razvojno okruženje za rad s Gemini modelima, dok Gemini API pruža način za integraciju tih modela u aplikacije. U kontekstu utjelovljene AI, to postavlja testiranje i poticanje bliže programerima koji razvijaju agencijske aplikacije.

Sigurnosne kontrole prelaze u dizajn sustava

Upravljanje postaje složenije kada ovi sustavi mogu pozivati alate, generirati kod ili pokretati akcije. Kontrole trebaju definirati koje podatke sustav može pristupiti, koje alate može koristiti, koje akcije zahtijevaju odobrenje ljudi i kako se aktivnost bilježi za pregled.

McKinseyjeva 2026. istraživanja povjerenja u AI ukazuje na isti problem u širem kontekstu korporativnog AI-a. Utvrđeno je da je samo oko jedne trećine organizacija izvijestilo o razinama zrelosti tri ili više u strategiji, upravljanju i agencijskom AI upravljanju, iako AI sustavi preuzimaju sve više autonomnih funkcija.

U robotici, sigurnost također uključuje fizičko ponašanje stroja. Google DeepMind opisuje sigurnost robota kao složen problem, pokrivajući niže razine kontrole kao što su izbjegavanje sudara, ograničenja sile i stabilnost, kao i više razine rasuđivanja o tome je li zatražena akcija sigurna u kontekstu.

Tvrtka je također predstavila ASIMOV, skup podataka za procjenu semantičke sigurnosti u robotici i utjelovljenoj AI. Google DeepMind je izjavio da je skup podataka dizajniran za testiranje mogu li sustavi razumjeti upute vezane uz sigurnost i izbjegavati nesigurno ponašanje u fizičkim okruženjima.

Iste kontrole koje se koriste za softverske agente postaju teže za upravljanje kada su sustavi povezani s robotima, senzorima ili industrijskom opremom. Ovo uključuje prava pristupa, tragove revizije i ponašanje odbijanja. Također uključuje putanje eskalacije i testiranje.

Okviri upravljanja, poput NIST okvira za upravljanje rizicima AI i ISO/IEC 42001, pružaju strukture za upravljanje rizicima AI i odgovornostima tijekom životnog ciklusa sustava. U Fizičkoj AI, te kontrole trebaju uzeti u obzir ponašanje modela, povezane strojeve i operativno okruženje.

Google DeepMind također je surađivao s tvrtkama za robotiku kao dio svog razvoja utjelovljene AI. U ožujku 2025. tvrtka je izjavila da surađuje s Apptronikom na humanoidnim robotima koristeći Gemini 2.0, i navela Agile Robots, Agility Robotics, Boston Dynamics i Enchanted Tools među pouzdanim testerima za Gemini Robotics-ER.

2026. ažuriranje također se osvrnulo na rad s Boston Dynamics-om koji uključuje robotske zadatke poput čitanja instrumenata. Ova vrsta slučaja korištenja ovisi o vizualnom razumijevanju, planiranju zadataka i pouzdanoj procjeni fizičkih uvjeta.

Fizička AI primjenjuje se u industrijskoj inspekciji, proizvodnji i logistici. Također se primjenjuje na objekte i skladišta. Ova okruženja zahtijevaju sustave koji interpretiraju uvjete u stvarnom svijetu i djeluju unutar definiranih granica. Pitanje upravljanja je kako se te granice postavljaju prije nego što autonomni sustavi dobiju dozvolu za donošenje ili izvršavanje odluka.

Google DeepMind i Google AI Studio navedeni su kao partneri za tehnologiju hackathona za AI & Big Data Expo North America 2026, koji će se održati 18.-19. svibnja u San Jose McEnery Convention Center-u.

(Foto: Mitchell Luo)

Pogledajte i: Upravljanje AI agentima postaje fokus dok regulatori ističu praznine u kontroli

Želite li saznati više o AI i velikim podacima od industrijskih lidera? Provjerite AI & Big Data Expo koji se održava u Amsterdamu, Kaliforniji i Londonu. Opsežni događaj je dio TechEx i suorganiziran je s drugim vodećim tehnološkim događanjima, kliknite ovdje za više informacija.

AI News podržava TechForge Media. Istražite druge nadolazeće događaje i webinare o korporativnoj tehnologiji ovdje.

Hot topics

Finance

Marketing

Politics

Strategy

Hot topics

Finance

Marketing

Politics

Strategy

Izazovi upravljanja fizičkom umjetnom inteligencijom

Od izlaza modela do fizičke akcije

Sigurnosne kontrole prelaze u dizajn sustava

Topics

Related Articles

Company

Headlines

Newsletter