Petak, 8 svibnja, 2026
8 C
London

OpenAI Unosi Nove Značajke Glasovne Inteligencije

OpenAI je u četvrtak objavio da će njihov API sada uključivati niz novih značajki glasovne inteligencije, osmišljenih da pomognu programerima u stvaranju aplikacija koje mogu razgovarati, transkribirati i prevoditi razgovore s korisnicima.

Tvrtkina nova GPT‑Realtime‑2 je još jedan glasovni model, izgrađen za stvaranje realistične vokalne simulacije koja može razgovarati s korisnicima. Međutim, za razliku od svog prethodnika (GPT-Realtime-1.5), ovaj model koristi GPT‑5‑klasu razmišljanja koju OpenAI opisuje kao sposobnu da odgovori na složenije zahtjeve korisnika.

Tvrtka također lansira GPT‑Realtime‑Translate, koji, kako mu i samo ime govori, osmišljen je za pružanje usluga prevođenja u stvarnom vremenu koje “prate” korisnika tijekom razgovora. Ova značajka uključuje više od 70 ulaznih jezika (tj. jezika koje može razumjeti) i 13 izlaznih jezika (jezika koje prenosi govoru).

Konačno, tvrtka je također predstavila novu sposobnost transkripcije, GPT-Realtime-Whisper, koja korisnicima omogućuje prijenos govora u tekst u stvarnom vremenu dok se interakcije odvijaju.

“Zajedno, modeli koje lansiramo pomiču audio u stvarnom vremenu od jednostavnih poziva i odgovora prema glasovnim sučeljima koja zapravo mogu obavljati poslove: slušati, razmišljati, prevoditi, transkribirati i poduzimati akcije dok se razgovor odvija,” izjavila je tvrtka.

Kome će ove nadogradnje biti korisne? Tvrtke koje žele proširiti svoje mogućnosti korisničke podrške očiti su cilj. Međutim, OpenAI također napominje da će nove značajke pomoći u širokom spektru područja, uključujući obrazovanje, medije, događaje i platforme za stvaratelje, među ostalima.

Koliko god se ovi alati činili korisnima iz perspektive poduzeća, također je realno da bi mogli biti zloupotrijebljeni. Tvrtka je izjavila da je izgradila zaštitne mjere kako bi spriječila zloupotrebu svojih novih značajki za stvaranje spama, prijevara ili drugih oblika internetskog zlostavljanja. Određeni okidači su ugrađeni u sustav tako da “razgovori mogu biti zaustavljeni ako se otkriju kao kršenje naših smjernica o štetnom sadržaju,” navodi OpenAI.

Svi novi glasovni modeli uključeni su u OpenAI-ov Realtime API. Translate i Whisper se naplaćuju po minuti, dok se GPT-Realtime-2 naplaćuje prema potrošnji tokena.

Hot this week

Švedski startup Pit privlači pažnju investitora

Švedski startup Pit možda je stekao pažnju zahvaljujući kontroverznim...

OpenAI predstavlja novu funkciju za sigurnost korisnika

U četvrtak je OpenAI najavio novu funkciju pod nazivom...

Perplexityov Personal Computer dostupan za Mac korisnike

Perplexityev Personal Computer, odgovor na OpenClaw i druge lokalne...

Muskova pravna borba protiv OpenAI

Pravna borba Elona Muska za razbijanje OpenAI-a mogla bi...

Bumble se oprošta od swipeanja

Hoće li problemi s aplikacijama za upoznavanje konačno uništiti...

Topics

Švedski startup Pit privlači pažnju investitora

Švedski startup Pit možda je stekao pažnju zahvaljujući kontroverznim...

OpenAI predstavlja novu funkciju za sigurnost korisnika

U četvrtak je OpenAI najavio novu funkciju pod nazivom...

Perplexityov Personal Computer dostupan za Mac korisnike

Perplexityev Personal Computer, odgovor na OpenClaw i druge lokalne...

Muskova pravna borba protiv OpenAI

Pravna borba Elona Muska za razbijanje OpenAI-a mogla bi...

Bumble se oprošta od swipeanja

Hoće li problemi s aplikacijama za upoznavanje konačno uništiti...

Aurora pokreće komercijalne operacije samovozećih kamiona

Samovozeći kamioni su "gotovo ovdje" već više od desetljeća....

Otvorene prijave za Startup Battlefield 200

Prijave za Startup Battlefield 200 su otvorene, ali samo...

TechCrunch Disrupt 2026: Prijavite se za izlaganje

Možete provesti mjesece pokušavajući doći do pravih ljudi. Ili...
spot_img

Related Articles

Popular Categories

spot_imgspot_img