Google je u ponedjeljak tiho lansirao aplikaciju za diktiranje pod nazivom “Google AI Edge Eloquent” na iOS-u, koja se natječe s aplikacijama poput Wispr Flow, SuperWhisper i Willow.
Aplikacija se može preuzeti besplatno, a nakon što se preuzmu modeli automatskog prepoznavanja govora (ASR) temeljeni na Gemmi, možete početi diktirati na svom telefonu. U aplikaciji možete vidjeti uživo transkripciju, a kada pritisnete pauzu, aplikacija automatski filtrira riječi poput “hm” i “ah” te uređuje tekst.
Ispod transkripta nalaze se opcije poput “Ključne točke”, “Formalno”, “Kratko” i “Dugo” za transformaciju teksta.

Možete također isključiti način rada u oblaku kako biste koristili samo lokalnu obradu. (Kada je način rada u oblaku uključen, aplikacija koristi modele Gemini temeljen na oblaku za čišćenje teksta.) Google AI Edge Eloquent može uvoziti određene ključne riječi, imena i žargon iz vašeg Gmail računa, ako želite. Osim toga, možete dodati svoje vlastite prilagođene riječi na popis.
Aplikacija prikazuje povijest sesije transkripcije i omogućuje pretraživanje svih transkripcija. Također može prikazati riječi koje su diktirane u posljednjoj sesiji, vašu brzinu riječi po minuti i ukupni broj izgovorenih riječi.
“Google AI Edge Eloquent je napredna aplikacija za diktiranje dizajnirana da premosti razliku između prirodnog govora i profesionalnog, spremnog za korištenje teksta. Za razliku od standardnih softvera za diktiranje koji doslovno transkribiraju greške i riječi za popunjavanje, Eloquent koristi AI za hvatanje vašeg namjera. Automatski uklanja ‘hm’, ‘ah’ i samokorekcije usred rečenice, isporučujući čist i točan tekst,” navodi se u opisu aplikacije u App Store-u.

Dok je aplikacija trenutno dostupna samo na iOS-u, opis u App Store-u spominje verziju za Android. (Kontaktirali smo Google za više informacija i ažurirat ćemo priču ako dobijemo odgovor.)
Prema opisu, Eloquent nudi “besprijekornu integraciju s Androidom”, gdje se može postaviti kao zadnja tipkovnica korisnika za pristup u svim tekstualnim poljima. Osim toga, aplikacija će moći koristiti značajku plutajućeg gumba, sličnu onoj koju koristi Wispr Flow na Androidu, za jednostavan pristup transkripciji s bilo kojeg mjesta.
Aplikacije za transkripciju temeljene na AI-u postaju sve popularnije među korisnicima kako se modeli govora u tekst poboljšavaju. S ovom eksperimentalnom aplikacijom, Google se pridružuje trendu. Ako ovaj test bude uspješan, mogli bismo vidjeti poboljšane značajke transkripcije i na Androidu.



