DeepL, tvrtka poznata po svojim alatima za prevođenje teksta, danas je predstavila skup alata za prevođenje govora koji pokriva situacije poput sastanaka, mobilnih i web razgovora te grupnih razgovora za radnike na terenu putem prilagođenih aplikacija. Tvrtka također predstavlja API koji omogućuje vanjskim programerima i poduzećima izgradnju aplikacija temeljenih na DeepL-ovoj tehnologiji za prilagođene primjene, poput call centara.
“Nakon što smo toliko godina radili na prevođenju teksta, prevođenje govora je bio prirodan korak za nas,” rekao je CEO DeepL-a, Jarek Kutylowski, u intervjuu za TechCrunch. “Napravili smo veliki napredak kada je u pitanju prevođenje teksta i dokumenata. No, smatrali smo da ne postoji dobar proizvod za prevođenje govora u stvarnom vremenu.”
Kutylowski je rekao da se izazovi u stvaranju proizvoda za prevođenje u stvarnom vremenu temelje na pronalaženju ravnoteže između smanjenja latencije — kašnjenja između govora i reprodukcije prevedenog zvuka — i održavanja točnih rezultata.
DeepL uvodi dodatke za platforme poput Zoom-a i Microsoft Teams-a, gdje slušatelji mogu čuti prevođenje u stvarnom vremenu dok drugi govore na svojim materinjim jezicima ili pratiti prevedeni tekst na ekranu. Ovaj program je trenutno u fazi ranog pristupa, a tvrtka poziva organizacije da se prijave na listu čekanja. Također, postoji proizvod za mobilne i web razgovore koji se mogu odvijati osobno ili na daljinu.
DeepL također omogućuje korisnicima sudjelovanje u grupnim razgovorima, primjerice tijekom treninga ili radionica, gdje sudionici mogu pristupiti putem QR koda.
Tvrtka je istaknula da njezina tehnologija prevođenja govora može učiti i prilagođavati se prilagođenom rječniku, uključujući terminologiju specifičnu za industriju te imena tvrtki i pojedinaca.
Kutylowski je rekao da AI preoblikuje budućnost korisničke podrške. Naglasio je da sloj prevođenja pomaže tvrtkama da pružaju podršku na jezicima gdje je kvalificirano osoblje rijetko i skupo za zapošljavanje.
Tvrtka tvrdi da kontrolira cijeli sustav prevođenja govora. Međutim, trenutni sustav prvo pretvara govor u tekst, zatim primjenjuje prevođenje i na kraju vraća taj tekst u govor. DeepL vjeruje da, budući da su godinama radili na prevođenju teksta, imaju prednost u kvaliteti prevođenja. U budućnosti, tvrtka želi razviti model prevođenja govora od kraja do kraja koji potpuno izostavlja korak s tekstom.
DeepL se suočava s konkurencijom nekoliko dobro financiranih startupa koji rade u srodnim područjima. Sanas, koji je prošle godine prikupio 65 milijuna dolara od Quadrille Capital i Teleperformance, koristi AI za modifikaciju naglaska govornika u stvarnom vremenu — alat prvenstveno namijenjen agentima u call centrima.
Tvrtka Camb.AI iz Dubaija fokusira se na sintezu govora i prevođenje za medijske i zabavne kompanije poput Amazon Web Services, pomažući im da dubliraju i lokaliziraju video sadržaj u velikim razmjerima.
Palabra, koju podržava tvrtka Seven Seven Six suosnivača Reddita, Alexis Ohaniana, razvija motor za prevođenje govora u stvarnom vremenu dizajniran za očuvanje i značenja i originalnog glasa govornika, što je čini izravnom konkurencijom onome što DeepL trenutno razvija.



