Tvrtka Cohere, specijalizirana za umjetnu inteligenciju, predstavila je novu obitelj višjezičnih modela na marginama Indijskog AI summita. Ovi modeli, nazvani Tiny Aya, otvorenog su koda, što znači da je njihov temeljni kod javno dostupan za korištenje i izmjenu. Podržavaju više od 70 jezika i mogu raditi na svakodnevnim uređajima poput prijenosnih računala bez potrebe za internet vezom.
Model, koji je lansirala istraživačka grana tvrtke Cohere Labs, podržava jezike južne Azije poput bengalskog, hindskog, pandžabskog, urdu, gudžaratskog, tamilski, telugua i marathija.
Osnovni model sadrži 3,35 milijardi parametara, što je mjera njegove veličine i složenosti. Cohere je također lansirao TinyAya-Global, verziju koja je fino podešena za bolje praćenje korisničkih naredbi, za aplikacije koje zahtijevaju široku jezičnu podršku. Regionalne varijante upotpunjuju obitelj modela: TinyAya-Earth za afričke jezike; TinyAya-Fire za jezike južne Azije; i TinyAya-Water za Aziju i Pacifik, Zapadnu Aziju i Europu.

„Ovaj pristup omogućuje svakom modelu da razvije jače jezično razumijevanje i kulturne nijanse, stvarajući sustave koji djeluju prirodnije i pouzdanije za zajednice kojima su namijenjeni. Istovremeno, svi Tiny Aya modeli zadržavaju široku višjezičnu pokrivenost, što ih čini fleksibilnim početnim točkama za daljnju prilagodbu i istraživanje,“ izjavila je tvrtka u priopćenju.
Cohere je napomenuo da su ovi modeli, koji su trenirani na jednom klasteru od 64 H100 GPU procesora (vrsta visokoučinkovitog čipa tvrtke Nvidia) koristeći relativno skromne računalne resurse, idealni za istraživače i programere koji razvijaju aplikacije za publiku koja govori maternji jezik. Modele je moguće pokretati izravno na uređajima, pa ih programeri mogu koristiti za offline prevođenje. Tvrtka je napomenula da je izgradila svoj temeljni softver kako bi odgovarao upotrebi na uređaju, zahtijevajući manje računalne snage od većine usporedivih modela.

U jezično raznolikim zemljama poput Indije, ovakva offline funkcionalnost može otvoriti raznolike aplikacije i primjere korištenja bez potrebe za stalnim pristupom internetu.
Modeli su dostupni na HuggingFace, popularnoj platformi za dijeljenje i testiranje AI modela, te na Cohere platformi. Programeri ih mogu preuzeti na HuggingFace, Kaggle i Ollama za lokalnu implementaciju. Tvrtka također planira objaviti skupove podataka za obuku i evaluaciju na HuggingFace te tehničko izvješće koje će detaljno opisivati svoju metodologiju obuke.



