Meta objavljuje nove alate za sigurnost AI modela

Dok radite s AI-jem ili se pokušavate obraniti od manje ugodnih strana tehnologije, Meta je predstavila nove Llama sigurnosne alate.

Poboljšani sigurnosni alati za Llama AI modele dolaze uz nove resurse iz Mete osmišljene kako bi pomogle timovima za cyber sigurnost da iskoriste AI za obranu. To je dio njihovog nastojanja da razvoj i korištenje AI učine sigurnijim za sve uključene.

Programeri koji rade s Llama modelima sada imaju pristup novim alatima. Ove najnovije Llama zaštitne alate možete preuzeti izravno s Meta stranice ili ih pronaći na Hugging Face i GitHubu.

Prvi alat je Llama Guard 4. Zamislite ga kao evoluciju Meta-ine prilagodljive sigurnosne filtracije za AI. Velika novost je da je sada multimodalan, što znači da može razumjeti i primjenjivati sigurnosna pravila ne samo na tekst, već i na slike. To je ključno kako se AI aplikacije sve više vizualiziraju. Ova nova verzija također će biti uključena u Meta-inu novu Llama API, koja je trenutno u ograničenoj verziji.

Tu je i LlamaFirewall. Ovaj alat je nova komponenta iz Mete, dizajnirana da djeluje kao kontrolni centar sigurnosti za AI sustave. Pomaže u upravljanju različitim sigurnosnim modelima koji rade zajedno i povezuje se s drugim zaštitnim alatima Mete. Njegov zadatak? Uočiti i blokirati rizike koji muče AI programere – poput pametnih napada ‘prompt injection’, potencijalno sumnjive generacije koda ili rizičnog ponašanja AI dodataka.

Meta je također unaprijedila svoj Llama Prompt Guard. Glavni model Prompt Guard 2 (86M) sada je bolji u otkrivanju pokušaja jailbreaka i prompt injekcija. Možda zanimljivije je uvođenje Prompt Guard 2 22M.

Prompt Guard 2 22M je mnogo manja, brža verzija. Meta smatra da može smanjiti latenciju i troškove obrade do 75% u usporedbi s većim modelom, bez previše kompromisa u snazi detekcije. Za sve koji trebaju brže odgovore ili rade s ograničenim budžetima, to je dobrodošla novina.

Meta se ne fokusira samo na graditelje AI-ja; također gledaju na cyber branitelje na prvoj liniji digitalne sigurnosti. Čuli su pozive za boljim AI alatima za pomoć u borbi protiv cyber napada i dijele neke ažurirane informacije usmjerene na to.

Ažuriran je CyberSec Eval 4 benchmark set. Ovaj open-source alat pomaže organizacijama da utvrde koliko su AI sustavi dobri u sigurnosnim zadacima. Ova najnovija verzija uključuje dva nova alata:

CyberSOC Eval: Ovaj okvir, razvijen uz pomoć stručnjaka za cyber sigurnost CrowdStrike, posebno mjeri koliko AI dobro funkcionira u stvarnom okruženju Centra za sigurnosne operacije (SOC). Cilj je dati jasniju sliku učinkovitosti AI-a u otkrivanju prijetnji i odgovoru. Benchmark će uskoro biti dostupan.
AutoPatchBench: Ovaj benchmark testira koliko su Llama i drugi AI sustavi dobri u automatskom pronalaženju i popravljanju sigurnosnih rupa u kodu prije nego što ih zloćudnici mogu iskoristiti.

Kako bi ove alate dostavili onima kojima su potrebni, Meta pokreće Llama Defenders Program. Čini se da je cilj dati partnerskim tvrtkama i programerima poseban pristup mješavini AI rješenja – neka su open-source, neka rane verzije, a neka možda i proprietary – sve usmjereno na različite sigurnosne izazove.

U sklopu toga, Meta dijeli alat za sigurnost AI koji koriste interno: Automatizirani alat za klasifikaciju osjetljivih dokumenata. Ovaj alat automatski dodaje sigurnosne oznake na dokumente unutar organizacije. Zašto? Da spriječi osjetljive informacije da ne izađu van ili da spriječi slučajno uključivanje u AI sustav (poput RAG postavki) gdje bi mogle biti otkrivene.

Meta se također bavi problemom lažnog zvuka generiranog AI-jem, koji se sve više koristi u prevarama. Llama Generator Audio Detector i Llama Audio Watermark Detector dijele se s partnerima kako bi im pomogli u prepoznavanju AI generiranih glasova u potencijalnim phishing pozivima ili prevarama. Tvrtke poput ZenDeska, Bell Canada i AT&T već su se prijavile za integraciju ovih alata.

Na kraju, Meta je dala kratak pregled nečega potencijalno velikog za privatnost korisnika: Privatna obrada. To je nova tehnologija na kojoj rade za WhatsApp. Ideja je omogućiti AI-u da obavlja korisne zadatke poput sažimanja vaših nepročitanih poruka ili pomoći u sastavljanju odgovora, ali bez mogućnosti da Meta ili WhatsApp mogu pročitati sadržaj tih poruka.

Meta je vrlo otvorena u vezi sa sigurnosnom stranom, čak objavljujući svoj model prijetnji i pozivajući istraživače sigurnosti da testiraju arhitekturu prije nego što postane javna. To je znak da znaju kako je važno ispraviti aspekte privatnosti.

Ukupno gledajući, Meta je predstavila širok spektar sigurnosnih najava vezanih uz AI. Jasno je da nastoje osigurati AI koji razvijaju, dok istovremeno pružaju širej zajednici tehnologije bolje alate za sigurno graditi i učinkovito se braniti.

Hot topics

Finance

Marketing

Politics

Strategy

Hot topics

Finance

Marketing

Politics

Strategy

Meta objavljuje nove alate za sigurnost AI modela

Topics

Related Articles

Company

Headlines

Newsletter