Meta a anunțat lansarea a două noi modele de inteligență artificială din categoria multimodală – Scout și Maverick – descriindu-le drept cele mai avansate din clasa lor. Modelele multimodale sunt capabile să proceseze și să genereze conținut în mai multe formate, precum text, imagine sau video.

Scout: performanță ridicată pe o singură placă grafică

Despre modelul Scout, Meta afirmă că poate funcționa eficient pe o singură placă grafică Nvidia H100, lucru care îl face extrem de accesibil din punct de vedere al infrastructurii. În plus, compania susține că modelul oferă „rezultate mai bune decât Gemini 2.0 Flash-Lite de la Google și Mistral 3.1, într-o gamă largă de teste pe scară largă.”

Maverick: lider în performanță multimodală

Meta descrie modelul Maverick ca fiind cel mai performant model multimodal din categoria sa, susținând că depășește competitori precum Gemini 2.0 Flash de la Google sau GPT-4o dezvoltat de OpenAI. „Maverick oferă cel mai bun raport performanță/cost din clasa sa”, se menționează într-o postare oficială pe blogul Meta.

Llama 4 Behemoth: profesorul AI în devenire

Pe lângă lansările actuale, Meta dezvoltă și un nou model AI de mari dimensiuni – Llama 4 Behemoth. Acesta este proiectat pentru a deveni cel mai puternic model al companiei, având rolul de a antrena și ghida alte modele AI. Reuters informează că Meta plănuiește să investească în 2025 aproximativ 65 de miliarde de dolari în infrastructura destinată inteligenței artificiale.

Totuși, potrivit publicației The Conversation, lansarea versiunilor Llama 4 a fost amânată. Motivul: dezvoltatorii ar fi fost îngrijorați de faptul că modelul nu atinge nivelul dorit în interacțiunile vocale cu utilizatorii. „Dezvoltatorii erau îngrijorați că modelul nu se descurcă la fel de bine ca modelele OpenAI în a purta o conversație, vocal, cu oamenii”, citează Reuters.