Sumar
Pe 30 ianuarie, Mistral AI, unicornul francez din domeniul GenAI, a introdus Small 3, un LLM cu 24 de miliarde de parametri, demonstrând că pentru a fi performant, un LLM nu necesită un număr astronomic de parametri. Small 3.1, succesorul său, păstrează o arhitectură compactă, introducând în același timp îmbunătățiri semnificative în ceea ce privește performanța, înțelegerea multimodală și gestionarea contextelor lungi, depășind modele precum Gemma 3-it 27B de la Google și GPT-4o Mini de la OpenAI.
Sursa: Mistral AI
Optimizarea performanței
-
O versiune instruită, Mistral Small 3.1 Instruct, pregătită să fie utilizată pentru sarcini conversaționale și de înțelegere a limbajului ;
-
O versiune preantrenată, Mistral Small 3.1 Base, ideală pentru fine-tuning și specializare pe domenii specifice (sănătate, finanțe, juridic, etc.).
-
Small 3.1 Instruct afișează performanțe mai bune decât Gemma 3-it (27B) de la Google în sarcini textuale, multimodale și multilingve ;
-
Depășește GPT-4o Mini de la OpenAI în benchmark-uri precum MMLU, HumanEval și LongBench v2, în special datorită ferestrei sale contextuale extinse la 128.000 de tokeni ;
-
De asemenea, depășește Claude-3.5 Haiku în sarcini complexe care implică contexte lungi și date multimodale;
-
Excelează față de Cohere Aya-Vision (32B) în benchmark-uri multimodale precum ChartQA și DocVQA, demonstrând o înțelegere avansată a datelor vizuale și textuale ;
-
Small 3.1 afișează performanțe ridicate în multilingvism, depășind concurenții săi în categorii precum limbile europene și asiatice.
Pentru a înțelege mai bine
Ce este un LLM (Large Language Model) în termeni de tehnologie și funcționare?
Un LLM este un model de inteligență artificială conceput pentru a înțelege și genera limbaj natural. Este format din miliarde de parametri care sunt ajustați prin antrenament pe cantități mari de text pentru a prezice următorul cuvânt dintr-o propoziție. LLM-urile sunt utilizate pentru aplicații precum traducerea automată, rezumarea textului și agenții conversaționali.
Ce este licența Apache 2.0 și de ce este importantă pentru proiectele open source?
Licența Apache 2.0 este o licență de software open source care permite utilizatorilor să facă modificări semnificative și să folosească software-ul în scopuri comerciale sau private, oferind în același timp brevete. Este importantă deoarece asigură că contribuțiile rămân gratuite și accesibile, stimulând inovația și adoptarea noilor tehnologii.