La unicorn canadese Cohere ha recentemente svelato “Command A”, l'ultima versione del suo modello di punta. Progettato specificamente, come i suoi predecessori, per rispondere alle esigenze delle aziende, questo LLM da 111 miliardi di parametri, che combina performance ed efficienza energetica, rivaleggia con modelli di primo piano come GPT-4o e DeepSeek-V3.
 
Uno dei principali vantaggi di Command A per le aziende è la sua impronta materiale minima. Mentre la maggior parte dei modelli comparabili richiede fino a 32 GPU, Command A funziona efficacemente con solo due GPU A100 o H100, il che si traduce in una riduzione significativa dei costi e della latenza oltre a una velocità di esecuzione più elevata. Oltre a una generazione più rapida del primo token, può generare fino a 156 token/s, un flusso 1,75 volte superiore a GPT-4o e 2,4 volte superiore a DeepSeek-V3.
Prestazioni di Command A
Cohere ha valutato le prestazioni di Command A rispetto a quelle di GPT-4o e DeepSeek-V3 su benchmark accademici: MMLU (conoscenze generali), MATH, IFEval (seguimento delle istruzioni), test di agenti intelligenti (BFCL, Taubench) e benchmark di codifica (MBPPPlus, SQL, RepoQA).
Le sue capacità nel seguire le istruzioni, nella codifica, in particolare in SQL, e nei compiti agentici superano quelle dei suoi concorrenti.
In test di valutazione umana, Command A, che copre 23 delle lingue principali, ha superato i suoi concorrenti in diverse lingue, in particolare in arabo dialettale, dove si è rivelato più coerente e preciso di GPT-4o e DeepSeek-V3. Questa capacità di adattarsi ai contesti locali rappresenta un vantaggio strategico per le aziende che operano a livello internazionale.
Capacità ottimizzate per le aziende
Contrariamente al suo predecessore, che supportava una lunghezza del contesto di 128.000 token, Command A è dotato di una lunghezza del contesto di 256 token, il che lo rende adatto ad analizzare documenti aziendali lunghi. Integra funzionalità avanzate come la generazione aumentata da recupero (RAG) con citazioni verificabili e l'uso di strumenti agentici sicuri.
È particolarmente efficace per:
  • L'analisi e l'estrazione di informazioni da rapporti finanziari voluminosi;
  • La gestione delle politiche HR secondo le specificità locali;
  • La verifica e l'interpretazione delle normative giuridiche complesse.
Grazie a un'integrazione fluida con North, la piattaforma di agenti IA di Cohere, Command A consente alle aziende di sviluppare soluzioni IA su misura mantenendo un alto livello di sicurezza e conformità.
Disponibilità e prezzi
Già disponibile sulla piattaforma Cohere, con un prossimo supporto dai principali fornitori di cloud, Command A è proposto a un costo di 2,50 $ per 1 milione di token in ingresso e 10,00 $ per 1 milione di token in uscita. È anche accessibile per scopi di ricerca su Hugging Face.