A OpenAI acaba de lançar três novos modelos na sua API: GPT-4.1, GPT-4.1 mini e GPT-4.1 nano. Estes modelos trazem melhorias significativas em termos de codificação, acompanhamento de instruções e oferecem uma gestão de contexto ampliada, chegando até 1 milhão de tokens.

Desempenho otimizado

O modelo principal, GPT-4.1, melhora significativamente o desempenho em relação ao GPT-4o, especialmente nos seguintes aspectos:

  • Codificação: O GPT-4.1 alcança 54,6% no benchmark SWE-bench Verified, um aumento notável em relação ao GPT-4o (33,2%) e GPT-4.5 (38%). Este resultado traduz uma melhoria na sua capacidade de resolver problemas complexos de desenvolvimento de software.

  • Acompanhamento de instruções: Na avaliação MultiChallenge de Scale, o GPT-4.1 obtém 38,3%, melhorando em 10,5 pontos absolutos o desempenho em relação ao GPT-4o.

  • Longo contexto: O GPT-4.1 estabelece um novo recorde com 72% no benchmark Video-MME, dedicado à compreensão de conteúdos multimodais em contexto ampliado.

Uma gama completa para atender a diversas necessidades

Além do GPT-4.1, as versões mini e nano oferecem compromissos eficazes entre desempenho e custo:

  • GPT-4.1 mini: Este modelo mais compacto supera o GPT-4o em várias avaliações, reduzindo consideravelmente a latência (quase pela metade) e o custo (redução de 83%).

  • GPT-4.1 nano: O modelo mais rápido e econômico, ideal para tarefas como classificação ou autocompletar, oferecendo, apesar de seu tamanho reduzido, um contexto de até 1 milhão de tokens.

Capacidades reforçadas para agentes inteligentes

Graças às suas melhorias em confiabilidade de acompanhamento de instruções e compreensão de contexto ampliado, o GPT-4.1 fortalece as aplicações baseadas em agentes autônomos. Os desenvolvedores agora podem construir sistemas mais confiáveis e eficientes para gestão documental, desenvolvimento de software, ou ainda processamento automatizado de solicitações de clientes.

Fim programado do GPT-4.5 Preview

A OpenAI anunciou a depreciação próxima do modelo GPT-4.5 Preview em prol do GPT-4.1, oferecendo um desempenho superior a um custo menor. O GPT-4.5 Preview será desativado a partir de 14 de julho de 2025, para permitir uma transição suave para os desenvolvedores.

Disponibilidade exclusiva via API

Vale notar que o GPT-4.1 estará disponível exclusivamente via API da OpenAI. Os usuários do ChatGPT beneficiam-se progressivamente das melhorias do GPT-4.1 integradas na versão GPT-4o.

Preços otimizados

Com uma revisão para baixo dos preços, o GPT-4.1 está agora acessível a um custo 26% menor em comparação ao GPT-4o para pedidos comuns. O preço muito competitivo do GPT-4.1 nano faz dele a oferta mais acessível já proposta pela OpenAI.

 

Fonte: https://openai.com/index/gpt-4-1/

Para entender melhor

O que é o benchmark SWE-bench Verified usado para avaliar os modelos da OpenAI?

O SWE-bench Verified é um conjunto de testes projetado para avaliar a capacidade dos modelos de inteligência artificial em resolver problemas complexos de desenvolvimento de software. Ele mede as habilidades de codificação dos modelos e sua eficiência em seguir instruções de desenvolvimento precisas.

Qual é a regulamentação atual em relação aos modelos de IA como o GPT-4.1?

Os modelos de IA como o GPT-4.1 devem cumprir regulamentos que incluem proteção de dados pessoais, transparência de algoritmos e responsabilidade por viés. A União Europeia está trabalhando no AI Act, que pode impor normas rigorosas de conformidade para modelos de uso comercial.