OpenAI lança GPT-4.1: melhor em código e em seguir instruções

A OpenAI anunciou nesta segunda-feira (14) a chegada da nova família de modelos GPT-4.

Foto de Meu Quadradinho Por Meu Quadradinho
14/04/2025 às 15:17:01 - Atualizado há

Foto: Olhar Digital
Foto: Olhar Digital

A OpenAI anunciou nesta segunda-feira (14) a chegada da nova família de modelos GPT-4.1 à sua API, incluindo as versões GPT-4.1, GPT-4.1 mini e GPT-4.1 nano. A empresa afirma que os novos modelos superam os anteriores GPT-4o e GPT-4o mini em diversos quesitos, com destaque para tarefas de programação e compreensão de instruções. Além disso, eles agora suportam janelas de contexto de até 1 milhão de tokens.

Segundo a OpenAI, os modelos foram desenvolvidos com foco em aplicações do mundo real, a partir de colaborações com a comunidade de desenvolvedores. A atualização também inclui um novo limite de conhecimento até junho de 2024.

Desempenho do GPT-4.1 em tarefas de codificação

  • Segundo a OpenAI, o GPT-4.1 apresentou melhorias significativas em benchmarks de engenharia de software, como o SWE-bench Verified, no qual obteve 54,6% de sucesso.
  • Este índice representa um aumento de mais de 20 pontos percentuais em relação ao GPT-4o e coloca o novo modelo como destaque entre os modelos de linguagem voltados à programação.
  • A OpenAI também informa que o GPT?4.1 é mais eficiente na geração de código em formatos de diffs e realiza menos edições desnecessárias.
  • Em avaliações internas, a frequência de alterações extrínsecas caiu de 9% para 2%, e houve melhorias expressivas em tarefas como desenvolvimento frontend.
  • Em testes comparativos, avaliadores humanos preferiram os sites gerados com o GPT?4.1 em 80% dos casos.
  • Outro destaque é a versão GPT?4.1 nano, que se posiciona como o modelo mais rápido e econômico da nova linha.
  • Ele alcança 80,1% no benchmark MMLU e se mostra adequado para tarefas como classificação e autocompletar, mantendo a capacidade de processar 1 milhão de tokens.

Aprimoramentos em instruções e conversas longas

Com foco na confiabilidade, o GPT-4.1 também avançou no cumprimento de instruções complexas, como seguir formatos específicos (ex: XML, Markdown), evitar comportamentos indesejados e manter coerência em múltiplas interações. O modelo teve desempenho 10,5% superior ao GPT-4o no benchmark MultiChallenge, que simula conversas com múltiplas instruções encadeadas.

Além disso, no IFEval — que avalia o cumprimento de instruções verificáveis — o GPT?4.1 obteve 87,4%, contra 81% do GPT?4o. Empresas que participaram da fase de testes, como Blue J e Hex, relataram reduções no retrabalho e maior precisão em tarefas de análise fiscal e consultas em bancos de dados.

Contexto ampliado: até 1 milhão de tokens

A nova linha também se diferencia pela ampliação significativa da janela de contexto. Enquanto versões anteriores como o GPT?4o limitavam-se a 128 mil tokens, os novos modelos conseguem lidar com entradas de até 1 milhão de tokens, o que, segundo a OpenAI, equivale a mais de oito cópias completas do código-fonte do React.

Para validar essa capacidade, a empresa desenvolveu testes como o "Needle in a Haystack", onde os modelos devem localizar uma informação escondida em grandes volumes de texto. O GPT?4.1 se mostrou eficaz mesmo com dados dispersos em janelas extensas. Para cenários mais complexos, a OpenAI criou o benchmark OpenAI-MRCR, que exige interpretação de múltiplas informações interligadas ao longo de conversas simuladas.

Transição e disponibilidade

O GPT-4.1 está disponível exclusivamente via API. A OpenAI também comunicou que a versão GPT?4.5 Preview será desativada em 14 de julho de 2025, já que o novo modelo oferece desempenho semelhante ou superior com menor custo e latência. Os recursos do GPT?4.5, como qualidade de texto e nuance, continuarão sendo incorporados aos próximos modelos.

Já no ChatGPT, as melhorias do GPT?4.1 estão sendo gradualmente integradas à versão GPT?4o. A empresa afirma que continuará ampliando essas atualizações nas futuras versões da plataforma.

GPT?4.1 mini e nano foram desenvolvidos pensando em performance com menor custo. A versão mini, por exemplo, reduz a latência pela metade e o custo em 83%, mantendo resultados comparáveis aos modelos maiores. Já a nano foca em velocidade e custo-benefício, sendo indicada para aplicações que exigem respostas rápidas com contexto extenso.

Esses avanços devem ampliar as possibilidades de criação de agentes autônomos mais úteis e confiáveis para áreas como suporte ao cliente, engenharia de software e análise documental.

Comentários

Notícias sobre Ciência&Tecnologia

Lembra disso? 5 recursos dos celulares antigos que não existem mais

Android

Lembra disso? 5 recursos dos celulares antigos que não existem mais

Os celulares antigos marcaram época e deixaram saudades em muita gente.

Barcelona x Celta de Vigo: onde assistir, horário e escalação da La Liga

la liga

Barcelona x Celta de Vigo: onde assistir, horário e escalação da La Liga

Neste sábado (19), Barcelona e Celta de Vigo se enfrentam pela 32ª rodada da La Liga 2024/2025.

China vai inaugurar a ponte mais alta do mundo; altura impressiona

China

China vai inaugurar a ponte mais alta do mundo; altura impressiona

Depois da Grande Muralha, da Cidade Proibida, do Palácio de Potala e do Exército de Terracota, a China está prestes a inaugurar uma nova obra...

Teclado velho em casa? Veja 6 dicas para reutilizar eletrônicos

artesanato

Teclado velho em casa? Veja 6 dicas para reutilizar eletrônicos

Com a constante evolução da tecnologia, é comum que periféricos de informática fiquem obsoletos e acabem esquecidos em gavetas ou

atividade física

"Pílula do exercício" pode ser usada para tratar obesidade?

A chamada "pílula do exercício" tem sido vista com interesse crescente pela comunidade científica por sua capacidade de simular, em alguma...

O que é microplástico?

cérebro

O que é microplástico?

Quando pensamos em poluição, geralmente imaginamos grandes objetos descartados incorretamente na natureza, como garrafas plásticas, embalagens...

Leia estas Notícias

Trabalho e estudo: comerciantes em Via Sacra no DF buscam sonhos

Via Sacra

Trabalho e estudo: comerciantes em Via Sacra no DF buscam sonhos

"Olha o salgadinho… cinco reais".

Trump descarta novas leis após ataque em universidade da Flórida

Mundo

Trump descarta novas leis após ataque em universidade da Flórida

O presidente dos Estados Unidos, Donald Trump, afirmou nesta quinta-feira (17) que não pretende apoiar nenhuma nova legislação sobre controle...

Via Sacra do Morro da Capelinha, em Planaltina, emociona milhares de fiéis

Brasília 65 anos

Via Sacra do Morro da Capelinha, em Planaltina, emociona milhares de fiéis

Com mais de 50 anos de tradição, a Via Sacra do Morro da Capelinha, em Planaltina, reuniu milhares de fiéis, nesta sexta-feira (18), para a...

Justiça anula contrato que Larissa Manoela assinou com gravadora na infância

Fama

Justiça anula contrato que Larissa Manoela assinou com gravadora na infância

SÃO PAULO, SP (FOLHAPRESS) - A Justiça do Rio de Janeiro determinou o encerramento do contrato de exclusividade entre Larissa Manoela e a gravadora...

Filmes que têm protagonistas femininas, mas os papéis eram destinados a homens!

Cultura

Filmes que têm protagonistas femininas, mas os papéis eram destinados a homens!

No início da década de 2010, Sandra Bullock estava cansada da falta de personagens femininas interessantes em oferta e apelou para os cineastas...

Famosos que sofreram AVC (alguns tiveram 2 ou mais)!

Fama

Famosos que sofreram AVC (alguns tiveram 2 ou mais)!

Acidente Vascular Cerebral (AVC), também conhecido como derrame, é a segunda principal causa de morte no mundo e a terceira a provocar incapacidade,...

Blogs & Colunas
Horóscopo
Camarão entre os mais saborosos do mundo tem mais de 30 cm e custa R$ 400 por quilo: 'Raridade'

Camarão entre os mais saborosos do mundo tem mais de 30 cm e custa R$ 400 por quilo: 'Raridade'

Sugerida para você

Camarão entre os mais saborosos do mundo tem mais de 30 cm e custa R$ 400 por quilo: 'Raridade'