GPT-5.4 mini e nano: Elevando Eficiência e Performance

Introdução

Hoje, testemunhamos o lançamento dos modelos GPT-5.4 mini e nano, as versões mais capazes de nossos modelos pequenos até agora. Eles trazem muitas das forças do GPT-5.4 para modelos mais rápidos e eficientes, projetados especificamente para workloads de alto volume. Estes modelos foram construídos para cenários onde a latência impacta diretamente a experiência do produto, como assistentes de codificação responsivos, subagentes para tarefas de suporte rápidas, sistemas de automação que interpretam capturas de tela e aplicações multimodais que raciocinam sobre imagens em tempo real.

Destaques dos Modelos

O GPT-5.4 mini representa uma melhoria significativa em relação ao GPT-5 mini em áreas como codificação, raciocínio, compreensão multimodal e uso de ferramentas, operando mais de 2x mais rápido. Ele também se aproxima do desempenho do modelo maior GPT-5.4 em várias avaliações.

O GPT-5.4 nano é a versão menor e mais econômica do GPT-5.4, ideal para tarefas onde a velocidade e o custo são primordiais. Recomendamos-o para classificação, extração de dados, ranqueamento e subagentes de codificação que lidam com tarefas de suporte mais simples. Nestes contextos, o modelo ideal muitas vezes não é o maior, mas sim aquele que responde rapidamente, usa ferramentas de forma confiável e ainda executa bem em tarefas profissionais complexas.

Performance e Aplicações

Os novos modelos demonstram um desempenho robusto em diversas benchmarks:

| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |---|---|---|---| | SWE-Bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% | | Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% | | Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% | | GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% | | OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |

Clientes que testaram o GPT-5.4 mini em seus workflows relatam: "O GPT-5.4 mini oferece um forte desempenho de ponta a ponta para um modelo nesta classe. Em nossas avaliações, ele igualou ou superou modelos competitivos em diversas tarefas de saída e recall de citação a um custo muito menor. Também alcançou taxas de aprovação de ponta a ponta mais altas e atribuição de fonte mais forte do que o modelo GPT-5.4 maior."

Eficiência em Workflows de Codificação

GPT-5.4 mini e nano são especialmente eficazes em workflows de codificação que se beneficiam de iterações rápidas. Os modelos lidam com edições direcionadas, navegação em bases de código, geração de front-end e ciclos de depuração com baixa latência, tornando-os ideais para tarefas de codificação que exigem velocidade e custos reduzidos. Em benchmarks, o GPT-5.4 mini consistentemente supera o GPT-5 mini com latências semelhantes e se aproxima das taxas de aprovação do GPT-5.4, enquanto opera muito mais rápido.

Benchmarks de Codificação:

| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |---|---|---|---| | SWE-bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% | | Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |

Composição de Sistemas com Subagentes

O GPT-5.4 mini também é uma excelente escolha para sistemas que combinam modelos de diferentes tamanhos. Por exemplo, em sistemas como o Codex, um modelo maior como o GPT-5.4 pode gerenciar o planejamento, a coordenação e o julgamento final, enquanto delega a subagentes GPT-5.4 mini para tarefas mais específicas e paralelas – como pesquisar uma base de código, revisar um arquivo grande ou processar documentos de suporte. Este padrão se torna cada vez mais útil à medida que modelos menores se tornam mais rápidos e capazes. Desenvolvedores podem compor sistemas onde modelos maiores decidem o que fazer e modelos menores executam rapidamente em escala.

Capacidades Multimodais

O GPT-5.4 mini é robusto em tarefas multimodais, especialmente aquelas relacionadas ao uso de computador. O modelo pode interpretar rapidamente capturas de tela de interfaces de usuário densas para completar tarefas de uso de computador com agilidade. No OSWorld-Verified, o GPT-5.4 mini se aproxima do GPT-5.4, superando substancialmente o GPT-5 mini.

Benchmarks Multimodais / Visão / CUA:

| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |---|---|---|---| | OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% | | MMMUPro w/ Python | 81.5% | 78.0% | 69.5% | 74.1% | | MMMUPro | 81.2% | 76.6% | 66.1% | 67.5% |

Disponibilidade e Custos

O GPT-5.4 mini está disponível hoje na API, Codex e ChatGPT.

Na API, o GPT-5.4 mini suporta entradas de texto e imagem, uso de ferramentas, chamada de função, pesquisa na web, pesquisa de arquivo, uso de computador e habilidades. Possui uma janela de contexto de 400k e custa $0.75 por 1M tokens de entrada e $4.50 por 1M tokens de saída.
No Codex, o GPT-5.4 mini está disponível em todo o aplicativo Codex, CLI, extensão IDE e web. Ele utiliza apenas 30% da cota do GPT-5.4, permitindo que os desenvolvedores lidem rapidamente com tarefas de codificação mais simples no Codex por aproximadamente um terço do custo.
No ChatGPT, o GPT-5.4 mini está disponível para usuários Gratuitos e Go através do recurso "Thinking" no menu +. Para todos os outros usuários, o GPT-5.4 mini está disponível como um fallback de limite de taxa para o GPT-5.4 Thinking.

O GPT-5.4 nano está disponível apenas na API e custa $0.20 por 1M tokens de entrada e $1.25 por 1M tokens de saída.

Impacto Prático

O lançamento dos modelos GPT-5.4 mini e nano transforma fundamentalmente a forma como os desenvolvedores podem abordar workloads de alto volume. Ao oferecer modelos menores, mais rápidos e mais eficientes, com capacidades aprimoradas em codificação e multimodalidade, permitimos a construção de sistemas AI mais responsivos e econômicos. Isso se traduz em ciclos de desenvolvimento mais ágeis, custos operacionais reduzidos e uma experiência de usuário significativamente melhorada, garantindo que o melhor modelo para uma tarefa seja aquele que equilibra desempenho, velocidade e custo de forma otimizada.